Cómo convertir archivos Excel a CSV
Es importante tener un mínimo conocimiento de esta materia para no tener problemas al leer o convertir archivos (generalmente numéricos) de un formato a otro. Los archivos CSV (Comma Separated Values) o valores separados por coma son una forma eficaz de almacenar mucha información en muy poco espacio, ya que los datos son insertados y carecen de formato alguno, salvo la separación por comas (u otros caracteres, que denominaremos separadores CSV).
Sin embargo, la mayoría de las veces que obtenemos un archivo de datos (contabilidad, finanzas, tablas…) viene en formato Excel, esto es en XLS o XLSX dependiendo de si se guardó para Excel 2007 y anteriores (XLS) o Excel posterior a 2007 (XLSX). Estos archivos proporcionan una visualización muy rápida de los datos, ya que se encuentran divididos en celdas y, por lo tanto, es fácil tratarlos como tablas (con sus respectivas gráficas y estadística apropiadas). El problema es que una vez se guardan como XLS o XLSX, no se pueden leer como CSV. Es decir, un archivo CSV, que se caracteriza por la limitación de comas entre los distintos datos, aparece ilegible si se guarda con esa extensión directamente. Para ver un ejemplo de a qué nos referimos, el siguiente archivo está en formato XLSX (Excel 2007 o superior).
Si abrimos ese archivo con un editor de textos, como es el bloc de notas o el wordpad, vamos a ver algo similar a esto.
Lo que definitivamente no nos da información útil de los datos que hemos visto en la primera imagen. En las siguientes secciones vamos a ver cómo pasar de Excel a CSV mediante varios métodos, tanto usando software como únicamente servicios online para quienes no dispongan del programa adecuado. Este cambio de formato es crucial para ahorrar espacio en el disco duro sin tener que borrar archivos. Cuando estos documentos contienen una gran cantidad de datos (como puede ser en bases de datos que se actualizan constantemente) es necesario almacenarlos como CSV para, después, leerlos adecuadamente mediante la conversión a formato Excel.
Al final de la guía veremos en términos cuantitativos cuánto podemos llegar a ahorrar en espacio al cambiar de Excel a CSV.
La primera opción para pasar un archivo Excel a CSV es mediante el propio Excel, el famoso software de tablas de cálculo de la suite Office de Microsfot, que también permite abrir CSV. Abrimos el documento deseado y le damos a la primera pestaña arriba a la izquierda, Archivo, le damos a Guardar como y a la derecha buscamos en el listado desplegable CSV (delimitado por comas). Guardamos ese archivo con el nombre deseado.
Ahora este archivo está formato CSV, para verlo tan solo tenemos que localizarlo y abrirlo con el bloc de notas. Veremos entonces que los valores que nos aparecían en cada celda en el documento Excel ahora aparecen separados por punto y coma, los llamados separadores CSV.
El programa ha optado por usar punto y coma puesto que nuestros datos tienen valores decimales indicados por coma, por lo que entraría en conflicto si se separasen por comas. Podemos, sin embargo, cambiar el tipo de separador fácilmente. Abrimos nuestro documento Excel inicial y vamos al icono de la lupa, a la derecha, clicamos en él y le damos a Reemplazar.
En el cuadro de arriba tenemos que poner el caracter actual que se usa para los decimales, en nuestro caso la coma. En el de abajo el cambio deseado, pondremos la coma alta ya que el punto entrará en conflicto con valores numéricos altos, ya que se usa para los miles. Si le damos a reemplazar todos ya tenemos nuestro Excel con decimales cambiados, y podremos usar otro tipo de separadores CSV.
Lo mismo podríamos haber hecho desde el CSV guardado anteriormente y delimitado por comas. Si abrimos ese archivo desde el bloc de notas y le damos a Edición y Reemplazar, seleccionando el punto y coma arriba y la coma abajo se sustituirán todos los delimitadores por comas.
Dado que los archivos CSV se caracterizan por tener un separador, existen varios caracteres que hacen de separadores. En el siguiente ejemplo vamos a pasar de un Excel a CSV delimitado por tabulaciones. Las tabulaciones son espaciados predefinidos, no es como un espacio normal que sucede cuando presionas la barra espaciadora, sino varios espacios unidos en forma de un solo caracter, lo que hace que el hueco entre valores consecutivos sea mucho mayor y quede mejor diferenciado. Abrimos nuevamente nuestro archivo Excel, clicamos nuevamente sobre la pestaña Archivo y vamos a Exportar, casi abajo del todo.
En la siguiente ventana clicamos sobre Cambiar el tipo de archivo y buscamos Texto (Delimitado por tabulaciones). Guardamos y abrimos el nuevo documento con el bloc de notas.
Ahora tenemos los valores separados por tabulaciones. No es lo más adecuado para interpretar los datos ya que el formato que tiene no es muy visual digamos, pero sirve de igual manera para almacenar muchos datos en muy poco espacio.
Hemos visto anteriormente varios métodos para convertir un archivo XLSX o XLS a CSV mediante el uso del programa Microsoft Excel. Ahora toca la parte en la que no usamos software alguno, ideal para quienes no tienen el programa instalado o para aquellos que desean no calentarse tanto la cabeza. Existen multitud de páginas web destinadas a ello, aunque no todas son efectivas.
Empezaremos por la más interesante de todas, ya que permite opciones que no suelen encontrarse en otras. Para pasar de XLSX a CSV online podemos ir a esta página y cargar nuestro archivo XLSX o XLS, funciona con ambos. Abajo en las opciones podemos seleccionar el tipo de separador CSV que queremos (aunque solo hay disponibles dos), y más abajo la codificación.
Le damos al botón rojo de Iniciar la conversión y esperamos unos segundos, el archivo convertido se descargará automáticamente. Si ahora abrimos ese archivo con el bloc de notas veremos que los valores se encuentran separados por el delimitador CSV elegido. Podemos cambiar este delimitador como hemos indicado anteriormente, dándole a Edición, Reemplazar y seleccionando el cambio que queremos.
Otra web que nos permite realizar este cambio es convertio, aunque es algo más lenta y no tiene tantas opciones de personalización pero lo realiza igualmente. El proceso es idéntico, seleccionamos el archivo en nuestro PC (debe estar en formato XLS o XLSX) y le damos a Convertir. Tardará un poco y nos permitirá realizar la descarga a mano.
Si ahora vamos al documento generado, ya en formato CSV, veremos que respecto al anterior ha cambiado algo, y es que ahora los valores, a pesar de estar delimitados por comas, también lo están por dobles comillas (“). Esto puede generar fallos al realizar luego la conversión inversa, es decir, pasar de CSV a Excel (cosa que explicamos detalladamente en esta otra guía).
Lo que haremos es usar la herramienta de reemplazo en el bloc de notas, seleccionando Edición, Reemplazar y en el recuadro de arriba poniendo las dobles comillas y dejando el de abajo vacío.
Estas pequeñas modificaciones hacen mucho a la hora de leer archivos CSV correctamente, ya que utilizar distintos separadores no es lo más conveniente, al menos si no queremos tener problemas.
Para recapitular, hemos visto cómo pasar de Excel a CSV mediante varios métodos. Los archivos Excel a los que nos referimos tienen extensiones XLS o XLSX, ambas válidas a día de hoy pero la XLSX es más utilizada. Para hacerlo hemos optado por dos métodos distintos usando el software Microsoft Excel y por otros dos métodos usando tan solo herramientas online para quienes carezcan del software necesario.
En los dos primeros métodos, usando Excel, hemos visto cómo cambiar los separadores CSV, tanto con Excel como con el simple bloc de notas, utilizando las técnicas de reemplazo de caracteres. Mientras que los dos últimos han sido métodos automatizados en los que tan solo hemos tenido que subir el archivo y, tras la transformación automática, bajarlo y ver que todo estaba en orden. Aun así, no siempre lo está así que mediante el bloc de notas hemos quitado caracteres innecesarios impuestos por el conversor online de XLSX a CSV.
Habiendo visto todos estos métodos, tan solo te queda elegir alguno de ellos y, si da problemas al pasar de Excel a CSV, probar otro método o bien solucionarlo mediante los reemplazos.
Para terminar, aunque ya lo hemos hablado anteriormente, lo más importante de este cambio es la versatilidad que ofrece para leerlo desde cualquier editor de texto, incluso desde el simple bloc de notas que viene incluido en todos los Windows. Pero también está el factor del espacio ocupado, y es que los archivos de valores separados por comas, o CSV, ocupan bastante menos que los Excel (sea XLS o XLSX). Esto con archivos pequeños como el que hemos manejado no tiene gran importancia, pero en una base de datos resulta crucial, ya que el espacio necesario casi se reduce a la mitad.
Es por esto que, pasar de Excel a CSV supone un ahorro en el espacio de almacenamiento necesario, sin conllevar ello una reducción de los datos, pues siguen estando todos ellos pero carentes de formato para ser visualizados y tratados como se merecen. Posteriormente, cuando necesitemos leerlos, podemos hacer uso de la conversión CSV a Excel, que explicamos detalladamente en esta otra guía.