Conector de CSV

El conector de archivo CSV se utiliza para los conjuntos de datos cuyo origen es un archivo CSV (.csv). Este es un archivo que contiene una lista de campos separados por un carácter ',' (normalmente en el caso de los archivos en inglés) o ';' (normalmente en el caso de los archivos en francés).

El conector de archivos CSV también puede leer otros archivos parecidos:

  • Archivos TSV (.tsv), con un tabulador como separador (en lugar de un carácter de coma o punto y coma)

  • Archivos de texto (.txt)

  • Archivos DAT (.dat)

Creación

Consulte cómo añadir un archivo.

Configuración

Nombre

Descripción

Uso

Comillas dobles

Para los campos con valores delimitados por comillas dobles.

De forma predeterminada, la casilla no está marcada. Marque la casilla si los valores de campos están delimitados por comillas dobles.

Codificación

Codificación del archivo.

Nota

La codificación de caracteres es la forma en que los caracteres están representados en un archivo guardado. Unicode (o UTF-8) es el estándar universal, pero algunos archivos pueden estar codificados en un formato heredado (p. ej. versiones de Excel anteriores), lo que requeriría establecer la codificación manualmente. En el software moderno, esto suele ser innecesario.

De forma predeterminada, la plataforma utiliza una técnica heurística para averiguar la codificación. Si el resultado no es correcto, elija la codificación adecuada en la lista o escríbala en el cuadro de texto. Se puede utilizar cualquier alias de Python.

Carácter de escape

Si se encuentra un carácter de escape junto antes de un separador, este dejará de considerarse un separador. La opción de configuración Carácter de escape evita esta situación.

De forma predeterminada, el cuadro de texto está vacío. Si el archivo contiene un carácter de escape (p. ej. # o \), escríbalo en el cuadro de texto.

Extraer nombre de archivo

Crea una columna nueva con el nombre del archivo de origen.

De forma predeterminada, la casilla no está marcada. Marque la casilla para extraer el nombre de archivo en una columna añadida.

Primer número de línea

Para los archivos que no empiezan en la primera línea, se puede decidir qué línea debe considerarse la primera. Las líneas por encima de esta se pasarán por alto en el conjunto de datos.

De forma predeterminada, el conjunto de datos empieza en la línea 1. Indique el número de la línea que debe considerarse el comienzo del conjunto de datos.

Encabezados

Para los archivos en que la primera línea contiene títulos de columna.

De forma predeterminada, la casilla está marcada. Hace de los valores de la primera línea las etiquetas de campo Desmarque la casilla si la primera línea no contiene títulos sino datos: así, las etiquetas de campo estarán vacías de forma predeterminada.

Separador

El separador fijo entre los campos del archivo.

Escriba el separador en el cuadro de texto. Solo puede haber un carácter. El valor predeterminado depende del formato del archivo. Los valores correctos suelen ser ';', ',', ' ' y '\t'.