CSV-Konnektor

Der CSV-Datei-Konnektor wird für Datensätze verwendet, deren Quelle eine CSV-Datei (.csv) ist. Dabei handelt es sich um eine Datei, die eine Liste von Feldern enthält, die entweder durch ein ',' (normalerweise für englische Dateien) oder ein ';' (normalerweise für französische Dateien) getrennt sind.

Der CSV-Datei-Konnektor kann auch andere ähnliche Dateien lesen:

  • TSV-Dateien (.tsv), wobei das Trennzeichen ein Tabulatorzeichen anstelle eines Komma- oder Semikolons ist,

  • Textdateien (.txt),

  • DAT-Dateien (.dat).

Konfiguration

Name

Beschreibung

Verwendung

Doppelte Anführungszeichen

Für Felder, deren Werte in doppelten Anführungszeichen stehen.

Standardmäßig ist das Kontrollkästchen nicht markiert. Markieren Sie das Kontrollkästchen, wenn die Feldwerte in doppelten Anführungszeichen stehen.

Codierung

Codierung der Datei.

Hinweis

Die Zeichen werden in einer gespeicherten Datei mittels Zeichencodierung dargestellt. Unicode (oder utf-8) ist der universelle Standard, aber einige Dateien können in einem älteren Format kodiert werden (z.B. alte Versionen von Excel), was eine manuelle Einstellung der Kodierung erforderlich macht. Bei neuerer Software ist dies in der Regel nicht erforderlich.

Standardmäßig verwendet die Plattform eine Heuristik, um die Kodierung zu ermitteln. Wenn die vermutete Codierung nicht richtig ist, wählen Sie die Richtige aus der Liste aus oder schreiben Sie sie in das Textfeld. Es kann jeder beliebige Alias von Python verwendet werden.

Escapezeichen

Wenn ein Escapezeichen unmittelbar vor einem Trennzeichen entdeckt wird, wird dieses nicht mehr als Trennzeichen betrachtet. Die Escapezeichen-Konfigurationsoption vermeidet diese Situation.

Standardmäßig ist das Textfeld leer. Falls die Datei ein Escapezeichen enthält (z.B. #`` oder `\`), schreiben Sie es in das Textfeld.

Dateinamen extrahieren

Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt.

Standardmäßig ist das Kontrollkästchen nicht markiert. Markieren Sie das Kontrollkästchen, um den Dateinamen in einer hinzugefügten Spalte zu extrahieren.

Nummer der ersten Zeile

Bei Dateien, die nicht in der ersten Zeile beginnen, kann bestimmt werden, welche Zeile als die erste angesehen werden soll. Die Zeilen darüber werden vom Datensatz übersprungen.

Standardmäßig beginnt der Datensatz in Zeile 1. Geben Sie die Nummer der Zeile an, die als Anfang des Datensatzes berücksichtigt werden soll.

Überschriften

Für Dateien, deren erste Zeile Spaltentitel enthält.

Standardmäßig ist das Kontrollkästchen markiert. Es bezieht sich auf die Werte der Feldbeschriftungen der ersten Zeile. Entfernen Sie die Markierung des Kontrollkästchens, wenn die erste Zeile keine Titel, sondern Daten enthält: in diesem Fall sind die Feldbezeichnungen standardmäßig leer.

Trennzeichen

Das festgelegte Trennzeichen zwischen den Feldern der Datei.

Schreiben Sie das Trennzeichen in das Textfeld. Es darf nur ein Zeichen vorhanden sein. Der Standard hängt vom Format der Datei ab. Gültige Werte sind in der Regel ';', ',', ' ' und '\t'.