CSV-Dateien¶
Sie können eine CSV-Datei (.csv) als Quelle verwenden. Eine CSV-Datei enthält eine Liste von Feldern, die entweder durch ein ,
-Zeichen (normalerweise für englische Dateien) oder ein ;
-Zeichen (normalerweise für französische Dateien) getrennt sind.
Sie können auch ähnliche Dateitypen verwenden:
TSV-Dateien (Tab-Separated Values) (.tsv)
Textdateien (.txt)
DAT-Dateien (.dat)
Erstellung¶
Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.
Konfiguration¶
Name | Beschreibung |
Verwendung |
---|---|---|
Dateikodierung |
Kodierung der Datei. Die Zeichen werden in einer gespeicherten Datei mittels Zeichenkodierung dargestellt. Unicode (oder UTF-8) ist der universelle Standard, aber einige Dateien können in einem älteren Format kodiert sein (z.B. alte Versionen von Excel), was eine manuelle Einstellung der Kodierung erforderlich macht. Bei neuerer Software ist dies in der Regel nicht erforderlich. |
Standardmäßig verwendet die Plattform eine Heuristik, um die Kodierung zu ermitteln. Wenn die vermutete Kodierung nicht richtig ist, wählen Sie die Richtige aus der Liste aus oder schreiben Sie sie in das Textfeld Andere ein. Sie können beliebige Aliase aus Python verwenden. |
Name | Beschreibung |
Verwendung |
---|---|---|
Feldtrennzeichen |
Zeichen zur Trennung von Feldern |
Geben Sie das Trennzeichen in das Textfeld ein. Der Standardwert hängt vom jeweiligen Dateiformat ab. Die korrekten Werte sind üblicherweise |
Escapezeichen |
Wenn ein Escapezeichen unmittelbar vor einem Trennzeichen entdeckt wird, wird dieses nicht mehr als Trennzeichen betrachtet. Die Konfigurationsoption Escapezeichen vermeidet diese Situation. |
Standardmäßig ist das Textfeld leer. Wenn die Datei ein Escape-Zeichen enthält (z. B. |
Felder mit Anführungszeichen |
Für Felder, deren Werte in doppelten Anführungszeichen stehen. |
Standardmäßig ist diese Option aktiviert. Deaktivieren Sie die Option, wenn die Feldwerte nicht in doppelten Anführungszeichen stehen. |
Name | Beschreibung |
Verwendung |
---|---|---|
Nummer der ersten Zeile |
Bei Dateien, die nicht in der ersten Zeile beginnen, kann festgelegt werden, welche Zeile als die erste angesehen werden soll. Die Zeilen darüber werden vom Datensatz übersprungen. |
Standardmäßig beginnt der Datensatz in Zeile 1. Geben Sie die Nummer der Zeile an, bei der der Datensatz starten soll. |
Header | Für Dateien, deren erste Zeile Feldnamen enthält. |
Standardmäßig ist diese Option aktiviert. Sie bezieht sich auf die Werte der ersten Zeile der Feldbeschriftungen. Schalten Sie diese Option aus, wenn die erste Zeile keine Feldnamen, sondern Daten enthält: Die Feldbeschriftungen sind dann standardmäßig leer. |
Name | Beschreibung |
Verwendung |
---|---|---|
Dateinamen extrahieren |
Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt. |
Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren. |