JSON-Dateien¶
JSON ist ein offenes Standardformat, das menschenlesbaren Text verwendet, um Datenobjekte zu übertragen, die aus Schlüssel-Wert-Paaren bestehen. Es ist das gängigste Format zur Erstellung von APIs.
JSON-Dokumente können viele verschiedene Formen haben. Deshalb kann die Plattform Daten aus JSON-Dateien, JSON-Zeilen-Dateien und JSON-Wörterbüchern extrahieren.
Hinweis
Wenn die Plattform die Extraktion eines Dokuments mit komplexer Struktur nicht vollständig abschließt, können Sie einen der JSON-Prozessoren verwenden, um die Extraktion abzuschließen.
JSON-Datei¶
Sie können eine JSON-Datei als Quelle verwenden. Aus dieser Datei extrahiert die Plattform ein gültiges JSON-Dokument (Array oder Objekt) in einen Datensatz mit mehreren Einträgen:
Ist das Dokument ein JSON-Array, wird für jedes Objekt innerhalb des Arrays ein Eintrag erstellt (die Schlüssel dienen als Spaltennamen).
Ist das Dokument ein JSON-Objekt, sollte der Parameter "JSON-Stamm" einen durch einen Punkt getrennten Pfad zum Array in Ihrem Objekt enthalten. Bei fehlender Angabe probiert der Konnektor
Elemente
.
Dank des Parameters "JSON-Objekt" kann die Plattform vor dem Extrahieren der Einträge einen anderen Pfad für jedes Element innerhalb des Arrays verfolgen.
Unterstützte Feldtypen¶
Reguläre Felder (dezimal, boolesch, Zeichenfolge)
JSON-Objekte werden verwendet wie sie sind
Array:
Enthält das Array JSON-Objekte, wird es verwendet, wie es ist.
Enthält das Array Zeichenfolgen, wird ein mehrwertiges Feld mit allen durch ein Semikolon (";") getrennten Zeichenfolgen erstellt.
Erstellung¶
Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.
Konfiguration¶
Name | Beschreibung |
Verwendung |
---|---|---|
JSON-Stamm |
ijson Pfad zum JSON-Array, das die Objekte enthält, die als Datensatzeinträge extrahiert werden sollen ijson ist eine Syntax zur Navigation innerhalb von JSON-Objekten. Dabei werden die Attributnamen durch Punkte getrennt (z.B. "content.trains"). Für fortgeschrittene Benutzer stehen weitere Funktionen zur Verfügung. |
Befindet sich das JSON-Array an der Wurzel des Dokuments, lassen Sie das Feld JSON root leer. Handelt es sich bei der JSON-Datei um ein JSON-Objekt, geben Sie den ijson-Pfad zum Array in das Feld JSON-Root ein. |
JSON-Objekt |
Relativer Pfad des zu extrahierenden JSON-Objekts |
Wenn nach dem Festlegen des JSON-Stammes in der Vorschau irrelevante Spalten angezeigt werden und das JSON-Objekt als Wert einer Spalte extrahiert wurde, geben Sie den Namen dieser Spalte in das Feld JSON-Objekt ein. |
Name | Beschreibung |
Verwendung |
---|---|---|
Dateinamen extrahieren |
Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt. |
Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren. |
Beispiele¶
Example 1:
[
{
"name": "Agra Express",
"origin": "Agra Cantt",
"destination": "New Delhi"
},
{
"name": "Gour Express",
"origin": "Balurghat",
"destination": "Sealdah"
}
]
In dieser JSON-Datei befindet sich das JSON-Array direkt am Stamm. Sie können das Feld JSON root leer lassen.
Der entstehende Datensatz lautet:
name | Herkunft |
Ziel |
Agra Express | Agra Cantt | New Delhi |
Gour Express | Balurghat | Sealdah |
Hinweis
Die Reihenfolge der Spalten kann unterschiedlich sein.
Example 2:
{
"filename": "trains.json",
"content": {
"trains": [
{
"id": 123,
"info": {
"name": "Agra Express",
"origin": "Agra Cantt",
"destination": "New Delhi"
}
},
{
"id": 555,
"info": {
"name": "Gour Express",
"origin": "Balurghat",
"destination": "Sealdah"
}
}
]
}
}
Für diese komplexe JSON-Datei lautet der korrekte JSON-Stamm content.trains
. Wenn content.trains
als JSON-Stamm festgelegt ist, dann resultiert folgender Datensatz daraus:
id | info |
123 | {"Herkunft": "Agra Cantt", "Ziel": "New Delhi", "Name": "Agra Express"} |
555 | {"Herkunft": "Balurghat", "Ziel": "Sealdah", "Name": "Gour Express"} |
Um nur die JSON-Objekte info
zu extrahieren und die id
Nummer zu überspringen, ist das richtige JSON-Objekt info
. Wenn info
als ein JSON-Objekt festgelegt ist, dann resultiert folgender Datensatz daraus:
name | Herkunft |
Ziel |
Agra Express | Agra Cantt | New Delhi |
Gour Express | Balurghat | Sealdah |
JSON-Zeilen¶
Sie können eine JSON-Zeilen-Datei als Quelle verwenden. In JSON Zeilen-Dateien ist jede Zeile ein einzeiliges JSON-Dokument. Die gesamte Datei ist kein gültiges JSON-Dokument, aber jede Zeile ist es.
Es werden zwei Modi unterstützt:
Ein JSON-Array in jeder Zeile (oder ein Array insgesamt)
Ein JSON-Objekt in jeder Zeile
Unterstützte Feldtypen¶
Reguläre Felder (dezimal, Zeichenfolge)
Array: wird verwendet, so wie es ist
JSON-Objekte werden verwendet wie sie sind
Erstellung¶
Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.
Konfiguration¶
Name | Beschreibung |
Verwendung |
---|---|---|
Dateinamen extrahieren |
Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt. |
Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren. |
Nummer der ersten Zeile |
Bei Dateien, die nicht in der ersten Zeile beginnen, kann festgelegt werden, welche Zeile als die erste angesehen werden soll. Die Zeilen darüber werden vom Datensatz übersprungen. |
Standardmäßig beginnt der Datensatz in Zeile 1. Geben Sie die Nummer der Zeile ein, die als Anfang des Datensatzes berücksichtigt werden soll. |
Überschriften |
Für Dateien, deren erste Zeile Feldnamen enthält. |
Standardmäßig ist diese Option aktiviert. Sie bezieht sich auf die Werte der ersten Zeile der Feldbeschriftungen. Schalten Sie diese Option aus, wenn die erste Zeile keine Feldnamen, sondern Daten enthält: Die Feldbeschriftungen sind dann standardmäßig leer. |
JSON Dict¶
Sie können ein JSON-Wörterbuch als Quelle verwenden. Die Plattform extrahiert ein gültiges JSON-Dokument (Array oder Objekt) in einen Datensatz mit mehreren Einträgen.
Die Plattform erwartet ein JSON-Objekt, in dem jeder Schlüssel einen Eintrag enthält. Die Plattform erstellt dann Einträge mit:
einer Spalte für den Schlüssel
einer Spalte für jedes Attribut des entsprechenden Objekts (oder einer einzelnen Spalte mit dem Namen "Wert", wenn der Wert eine Zeichenfolge statt eines Objekts ist).
Unterstützte Feldtypen¶
Reguläre Felder (dezimal, boolesch, Zeichenfolge)
JSON-Objekte werden verwendet wie sie sind
Array:
Enthält das Array JSON-Objekte, wird es verwendet, wie es ist.
Enthält das Array Zeichenfolgen, wird ein mehrwertiges Feld mit allen durch ein Semikolon (";") getrennten Zeichenfolgen erstellt.
Erstellung¶
Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.
Konfiguration¶
Name | Beschreibung |
Verwendung |
---|---|---|
Dateinamen extrahieren |
Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt. |
Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren. |
JSON-Stamm |
ijson Pfad zum JSON-Array, das die Objekte enthält, die als Datensatzeinträge extrahiert werden sollen ijson ist eine Syntax zur Navigation innerhalb von JSON-Objekten. Dabei werden die Attributnamen durch Punkte getrennt (z.B. "content.trains"). Für fortgeschrittene Benutzer stehen weitere Funktionen zur Verfügung. |
Befindet sich das JSON-Array an der Wurzel des Dokuments, lassen Sie das Feld JSON root leer. Handelt es sich bei der JSON-Datei um ein JSON-Objekt, geben Sie den ijson-Pfad zum Array in das Feld JSON-Root ein. |
Schlüssel-Feldname |
Beschriftung der Spalte "Schlüssel" |
Der Standardwert lautet "Schlüssel". Geben Sie die neue Bezeichnung der Spalte "Schlüssel" in das Textfeld ein. Es wird sowohl die Beschriftung als auch die technische Kennung der Spalte geändert. |
Beispiele¶
Example 1:
{
"2016": {
"type1": {
"price": 10,
"color": "blue",
"available": true
},
"type2": {
"price": 9,
"color": "red",
"available": true
}
},
"2015": {
"type1": {
"price": 10.5,
"color": "teal",
"available": true
},
"type2": {
"price": 9.1,
"color": "crimson",
"available": true
}
}
}
Wenn Sie das Feld JSON root leer lassen, dann resultiert folgender Datensatz daraus:
Schlüssel |
Typ1 |
Typ2 |
2016 | {"color": "blue", "available": true, "price": 10} | {"color": "red", "available": true, "price": 9} |
2015 | {"color": "teal", "available": true, "price": 10.5} | {"color": "crimson", "available": true, "price": 9.1} |
Example 2:
{
"results": {
"datasets": [{
"abc": {
"title": "A B C",
"description": "A description about ABC"
}
},
{
"xyz": {
"title": "D E F",
"description": "Another description"
}
}
]
}
}
Für diese komplexe JSON-Datei lautet der korrekte JSON-Root results.datasets.item
.
results.datasets
führt zum Arrayitem
iteriert innerhalb des Arrays und ruft jedes Objekt ab
Schlüssel |
Beschreibung |
Titel |
abc | Eine Beschreibung von ABC |
A B C |
xyz | Eine andere Beschreibung |
D E F |