JSON-Dateien

JSON ist ein offenes Standardformat, das menschenlesbaren Text verwendet, um Datenobjekte zu übertragen, die aus Schlüssel-Wert-Paaren bestehen. Es ist das gängigste Format zur Erstellung von APIs.

JSON-Dokumente können viele verschiedene Formen haben. Deshalb kann die Plattform Daten aus JSON-Dateien, JSON-Zeilen-Dateien und JSON-Wörterbüchern extrahieren.

Hinweis

Wenn die Plattform die Extraktion eines Dokuments mit komplexer Struktur nicht vollständig abschließt, können Sie einen der JSON-Prozessoren verwenden, um die Extraktion abzuschließen.

JSON-Datei

Sie können eine JSON-Datei als Quelle verwenden. Aus dieser Datei extrahiert die Plattform ein gültiges JSON-Dokument (Array oder Objekt) in einen Datensatz mit mehreren Einträgen:

  • Ist das Dokument ein JSON-Array, wird für jedes Objekt innerhalb des Arrays ein Eintrag erstellt (die Schlüssel dienen als Spaltennamen).

  • Ist das Dokument ein JSON-Objekt, sollte der Parameter "JSON-Stamm" einen durch einen Punkt getrennten Pfad zum Array in Ihrem Objekt enthalten. Bei fehlender Angabe probiert der Konnektor Elemente.

Dank des Parameters "JSON-Objekt" kann die Plattform vor dem Extrahieren der Einträge einen anderen Pfad für jedes Element innerhalb des Arrays verfolgen.

Unterstützte Feldtypen

  • Reguläre Felder (dezimal, boolesch, Zeichenfolge)

  • JSON-Objekte werden verwendet wie sie sind

  • Array:

    • Enthält das Array JSON-Objekte, wird es verwendet, wie es ist.

    • Enthält das Array Zeichenfolgen, wird ein mehrwertiges Feld mit allen durch ein Semikolon (";") getrennten Zeichenfolgen erstellt.

Erstellung

Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.

Konfiguration

JSON-Parameter
Name

Beschreibung

Verwendung

JSON-Stamm

ijson Pfad zum JSON-Array, das die Objekte enthält, die als Datensatzeinträge extrahiert werden sollen

ijson ist eine Syntax zur Navigation innerhalb von JSON-Objekten. Dabei werden die Attributnamen durch Punkte getrennt (z.B. "content.trains"). Für fortgeschrittene Benutzer stehen weitere Funktionen zur Verfügung.

Befindet sich das JSON-Array an der Wurzel des Dokuments, lassen Sie das Feld JSON root leer. Handelt es sich bei der JSON-Datei um ein JSON-Objekt, geben Sie den ijson-Pfad zum Array in das Feld JSON-Root ein.

JSON-Objekt

Relativer Pfad des zu extrahierenden JSON-Objekts

Wenn nach dem Festlegen des JSON-Stammes in der Vorschau irrelevante Spalten angezeigt werden und das JSON-Objekt als Wert einer Spalte extrahiert wurde, geben Sie den Namen dieser Spalte in das Feld JSON-Objekt ein.

Dateinamen extrahieren
Name

Beschreibung

Verwendung

Dateinamen extrahieren

Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt.

Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren.

Beispiele

Example 1:

[
 {
     "name": "Agra Express",
     "origin": "Agra Cantt",
     "destination": "New Delhi"
 },
 {
     "name": "Gour Express",
     "origin": "Balurghat",
     "destination": "Sealdah"
 }
]

In dieser JSON-Datei befindet sich das JSON-Array direkt am Stamm. Sie können das Feld JSON root leer lassen.

Der entstehende Datensatz lautet:

name

Herkunft

Ziel

Agra Express Agra Cantt New Delhi
Gour Express Balurghat Sealdah

Hinweis

Die Reihenfolge der Spalten kann unterschiedlich sein.

Example 2:

{
 "filename": "trains.json",
 "content": {
     "trains": [
         {
             "id": 123,
             "info": {
                 "name": "Agra Express",
                 "origin": "Agra Cantt",
                 "destination": "New Delhi"
             }
         },
         {
             "id": 555,
             "info": {
                 "name": "Gour Express",
                 "origin": "Balurghat",
                 "destination": "Sealdah"
             }
         }
     ]
 }
}

Für diese komplexe JSON-Datei lautet der korrekte JSON-Stamm content.trains. Wenn content.trains als JSON-Stamm festgelegt ist, dann resultiert folgender Datensatz daraus:

id info
123

{"Herkunft": "Agra Cantt", "Ziel": "New Delhi", "Name": "Agra Express"}

555

{"Herkunft": "Balurghat", "Ziel": "Sealdah", "Name": "Gour Express"}

Um nur die JSON-Objekte info zu extrahieren und die id Nummer zu überspringen, ist das richtige JSON-Objekt info. Wenn info als ein JSON-Objekt festgelegt ist, dann resultiert folgender Datensatz daraus:

name

Herkunft

Ziel

Agra Express Agra Cantt New Delhi
Gour Express Balurghat Sealdah

JSON-Zeilen

Sie können eine JSON-Zeilen-Datei als Quelle verwenden. In JSON Zeilen-Dateien ist jede Zeile ein einzeiliges JSON-Dokument. Die gesamte Datei ist kein gültiges JSON-Dokument, aber jede Zeile ist es.

Es werden zwei Modi unterstützt:

  • Ein JSON-Array in jeder Zeile (oder ein Array insgesamt)

  • Ein JSON-Objekt in jeder Zeile

Unterstützte Feldtypen

  • Reguläre Felder (dezimal, Zeichenfolge)

  • Array: wird verwendet, so wie es ist

  • JSON-Objekte werden verwendet wie sie sind

Erstellung

Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.

Konfiguration

Konfiguration
Name

Beschreibung

Verwendung

Dateinamen extrahieren

Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt.

Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren.

Nummer der ersten Zeile

Bei Dateien, die nicht in der ersten Zeile beginnen, kann festgelegt werden, welche Zeile als die erste angesehen werden soll. Die Zeilen darüber werden vom Datensatz übersprungen.

Standardmäßig beginnt der Datensatz in Zeile 1. Geben Sie die Nummer der Zeile ein, die als Anfang des Datensatzes berücksichtigt werden soll.

Überschriften

Für Dateien, deren erste Zeile Feldnamen enthält.

Standardmäßig ist diese Option aktiviert. Sie bezieht sich auf die Werte der ersten Zeile der Feldbeschriftungen. Schalten Sie diese Option aus, wenn die erste Zeile keine Feldnamen, sondern Daten enthält: Die Feldbeschriftungen sind dann standardmäßig leer.

JSON Dict

Sie können ein JSON-Wörterbuch als Quelle verwenden. Die Plattform extrahiert ein gültiges JSON-Dokument (Array oder Objekt) in einen Datensatz mit mehreren Einträgen.

Die Plattform erwartet ein JSON-Objekt, in dem jeder Schlüssel einen Eintrag enthält. Die Plattform erstellt dann Einträge mit:

  • einer Spalte für den Schlüssel

  • einer Spalte für jedes Attribut des entsprechenden Objekts (oder einer einzelnen Spalte mit dem Namen "Wert", wenn der Wert eine Zeichenfolge statt eines Objekts ist).

Unterstützte Feldtypen

  • Reguläre Felder (dezimal, boolesch, Zeichenfolge)

  • JSON-Objekte werden verwendet wie sie sind

  • Array:

    • Enthält das Array JSON-Objekte, wird es verwendet, wie es ist.

    • Enthält das Array Zeichenfolgen, wird ein mehrwertiges Feld mit allen durch ein Semikolon (";") getrennten Zeichenfolgen erstellt.

Erstellung

Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.

Konfiguration

Konfiguration
Name

Beschreibung

Verwendung

Dateinamen extrahieren

Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt.

Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren.

JSON-Stamm

ijson Pfad zum JSON-Array, das die Objekte enthält, die als Datensatzeinträge extrahiert werden sollen

ijson ist eine Syntax zur Navigation innerhalb von JSON-Objekten. Dabei werden die Attributnamen durch Punkte getrennt (z.B. "content.trains"). Für fortgeschrittene Benutzer stehen weitere Funktionen zur Verfügung.

Befindet sich das JSON-Array an der Wurzel des Dokuments, lassen Sie das Feld JSON root leer. Handelt es sich bei der JSON-Datei um ein JSON-Objekt, geben Sie den ijson-Pfad zum Array in das Feld JSON-Root ein.

Schlüssel-Feldname

Beschriftung der Spalte "Schlüssel"

Der Standardwert lautet "Schlüssel". Geben Sie die neue Bezeichnung der Spalte "Schlüssel" in das Textfeld ein. Es wird sowohl die Beschriftung als auch die technische Kennung der Spalte geändert.

Beispiele

Example 1:

{
  "2016": {
    "type1": {
      "price": 10,
      "color": "blue",
      "available": true
    },
    "type2": {
      "price": 9,
      "color": "red",
      "available": true
    }
  },
  "2015": {
    "type1": {
      "price": 10.5,
      "color": "teal",
      "available": true
    },
    "type2": {
      "price": 9.1,
      "color": "crimson",
      "available": true
    }
  }
}

Wenn Sie das Feld JSON root leer lassen, dann resultiert folgender Datensatz daraus:

Schlüssel

Typ1

Typ2

2016 {"color": "blue", "available": true, "price": 10} {"color": "red", "available": true, "price": 9}
2015 {"color": "teal", "available": true, "price": 10.5} {"color": "crimson", "available": true, "price": 9.1}

Example 2:

{
  "results": {
    "datasets": [{
        "abc": {
          "title": "A B C",
          "description": "A description about ABC"
        }
      },
      {
        "xyz": {
          "title": "D E F",
          "description": "Another description"
        }
      }
    ]
  }
}

Für diese komplexe JSON-Datei lautet der korrekte JSON-Root results.datasets.item.

  • results.datasets führt zum Array

  • item iteriert innerhalb des Arrays und ruft jedes Objekt ab

Schlüssel

Beschreibung

Titel

abc

Eine Beschreibung von ABC

A B C
xyz

Eine andere Beschreibung

D E F