RDF-Dateien¶
Sie können eine RDF-Datei (.rdf) als Quelle verwenden.
Die Plattform erzeugt Einträge aus einer beliebigen RDF-Struktur, indem sie alle Elemente bei einer bestimmten Tiefe (optional mit einem Tag gefiltert) zu einem Satz von Einträgen umwandelt. Für jedes Element, das in einen Eintrag umgewandelt wird, werden die Attribute, die eingeschlossenen Tags und der Inhalt, in Felder konvertiert. Komplexe Daten innerhalb der Felder werden in eine JSON-Darstellung konvertiert, die beide Attribute und den Inhalt beinhaltet.
Erstellung¶
Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.
Konfiguration¶
Name | Beschreibung |
Verwendung |
---|---|---|
Übergeordnete Tags |
Anzahl der übergeordneten Elemente, von denen Attribute abgerufen werden können Wenn die einschließenden Tags relevante Attribute enthalten, verwenden Sie diese Option, um sie zu den Einträgen hinzuzufügen. |
Geben Sie die Anzahl der übergeordneten Tags ein, von denen Attribute abgerufen werden sollen (z.B. |
Name der zu extrahierenden Tags |
Befinden sich irrelevante Tags bei derselben Tiefe wie die extrahierten Elemente, können Sie diese Option nutzen, um nur relevante Tags zu filtern. |
Geben Sie in das Feld Name der zu extrahierenden Tags den zu extrahierenden Tag ein (z.B. |
Tag-Tiefe |
Tiefe der Tags, die in Einträge umgewandelt werden müssen |
Geben Sie die Tiefe des wiederholten Tags in Tag-Tiefe ein (z.B. |
Name | Beschreibung |
Verwendung |
---|---|---|
Dateinamen extrahieren |
Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt. |
Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren. |
Technische Daten¶
Felderstellung¶
Die Richtlinie für die Erstellung von Feldern aus einem Element wird wie in den folgenden Beispielen gezeigt definiert.
1 2 3 4 5 6 7 8 | <rows>
<data attribute="attribute value" other_attribute="other attribute value">
<indicator>GDP per capita</indicator>
<country>Andean Region</country>
<decimal>0</decimal>
</data>
<data attribute="2nd data tag">Text only</data>
</rows>
|
Attribut |
anderes_Attribut |
Indikator |
Land |
dezimal |
Inhalt |
Attributwert |
anderer Attributwert |
Pro-Kopf-BIP |
Andenregion |
0 | |
2nd data tag | Nur Text |
JSON-Darstellung¶
Komplexe Daten in Feldern werden in JSON konvertiert, wie im folgenden Beispiel gezeigt.
1 2 3 4 5 6 7 8 9 | <mydocument has="an attribute">
<and>
<many>elements</many>
<many>more elements</many>
</and>
<plus a="complex">
element as well
</plus>
</mydocument>
|
{
"mydocument": {
"@has": "an attribute",
"and": {
"many": [
"elements",
"more elements"
]
},
"plus": {
"@a": "complex",
"#text": "element as well"
}
}
}
Beispiele¶
Example 1¶
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 | <?xml version="1.0" encoding="utf-8"?>
<wb:rows xmlns:wb="http://www.worldbank.org">
<wb:data>
<wb:indicator id="6.0.GDPpc">GDP per capita (2005 USD)</wb:indicator>
<wb:country id="L5">Andean Region</wb:country>
<wb:date>2012</wb:date>
<wb:value>10561.668936515</wb:value>
<wb:decimal>0</wb:decimal>
</wb:data>
<wb:data>
<wb:indicator id="6.0.GDPpc">GDP per capita (2005 USD)</wb:indicator>
<wb:country id="L5">Andean Region</wb:country>
<wb:date>2011</wb:date>
<wb:value>10215.3319157514</wb:value>
<wb:decimal>0</wb:decimal>
</wb:data>
<wb:data>
<wb:indicator id="6.0.GDPpc">GDP per capita (2005 USD)</wb:indicator>
<wb:country id="L5">Andean Region</wb:country>
<wb:date>2010</wb:date>
<wb:value>9711.85739310366</wb:value>
<wb:decimal>0</wb:decimal>
</wb:data>
</wb:rows>
|
In diesem Beispiel:
Tag-Tiefe ist auf
2
gesetzt, weil sichwb:data
auf der zweiten Ebene des XML-Baums (wb:rows/wb:data
) befindet.Sie brauchen die Tags nicht herauszufiltern, da alle Elemente in dieser Tiefe Einträge sind.
Der entstehende Datensatz sieht so aus:
wb:Indikator |
wb:Land |
wb:Datum |
wb:Wert |
wb:dezimal |
{"#text": "Pro-Kopf-BIP (2005 USD)", "@id": "6.0.GDPpc"} |
{"#text": "Andenregion", "@id": "L5"} |
2005 | 8154.72913271721 | 0 |
{"#text": "Pro-Kopf-BIP (2005 USD)", "@id": "6.0.GDPpc"} |
{"#text": "Bolivien", "@id": "BO"} |
2009 | 5152.46337890625 | 0 |
{"#text": "Pro-Kopf-BIP (2005 USD)", "@id": "6.0.GDPpc"} |
{"#text": "Bolivien", "@id": "BO"} |
2006 | 4715.9892578125 | 0 |
Example 2¶
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | <?xml version="1.0" encoding="UTF-8"?>
<shoppingList>
<id>abcdef123</id>
<description>A shopping list</description>
<basket>
<itemCount>3</itemCount>
<totalQuantity>19</totalQuantity>
<item>
<name>tomato</name>
<quantity>10</quantity>
</item>
<item>
<name>potato</name>
<quantity>5</quantity>
</item>
<item>
<name>banana</name>
<quantity>4</quantity>
</item>
</basket>
</shoppingList>
|
In diesem Beispiel ist der XML-Baum komplex. Daher kann die automatische Parametererkennung die richtige Tiefe nicht ermitteln. Sie müssen die Quelle manuell konfigurieren:
Tag-Tiefe ist auf
3
gesetzt, weil sich der KnotenElement
auf der dritten Ebene des XML-Baums befindet (shoppingList/basket/item
).Der Name der zu extrahierenden Tags muss auf
Element
gesetzt werden, daitemCount
undtotalQuantity
ebenfalls auf der dritten Ebene liegen, jedoch nicht relevant sind.
Der entstehende Datensatz sieht so aus:
name | Menge |
Kartoffel |
5 |
Banane |
4 |
Tomate |
10 |