RDF-Dateien

Sie können eine RDF-Datei (.rdf) als Quelle verwenden.

Die Plattform erzeugt Einträge aus einer beliebigen RDF-Struktur, indem sie alle Elemente bei einer bestimmten Tiefe (optional mit einem Tag gefiltert) zu einem Satz von Einträgen umwandelt. Für jedes Element, das in einen Eintrag umgewandelt wird, werden die Attribute, die eingeschlossenen Tags und der Inhalt, in Felder konvertiert. Komplexe Daten innerhalb der Felder werden in eine JSON-Darstellung konvertiert, die beide Attribute und den Inhalt beinhaltet.

Erstellung

Weitere Informationen zum Hinzufügen einer Dateiquelle finden Sie hier Eine Datei abrufen.

Konfiguration

XML-Parameter
Name

Beschreibung

Verwendung

Übergeordnete Tags

Anzahl der übergeordneten Elemente, von denen Attribute abgerufen werden können

Wenn die einschließenden Tags relevante Attribute enthalten, verwenden Sie diese Option, um sie zu den Einträgen hinzuzufügen.

Geben Sie die Anzahl der übergeordneten Tags ein, von denen Attribute abgerufen werden sollen (z.B. 2).

Name der zu extrahierenden Tags

Befinden sich irrelevante Tags bei derselben Tiefe wie die extrahierten Elemente, können Sie diese Option nutzen, um nur relevante Tags zu filtern.

Geben Sie in das Feld Name der zu extrahierenden Tags den zu extrahierenden Tag ein (z.B. Element). Wenn Sie das Feld leer lassen, werden alle Tags in der angegebenen Tiefe in Datensätze umgewandelt.

Tag-Tiefe

Tiefe der Tags, die in Einträge umgewandelt werden müssen

Geben Sie die Tiefe des wiederholten Tags in Tag-Tiefe ein (z.B. 3).

Dateinamen extrahieren
Name

Beschreibung

Verwendung

Dateinamen extrahieren

Es wird eine neue Spalte mit dem Namen der Quelldatei erstellt.

Standardmäßig ist diese Option deaktiviert. Aktivieren Sie diese Option, um den Dateinamen in einer zusätzlichen Spalte zu extrahieren.

Technische Daten

Felderstellung

Die Richtlinie für die Erstellung von Feldern aus einem Element wird wie in den folgenden Beispielen gezeigt definiert.

1
2
3
4
5
6
7
8
<rows>
  <data attribute="attribute value" other_attribute="other attribute value">
    <indicator>GDP per capita</indicator>
    <country>Andean Region</country>
    <decimal>0</decimal>
  </data>
  <data attribute="2nd data tag">Text only</data>
</rows>

Attribut

anderes_Attribut

Indikator

Land

dezimal

Inhalt

Attributwert

anderer Attributwert

Pro-Kopf-BIP

Andenregion

0  
2nd data tag        

Nur Text

JSON-Darstellung

Komplexe Daten in Feldern werden in JSON konvertiert, wie im folgenden Beispiel gezeigt.

1
2
3
4
5
6
7
8
9
<mydocument has="an attribute">
  <and>
    <many>elements</many>
    <many>more elements</many>
  </and>
  <plus a="complex">
    element as well
  </plus>
</mydocument>
{
    "mydocument": {
        "@has": "an attribute",
        "and": {
            "many": [
                "elements",
                "more elements"
            ]
        },
        "plus": {
            "@a": "complex",
            "#text": "element as well"
        }
    }
}

Beispiele

Example 1

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
<?xml version="1.0" encoding="utf-8"?>
<wb:rows xmlns:wb="http://www.worldbank.org">
  <wb:data>
    <wb:indicator id="6.0.GDPpc">GDP per capita (2005 USD)</wb:indicator>
    <wb:country id="L5">Andean Region</wb:country>
    <wb:date>2012</wb:date>
    <wb:value>10561.668936515</wb:value>
    <wb:decimal>0</wb:decimal>
  </wb:data>
  <wb:data>
    <wb:indicator id="6.0.GDPpc">GDP per capita (2005 USD)</wb:indicator>
    <wb:country id="L5">Andean Region</wb:country>
    <wb:date>2011</wb:date>
    <wb:value>10215.3319157514</wb:value>
    <wb:decimal>0</wb:decimal>
  </wb:data>
  <wb:data>
    <wb:indicator id="6.0.GDPpc">GDP per capita (2005 USD)</wb:indicator>
    <wb:country id="L5">Andean Region</wb:country>
    <wb:date>2010</wb:date>
    <wb:value>9711.85739310366</wb:value>
    <wb:decimal>0</wb:decimal>
  </wb:data>
</wb:rows>

In diesem Beispiel:

  • Tag-Tiefe ist auf 2 gesetzt, weil sich wb:data auf der zweiten Ebene des XML-Baums (wb:rows/wb:data) befindet.

  • Sie brauchen die Tags nicht herauszufiltern, da alle Elemente in dieser Tiefe Einträge sind.

Der entstehende Datensatz sieht so aus:

wb:Indikator

wb:Land

wb:Datum

wb:Wert

wb:dezimal

{"#text": "Pro-Kopf-BIP (2005 USD)", "@id": "6.0.GDPpc"}

{"#text": "Andenregion", "@id": "L5"}

2005 8154.72913271721 0

{"#text": "Pro-Kopf-BIP (2005 USD)", "@id": "6.0.GDPpc"}

{"#text": "Bolivien", "@id": "BO"}

2009 5152.46337890625 0

{"#text": "Pro-Kopf-BIP (2005 USD)", "@id": "6.0.GDPpc"}

{"#text": "Bolivien", "@id": "BO"}

2006 4715.9892578125 0

Example 2

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
<?xml version="1.0" encoding="UTF-8"?>
<shoppingList>
    <id>abcdef123</id>
    <description>A shopping list</description>
    <basket>
        <itemCount>3</itemCount>
        <totalQuantity>19</totalQuantity>
        <item>
            <name>tomato</name>
            <quantity>10</quantity>
        </item>
        <item>
            <name>potato</name>
            <quantity>5</quantity>
        </item>
        <item>
            <name>banana</name>
            <quantity>4</quantity>
        </item>
    </basket>
</shoppingList>

In diesem Beispiel ist der XML-Baum komplex. Daher kann die automatische Parametererkennung die richtige Tiefe nicht ermitteln. Sie müssen die Quelle manuell konfigurieren:

  • Tag-Tiefe ist auf 3 gesetzt, weil sich der Knoten Element auf der dritten Ebene des XML-Baums befindet (shoppingList/basket/item).

  • Der Name der zu extrahierenden Tags muss auf Element gesetzt werden, da itemCount und totalQuantity ebenfalls auf der dritten Ebene liegen, jedoch nicht relevant sind.

Der entstehende Datensatz sieht so aus:

name

Menge

Kartoffel

5

Banane

4

Tomate

10