Een dataset met meerdere bestanden aanmaken

Het is mogelijk om meerdere bestanden aan een dataset toe te voegen alsook om meerdere bronnen in één dataset te hebben.

Er zijn 3 methodes om meerdere bestanden in een dataset toe te voegen: door ze één voor één toe te voegen of door meerdere bestanden tezelfdertijd toe te voegen, ofwel via een archiefbestand ofwel via een FTP-server.

Bestanden één voor één sourcen

Deze methode bestaat uit het één voor één toevoegen van verschillende bestanden, uit het aanmaken van even zoveel bronnen als het aantal toegevoegde bestanden. In dat geval kunnen deze verschillende formaten hebben (zie Ondersteunde formaten) aangezien er voor elk toegevoegd bestand een nieuwe bron wordt aangemaakt.

  1. Klik in Catalogus > Datasets op de knop Nieuwe dataset.

  2. Klik op de knop Een bron toevoegen.

  3. Kies één van de 3 beschikbare methodes om uw eerste bestand te uploaden (zie Data sourcen).

  4. Eenmaal het bestand is toegevoegd, klik opnieuw op de knop Een bron toevoegen.

  5. Herhaal de procedure vanaf stap 3 zoveel als nodig is tot al uw bestanden toegevoegd zijn aan de nieuwe dataset.

Belangrijk

Met deze methode is het het eerste bestand dat moet worden toegevoegd dat het dataschema bepaalt. Met andere woorden, wanneer de andere bestanden velden bevatten die niet overeenstemmen met die in het eerst toegevoegde bestand, zullen deze door het platform worden genegeerd.

Meerdere bestanden in een archief sourcen

Deze methode bestaat uit het tezelfdertijd toevoegen van verschillende bestanden via een archiefbestand, het aanmaken van éénzelfde bron voor alle toegevoegde bestanden. In dit geval moeten deze hetzelfde formaat hebben (zie Ondersteunde formaten) omdat er voor alle bestanden slechts één bron wordt aangemaakt.

Belangrijk

Met deze methode zal het platform het bestand kiezen met de oudste wijzigingstijd om het dataschema te bepalen.

  1. Creëer een archiefbestand (zie Ondersteunde gecomprimeerde bestandsformaten) met de bestanden die in dezelfde dataset moeten worden toegevoegd.

  2. Klik in Catalogus > Datasets op de knop Nieuwe dataset.

  3. Klik op de knop Een bron toevoegen.

  4. Haal het archiefbestand op door gebruik te maken van één van de 3 beschikbare methodes (zie Data ophalen).

Belangrijk

Om een shapefile om te halen (dat de volgende bestandsformaten bevat: .shp, .shx, .dbf en .pri), dient u een archiefbestand aan te maken waarin alle nodige bestanden staan en de bovenstaande procedure te volgen.

Meerdere bestanden sourcen die opgeslagen zijn op een FTP-server

Deze methode bestaat erin dat het platform wordt verbonden met de map van een FTP-server om alle bestanden op te halen die opgeslagen zijn in deze map.

Opgelet

Alle bestanden in de map moeten hetzelfde formaat en schema hebben (bijv. CSV-bestanden met dezelfde kolomtitels). Bestanden mogen ook niet in submappen staan: wanneer een URL verwijst naar een map die een gecomprimeerd bestand bevat, zal de laatstgenoemde als dusdanig geïmporteerd worden in het platform - het zal niet worden unzipped.

  1. Klik in Catalogus > Datasets op de knop Nieuwe dataset.

  2. Klik op de knop Een bron toevoegen.

  3. Schrijf in het vakje Voer een URL in de URL van de FTP-server waar de bestanden zijn opgeslagen. De URL moet zowel de login als het wachtwoord naar de FTP bevatten (bijv. ftp://login:password@example.org/my_directory/my_dataset).

Opmerking

Ook FTPS-servers worden voor deze methode ondersteund (bijv. ftps://login:password@example.org/my_directory/my_dataset).

Belangrijk

Wanneer er wordt gesynchroniseerd vanuit een FTP-locatie op afstand, behoudt OpenDataSoft een persistente cache en snoeit het niet automatisch ontbrekende bestanden uit de directory op afstand. Gelieve contact op te nemen met het Support Team van OpenDataSoft indien u wil dat er een opkuis wordt uitgevoerd.