Een datasetschema definiëren

Elke dataset volgt een bepaald schema. Het volledig definiëren en configureren van een datasetschema betekent:

Processing tab when publishing a new dataset

Een label wijzigen

Het Opendatasoft-platform haalt de standaard veldlabels op die teruggevonden zijn in de source dataset. Het is evenwel mogelijk om elk label van een veld in een dataset te wijzigen.

Opmerking

We raden ten stelligste aan om duidelijk geformuleerde, expliciete labels te kiezen. Denk er ook aan dat deze labels weergegeven zullen worden in de front office voor alle gebruikers van het portaal. Het verdient dus misschien de voorkeur om eenvoudige labels te gebruiken in plaats van bedrijfsspecifieke termen om ervoor te zorgen dat de data begrepen kunnen worden door een breder publiek.

Om een label te wijzigen:

  1. Selecteer in de voorbeeldweergave in het tabblad Verwerken het huidige label van het veld van uw keuze.

  2. Voer een nieuw label in. Dit kan speciale karakters bevatten.

  3. Klik buiten het label of druk op Enter om de wijzigingen te registreren.

Opgelet

Wanneer u het label van een veld wijzigt, wordt er niets gewijzigd aan de technische identifier van dat veld, die kan worden teruggevonden in het configuratiemenu van de dataset.

Een beschrijving aan een veld toevoegen

Er kunnen beschrijvingen aan velden in een dataset worden toegevoegd om zo meer context of meer verduidelijking te verschaffen.

Om een beschrijving aan een veld toe te voegen:

  1. Klik in de voorbeeldweergave van het tabblad Verwerken op het tekstvak Beschrijving van het veld van uw keuze.

  2. Voer de aanverwante beschrijving in.

  3. Klik buiten het tekstvak Beschrijving om de beschrijving te registreren.

Beschrijvingen van velden zullen vervolgens worden weergegeven in de front office:

  • in de rubriek Dataschema van het tabblad Informatie van de dataset

  • in de tooltip van de aanverwante velden, in het tabblad Tabel

Een type veld kiezen

Velden worden gekenmerkt door types. Afhankelijk van het gekozen veldtype, zal het platform records op een specifieke manier verwerken en weergeven.

Om een type voor een veld te kiezen:

  1. Kiik in de voorbeeldweergave van het tabblad Verwerken op de keuzelijst met veldtypes van het veld van uw keuze.

  2. Kies het juiste type voor dit veld.

Er zijn 8 verschillende types: datum, datum/tijd, decimaal, geheel getal, geopoint, geoshape, tekst en bestand.

Type

Omschrijving

Datum

De veldwaarden zijn datums. Het ideale formaat is het ISO 8601-formaat, zijnde YYYY-mm-dd. Er worden ook andere formaten begrepen door het platform, zoals YYYY/mm/dd of dd/mm/YYYY.

Opmerking

Het platform zal proberen het formaat van de inputdata zo nauwkeurig mogelijk te raden. In geval het verkeerde formaat wordt gedetecteerd of in geval van dubbelzinnigheid, gebruik dan het document Normalize Date processor om het parsing-formaat van het datumveld te definiëren.

DatumTijd

Veldwaarden zijn een combinatie van een datum en een tijdstip. Het ideale formaat is het ISO 8601-formaat, zijnde YYYY-mm-ddTHH:MM:ss+00:00, YYYY-mm-ddTHH:MM:ssZ of YYYYmmddTHHMMssZ. Er worden ook andere formaten door het platform begrepen, zoals YYYY-mm-dd-HH:MM:ss of YYYY-mm-dd HH:MM:ss.

Opmerking

Het platform zal proberen het ingevoerde datum/tijd-formaat zo nauwkeurig mogelijk te raden. In geval het verkeerde formaat wordt gedetecteerd of in geval van dubbelzinnigheid, gebruik dan het document Normalize Date processor om het parsing-formaat van het datum/tijd-veld te definiëren.

Opmerking

Standaard zijn de tijdstiprecords in de UTC tijdzone. Om de tijdzone te wijzen, gebruik het Set Timezone processor.

Decimaal

Veldwaarden zijn decimale getallen. Geldige scheidingstekens voor het decimale gedeelte zijn "." of ",".

Geopoint

Veldwaarden zijn een enkelvoudige geografische locatie, uitgedrukt in het formaat <LAT>,<LON>, bijvoorbeeld 45.8,2.5.

Opmerking

Wanneer uw dataset twee velden, lengtegraad en breedtegraad, omvat, gebruik dan het Create GeoPoint processor om een geldig geopoint-veld aan te maken.

Geoshape

Veldwaarden zijn geografische vormen, uitgedrukt in GeoJSON. Bijvoorbeeld:

{"type": "LineString",
 "coordinates": [ [100.0, 0.0], [101.0, 1.0] ]}

Opmerking

Functieverzamelingen worden niet ondersteund.

Geheel getal

Veldwaarden zijn volledige getallen. Wanneer een vlottende puntwaarde wordt teruggevonden, wordt deze automatisch gekoppeld aan zijn volledig getalgedeelte.

Tekst

Veldwaarden zijn tekstgegevens.

Bestand

Veldwaarden zijn bestanden die opgehaald worden met een van de beschikbare methodes om een dataset met mediabestanden aan te maken (met de File-processor, via een archiefbestand of met een specifieke extractor), het aanmaken van een veld met standaard type is bestand. In dat geval is enkel dit veldtype beschikbaar.

Velden instellen als facetten

Facetten definiëren de filters van een dataset die in de front office links van de weergave van de dataset worden weergegeven. Deze filters hebben verschillende doeleinden: ze stellen gebruikers in staat om specifieke, nauwkeurige records in een dataset terug te vinden, maar ze bieden ook de mogelijkheid om daarna grafieken aan te maken (wanneer de records in een veld geen getallen zijn, zullen ze gebruikt kunnen worden in de Chart Builder en in de weergave Analyse, maar enkel wanneer ze ingesteld zijn als facetten).

Opmerking

Velden met als type ofwel geoshape of geopoint kunnen niet worden ingesteld worden als facetten.

Om een veld in te stellen als een facet:

  1. Kies in de voorbeeldweergave van het tabblad Verwerken het veld dat u wilt instellen als een facet. Kies een veld dat voldoende relevant is om ingesteld te worden als filter.

  2. Klik op de knop icon-facet.

Veldopties configureren

  1. Klik in de voorbeeldweergave van het tabblad Verwerken op de knop icon-configuration van het veld van uw keuze.

  2. Configuratieopties wijzigen afhankelijk van het type veld en van het feit of het veld al dan niet is ingesteld als facet. Volg de juiste instructies afhankelijk van de gekozen configuratieoptie.

Er zijn configuratieopties beschikbaar voor elk veld

Configuratieoptie

Omschrijving

Naam

Technische identifier van het veld. In tegenstelling tot het label, heeft de technische identifier geen esthetische doeleinden en bevat hij bijgevolg geen speciale karakters, waaronder spaties. Technische identifiers kunnen bijvoorbeeld gebruikt worden om een custom tooltip met HTML aan te maken.

Waarschuwing

Het wijzigen van de technische identifier kan het hergebruik van de aanverwante dataset verstoren (custom tooltip, custom tab of pagina's). Het zou ook een probleem kunnen vormen wanneer de bron van de dataset (regelmatig) wordt geüpdatet: wanneer een bron wordt vervangen door een nieuwere controleert het platform de technische identifier van de velden van beide bronnen om een match te vinden tussen de twee. Vervolgens worden de oude data vervangen door de nieuwe. Wanneer technische identifiers niet meer dezelfde zijn, kan de dataset niet worden geüpdatet.

Om de technische identifier van een veld te wijzigen:

  1. Selecteer de huidige technische identifier van het veld die terug te vinden in het tekstvak onder "Naam".

  2. Voer een nieuwe technische identifier in. Deze mag geen speciale karakters bevatten.

  3. Klik buiten het tekstvak of druk op Enter om de wijziging te registreren.

Uniek ID

Elk record wordt op unieke wijze geïdentificeerd door zijn identifier, die standaard ingesteld wordt als de vingerafdruk van alle veldwaarden van het record. Wanneer de Unieke ID-optie geactiveerd is voor een veld, worden records met dezelfde identifier (of waarde) verwijderd worden, maar enkel voor de laatste/oudste die in de dataset blijft staan. Dit is vooral nuttig voor real-time datasets om ervoor te zorgen dat nieuwe waarden de oude vervangen in plaats van telkens nieuwe records worden toegevoegd wanneer de dataset wordt geüpdatet.

Om de Unieke ID-optie van een veld te activeren: vink het Unieke ID-vakje aan.

Configuratieopties voor datum & datum/tijd-velden

Configuratieoptie

Omschrijving

Verduidelijking

Mate van duidelijkheid van het datum- of datum/tijd-veld

Om een mate van duidelijkheid te definiëren:

  1. Klik op het keuzelijst Verduidelijking van het veld van uw keuze.

  2. Kies een mate van duidelijkheid:

Voor datumvelden:

  • jaar: enkel het jaar van de datum wordt weergegeven in de dataset

  • maand: enkel de maand en het jaar van de datum worden weergegeven in de dataset

  • dag: de volledige datum (dag, maand en jaar) wordt weergegeven in de dataset

Voor datum/tijd-velden:

  • uur

  • minuut

Voor de datum/tijd-verduidelijkingen wordt de volledige datum/tijd (uur en minuten) weergegeven in de dataset. Het verschil zit hem in de weergave Analyse en in de Chart Builder waar de mate van duidelijkheid beschikbaar is om deze grafiek te configureren.

Configuratieopties voor decimalen- & geheel getal-velden

Configuratieoptie

Omschrijving

Eenheid

Eenheid van het veld om samen met de decimaal- of geheel getalwaarde weer te geven.

Om een eenheid van een veld te definiëren:

  1. Klik op het keuzelijst Eenheid van het veld van uw keuze.

  2. Kies de juiste eenheid uit de lijst.

Voer het aantal decimalen in dat moet worden weergegeven

Kies het aantal decimalen voor alle velden van het veld.

Om een aantal decimalen voor een veld te definiëren:

  1. Vink het vakje "Het aantal decimalen dat moet worden weergegeven, invoeren".

  2. Voer in het onderstaande tekstveld het aantal decimalen van uw keuze in of gebruik de pijltoetsen hiervoor.

Configuratieopties voor tekstvelden

Configuratieoptie

Omschrijving

Sorteerbaar

Standaard kunnen enkel numerieke velden (decimalen en gehele getallen) worden gesorteerd. Met deze optie wordt het sorteren op tekstvelden geactiveerd. Zo is het mogelijk om in een Tabelweergave van de dataset in de front office tekstvelden in alfabetische volgorde te sorteren.

Om ervoor te zorgen dat een veld kan worden gesorteerd: Vink het vakje "Sorteerbaar" aan.

Meerdere waarden

Deze optie is er voor records met meerdere waarden die gescheiden worden door eenzelfde scheidingsteken. Bijvoorbeeld: "Frankrijk, VK, VS". Wanneer deze ingesteld worden als een facet verschijnen de recordwaarden van elk van de velden als een afzonderlijke entry in de filterssectie. Wanneer een van de entries wordt aangeklikt, verdwijnen alle andere entries die er geen verband mee houden (m.a.w. de entries die nooit in hetzelfde record verschijnen als onderdeel van een combinatie van meerdere waarden) automatisch en blijven enkel de aanverwante entries staan als beschikbaar filterentries.

Om de optie met meerdere waarden te activeren:

  1. Vink het vakje "Meerdere waarden" aan.

  2. Voer in het onderstaande tekstvak het scheidingsteken tussen de waarden van de records in.

  3. Klik buiten het tekstvak of druk op Enter om de wijziging te registreren.

Hiërarchisch

Deze optie is er voor records met meerdere waarden die gescheiden worden door eenzelfde scheidingsteken en die een hiërarchische relatie hebben. Voorbeeld: "Frankrijk/Ile-de-France/Parijs". Wanneer deze is ingesteld als een facet, verschijnt elke eerste waarde van de combinatie met meerdere waarden van elk record als een afzonderlijke entry in de filterssectie. Wanneer één entry wordt aangeklikt, verschijnen alle waarden van het tweede niveau die verband houden met die entry, enzovoort. Voorbeeld: Na op de filterentry "Frankrijk" te hebben geklikt, verschijnt de aanverwante entry van het tweede niveau "Ile-de-France". Na op "Ile-de-France" te hebben geklikt, verschijnt de aanverwante entry van het derde niveau "Parijs".

Om deze hiërarchische optie te activeren:

  1. Vink het vakje "Hiërarchisch" aan.

  2. Voer in het onderstaande tekstvak het scheidingsteken tussen de waarden van de records in.

  3. Klik buiten het tekstvak of druk op Enter om de wijziging te registreren.

Configuratieopties voor facetten

Configuratieoptie

Omschrijving

Sorteer facet per

Gekozen sortering van de entries van het veld in de filterssectie van de front office.

Om een sorteervolgorde voor een gefacetteerd veld te kiezen:

  1. Klik op de keuzelijst "Sorteer facet per" in het veld van uw keuze.

  2. Kies een sorteervolgorde:

  • Tellen van items (in dalende volgorde): entries worden gerangschikt in volgorde van diegene met het minst aantal rechts tot diegene met het meest aantal records

  • Tellen van items (in stijgende volgorde): entries worden gerangschikt in volgorde van diegene met het meest aantal records tot diegene met het minst aantal records

  • Naam (in dalende volgorde): entries worden in alfabetische volgorde gerangschikt

  • Naam (in stijgende volgorde): entries worden in omgekeerd alfabetische volgorde gerangschikt

Meervoudige selectie in filters mogelijk maken

Standaard, wanneer op een filterentry wordt geklikt, verdwijnen de andere. Met de optie "Meervoudige selectie", is het mogelijk om verschillende filterentries te selecteren.

Om een meervoudige selectie in filters mogelijk te maken: vink het vakje "Meervoudige selectie in filters mogelijk maken" aan.

Velden in datasets rangschikken

Velden van datasets kunnen opnieuw gerangschikt worden in hun dataset. Dit kan 2 soorten gevolgen hebben:

  • In de filterssectie van de dataset, in de front office. Wanneer de volgorde van de velden in de dataset wordt gewijzigd, wordt ook de volgorde van de filters gewijzigd. Het eerst gefacetteerde veld van de dataset wordt de eerst weergegeven filter, enzovoort.

  • Wanneer de dataset geoshape-velden bevat. De kaartweergave kan niet meer dan één laag van geoshapes weergeven. Dit houdt in dat de laag met geoshapes die standaard wordt weergegeven, gedefinieerd moet worden. Om dit te doen moet het veld dat de geoshapes bevat die standaard moeten worden weergegeven, gerangschikt moet worden vóór alle andere geoshapes-velden.

Om een veld in een dataset opnieuw te rangschikken:

  1. Klik in de voorbeeldweergave van het tabblad Verwerken op de knop icon-order van het veld dat u opnieuw in de dataset wilt rangschikken.

  2. Terwijl u de muisknop ingedrukt houdt op de knop "Opnieuw rangschikken", sleept u het veld naar zijn nieuwe positie in de dataset.

  3. Eenmaal het veld zich op zijn nieuwe positie in de dataset bevindt, kunt u de muisknop loslaten.

Velden uit datasets verwijderen

Velden van een dataset kunnen uit de dataset worden verwijderd. Dit betekent niet dat het veld volledig uit de dataset wordt verwijderd, maar enkel verwijderd wordt uit de output. Dit is de reden waarom het verwijderde veld niet meer zal worden weergegeven in een weergave eenmaal de dataset wordt gepubliceerd en dat, wanneer de dataset wordt geëxporteerd, het verwijderde veld niet in de export zal zitten.

Om een veld uit een dataset te verwijderen: klik op de knop icon-delete van het veld dat u uit de dataset wilt verwijderen.

Aangezien verwijderde velden niet volledig uit de dataset worden verwijderd, kunnen ze te allen tijde worden hersteld.

Om een verwijderd veld uit een dataset te herstellen:

  1. Swipe in de voorbeeldweergave van het tabblad Verwerken naar rechts om naar de laatste velden van de datasets te gaan.

  2. De verwijderde velden van de dataset verschijnen helemaal op het einde van de dataset. Ze zien eruit als blanco, grijze kolommen die de naam hebben gekregen van hun technische identifiers. Hier kunt u diegene terugvinden die u wilt herstellen.

  3. Klik op de knop icon-retrieve_discarded.