Processors aan een dataset toevoegen

Processors zijn tools die gebruikt kunnen worden om de data van een dataset te wijzigen, te verbeteren of te verrijken. In het Opendatasoft-platform worden processors ondergebracht in 4 verschillende categorieën:

  • Processors voor geografische mapping

  • Processors voor gegevensverwerking

  • Processors voor teksttransformaties

  • Processors voor generische operaties

Om een processor aan een dataset toe te voegen:

  1. Klik in het tabblad Verwerken op de knop Een processor toevoegen

  2. Kies de processor die aan de dataset moet worden toegevoegd.

  3. Vul met behulp van de documentatie van de gekozen processor, de juiste parameters in om de processor in te stellen.

Opmerking

Eenmaal de parameters zijn geconfigureerd, kunt u buiten het processorvakje klikken om ervoor te zorgen dat de processor en de wijzigingen die deze veroorzaakt, worden geregistreerd en toegepast op de dataset.

Opmerking

Gebruik altijd de technische identifiers van de velden die moeten worden verwerkt en nooit de labels, ongeacht de processor.

Geografische processoren

Geografische processors worden onderverdeeld in 4 categorieën, afhankelijk van wat geprobeerd wordt te realiseren:

  • Geocoders: om een adres dat door mensen kan worden gelezen, om te zetten naar een geopoint. Er zijn 10 geocoders.

  • GeoJoin processor: om geoshapes uit genormaliseerde codes voor landenspecifieke administratieve afdelingen terug te vinden. De GeoJoin-processor ondersteunt verschillende landen, die elk afzonderlijke indexatiecodes heeft, zoals postcode, staat of regio identifier, enz.

  • Retrieve Administrative Divisions processor: om de naam, code en geografische vorm op te halen van landenspecifieke afdelingen die een geografisch punt omvatten.

  • Converters and functions: om geografische gegevens te vereenvoudigen, te converteren of te normaliseren of om berekeningen uit te voeren die erop gebaseerd zijn. Binnen deze categorie zijn er 7 processors.

Geocoders

Naam

Omschrijving

Beschikbaarheid

Geocode with BAN

Geocode-adressen in Frankrijk door de Base d'Adresses Nationale (BAN) service te gebruiken

Standaard

Geocode with Google

Volledige tekstadressen van geocodes door gebruiken van de Google Geocoding API

Op verzoek

Geocode with ArcGIS

Volledige tekstadressen van geocodes door gebruik te maken van ArcGIS Geocoding API

Standaard

Geocode with PDOK

Geocode-adressen in Nederland door gebruik te maken van de PDOK service

Op verzoek

Country code to geo coordinates

Genereren een geografische coördinaat met de ISO-code van een land

Standaard

INSEE code to geo coordinates

Genereert een geografische coördinaat met een Franse INSEE-code

Standaard

IP address to geo coordinates

Geeft een geografische code van een IP-adres

Standaard

Zip code to geo coordinates

Genereert een geografische coördinaat met een Franse postcode

Standaard

what3words

Genereert een adres in drie woorden met geografische coördinaten

Op verzoek

Geo coordinates from a 3 word address

Zet een adres met 3 woorden om in geografische coördinaten

Op verzoek

De GeoJoin-processor

Naam

Omschrijving

Beschikbaarheid

Geojoin

Haalt geografische vormen van administratieve afdelingen op voor een welbepaald land en referentie

Standaard

De Retrieve Administrative Divisions Processor

Naam

Omschrijving

Beschikbaarheid

Retrieve administrative divisions

Haalt informatie van administratieve afdelingen op met een geografisch punt

Standaard

Converters en functies

Naam

Omschrijving

Beschikbaarheid

Convert degrees

Zet een coördinaat in graden, minuten, seconden om naar WGS84-coördinaten

Standaard

Normalize projection reference

Vervangt een geografisch punt met zijn WGS84-tegenhanger

Standaard

WKT and WKB to GeoJSON

Zet een vector geometrie voorwerp dat weergegeven wordt in WKT of WKB om in een GeoJson-voorwerp

Op verzoek

Simplify geo shape

Vereenvoudigt een geografische vorm om de verwerkingstijd en de omvang van de dataset te verkleinen

Standaard

Geomasking

Biedt privacybescherming door een geografische locatie binnen een specifieke straal te benaderen

Standaard

Geo distance

Berekent de afstand tussen 2 coördinaten

Standaard

Create geo point

Maakt een veld "geografisch punt" aan op basis van een veld "lengtegraad" en van een veld "breedtegraad"

Standaard

Datumverwerkers

Naam

Omschrijving

Beschikbaarheid

Normalize date

Normaliseert een datumformaat dat niet automatisch begrepen wordt door het platform

Standaard

Set timezone

Definieert een tijdzone voor een datum/tijd-veld

Standaard

Tekstverwerkers

Naam

Omschrijving

Beschikbaarheid

Concatenate text

Voegt 2 velden samen

Standaard

Decode HTML entities

Decodeert HTML-entiteiten uit een tekst om deze om te zetten naar geldige HTML.

Standaard

Extract HTML

Extraheert HTML uit een HTML-tag om enkel de tekstuele context te behouden

Standaard

Extract text

Extraheert een deel van een veldwaarde met behulp van een regelmatige uitdrukking

Standaard

Extract URLs

Extraheert URL's uit HTML of tekstinhoud

Standaard

Normalize unicode values

Normaliseer Unicode-content door gebruik te maken van de Normalization Form Canonical Composition (NFC)

Standaard

Normalize URL

Normaliseert een veldwaarde om een geldige URL te bekomen

Standaard

Replace text

Vervangt een tekstueel veld door een gekozen tekst

Standaard

Replace via Regexp

Vervangt een verwijderd deel van een veldwaarde met behulp van een regelmatige uitdrukking

Standaard

Split text

Splitst een veldwaarde en extraheert een deel ervan in een nieuw veld

Standaard

Generische processoren

Naam

Omschrijving

Beschikbaarheid

Add a field

Voegt een nieuw leeg veld toe in een dataset

Standaard

Copy a field

Kopieert een veldwaarde vanuit een veld naar een ander veld

Standaard

Delete record by ID

Verwijdert een bestaand record op basis van zijn uniek ID uit een dataset

Standaard

Expand from JSON array

Zet rijen die een JSON-array bevatten om in verschillende rijen

Standaard

Expression

Schrijft complexe uitdrukkingspatronen met behulp van veldwaarden

Standaard

Extract bit range

Extraheert een arbitrair bit-bereik uit een hexadecimale of binaire inhoud

Op verzoek

Extract from JSON

Extraheert waarden uit een veld dat een JSON-voorwerp bevat

Standaard

File

Haalt afbeeldingen uit URL's

Standaard

Join dataset

Voegt 2 datasets samen om een welbepaald veld in een dataset terug te vinden

Standaard

JSON array to multivalued

Extraheert meerdere waarden uit een JSON-array en voegt deze samen in een veld met meerdere waarden

Standaard

Skip records

Slaat records uit een dataset over

Standaard

Transform boolean columns to multivalues fields

Zet ware waarden uit boolean velden om in een veld met meerdere waarden

Standaard

Transpose fields

Transformeert labels in veldwaarden

Standaard