Définir un modèle de données

Chaque jeu de données respecte un modèle. La définition et la configuration totales d’un modèle de données signifie :

Processing tab when publishing a new dataset

Modifier un label

La plateforme OpenDataSoft récupère les labels de champ par défaut qui se trouvent dans le jeu de données source. Néanmoins, il est possible de modifier chaque label de champ de jeu de données.

Remarque

Nous vous recommandons fortement d’opter pour des labels explicites et bien écrits. Gardez également à l’esprit que, comme ces labels seront affichés dans la plateforme, il est préférable de choisir des labels simples plutôt que du jargon spécifique afin de faciliter la compréhension des données par un public plus large.

Pour modifier un label :

  1. Dans la zone d’aperçu de l’onglet Traitement, sélectionnez le label actuel du champ de votre choix.

  2. Saisissez un nouveau label. Les caractères spéciaux sont autorisés.

  3. Cliquez à l’extérieur de la zone du label ou appuyez sur Entrée pour que les modifications soient prises en compte.

Avertissement

La modification du label d’un champ ne modifie en aucune façon son identifiant technique qui se trouve dans le menu Configuration du jeu de données.

Ajouter une description à un champ

Des descriptions peuvent être ajoutées aux champs d’un jeu de données pour apporter davantage de contexte ou de précision.

Pour ajouter une description à un champ :

  1. Dans la zone d’aperçu de l’onglet Traitement, cliquez dans le champ de texte Description du champ de votre choix.

  2. Saisissez la description associée.

  3. Cliquez à l’extérieur du champ de texte Description pour que la description soit prise en compte.

Les descriptions de champ seront ensuite affichées dans la plateforme :

  • dans la section Schéma de données de l’onglet Informations du jeu de données,

  • dans l’infobulle de leurs champs associés, dans l’onglet Tableau.

Choisir un type de champ

Les champs sont caractérisés par des types. En fonction du type de champ choisi, la plateforme traitera et affichera les enregistrements d’une façon spécifique.

Pour choisir un type pour un champ :

  1. Dans la zone d’aperçu de l’onglet Traitement, cliquez dans la zone de liste de type de champ pour le champ de votre choix.

  2. Choisissez le type approprié pour ce champ.

8 types différents sont disponibles : date, datetime, décimal, entier, point géo, forme géo, texte et fichier.

Type Description
Date

Les valeurs du champ sont des dates. Le format ISO 8601, c’est-à-dire AAAA-mm-jj, est idéal. D’autres formats également pris en charge par la plateforme sont : AAAA/mm/jj ou jj/mm/AAAA.

Remarque

La plateforme va tenter de détecter le format de la date aussi précisément que possible. Cependant, si jamais la détection est fausse ou ambigüe, utilisez le processeur Normaliser une Date qui vous permet de définir le format à utiliser pour interpréter les valeurs du champ de date.

DateTime

Les valeurs du champ sont une date et une heure combinées. Le format ISO 8601, c’est-à-dire AAAA-mm-jjTHH:MM:ss+00:00, AAAA-mm-jjTHH:MM:ssZ ou AAAAmmjjTHHMMssZ,``est idéal. D'autres formats également pris en charge par la plateforme sont : ``AAAA-mm-jj-HH:MM:ss ou AAAA-mm-jj HH:MM:ss.

Remarque

La plateforme va tenter de détecter le format datetime aussi précisément que possible. Cependant, si jamais la détection est fausse ou ambigüe, utilisez le processeur Normaliser une Date qui vous permet de définir le format à utiliser pour interpréter les valeurs du champ datetime.

Remarque

Par défaut, les enregistrements d’heure sont définis sur le fuseau horaire UTC. Pour modifier le fuseau horaire, utilisez le processeur Définir le fuseau horaire.

Décimal

Les valeurs de champ sont des nombres décimaux. Les séparateurs valides pour la partie décimale sont : . ou ,.

Point géo

Les valeurs de champ sont un emplacement géographique simple, exprimé au format <LAT>,<LON>, par exemple 45.8,2.5.

Remarque

Si votre jeu de données comprend deux champs, l’un correspondant à la latitude, l’autre à la longitude, utilisez le processeur Créer un GeoPoint pour créer un champ de point géo valide.

Forme géo

Les valeurs de champ sont des formes géographiques exprimées en GeoJSON. Par exemple :

{"type": "LineString",
 "coordinates": [ [100.0, 0.0], [101.0, 1.0] ]}

Remarque

Les collections de caractéristiques ne sont pas prises en charge.

Entier

Les valeurs de champ sont des nombres entiers. S’il existe une partie non entière, la valeur est automatiquement transformée en sa valeur entière uniquement.

Texte

Les valeurs de champ sont des données textuelles.

Fichier

Les valeurs de champ sont des fichiers collectés à l’aide de l’une des méthodes disponibles pour créer un jeu de données avec des images (avec le processeur de fichiers, via un fichier d’archive ou avec un extracteur spécifique), ce qui permet d’obtenir un champ de type fichier par défaut. Ce type de champ est uniquement disponible dans ce cas.

Paramétrer des champs en tant que facettes

Les facettes définissent les filtres d’un jeu de données, qui s’affichent à gauche de la visualisation du jeu de données, dans la plateforme. Ces filtres peuvent être utilisés de diverses façons : ils permettent aux utilisateurs de rechercher des enregistrements précis, spécifiques dans un jeu de données, mais offrent également la possibilité de créer des graphes plus tard (si les enregistrements d’un champ ne sont pas des nombres, ils pourront être utilisés dans l’éditeur de graphes et dans la vue Analyse, uniquement s’ils sont paramétrés en tant que facettes).

Remarque

Les champs de type forme géo ou point géo ne peuvent pas être paramétrés en tant que facettes.

Pour paramétrer un champ en tant que facette :

  1. Dans la zone d’aperçu de l’onglet Traitement, choisissez le champ à paramétrer en tant que facette. Sélectionnez un champ suffisamment pertinent pour être utilisé comme filtre.

  2. Cliquez sur le bouton icon-facet.

Configurer des options de champ

  1. Dans la zone d’aperçu de l’onglet Traitement, cliquez sur le bouton icon-configuration du champ de votre choix.

  2. Les options de configuration varient en fonction du type de champ et de si le champ est paramétré en tant que facette ou non. Suivez les instructions qui correspondent à l’option de configuration choisie.

Options de configuration disponibles pour chaque champ

Option de configuration

Description

Nom

Identifiant technique du champ. Contrairement au label, l’identifiant technique n’a aucun but esthétique et ne peut donc contenir de caractères spéciaux, même des espaces. Les identifiants techniques peuvent par exemple être utilisés pour la création d’une infobulle personnalisée avec HTML.

Avertissement

La modification de l’identifiant technique d’un champ peut altérer les réutilisations du jeu de données associé (infobulle personnalisée, vue personnalisée ou pages). Cette opération peut également poser un problème si la source du jeu de données est (régulièrement) mise à jour : lorsque vous remplacez une source par une nouvelle, la plateforme vérifie l’identifiant technique des champs des deux sources, afin de trouver une correspondance entre les deux, puis remplace les anciennes données par les nouvelles. Si les identifiants techniques ne sont plus les mêmes, le jeu de données ne peut pas être mis à jour.

Pour modifier l’identifiant technique d’un champ :

  1. Sélectionnez l’identifiant technique actuel du champ, écrit dans la zone de texte sous “Nom”.

  2. Saisissez un nouvel identifiant technique. Les caractères spéciaux ne sont pas autorisés.

  3. Cliquez à l’extérieur du champ de texte ou appuyez sur Entrée pour que les modifications soient prises en compte.

ID unique

Chaque enregistrement est identifié de façon unique par son identifiant, qui est par défaut généré à partir de l’empreinte de toutes les valeurs des champs de l’enregistrement. Si l’option ID unique est activée pour un champ, les enregistrements avec le même identifiant (ou la même valeur) sont supprimés pour que seules les dernières valeurs et les valeurs les plus anciennes restent dans le jeu de données. Cette option est plus pertinente pour les jeux de données en temps réel, puisqu’elle permet de vous assurer que lors de chaque mise à jour du jeu de données, au lieu d’ajouter de nouveaux enregistrements, ce sont les nouvelles valeurs qui remplacent les anciennes.

Pour activer l’option ID unique d’un champ : cochez la case ID unique.

Options de configuration des champs date et datetime

Option de configuration

Description

Précision

Degré de précision du champ date ou datetime.

Pour définir un degré de précision :

  1. Cliquez sur la zone de liste Précision du champ de votre choix.

  2. Choisissez un degré de précision :

Pour les champs date :

  • année : seule l’année de la date est affichée dans le jeu de données,

  • mois : seuls le mois et l’année de la date sont affichés dans le jeu de données,

  • jour : la date complète (jour, mois et année) est affichée dans le jeu de données.

Pour les champs datetime :

  • heure

  • minute

En ce qui concerne la précision du datetime, le datetime complet (heure et minutes) est affiché dans le jeu de données. La différence se trouve dans la vue Analyse et dans l’éditeur de graphes, où le degré de précision est disponible pour configurer le graphe.

Options de configuration des champs décimaux et entiers

Option de configuration

Description

Unité

Unité du champ, à afficher avec la valeur décimale ou entière.

Pour définir une unité pour un champ :

  1. Cliquez sur la zone de liste Unité du champ de votre choix.

  2. Choisissez l’unité appropriée dans la liste.

Appliquer le nombre de décimales à afficher

Nombre de décimales choisi pour toutes les valeurs du champ.

Pour définir un nombre de décimales pour un champ :

  1. Cochez la case “Appliquer le nombre de décimales à afficher”.

  2. Dans la zone de texte ci-dessous, saisissez le nombre de décimales de votre choix ou utilisez les flèches pour le choisir.

Options de configuration des champs texte

Option de configuration

Description

Triable

Par défaut, seuls les champs numériques (décimal et entier) peuvent être triés. Cette option permet de trier les champs textuels. Quand vous vous trouvez dans la vue tableau du jeu de données dans la plateforme, vous avez alors la possibilité de trier les champs texte par ordre alphabétique.

Pour qu’un champ soit triable : cochez la case “Triable”.

Multivalué

Cette option est destinée aux enregistrements avec plusieurs valeurs, séparées par un même séparateur. Par exemple, France,UK,USA. Lorsqu’elles sont paramétrées en tant que facettes, chaque valeur d’enregistrement du champ s’affiche sous la forme d’une entrée distincte dans la section dédiée aux filtres. Lorsque vous cliquez sur l’une des entrées, toutes les autres entrées qui n’y sont pas associées (c’est-à-dire les entrées qui ne s’affichent jamais dans le même enregistrement dans le cadre d’une combinaison de plusieurs valeurs) disparaissent automatiquement. Seules les entrées associées restent en tant qu’entrées de filtre disponibles.

Pour activer l’option Multivalué :

  1. Cochez la case “Multivalué”.

  2. Dans la zone de texte ci-dessous, saisissez le séparateur entre les valeurs des enregistrements.

  3. Cliquez à l’extérieur du champ de texte ou appuyez sur Entrée pour que les modifications soient prises en compte.

Hiérarchique

Cette option est destinée aux enregistrements avec plusieurs valeurs, séparées par un même séparateur et qui ont une relation hiérarchique. Par exemple, France/Ile-de-France/Paris. Lorsqu’elle est paramétrée en tant que facette, la première valeur d’une combinaison avec plusieurs valeurs de chaque enregistrement s’affiche sous la forme d’une entrée distincte dans la section dédiée aux filtres. Lorsque vous cliquez sur une entrée, toutes les valeurs de deuxième niveau associées à cette entrée s’affichent, et ainsi de suite. Par exemple : après avoir cliqué sur l’entrée de filtre France, l’entrée de deuxième niveau Ile-de-France associée s’affiche. Après avoir cliqué sur Ile-de-France, l’entrée de troisième niveau Paris associée s’affiche.

Pour activer l’option Hiérarchique :

  1. Cochez la case “Hiérarchique”.

  2. Dans la zone de texte ci-dessous, saisissez le séparateur entre les valeurs des enregistrements.

  3. Cliquez à l’extérieur du champ de texte ou appuyez sur Entrée pour que les modifications soient prises en compte.

Options de configuration des facettes

Option de configuration

Description

Trier la facette par

Tri choisi pour les entrées de champ dans la section dédiée aux filtres de la plateforme.

Pour choisir un ordre de tri pour un champ avec des facettes :

  1. Cliquez sur la zone de liste “Trier la facette par” du champ de votre choix.

  2. Choisissez un ordre de tri :

  • Nombre de résultats décroissant : les entrées sont triées en allant de l’entrée avec le moins d’enregistrements à celle avec le plus d’enregistrements.

  • Nombre de résultats croissant : les entrées sont triées en allant de l’entrée avec le plus d’enregistrements à celle avec le moins d’enregistrements.

  • Valeur décroissante : les entrées sont triées par ordre alphabétique (A-Z).

  • Valeur croissante : les entrées sont triées dans l’ordre alphabétique inverse (Z-A).

Sélection multiple dans les filtres

Par défaut, après avoir cliqué sur une entrée de filtre, les autres disparaissent. L’option de sélection multiple permet de sélectionner plusieurs entrées de filtre.

Pour autoriser la sélection multiple dans les filtres : cochez la case “Sélection multiple dans les filtres”.

Trier les champs dans les jeux de données

Les champs de jeu de données peuvent être réordonnés dans leur jeu de données. Deux conséquences sont possibles :

  • Dans la section dédiée aux filtres du jeu de données, dans la plateforme. Modifier l’ordre des champs du jeu de données a également une incidence sur l’ordre des filtres. Le premier champ avec des facettes du jeu de données devient le premier filtre affiché, et ainsi de suite.

  • Si le jeu de données comprend des champs de forme géo. La vue Carte ne peut pas afficher plus d’une couche de formes géo ; la couche de forme géo par défaut doit donc être définie. Pour ce faire, le champ contenant les formes géo à afficher par défaut sur la carte doit être trié avant tous les autres champs de formes géo.

Pour réordonner un champ dans un jeu de données :

  1. Dans la zone d’aperçu de l’onglet Traitement, cliquez sur le bouton icon-order du champ à réordonner dans le jeu de données.

  2. Tout en cliquant sur le bouton Réordonner, faites glisser le champ vers son nouvel emplacement dans le jeu de données.

  3. Une fois que le champ se trouve à son nouvel emplacement, vous pouvez cesser de cliquer sur le bouton.

Supprimer des champs des jeux de données

Des champs de jeu de données peuvent être supprimés du jeu de données. Cela ne signifie pas que le champ est définitivement supprimé du jeu de données, mais qu’il est supprimé de la sortie. C’est pour cette raison que, une fois le jeu de données publié, le champ supprimé ne sera pas affiché dans les visualisations, et en cas d’exportation du jeu de données, le champ supprimé n’apparaîtra pas non plus.

Pour supprimer un champ d’un jeu de données : cliquez sur le bouton icon-delete du champ à supprimer du jeu de données.

Puisque les champs supprimés ne sont pas définitivement effacés du jeu de données, ils peuvent être restaurés à tout moment.

Pour restaurer un champ supprimé d’un jeu de données :

  1. Dans la zone d’aperçu de l’onglet Traitement, balayez vers la droite pour accéder aux derniers champs des jeux de données.

  2. Les champs supprimés du jeu de données s’affichent tout en bas du jeu de données : ils ressemblent à des colonnes grises et vides portant le nom de leurs identifiants techniques. Recherchez les champs que vous souhaitez restaurer.

  3. Cliquez sur le bouton icon-retrieve_discarded.