Création d'un jeu de données avec plusieurs fichiers

Vous pouvez ajouter plusieurs fichiers à un jeu de données des façons suivantes :

  • ajouter les fichiers un par un,

  • ajouter plusieurs fichiers en même temps via un fichier d'archive,

  • ou ajouter plusieurs fichiers via un serveur FTP.

Collecte de fichiers un par un

Cette méthode consiste à ajouter les fichiers un par un à la plateforme, de façon à créer autant de sources que le nombre de fichiers ajoutés. Dans cette situation, étant donné qu'une source différente est créée pour chaque fichier ajouté, ceux-ci peuvent être de divers formats.

Pour plus d'informations, consultez Formats pris en charge.

Important

Lorsque vous chargez les fichiers un par un, le premier fichier ajouté détermine le schéma des données.

Si les fichiers suivants contiennent des champs qui ne correspondent pas à ceux du premier fichier, ces derniers seront ignorés par la plateforme.

  1. Créez un jeu de données en utilisant votre premier fichier en tant que source .

  2. Dans l'onglet Sources du jeu de données, cliquez sur le bouton Ajouter une source.

  3. Ajoutez le fichier suivant.

Avertissement

Attention, lorsque vous supprimez des fichiers dans un jeu de données créé à partir de plusieurs fichiers, notamment ceux ayant différents schémas de données : si le premier fichier est supprimé, alors le jeu de données paraîtra entièrement vide.

Collecte de plusieurs fichiers dans une archive

Cette méthode consiste à ajouter plusieurs fichiers en même temps via un fichier d'archive, de façon à créer une source unique pour tous les fichiers ajoutés. Dans cette situation, étant donné qu'une seule source est créée pour l'ensemble des fichiers, ceux-ci doivent tous avoir le même format.

Pour plus d'informations, consultez Formats pris en charge.

Important

Avec cette méthode, la plateforme choisit le fichier possédant la date de modification la plus ancienne pour déterminer le schéma de données.

  1. Créez un fichier d'archive avec les fichiers à ajouter au même jeu de données.

  2. Dans Catalogue > Jeux de données, cliquez sur le bouton Nouveau jeu de données.

  3. Ajoutez le fichier d'archive en tant que source en utilisant l'une des 3 méthodes disponibles sous la section Récupérer un fichier. Pour plus d'informations, consultez Récupérer un fichier à partir de votre ordinateur, d'une URL ou d'un serveur FTP.

  4. Configurez la source dans l'aperçu des 20 premiers enregistrements qui s'affiche.

  5. Configurez les informations du jeu de données ou utilisez les valeurs préremplies.

Collecte de plusieurs fichiers stockés sur un serveur FTP

Cette méthode consiste à connecter la plateforme au répertoire d'un serveur FTP pour récupérer tous les fichiers de ce répertoire.

Avertissement

Tous les fichiers du répertoire doivent avoir le même format et le même schéma (par exemple, des fichiers CSV avec des titres de colonnes identiques). En outre, les fichiers ne doivent pas se trouver dans des sous-répertoires : si l'URL pointe vers un répertoire contenant un fichier compressé, ce dernier est importé tel quel (non décompressé) dans la plateforme.

  1. Dans Catalogue > Jeux de données, cliquez sur le bouton Nouveau jeu de données.

  2. Sélectionnez À partir d'un serveur FTP dans l'assistant qui s'ouvre, sous la section Récupérer un fichier.

  3. Configurez votre connexion FTP.

    • Les serveurs FTPS sont pris en charge pour cette méthode (par exemple, ftps://login:password@example.org/my_directory/my_dataset).

    • Lors de la synchronisation depuis un emplacement FTP distant, Opendatasoft conserve un cache persistant et ne nettoie pas automatiquement les fichiers absents du répertoire distant. Pour tout besoin de nettoyage, cliquez sur "Nettoyer le cache" à droite de la ressource.

  4. Configurez la source dans l'aperçu des 20 premiers enregistrements qui s'affiche.

  5. Configurez les informations du jeu de données ou utilisez les valeurs préremplies.