Recolectar un catálogo

Los recolectores permiten a los administradores crear y actualizar fácilmente un número importante de conjuntos de datos importándolos de un origen externo como un catálogo CSW o un servicio ArcGIS, entre muchos otros.

Los 2 usos principales de los recolectores son:

  1. Efectuar un arranque del portal con conjuntos de datos de un portal ya existente

  2. Mantener los conjuntos de datos sincronizados con un servicio externo

El recolector creará los conjuntos de datos, actualizará sus metadatos y recursos, los mantendrá sincronizados y los publicará.

Crear un recolector

Para empezar a trabajar con los recolectores, haga clic en el menú Recolectores del back office y, acto seguido, en Añadir recolector. Se le pedirá que elija el tipo de portal que desea recolectar y un nombre para el recolector.

Cuando haya terminado, haga clic en Crear recolector y se le redirigirá al formulario de configuración del recolector. Como varía según el tipo de recolector, consulte las instrucciones detalladas en la página de cada uno de los recolectores.

Algunas opciones están disponibles para todos los tipos de recolectores, como las siguientes:

  • Actualizar al suprimir: Si los conjuntos de datos de origen se suprimen en el portal recolectado, suprimirlos también en este portal OpenDataSoft. De lo contrario, usted puede tener conjuntos de datos que ya no estén disponibles en el servicio externo (p. ej. al suprimirse del servicio externo).

  • Descargar recursos: Descargar los recursos en lugar de asociarlos mediante la dirección URL. Esta opción permite desasociar los conjuntos de datos del portal remoto copiando de forma permanente todos los datos necesarios en la plataforma OpenDataSoft. De lo contrario, los conjuntos de datos estarán vinculados al servicio externo y se accederá a los conjuntos de datos remotos a través de la dirección URL en cada una de las publicaciones.

  • Restringir visibilidad: Establecer la visibilidad de los conjuntos de datos recolectados como restringida. De lo contrario, tendrán la visibilidad predeterminada del portal.

  • Metadatos predeterminados, Metadatos Inspire, Metadatos DCAT: Permiten sobrescribir algunos metadatos en todos los conjuntos de datos recolectados. Esta opción resulta de utilidad si se desea forzar el tema o publicador en lugar de utilizar el del servicio externo.

Cuando haya terminado de configurar el recolector, puede hacer clic en el botón Vista previa para llevar a cabo una ejecución de prueba en algunos conjuntos de datos. Si observa títulos y descripciones con una apariencia correcta, ya ha completado la tarea. De lo contrario, revise la configuración.

Ejecutar un recolector

El proceso de recolección puede ser bastante largo en servicios externos con conjuntos de datos numerosos o voluminosos, por lo que se ha dividido en 2 fases.

  • En primer lugar, el recolector conectará con el servicio remoto y descubrirá todos los conjuntos de datos que contiene. A continuación, creará un conjunto de datos con publicación cancelada para cada uno de los conjuntos de datos remotos que encuentre. Estos conjuntos de datos contendrán todos los metadatos y recursos disponibles (como direcciones URL o archivos, según la opción Descargar recursos). Esto sucede al hacer clic en el botón Iniciar recolector.

  • Después procesará y publicará todos los conjuntos de datos recolectados. Este paso puede tardar bastante tiempo. Esto sucede al hacer clic en el botón Publicar.

Editar conjuntos de datos recolectados

Antes de publicarlos, puede cambiar los metadatos de los conjuntos de datos recolectados. En la página de conjunto de datos (ficha de información), puede sobrescribir manualmente los metadatos haciendo clic en Sobrescribir y añadiendo su propio valor. El valor sobrescrito se mantiene incluso si se reinicia el recolector.

Suprimir un recolector

Al suprimir un recolector haciendo clic en el botón Suprimir recolector, puede elegir entre conservar los conjuntos de datos recolectados (se conservarán como conjuntos de datos normales del catálogo) o suprimirlos con el recolector.

Si decide conservarlos, tenga en cuenta que deberá manejarlos de forma individual si más tarde desea cancelar su publicación o suprimirlos, y que se duplicarán si vuelve a crear otro recolector en el mismo servicio externo.

Tipos de recolector

Servicios

Nota

A menos que se estipule lo contrario, todos los recolectores utilizan HTTPS de forma predeterminada, pero admiten HTTP si así se especifica en la dirección URL.

El recolector de FTP utiliza FTPS (modo explícito en el puerto 201) de forma predeterminada pero admite FTP si así se especifica en la dirección de URL o si el servidor remoto no admite FTPS.

Planificación

En la página de configuración de un recolector, se puede establecer que este se ejecute periódicamente. Para ello, desplácese a la parte inferior de la página y haga clic en "Establecer ejecuciones recurrentes". Puede ejecutar el recolector todos los días o elegir qué días de la semana o mes se ejecutará. Sin embargo, siempre debe elegir la hora del día en que se ejecutará porque solo se admite una ejecución al día.

La ejecución periódica tan solo se desencadenará si el recolector se ha ejecutado como mínimo una vez.

Al final de una ejecución planificada, se habrán vuelto a publicar los conjuntos de datos ya publicados de todos los recolectores, aunque no se habrán publicado automáticamente los conjuntos de datos con la publicación cancelada o los conjuntos de datos nuevos.