Añadir procesadores a un conjunto de datos

Los procesadores son herramientas que pueden emplearse para modificar, mejorar o enriquecer los datos de un conjunto de datos. En la plataforma OpenDataSoft, los procesadores se clasifican en 4 categorías distintas:

  • Procesadores para los mapas geográficos

  • Procesadores para la gestión de fechas

  • Procesadores para las transformaciones de texto

  • Procesadores para las operaciones genéricas

Para añadir un procesador a un conjunto de datos:

  1. En la ficha Procesadores, haga clic en el botón Añadir un procesador.

  2. Elija el procesador que desea añadir al conjunto de datos.

  3. Con la documentación del procesador seleccionado, especifique los parámetros adecuados para establecer el procesador.

Nota

Tal vez tenga que hacer clic fuera del cuadro del procesador una vez configurados los parámetros para asegurarse de que el procesador y los cambios que desencadena se tienen en cuenta y se aplican al conjunto de datos.

Nota

Independientemente del procesador, utilice siempre los identificadores técnicos de los campos de proceso, nunca las etiquetas.

Procesadores geográficos

Los procesadores geográficos se dividen en 4 categorías en función de lo que se desea obtener:

  • Geocodificadores: Para convertir una dirección natural en un punto geográfico. Hay 10 geocodificadores.

  • Procesador GeoJoin: Para recuperar las formas geográficas de los códigos normalizados de las divisiones administrativas específicas de país. El procesador GeoJoin admite varios países, cada uno de ellos con varios códigos de indexación como código postal, identificador de estado o región, etc.

  • Procesador Recuperar divisiones administrativas: Para recuperar el nombre, el código y la forma geográfica de las divisiones administrativas específicas de país en que se encuentra un punto geográfico.

  • Convertidores y funciones: Para simplificar, convertir o normalizar datos geográficos, o ejecutar cálculos a partir de ellos. En esta categoría hay 7 procesadores.

Geocodificadores

Nombre

Descripción

Disponibilidad

Geocodificar con BAN

Geocodificar las direcciones de Francia a través del servicio BAN (Base d'Adresses Nationale)

Valor predeterminado

Geocodificar con Google

Geocodificar las direcciones de texto completo mediante la API de geocodificación de Google

Bajo demanda

Geocodificar con ArcGIS

Geocodificar las direcciones de texto completo mediante la API de geocodificación de ArcGIS

Valor predeterminado

Geocodificar con PDOK

Geocodificar las direcciones de los Países Bajos mediante el servicio PDOK

Bajo demanda

Código de país a geocoordenadas

Producir una geocoordenada con un código de país ISO

Valor predeterminado

Código INSEE a geocoordenadas

Producir una geocoordenada con un código INSEE francés

Valor predeterminado

Dirección IP a geocoordenadas

Geocodificar una dirección IP

Valor predeterminado

Código postal a geocoordenadas

Producir una geocoordenada con un código postal francés

Valor predeterminado

what3words

Producir una dirección de 3 palabras con coordenadas geográficas

Bajo demanda

Obtener coordenadas a partir de una dirección de 3 palabras

Convertir una dirección de 3 palabras en coordenadas geográficas

Bajo demanda

Procesador GeoJoin

Nombre

Descripción

Disponibilidad

Geojoin

Recuperar las formas geográficas de las divisiones administrativas para un país específico y referente

Valor predeterminado

Procesador Recuperar divisiones administrativas

Nombre

Descripción

Disponibilidad

Recuperar divisiones administrativas

Recuperar la información de las divisiones administrativas con un punto geográfico

Valor predeterminado

Convertidores y funciones

Nombre

Descripción

Disponibilidad

Convertir grados

Convertir una geocoordenada de grados, minutos y segundos en coordenadas WGS84

Valor predeterminado

Normalizar referencia de proyección

Sustituir un punto geográfico por su representación WGS84

Valor predeterminado

WKT y WKB en GeoJSON

Convertir un objeto de geometría vectorial representado con el formato WKT o WKB en un objeto GeoJson

Bajo demanda

Simplificar forma geográfica

Simplificar una forma geográfica para reducir el tiempo de procesamiento y el tamaño del conjunto de datos

Valor predeterminado

Geomáscara

Aporta protección de privacidad por aproximación a una ubicación geográfica dentro de un radio específico.

Valor predeterminado

Distancia geográfica

Calcular la distancia entre 2 coordenadas

Valor predeterminado

Crear punto geográfico

Crear un campo de punto geográfico a partir de un campo de latitud y un campo de longitud

Valor predeterminado

Procesadores de fecha

Nombre

Descripción

Disponibilidad

Normalizar fecha

Normalizar un formato de fecha que la plataforma no entendería automáticamente

Valor predeterminado

Establecer zona horaria

Definir una zona horaria para un campo de fecha y hora

Valor predeterminado

Procesadores de texto

Nombre

Descripción

Disponibilidad

Concatenar texto

Concatenar 2 campos

Valor predeterminado

Descodificar entidades HTML

Descodificar entidades HTML de un texto para convertirlas en HTML válido

Valor predeterminado

Extraer HTML

Extraer HTML de una etiqueta HTML para conservar únicamente el contenido textual

Valor predeterminado

Extraer texto

Extraer parte del valor de un campo con una expresión regular

Valor predeterminado

Extraer direcciones URL

Extraer direcciones URL de contenido de texto o HTML

Valor predeterminado

Normalizar valores Unicode

Normalizar el contenido Unicode mediante el formato NFC (Normalization Form Canonical Composition).

Valor predeterminado

Normalizar dirección URL

Normalizar el valor de un campo para obtener una dirección URL válida

Valor predeterminado

Sustituir texto

Sustituir el valor de un campo textual por un texto seleccionado

Valor predeterminado

Sustituir mediante Regexp

Sustituir o eliminar una parte del valor de un campo por una expresión regular

Valor predeterminado

Dividir texto

Dividir el valor de un campo y extraer una parte del mismo en un campo nuevo

Valor predeterminado

Procesadores genéricos

Nombre

Descripción

Disponibilidad

Añadir un campo

Añadir un nuevo campo vacío en un conjunto de datos

Valor predeterminado

Copiar un campo

Copiar el valor de un campo en otro campo

Valor predeterminado

Suprimir registro por ID

Eliminar un registro existente, en función de su ID exclusivo, de un conjunto de datos

Valor predeterminado

Expandir desde matriz JSON

Transponer las filas que contiene una matriz JSON en varias filas

Valor predeterminado

Expresión

Escribir patrones de expresiones complejas mediante valores de campo

Valor predeterminado

Extraer rango de bits

Extraer un rango de bits arbitrario de un contenido hexadecimal o binario

Bajo demanda

Extraer de JSON

Extraer los valores de un campo que contiene un objeto JSON

Valor predeterminado

Archivo

Recuperar imágenes de direcciones URL

Valor predeterminado

Unir conjunto de datos

Unir 2 conjuntos de datos para recuperar un campo especificado en un conjunto de datos

Valor predeterminado

Matriz JSON en multivalor

Extraer varios valores de una matriz JSON y concatenarlos en un campo multivalor

Valor predeterminado

Omitir registros

Omitir registros de un conjunto de datos

Valor predeterminado

Transformar columnas booleanas en campos multivalor

Transformar los valores verdaderos de los campos booleanos en un campo multivalor

Valor predeterminado

Transponer campos

Transformar etiquetas en valores de campo

Valor predeterminado