Procesador Unir conjunto de datos

Este procesador permite unir 2 conjuntos de datos. Sin embargo, para poder unirse, estos 2 conjuntos de datos deben tener un campo en común.

Ejemplo: Se quiere enriquecer un conjunto de datos A con más datos, que están en un conjunto de datos B. Si los conjuntos de datos A y B tienen un campo en común, ambos conjuntos de datos se pueden unir a fin de recuperar un campo del conjunto de datos B y añadirlo al conjunto de datos A.

Importante

De forma predeterminada, el procesador Unir conjunto de datos solo se puede utilizar con conjuntos de datos remotos que tengan menos de 100.000 registros. Además, al aplicar un procesador Unir conjunto de datos a un conjunto de datos planificado, la unión solo se vuelve a aplicar cuando el recurso ha cambiado. Esto significa que, dado un conjunto de datos planificado A, que tiene un procesador Unir conjunto de datos que extrae valores del conjunto de datos B, si hay valores nuevos en el conjunto de datos B pero los recursos del conjunto de datos A no han cambiado, el procesamiento planificado no extraerá los valores nuevos de B.

Establecer el procesador

Para establecer los parámetros del procesador Unir conjunto de datos, siga las indicaciones de esta tabla.

Etiqueta

Descripción

Obligatorio

Conjunto de datos

Conjunto de datos utilizado para la unión. Puede seleccionarse de los conjuntos de datos del portal o de la red de Opendatasoft.

Clave local

Campo local que se usará para identificar los registros correspondientes en el conjunto de datos remoto. Se puede especificar más de una clave.

Clave remota

Campo remoto correspondiente a la clave local. Puede ser una lista.

Campos de salida

Lista de campos para recuperar del conjunto de datos remoto.

Recuperar todos los campos

Establecer para recuperar todos los campos del conjunto de datos remoto.

No

Distinguir mayúsculas de minúsculas

Establecer para recuperar el nombre del campo sin marcas de acentuación y en minúsculas.

No

Una línea

En algunos casos, el conjunto de datos remoto puede contener más de una fila que coincida con la clave local. En esa circunstancia, puede interesarle contraer los duplicados (es decir, generar una única fila con campos multivalor) o no.

No

Separador

Para rellenar si se establece Una línea. Especifica el carácter que se usará para separar los valores en el campo generado.

No

Ejemplos

Unión simple

Conjunto de datos A: La lista de estaciones de taxi de París (nombre del conjunto de datos: paris_taxis_stations).

station_id station_name station_address
1 Tour Eiffel 69 quai Branly, 75007 Paris
2 Rennes - Montparnasse 1 place du dix huit Juin 1940, 75006 Paris

Conjunto de datos B: El número de taxis en espera por estación en París.

station_id

Número

1 10
2 15

Conjunto de datos A una vez enriquecido con un campo del conjunto de datos B, mediante el procesador Unir conjunto de datos:

station_id

Número

station_name station_address
1 10 Tour Eiffel 69 quai Branly, 75007 Paris
2 15 Rennes - Montparnasse 1 place du dix huit Juin 1940, 75006 Paris

Unión con el parámetro "Una línea" establecido

Nota

Los conjuntos de datos utilizados en el ejemplo siguiente son los mismos que en el anterior.

El conjunto de datos A contiene 2 filas para la primera estación:

station_id station_name station_address
1 Tour Eiffel 69 quai Branly, 75007 Paris
1 Quai Branly 69 quai Branly, 75007 Paris
2 Rennes - Montparnasse 1 place du dix huit Juin 1940, 75006 Paris

Si se establece Una línea (con | como separador), la unión dará como resultado:

station_id

Número

station_name station_address
1 10 Tour Eiffel|Quai Branly

69 quai Branly, 75007 Paris|69 quai Branly, 75007 París

2 15 Rennes - Montparnasse 1 place du dix huit Juin 1940, 75006 Paris

Sin embargo, si no se establece Una línea, la unión dará como resultado:

station_id

Número

station_name station_address
1 10 Tour Eiffel 69 quai Branly, 75007 Paris
1 10 Quai Branly 69 quai Branly, 75007 Paris
2 15 Rennes - Montparnasse 1 place du dix huit Juin 1940, 75006 Paris

Unión con tipos de campo diferentes

Pueden unirse campos de enteros, campos de decimales y campos de texto con valores numéricos.

Conjunto de datos A: Con campos de decimales y campos de texto con valores numéricos.

insee_code (texto)

bloom_competition_result (decimal)
01262

2,0

90010

4,0

57355

2,0

Conjunto de datos B: Con campos de enteros.

bloom_ranks (entero)

2

Conjunto de datos A una vez utilizado Unir conjunto de datos: La coincidencia entre los valores 2 y 2.0 se ha detectado correctamente a pesar de la diferencia de tipo.

insee_code (texto)

bloom_competition_result (decimal)
01262 2
57355 2

Se puede utilizar un segundo procesador Unir conjunto de datos, como este conjunto de datos C:

city (texto)

insee_code (entero)

postal_code (texto)

Montluel 1262 01120
Belfort 90010 90000
Kalhausen 57355 57412

Conjunto de datos A una vez unido con los conjuntos de datos B y C:

insee_code (texto)

bloom_competition_result (decimal)

city (texto)

postal_code (texto)

01262 2 Montluel 01120
57355 2 Kalhausen 57412

Aunque insee_code no era del mismo tipo, se ha detectado la coincidencia. La coincidencia ha funcionado incluso para el valor 1262 del primer conjunto de datos (obsérvese la ausencia de 0 inicial al tratarse de un valor entero), que ha coincidido con el valor 01262 del segundo conjunto de datos. Si bien la mayoría de los tipos de columnas se pueden recuperar mediante el procesador Unir conjunto de datos, las columnas de tipo archivo no generan el recurso real por medio del procesador sino que generan el nombre del recurso subyacente.