Processeur Remplacer via Expression Régulière

Ce processeur permet de remplacer ou de supprimer une partie d'un texte, d'un nombre ou d'une combinaison des deux.

Configurer le processeur

Pour définir les paramètres du processeur Remplacer via Expression Régulière, suivez les indications du tableau ci-dessous.

Label Description

Obligatoire

Valeur par défaut

Champ

Champ contenant les valeurs à remplacer ou à supprimer.

oui

 

Tous les champs

Si la case de cette option est cochée : tous les champs du jeu de données sont traités avec le processeur Remplacer via Expression Régulière

non

 

Expression régulière

Expression régulière permettant de déterminer la partie des valeurs qui sera remplacée ou supprimée. Consultez http://en.wikipedia.org/wiki/Regular_expression pour plus d'informations sur l'utilisation des expressions régulières. Vous pouvez également tester les expressions régulières avec un débogueur en ligne comme Regex101.

oui

 

Nouvelle valeur

Si la valeur de champ identifiée par l'expression régulière est remplacée, écrivez la nouvelle valeur qui doit remplacer l'ancienne. Si la valeur de champ identifiée par l'expression régulière est supprimée, laissez ce paramètre vide.

non

 

Expression régulière non sensible à la casse

Si la case de cette option est cochée : les expressions régulières ne sont pas sensibles à la casse

non

false

Expression régulière sur plusieurs lignes

Si la case de cette option est cochée : chaque nouvelle ligne marque le début d'une autre ligne. Vous trouverez plus d'informations sur l'option multiligne dans la documentation Python.

non

false

Le caractère '.' correspond aux nouvelles lignes

Si la case de cette option est cochée : le caractère '.' inclut également les nouvelles lignes. Vous trouverez plus d'informations sur le caractère '.' dans la documentation Python.

non

false

Exemple

Si vous souhaitez garder uniquement une partie d'un nombre, le processeur Remplacer via Expression Régulière doit être utilisé. Par exemple, vous pouvez garder uniquement le code de département d'un code postal français (par ex. pour 44100 [Nantes], gardez uniquement 44 [Loire-Atlantique]).

Replace Regexp

In this example, the regular expression processor is configured with the pattern [0-9]{3}$, and a replacement by nothing. The pattern means "select 3 digits from the end", with [0-9] meaning any digit, {3} meaning exactly 3 occurrences, and $ meaning the end of the text. These 3 digits from the end are then replaced by nothing, so only the first 2 digits will stay.