Les dix meilleures solutions pour nettoyer vos données

S’applique à
Excel pour Microsoft 365 Excel 2024 Excel 2021 Excel 2019 Excel 2016

Les mots mal orthographiés, les espaces de fin récalcitrants, les préfixes indésirables, les majuscules incorrectes et les caractères non imprimables donnent une mauvaise première impression. Sans compter qu’il ne s’agit pas là d’une liste exhaustive des façons dont vos données peuvent s’encrasser. Retroussez vos manches. Il est temps de procéder à un grand nettoyage de printemps de vos feuilles de calcul avec Microsoft Excel.

Concepts de base du nettoyage de vos données

Vous n’avez pas toujours le contrôle sur le format et le type de données que vous importez à partir d’une source de données externe, telle qu’une base de données, un fichier texte ou une page web. Avant de pouvoir analyser les données, vous devez souvent les nettoyer. Heureusement, Excel propose de nombreuses fonctionnalités pour vous aider à obtenir des données dans le format précis souhaité. Parfois, la tâche est simple et il existe une fonctionnalité spécifique qui effectue le travail pour vous. Par exemple, vous pouvez facilement utiliser la fonctionnalité Vérificateur d’orthographe pour nettoyer les mots mal orthographiés dans les colonnes qui contiennent des commentaires ou des descriptions. Ou, si vous souhaitez supprimer des lignes en double, vous pouvez le faire rapidement à l’aide de la boîte de dialogue Supprimer les doublons.

Dans d’autres cas, vous devrez manipuler une ou plusieurs colonnes à l’aide d’une formule pour convertir les valeurs importées en nouvelles valeurs. Par exemple, si vous souhaitez supprimer les espaces de fin, vous pouvez créer une colonne pour nettoyer les données à l’aide d’une formule, remplir la nouvelle colonne, convertir les formules de cette nouvelle colonne en valeurs, puis supprimer la colonne d’origine.

Les étapes de base pour nettoyer les données sont les suivantes :

  1. Importez les données à partir d’une source de données externe.

  2. Créez une copie de sauvegarde des données d’origine dans un classeur distinct.

  3. Assurez-vous que les données se présentent dans un format tabulaire de lignes et de colonnes avec : des données similaires dans chaque colonne, toutes les colonnes et lignes visibles, et aucune ligne vierge dans la plage. Pour de meilleurs résultats, utilisez un tableau Excel.

  4. Effectuez des tâches qui ne nécessitent pas de manipulation de colonnes en premier, telles que la vérification de l’orthographe ou l’utilisation de la boîte de dialogue Rechercher et remplacer.

  5. Ensuite, effectuez des tâches qui nécessitent une manipulation de colonne. Les étapes générales de manipulation d’une colonne sont les suivantes :

    1. Insérez une nouvelle colonne (B) en regard de la colonne d’origine (A) qui doit être nettoyée.
    2. Ajoutez une formule qui transformera les données en haut de la nouvelle colonne (B).
    3. Indiquez la formule dans la nouvelle colonne (B). Dans un tableau Excel, une colonne calculée est automatiquement créée avec des valeurs indiquées.
    4. Sélectionnez la nouvelle colonne (B), copiez-la, puis collez-la en tant que valeurs dans la nouvelle colonne (B).
    5. Supprimez la colonne d’origine (A), qui convertit la nouvelle colonne de B en A.

Pour nettoyer régulièrement la même source de données, envisagez d’enregistrer une macro ou d’écrire du code pour automatiser l’ensemble du processus. Il existe également un certain nombre de compléments externes écrits par des fournisseurs tiers, répertoriés dans la section Fournisseurs tiers, que vous pouvez envisager d’utiliser si vous n’avez pas le temps ou les ressources nécessaires pour automatiser le processus par vous-même.

Informations supplémentaires Description
Recopier automatiquement des données dans les cellules d’une feuille de calcul Montre comment utiliser la commande Remplissage.
Créer des tableaux

Redimensionner un tableau en ajoutant ou supprimant des lignes et des colonnes

Utiliser des colonnes calculées dans un tableau Excel
Montrer comment créer un tableau Excel et ajouter ou supprimer des colonnes ou des colonnes calculées.
Créer une macro Montre plusieurs façons d’automatiser des tâches répétitives à l’aide d’une macro.

Vérification de l’orthographe

Vous pouvez utiliser un vérificateur d’orthographe pour non seulement rechercher des mots mal orthographiés, mais aussi pour rechercher des valeurs qui ne sont pas utilisées de manière cohérente, telles que les noms de produits ou d’entreprises, en ajoutant ces valeurs à un dictionnaire personnel.

Informations supplémentaires Description
Vérifier la grammaire et l’orthographe Montre comment corriger les mots mal orthographiés dans une feuille de calcul.
Utiliser des dictionnaires personnels pour ajouter des mots dans le vérificateur d’orthographe Explique comment utiliser des dictionnaires personnels.

Suppression des lignes en double

Les lignes en double sont un problème courant lorsque vous importez des données. Il est conseillé de filtrer d’abord les valeurs uniques pour confirmer que les résultats correspondent à vos attentes avant de supprimer les valeurs en double.

Informations supplémentaires Description
Filtrer des valeurs uniques ou supprimer des doublons Montre deux procédures étroitement liées : comment filtrer des lignes uniques et comment supprimer des lignes en double.

Recherche et remplacement de texte

Vous souhaitez peut-être supprimer une chaîne de début courante, telle qu’une étiquette suivie de deux points et d’une espace, ou un suffixe, tel qu’une expression entre parenthèses à la fin de la chaîne, qui est obsolète ou inutile. Pour ce faire, recherchez les instances de ce texte et remplacez-les par un texte vide ou un autre texte.

Informations supplémentaires Description
Vérifiez si une cellule contient du texte (non-respect de la casse)

Vérifier si une cellule contient du texte (respect de la casse)
Montrer comment utiliser la commande Rechercher et plusieurs fonctions pour rechercher du texte.
Supprimer les caractères de texte Montre comment utiliser la commande Remplacer et plusieurs fonctions pour supprimer du texte.
Rechercher ou remplacer du texte et des nombres dans une feuille de calcul Montrer comment utiliser les boîtes de dialogue Rechercher et Remplacer.
TROUVE, TROUVERB

CHERCHE, CHERCHERB

REMPLACER*, REMPLACERB*

SUBSTITUE

GAUCHE, GAUCHEB*

DROITE*, DROITEB*

NBCAR, LENB*
STXT*, STXTB*
Il s’agit des fonctions que vous pouvez utiliser pour effectuer diverses tâches de manipulation de chaîne, telles que la recherche et le remplacement d’une sous-chaîne dans une chaîne, l’extraction de parties d’une chaîne ou la détermination de la longueur d’une chaîne.

Modification de la casse du texte

Parfois, le texte se présente sous une forme mixte, surtout lorsqu’il s’agit de la casse du texte. À l’aide d’une ou de plusieurs des trois fonctions de casse, vous pouvez convertir du texte en minuscules, par exemple des adresses e-mail, en majuscules, par exemple des codes de produits, ou en majuscules propres, par exemple des noms ou des titres de livres.

Informations supplémentaires Description
Modifier la casse d’un texte Montre comment utiliser les trois fonctions de casse.
LOWER Convertit toutes les lettres majuscules d’une chaîne de caractères en lettres minuscules.
NOMPROPRE Met en majuscule la première lettre de chaque chaîne de caractères et toute lettre d’un texte qui suit un caractère non alphabétique. Toutes les autres lettres sont converties en lettres minuscules.
UPPER Convertit du texte en majuscules.

Suppression d’espaces et de caractères non imprimables du texte

Parfois, les valeurs de texte contiennent des caractères de début, de fin ou plusieurs espaces incorporés (valeurs de jeu de caractères Unicode 32 et 160) ou des caractères non imprimables (valeurs de jeu de caractères Unicode comprises entre 0 et 31, 127, 129, 141, 143, 144 et 157). Ces caractères peuvent parfois entraîner des résultats inattendus lorsque vous effectuez un tri, un filtrage ou une recherche. Par exemple, dans la source de données externe, les utilisateurs peuvent faire des erreurs typographiques en ajoutant par inadvertance des caractères espace supplémentaires, ou les données textuelles importées de sources externes peuvent contenir des caractères non imprimables qui sont intégrés dans le texte. Étant donné que ces caractères ne sont pas facilement visibles, les résultats inattendus peuvent être difficiles à comprendre. Pour supprimer ces caractères indésirables, vous pouvez utiliser une combinaison des fonctions SUPPRESPACE, EPURAGE et SUBSTITUE.

Informations supplémentaires Description
CODE Renvoie le numéro de code du premier caractère du texte.
EPURAGE Supprime les 32 premiers caractères non imprimables du code ASCII à 7 bits (valeurs 0 à 31) du texte.
SUPPRESPACE Supprime le caractère espace ASCII à 7 bits (valeur 32) du texte.
SUBSTITUE Vous pouvez utiliser la fonction SUBSTITUE pour remplacer les caractères Unicode de valeur supérieure (valeurs 127, 129, 141, 143, 144, 157 et 160) par les caractères ASCII à 7 bits pour lesquels les fonctions SUPPRESPACE et EPURAGE ont été conçues.

Correction des nombres et des signes numériques

Il existe deux problèmes principaux liés aux nombres qui peuvent vous obliger à nettoyer les données : le nombre a été importé par inadvertance en tant que texte et le signe négatif doit être remplacé par la norme de votre organisation.

Informations supplémentaires Description
Convertir les nombres stockés en tant que texte en nombres Montre comment convertir au format numérique les nombres qui sont formatés et stockés dans les cellules sous forme de texte, ce qui peut entraîner des problèmes de calcul ou produire des ordres de tri déroutants.
DEVISE Convertit un nombre au format texte et applique un symbole monétaire.
TEXT Convertit une valeur en texte dans un format de nombre spécifique.
RÉSOLU Arrondit un nombre au nombre de décimales spécifié, met en forme le nombre au format décimal à l’aide d’un point et de virgules, et renvoie le résultat sous forme de texte.
VALUE Convertit en nombre une chaîne de caractères représentant un nombre.

Correction des dates et des heures

En raison du grand nombre de formats de date différents, et de la confusion possible entre ces formats et les codes de parties numérotés ou d’autres chaînes contenant des barres obliques ou des traits d’union, il est souvent nécessaire de convertir et de reformater les dates et les heures.

Informations supplémentaires Description
Modifier le système de date, le format ou l’interprétation de l’année à deux chiffres Décrit le fonctionnement du système de date dans Office Excel.
Convertir des heures Montre comment effectuer une conversion entre différentes unités de temps.
Convertir les dates stockées en tant que texte en dates Montre comment convertir au format de date les dates qui sont formatées et stockées dans les cellules sous forme de texte, ce qui peut entraîner des problèmes de calcul ou produire des ordres de tri déroutants.
DATE Renvoie le numéro de série séquentiel qui représente une date particulière. Si le format de cellule était Standard avant que la fonction ne soit entrée, le résultat est mis en forme en tant que date.
DATEVAL Convertit une date représentée par du texte en numéro de série.
TIME Renvoie le nombre décimal d’une heure précise. Si le format de cellule était Standard avant que la fonction ne soit entrée, le résultat est mis en forme en tant que date.
TEMPSVAL Renvoie le nombre décimal de l’heure représentée par une chaîne de texte. Le nombre décimal est une valeur comprise entre 0 (zéro) et 0,99999999, représentant les heures comprises entre 0:00:00 (12:00:00 AM) et 23:59:59 (11:59:59 PM).

Fusion et fractionnement des colonnes

Après avoir importé des données à partir d’une source de données externe, il est courant de fusionner deux colonnes ou plus en une seule, ou de fractionner une colonne en deux colonnes ou plus. Par exemple, vous pouvez fractionner une colonne qui contient un nom complet en un prénom et un nom. Vous pouvez également fractionner une colonne qui contient un champ d’adresse en colonnes de code postal, de ville, de région et de rue distinctes. L’inverse peut aussi être vrai. Vous pouvez fusionner une colonne Prénom et Nom en une colonne Nom complet, ou combiner des colonnes d’adresse distinctes en une seule colonne. Les valeurs courantes supplémentaires qui peuvent nécessiter la fusion en une colonne ou le fractionnement en plusieurs colonnes incluent les codes de produit, les chemins d’accès aux fichiers et les adresses IP (Internet Protocol).

Informations supplémentaires Description
Combiner le prénom et le nom

Combiner du texte et des nombres

Combiner du texte avec une date ou heure

Combiner plusieurs colonnes en utilisant une fonction
Afficher des exemples classiques de combinaison de valeurs provenant de deux colonnes ou plus.
Fractionner du texte en plusieurs colonnes à l’aide de l’Assistant Conversion Montre comment utiliser cet Assistant pour fractionner des colonnes en fonction de différents délimiteurs courants.
Fractionner du texte en plusieurs colonnes en utilisant des fonctions Montre comment utiliser les fonctions GAUCHE, STXT, DROITE, CHERCHE et NBCAR pour fractionner une colonne de nom en deux colonnes ou plus.
Combiner ou fractionner le contenu des cellules Montre comment utiliser la fonction CONCATENER, l’opérateur & (esperluette) et l’Assistant Conversion de texte en colonnes.
Fusionner des cellules ou fractionner des cellules fusionnées Montre comment utiliser les commandes Fusionner les cellules, Fusionner et Fusionner et centrer.
CONCATENER Joint deux ou plusieurs chaînes de caractères en une seule chaîne de caractères.

Transformation et réorganisation des colonnes et des lignes

La plupart des fonctionnalités d’analyse et de mise en forme dans Office Excel supposent que les données existent dans un tableau unique, plat et à deux dimensions. Il peut arriver que vous souhaitiez que les lignes deviennent des colonnes et que les colonnes deviennent des lignes. Dans d’autres cas, les données ne sont même pas structurées dans un format tabulaire, et vous avez besoin d’un moyen de transformer les données d’un format non tabulaire en format tabulaire.

Informations supplémentaires Description
TRANSPOSE Renvoie une plage verticale de cellules comme une plage horizontale, ou vice-versa.

Rapprochement des données de table par jointure ou correspondance

Il arrive que les administrateurs de base de données utilisent Office Excel pour rechercher et corriger les erreurs correspondantes lorsque deux tables ou plus sont jointes. Il peut s’agir de rapprocher deux tables provenant de feuilles de calcul différentes, par exemple, pour voir tous les enregistrements des deux tables ou pour comparer les tables et rechercher les lignes qui ne correspondent pas.

Informations supplémentaires Description
Rechercher des valeurs dans une liste de données Montre les méthodes courantes pour rechercher des données à l’aide des fonctions de recherche.
RECHERCHE Renvoie une valeur à partir d’une plage d’une ligne ou d’une colonne ou à partir d’un tableau. La fonction RECHERCHE comporte deux formes de syntaxe : la forme vectorielle et la forme de tableau.
RECHERCHEH Recherche une valeur dans la ligne supérieure d’une table ou d’un tableau de valeurs, puis renvoie une valeur dans la même colonne à partir d’une ligne que vous spécifiez dans la table ou le tableau.
RECHERCHEV Recherche une valeur dans la première colonne d’un tableau de tables et renvoie une valeur de la même ligne à partir d’une autre colonne du tableau de tables.
INDEX Renvoie une valeur ou la référence à une valeur à l’intérieur d’une table ou d’une plage. Il existe deux formes de la fonction INDEX : la forme de tableau et la forme de référence.
MATCH Renvoie la position relative d’un élément dans un tableau qui correspond à une valeur spécifiée dans un ordre spécifié. Utilisez la fonction EQUIV plutôt qu’une des fonctions RECHERCHE lorsque vous avez besoin de la position d’un élément dans une plage et non de l’élément en tant que tel.
DECALER Renvoie une référence à une plage qui correspond à un nombre déterminé de lignes et de colonnes d’une cellule ou plage de cellules. La référence qui est renvoyée peut être une cellule unique ou une plage de cellules. Vous pouvez spécifier le nombre de lignes et de colonnes à renvoyer.

Fournisseurs tiers

Voici une liste partielle de fournisseurs tiers dont les produits sont utilisés pour nettoyer les données de diverses manières.

Remarque

Microsoft ne fournit aucun support pour les produits tiers.

Fournisseur Produit
Complément Express Ltd. Ultimate Suite pour Excel, Assistant Fusion de tableaux, Remover dupliqué, Assistant Consolider des feuilles de calcul, Assistant Combiner des lignes, Nettoyeur de cellules, Générateur aléatoire, Fusionner des cellules, Outils rapides pour Excel, Trieuse aléatoire, Recherche avancée & Remplacer, Recherche de doublons floues, Fractionnement de noms, Assistant Fractionner les tables, Gestionnaire de classeurs
Add-Ins.com Recherche de doublons
AddinTools AddinTools Assist
WinPure ListCleaner Lite
ListCleaner Pro

Haut de la page