Nettoyer vos données efficacement avec Power Query

Chaque jour, des milliers de professionnels perdent un temps précieux à corriger manuellement leurs tableaux. Entre les fautes de frappe, les formats qui changent et les informations dupliquées, la préparation des fichiers devient vite un cauchemar. Heureusement, Power Query transforme cette tâche pénible en un jeu d’enfant. Cet assistant intelligent automatise le nettoyage de vos fichiers et mémorise chaque action pour les prochaines fois.

En bref

  • Power Query élimine automatiquement les espaces inutiles, les doublons et corrige les formats incohérents sans programmation
  • L’outil mémorise toutes vos transformations pour les réappliquer en un clic sur de nouveaux fichiers
  • Vous pouvez supprimer des colonnes, diviser ou fusionner des données, et créer des filtres personnalisés directement dans l’éditeur
  • Les valeurs manquantes se remplissent facilement avec des options comme « Vers le bas » ou des valeurs par défaut
  • Une fois configuré, le processus se réactualise automatiquement à chaque nouvelle importation de données

Pourquoi nettoyer vos données avec Power Query

Les données brutes contiennent souvent des erreurs, des doublons ou des formats inadaptés. Ces problèmes rendent l’analyse difficile et les résultats peu fiables.

Power Query transforme cette corvée en processus simple et rapide. Cet outil intégré à Excel et Power BI permet de préparer vos données sans écrire une seule ligne de code.

Le nettoyage manuel des données prend énormément de temps. Avec Power Query, vous créez une séquence d’étapes reproductibles. Quand de nouvelles données arrivent, un simple clic actualise tout le processus.

Les problèmes courants dans vos données

Avant de nettoyer vos données, vous devez identifier ce qui ne va pas. Les fichiers que vous recevez présentent souvent les mêmes défauts.

Les espaces superflus se cachent au début ou à la fin des cellules. Ils empêchent les regroupements et les recherches de fonctionner correctement.

Les formats incohérents posent aussi problème. Une colonne de dates peut mélanger plusieurs formats comme « 01/12/2024 » et « 1-déc-24 ».

Les doublons apparaissent fréquemment dans les bases de données. Ils faussent les calculs et gonflent artificiellement les résultats.

Les valeurs manquantes créent des trous dans vos analyses. Certaines cellules restent vides alors qu’elles devraient contenir « 0 » ou « Non renseigné ».

Démarrer avec Power Query dans Excel

L’accès à Power Query se fait depuis l’onglet « Données » dans Excel. Vous trouvez la section « Récupérer et transformer les données ».

Cliquez sur « Depuis un tableau/plage » pour charger vos données. Une nouvelle fenêtre s’ouvre : l’éditeur Power Query. C’est votre espace de travail pour le nettoyage.

L’interface affiche vos données en haut et les étapes appliquées à droite. Chaque transformation que vous effectuez s’ajoute automatiquement à cette liste.

Vous pouvez revenir en arrière en supprimant une étape. Cette flexibilité vous permet d’expérimenter sans risque.

Supprimer les colonnes inutiles

Les fichiers contiennent souvent des colonnes dont vous n’avez pas besoin. Ces données supplémentaires ralentissent vos traitements.

Sélectionnez les colonnes à garder en maintenant la touche Ctrl enfoncée. Faites un clic droit et choisissez « Supprimer les autres colonnes ».

Cette méthode est plus sûre que de supprimer les colonnes une par une. Vous êtes certain de conserver exactement ce dont vous avez besoin.

Nettoyer le texte et les espaces

Les colonnes de texte accumulent des problèmes de formatage. Power Query propose des outils spécifiques pour y remédier.

Sélectionnez votre colonne et allez dans le menu « Transformer ». L’option « Format » vous donne accès à plusieurs choix :

  • Supprimer les espaces de début et de fin
  • Nettoyer pour retirer les caractères non imprimables
  • Mettre en majuscules ou en minuscules
  • Mettre en majuscule chaque mot

Ces transformations s’appliquent instantanément à toutes les lignes. Vous visualisez le résultat avant de valider.

Pour les problèmes plus complexes, utilisez la fonction « Remplacer les valeurs ». Elle trouve et corrige des erreurs récurrentes comme « Oui  » avec un espace en trop.

Gérer les doublons efficacement

Les doublons faussent vos statistiques et créent de la confusion. Power Query les détecte et les élimine rapidement.

Sélectionnez les colonnes qui définissent un doublon. Par exemple, pour des clients, ce serait l’email ou le numéro de téléphone.

Cliquez sur « Supprimer les doublons » dans l’onglet « Accueil ». Le système garde la première occurrence et supprime les suivantes.

Vous pouvez aussi choisir « Conserver les lignes » puis « Conserver les doublons » pour les analyser avant de les supprimer. Cette approche vous aide à comprendre d’où viennent les problèmes.

Corriger les types de données

Power Query devine le type de chaque colonne au chargement. Cette détection automatique fait parfois des erreurs.

Une colonne de codes postaux peut être reconnue comme nombre. Le problème : les zéros au début disparaissent alors.

Cliquez sur l’icône à gauche du nom de colonne pour changer le type. Les options incluent texte, nombre entier, nombre décimal, date et bien d’autres.

Le bon type de données évite les erreurs de calcul. Les dates doivent être au format date pour calculer des durées. Les montants doivent être en nombre décimal pour les additions.

Traiter les valeurs manquantes

Les cellules vides posent problème dans les calculs et les graphiques. Plusieurs stratégies permettent de les gérer.

Vous pouvez les remplir avec une valeur par défaut. Sélectionnez la colonne, cliquez sur « Transformer » puis « Remplir ». Choisissez « Vers le bas » pour répéter la dernière valeur connue.

L’option « Remplacer les valeurs » permet de transformer les cellules vides en texte comme « Non renseigné » ou en chiffre comme « 0 ».

Pour les suppressions, utilisez « Supprimer les lignes » puis « Supprimer les lignes vides ». Cette option élimine toute ligne où toutes les colonnes sont vides.

Diviser et fusionner des colonnes

Les données arrivent parfois dans un mauvais format. Un nom complet dans une seule colonne doit être séparé en prénom et nom.

Sélectionnez la colonne et choisissez « Fractionner la colonne ». Vous pouvez diviser par délimiteur comme l’espace ou le point-virgule.

L’inverse fonctionne aussi. Pour créer une adresse email, fusionnez le prénom et le nom avec un point entre les deux. Utilisez « Fusionner les colonnes » et choisissez votre séparateur.

Ces manipulations gardent vos données structurées. Chaque information dans sa propre colonne facilite les filtres et les regroupements.

Filtrer les données indésirables

Toutes les lignes de votre fichier ne vous intéressent pas forcément. Les filtres éliminent ce qui n’est pas pertinent.

Cliquez sur la flèche à droite du nom de colonne. Une liste de valeurs apparaît. Décochez celles à exclure.

Les filtres de texte offrent des options avancées. Vous pouvez garder uniquement les lignes qui commencent par, contiennent ou se terminent par certains caractères.

Pour les nombres, filtrez selon des conditions comme « supérieur à 1000 » ou « entre 50 et 100 ». Ces critères nettoient les valeurs aberrantes.

Créer des colonnes calculées

Le nettoyage inclut aussi l’enrichissement de vos données. Les colonnes calculées ajoutent des informations utiles.

L’option « Colonne personnalisée » vous permet de créer des formules. La syntaxe M de Power Query est accessible même aux débutants.

Vous pouvez aussi utiliser « Colonne conditionnelle » pour créer des catégories. Par exemple, classez les montants en « Faible », « Moyen » ou « Élevé » selon des seuils.

Les colonnes d’exemples utilisent l’intelligence artificielle. Tapez quelques exemples du résultat souhaité et Power Query devine la logique.

Sauvegarder et réutiliser vos transformations

Une fois le nettoyage terminé, cliquez sur « Fermer et charger ». Vos données nettoyées apparaissent dans Excel sous forme de tableau.

Les étapes de transformation restent mémorisées. Quand vous recevez un nouveau fichier avec la même structure, actualisez simplement la requête.

Nous conseillons de documenter vos étapes complexes. Ajoutez des commentaires en faisant un clic droit sur une étape et en choisissant « Propriétés ».

Vous pouvez aussi dupliquer une requête pour créer des variantes. Cette technique accélère le traitement de fichiers similaires.

Les erreurs fréquentes à éviter

Les débutants tombent dans certains pièges. Modifier directement les données sources après avoir créé une requête cause des problèmes de rafraîchissement.

Ne renommez pas les colonnes dans le fichier d’origine. Power Query cherchera ces noms et affichera des erreurs. Faites tous vos renommages dans l’éditeur.

Attention aux étapes dans le mauvais ordre. Supprimer des doublons avant de corriger les espaces peut laisser passer des fausses différences.

Testez toujours vos transformations sur un échantillon avant de traiter des millions de lignes. Cela évite les longues attentes si quelque chose ne fonctionne pas.

FAQ

Power Query fonctionne-t-il avec d’autres sources de données qu’Excel ?

Power Query fonctionne effectivement avec de nombreuses sources de données. Vous pouvez connecter des fichiers CSV, des bases de données SQL, des API web, des dossiers entiers ou même des services cloud. Cette polyvalence vous permet de centraliser le nettoyage de toutes vos données dans un seul outil.

Peut-on annuler une transformation après avoir fermé l’éditeur Power Query ?

Annuler une transformation après fermeture est tout à fait possible. Retournez dans l’éditeur en cliquant sur votre requête puis « Modifier ». Toutes vos étapes apparaissent dans le panneau de droite. Supprimez simplement l’étape problématique et vos données reviennent à l’état précédent sans perdre le reste.

Les transformations Power Query ralentissent-elles Excel avec de gros fichiers ?

Les transformations Power Query ne ralentissent pas Excel une fois chargées. Le traitement se fait uniquement lors de l’actualisation. Pour de très gros volumes, chargez vos données uniquement dans le modèle de données plutôt que dans une feuille Excel. Cela optimise considérablement les performances.

Comment partager mes requêtes Power Query avec mes collègues ?

Partager vos requêtes se fait simplement en envoyant le fichier Excel complet. Les requêtes sont intégrées au classeur. Vos collègues verront toutes vos étapes de transformation et pourront les réutiliser. Veillez juste à ce que les chemins d’accès aux sources de données soient accessibles pour eux.

Est-il possible de programmer une actualisation automatique des données ?

Programmer une actualisation automatique nécessite Power BI ou Excel avec un abonnement Microsoft 365. Dans Power BI, configurez un calendrier d’actualisation dans les paramètres du jeu de données. Pour Excel en ligne, utilisez les options d’actualisation planifiée disponibles dans les paramètres du classeur.