Transformer avec Power Query

Vous allez découvrir comment transformer avec Power Query, afin de nettoyer les données inutiles et corriger les erreurs.

En effet, avant d’exploiter les données dans Power BI, il est nécessaire de les nettoyer et d’enlever les données parasites ou inutiles. Il faut aussi corriger d’éventuelles erreurs qui n’ont pas pu être corrigées, ou qui ne doivent pas être modifiées, dans la source initiale.

Le scénario proposé est de nettoyer les données d’un fichier Excel, qui nécessite plusieurs transformations.

Les données sont dans le fichier Excel XLS_Devis2024.xlsx.

Gardez à l’esprit que l’interface a pu évoluer fortement depuis que cet article a été rédigé.

Comprendre les données

Premièrement, télécharger et ouvrir le fichier XLS_Devis2024.xlsx afin de prendre connaissance de sa structure et de ses données puis fermer le fichier.

Ensuite, créer un nouveau fichier Power BI Desktop vierge nommé PBI_Lab31.pbix.

Puis, dans l’éditeur Power Query, se connecter au fichier Excel : XLS_Devis2024.xlsx.

Enfin, sélectionner l’onglet Ong_Devis2024 puis cliquer sur Transformer les données : l’éditeur Power Query s’ouvre directement.

Renommer la requête avant de transformer avec Power Query

Dans un deuxième temps, renommer la requête Ong_Devis2024 en Devis.

Vous pouvez le faire de différentes manières. Ma méthode préférée est de double-cliquer sur Ong_Devis2024 (à gauche) puis de saisir Devis. Vous pouvez aussi le faire à l’aide du volet Paramètres d’une requête (à droite) en saisissant directement le nouveau nom (Devis) à la place de Ong_Devis2024 dans la zone Nom.

Par ailleurs, si vous ne voyez plus le volet Paramètres d’une requête (à droite), cliquez dans le ruban Affichage (en haut) puis sur Paramètres d’une requête (à gauche).

Supprimer les premières lignes pour transformer avec Power Query

Ensuite, supprimer la première ligne.

Attention à la taille et à la résolution de votre écran. Si vous avez un écran de portable de 15 pouces ou moins, avec une résolution importante, il est possible que vous ne voyiez pas le libellé des menus en toutes lettres (Supprimer les ligne, etc.). Dans ce cas, vous ne verrez que le nom des groupes (Réduire les lignes, etc.). Vous devrez donc cliquer sur le groupe pour retrouver le libellé des menus.

Notamment, cliquer sur le ruban Accueil (en haut), puis sur Supprimer les lignes puis sur Supprimer les lignes du haut. Dans le pop-up, saisir le chiffre 1 puis cliquer sur le bouton OK.

Promouvoir l’entête pour récupérer le nom des colonnes

Ensuite, promouvoir la première ligne comme entête.

Vous pouvez le faire de différentes manières. Ma méthode préférée est de cliquer sur la petite icône en forme de tableau, qui se trouve à l’intersection des en-têtes de colonnes et de lignes du tableau. Dans le menu qui s’ouvre, cliquer sur Utiliser la première ligne pour les en-têtes.

Pour vous aider, regarder la copie d’écran ci-dessous.

Transformer avec Power Query : Utiliser la première ligne pour les en-têtes
Transformer avec Power Query : Utiliser la première ligne pour les en-têtes

Remplacer les valeurs

Puis dans la colonne Date réception, remplacer la date 36/02/2024 par 26/02/2024.

Attention à la résolution de votre écran : cf. l’avertissement juste au-dessus.

Notamment, sélectionner la colonne Date réception, puis cliquer sur le ruban Transformer (en haut), puis sur Remplacer les valeurs puis sur Remplacer les valeurs. Dans le pop-up, saisir 36/02/2024 dans la zone Valeur à rechercher, puis saisir 26/02/2024 dans la zone Remplacer par, puis cliquer sur le bouton OK.

Si vous utilisez une version US, il faudra écrire la date au format 02/26/2024.

Modifier le type d’une donnée

Ensuite, convertir le format de la colonne Date réception en Date.

Vous pouvez le faire de différentes manières. Ma méthode préférée est de cliquer sur l’icône ABC/123 qui est à gauche de la colonne Date réception. Dans le menu, cliquer sur Date.

Puis, vérifier l’absence d’erreur dans la colonne Date réception.

Parmi les méthodes disponibles pour vérifier l’absence d’erreurs, vous avez la vérification visuelle du ruban de couleur verte sous Date réception ou le survol du ruban avec la souris. Vous pouvez aussi afficher la Qualité de la colonne dans le ruban Affichage.

En cas d’erreur, remplacer la date 26/02/2024 avec le format US : 02/26/2024.

Transformer avec Power Query

Scénario : votre responsable souhaite analyser les devis. Notamment, il vous demande de créer une nouvelle colonne qui contienne uniquement la matière de la pièce. La matière de la pièce (acier, inox, aluminium) se trouve dans la colonne Désignation.

Notamment, faire en sorte qu’une colonne nommée Matière, contienne la matière de la pièce.

Premièrement, pour trouver la réponse à cette question, vous devez en premier lieu, recenser toutes les valeurs distinctes de la colonne Désignation.

Notamment, cliquer sur l’icône en forme de petite flèche vers le bas qui se trouve à droite de Désignation.

Pour vous aider, regarder la copie d’écran ci-dessous.

Valeurs distinctes de Désignation
Valeurs distinctes de Désignation

Dans ce cas simple, il y a uniquement que 3 valeurs qui sont recensées.

Aussi, nous vous proposons une méthode basique. Malgré sa rusticité, elle est souvent utilisée car efficace.

Transformer avec Power Query : Comprendre la méthode

Le raisonnement est le suivant :

  • Si la colonne Désignation contient la valeur Bague en acier avec clapet alors la colonne Matière doit contenir la valeur Acier.
  • Si la colonne Désignation contient la valeur Bague en aluminium avec clapet alors la colonne Matière doit contenir la valeur Aluminium.
  • Si la colonne Désignation contient la valeur Bague en inox avec clapet alors la colonne Matière doit contenir la valeur Inox.

Il est immédiat que ces 3 affirmations peuvent être simplifiées :

  • Si la colonne Désignation contient la valeur acier alors la colonne Matière doit contenir la valeur Acier.
  • Si la colonne Désignation contient la valeur aluminium alors la colonne Matière doit contenir la valeur Aluminium.
  • Si la colonne Désignation contient la valeur inox alors la colonne Matière doit contenir la valeur Inox.

Il est même possible d’appliquer une dernière simplification en tenant compte de l’ordre des affirmations :

  • Si la colonne Désignation contient la valeur acier alors la colonne Matière doit contenir la valeur Acier.
  • Si la colonne Désignation contient la valeur aluminium alors la colonne Matière doit contenir la valeur Aluminium.
  • Dans tous les autres cas, la colonne Matière doit contenir la valeur Inox.

Créer une colonne conditionnelle avec Power Query

Pour mettre en œuvre cette solution, cliquer sur le ruban Ajouter une colonne (en haut), puis sur Colonne conditionnelle. Dans le pop-up, saisir Matière dans la zone Nouveau nom de colonne. Ensuite, cliquer sous Nom de la colonne puis sélectionner la colonne Désignation et changer l’opérateur (égal à) en contient. Sous Valeur, saisir la valeur acier puis sous Sortie, saisir la valeur Acier.

Pour vous aider, regarder la copie d’écran ci-dessous.

Transformer avec Power Query : colonne conditionnelle
Transformer avec Power Query : colonne conditionnelle

Ensuite, cliquer sur le bouton Ajouter une clause et recommencer cette manipulation pour l’Aluminium.

Pour vous aider, regarder la copie d’écran ci-dessous.

Ajout de la seconde clause de la colonne conditionnelle
Ajout de la seconde clause de la colonne conditionnelle

La dernière clause est ce qu’on appelle une clause alternative. La procédure est donc différente.

Sous Autre, saisir la valeur Inox.

Pour vous aider, regarder la copie d’écran ci-dessous.

Ajout de la clause alternative de la colonne conditionnelle
Ajout de la clause alternative de la colonne conditionnelle

Cliquer sur le bouton OK : c’est terminé pour la création de la colonne Matière.

Vérifier visuellement que la colonne Matière contient les bonnes valeurs.

Déplacer la colonne Matière au début.

Pour cela, faire un clic droit sur la colonne Matière. Dans le menu qui s’ouvre, cliquer sur Déplacer puis sur Au début.

Pour vous aider, regarder la copie d’écran ci-dessous.

Colonne Matière
Colonne Matière

Enregistrer son travail

Appliquer les transformations puis enregistrer et fermer PBI_Lab31.pbix.

La manipulation est terminée.


Publié

dans

par

Étiquettes :

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *