Filtrer, trier et supprimer les doublons

Filtrer, trier et supprimer les doublons avec Power BI

L’objectif est d’apprendre à choisir des colonnes, ainsi qu’à trier et filtrer les lignes dans un fichier Microsoft Power BI.

Le fichier de travail Power BI PBI_Lab22.pbix est téléchargeable.

Attention. Les données d’origine, qui ont permis de créer PBI_Lab22.pbix, sont censées être présentes dans le dossier C:\FICHIERS_EXERCICES_FORMATION.

Cet article fait partie d’une série de tutos sur Power BI :

  1. Créer des requêtes Power BI pour se connecter aux données
  2. Filtrer, trier et supprimer les doublons avec Power BI
  3. Formater les tables de données avec Power Query
  4. Formater une colonne Date avec Power BI
  5. Fractionner une colonne
  6. Grouper les requêtes
  7. Insérer une colonne conditionnelle
  8. Manipuler les requêtes empilées
  9. Rassembler 2 tables avec une jointure
  10. Requêtes paramétrées et modèle

Manipulations

Télécharger Power BI Desktop

Télécharger et installer Power BI Desktop.

Ouvrir un fichier pbix

Ensuite, télécharger et ouvrir le fichier PBI_Lab22.pbix dans Power BI Desktop.

Puis cliquer sur le ruban Fichier puis sur le menu Enregistrer sous et nommer le fichier PBI_Lab24.pbix.

Ouvrir l’éditeur Power Query

Cliquer sur le ruban Accueil (Home) puis sur la partie haute du menu Transformer les données (Transform Data).

Sélectionner la requête

Sélectionner la requête CSV_Communes.

Elle est dessous la requête Ong_Fruits_Filtres dans le volet Requêtes [4] à gauche.

Choisir des colonnes

Scénario : Votre responsable vous demande de supprimer des colonnes qui ne serviront à rien dans le rapport. Pour ce faire, vous allez utiliser 2 méthodes différentes qui sont indiquées ci-dessous.

Cliquer sur le ruban Accueil.

Sélectionner la colonne ligne_5.

Dans le groupe Gérer les colonnes, cliquer sur le menu Supprimer les colonnes.

Supprimer la colonne ligne_5.

Dans le groupe Gérer les colonnes, cliquer sur le menu Choisir les colonnes.

Choisir toutes les colonnes SAUF les colonnes : libelle_acheminement, nom_commune_complet.

Trier les lignes

Vous allez trier la colonne latitude en ordre croissant. L’objectif est d’identifier la présence de lignes avec la latitude vide.

Pour ce faire, trier la colonne latitude en ordre croissant avec la commande qui se trouve dans le ruban Accueil et dans le groupe Trier.

Il y a 39201 lignes. Pour compter les lignes, il faut cliquer sur Transformer puis Compter les lignes. Une fois le résultat obtenu (39201), il faut supprimer l’étape appliquée Lignes comptées (à droite).

Filtrer les lignes

Garder toutes les lignes SAUF les lignes avec la latitude vide. Vous pouvez le faire à l’aide du petit bouton qui se trouve dans l’entête de la colonne latitude.

Décocher la case marquée (vide).

Pour vous aider, regarder la copie d’écran ci-dessous.

Bouton de l'entête
Bouton de l’entête

Pour information, il reste 38932 lignes.

Supprimer les doublons

Supprimer les doublons de la colonne code_commune_INSEE.

Pour ce faire, cliquer sur la colonne code_commune_INSEE puis cliquer dans le ruban Accueil puis Supprimer les lignes puis Supprimer les doublons.

Pour information, il reste 35921 lignes.

Pour vous aider, regarder la copie d’écran ci-dessous.

Source Communes (extrait)
Source Communes (extrait)

Enregistrer son travail

Fermer & appliquer puis Enregistrer son fichier Power BI Desktop et Fermer Power BI Desktop.

Résumé

Vous avez appris à choisir des colonnes, ainsi qu’à trier et filtrer les lignes d’un fichier Microsoft Power BI.

Vous avez aussi supprimé les doublons de la requête. Gardez à l’esprit que vous n’avez pas supprimé uniquement les doublons existants. Vous supprimez aussi les éventuels futurs doublons qui pourraient se produire lors de l’actualisation du rapport.

Téléchargement de la solution

https://coudr.com/PBI_Lab24

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.