La transformation avec Power Query

LinkedIn

Pré-requis

  1. Microsoft Power BI Desktop
  2. Microsoft Excel

Les meilleures pratiques sont essentielles pour toute réalisation d’un projet. Avec Power BI, elles nous permettent d’améliorer les performances et la visibilité finale.

Nous allons approfondir certaines des meilleures pratiques conseillées our Power Query (préparation du jeu de données).

Choisir le bon mode de connexion en fonction de l'utilisation finale.

Lorsque vous choisissez le mode de connexion, pensez à l’utilisation finale du rapport.

En effet, l’actualisation et les performances globales de vos requêtes rentrent en jeu dans le choix du mode de connexion.

Face aux nombreuses limitations de DirectQuery, le mode import reste à privilégier. Cependant, dans certains cas, une connexion directe répondra mieux à votre besoin.

Astuce : dans la vue modèle, les paramètres avancés des tables permettent de modifier le mode de stockage.

Attention, si vous vous connectez en DirectQuery pour ensuite switcher en Import, vous ne pourrez plus revenir en connexion directe par la suite.

Choisir le bon connecteur en fonction des actualisations demandées.

Prenons l’exemple d’un fichier Excel. Celui-ci peut être stocké dans Power BI grâce à plusieurs connecteurs :

  • Excel local
  • One Drive
  • Sharepoint
  • Web…

Vous l’aurez compris, chaque connecteur aura des avantages et des inconvénients différents au niveau des performances du rapport mais aussi des actualisations des données.

Supprimer le plus tôt possible les données non utilisées.

Sachez d’ores et déjà que chaque étape demandée à Power Query est tout simplement une nouvelle ligne de script. Il est de bonne pratique d’agencer les transformations dans l’ordre et de demander à l’éditeur de supprimer les données non utilisées le plus tôt possible.

Cela permettra au script de traiter moins de données lors des étapes de transformation suivantes et donc, augmentera les performances de mises à jour.

S'assurer du bon formatage et type des données.

Cette étape est indispensable pour faciliter par la suite le bon fonctionnement des fonctions DAX et de la dataviz. Il se peut que l’intelligence de Power BI lorsqu’il détecte automatiquement les types de données, ne soit pas en lien avec votre besoin. 

Veillez à vérifier le type des données mais aussi la catégorie et mise en forme (Code postal, pays, adresse, pourcentage, monétaire, URL…)

Vous pourrez toujours ajouter ces étapes pendant la dataviz.

Assembler les étapes qui peuvent l'être.

Une erreur fréquente consiste à dupliquer les étapes de transformation.

Prenons l’exemple du typage de colonnes. Si vous modifiez le type de donnée d’une colonne, Power Query ajoutera une nouvelle étape alors qu’il en existe déjà une dans certains cas..

En effet Power BI reconnait en général le type de données lors de la connexion à la source de données. Il suffit donc de se positionner sur cette étape et de faire le changement du type en passant par le ruban. Power Query vous demandera si vous voulez l’ajouter à l’étape actuelle ou en créer une nouvelle.

Renommer les étapes de transformation.

Certains jeux de données nécessitent des dizaines voir des centaines d’étapes de transformation. La bonne pratique consiste à renommer les étapes pour vous donner de la visibilité mais aussi aux utilisateurs finaux ou developpeurs qui s’occuperont de la maintenance.

Analyser les données grâce aux nouveaux outils disponibles dans l'onglet Affichage.

Suite à la mise à jour de novembre 2019, vous pouvez approfondir les audits de données. Activez les options dans l’onglet « affichage » de Power Query.

Une autre nouveauté qui se trouve dans l’onglet « outil », consiste à enregistrer un diagnostic de vos données et des performances des requêtes.

Utiliser les paramètres (Getfiles, filtres...)

Les paramètres et fonctions permettent de simplifier et d’automatiser des étapes qui seraient fastidieuses de réaliser à la main.

Prenons l’exemple d’une source de données qui change régulièrement de cheminement (local, réseau ou connexion à une base de données). Vous pouvez demander à Power BI d’aller récupérer le nouvel emplacement et d’attribuer la modification dans les requêtes de toutes les tables liées à cette source. Pratique non…

 

D’autres Best Practices Power Query :
  • Nommer significativement les tables
  • Utiliser des entiers à la place des chaînes dès que possible
  • Grouper les tables de faits et de dimensions
  • Penser à la future maintenance
  • utiliser si possible des colonnes calculées avec le code M et non le code DAX
  • Ne pas totaliser les sommes et moyennes automatiquement
  • Supprimer les doublons
 
 

Laisser un commentaire

Nos autres articles !

LinkedIn