Las 5 prácticas más importantes en Power Query

Jan 26 / Elías Ortiz
Hay una serie de buenas prácticas a la hora de trabajar con Power Query que nos indica Microsoft para mejorar el rendimiento y optimizar nuestro proceso de extracción, transformación y carga. 
Antes de comenzar es importante conocer que Power Query es una tecnología de Microsoft que permite conectarse a gran cantidad de orígenes de datos, combinarlos, transformarlos para lograr posteriormente una gran capacidad de análisis sin necesidad de saber código. Esta tecnología está disponible en Excel, Power BI, Flujos de datos de Power Apps y Power BI y recientemente ha sido integrada también en Azure, por lo que al aprender el funcionamiento de esta tecnología te va a permitir posteriormente usarla en diferentes herramientas de Microsoft, además el aprendizaje de esta es muy sencillo ya que es muy intuitivo. 
Una vez que conocemos de que trata Power Query, Microsoft nos recomienda una serie de prácticas a la hora de realizar nuestras consultas con dicha herramienta que son los siguientes:

1. Usar el conector adecuado

Power Query dispone de una gran cantidad de orígenes de datos, desde archivos de Excel, csv, txt hasta conectores de bases de datos, SQL Server, Dynamics, Google Analytics, LinkedIn, ODBC.. por lo que puede ser que en numerosas ocasiones nos podamos conectar de diferentes maneras al origen de datos y lo que nos recomienda Microsoft es que usemos el conector más correcto para cada fin.
Esto te va a permitir obtener mayor rendimiento de tu consulta, por ejemplo, si nuestra base de datos está en un SQL Server conectarnos a ella mediante el conector de SQL Server y no a través de una conexión de ODBC. No quiere decir que una conexión con ODBC vaya a ir mal, ni mucho menos, pero es mucho más eficiente hacerlo con su conector adecuado y no usar un “puente”.

2. Filtrar en los pasos lo antes posible

Siempre es recomendable filtrar en los pasos de Power Query lo antes posible, incluso si es una consulta directa a una base de datos y se puede filtrar directamente como por ejemplo mediante SQL, lo ideal es realizarlo justo en esa consulta.

3. Usar el tipo de datos correcto

Algunas de las características de Power BI van a depender del tipo que tenga la columna. Por ejemplo, cuando una columna de fecha tiene el tipo de datos correcto nos va a permitir que la opción en añadir columnas de la fecha esté operativa:
Por ello, es crucial que siempre trabajes con el tipo de datos correcto para tus columnas, normalmente cuando la información viene de una base de datos seguramente el tipo de datos sea correcto, pero cuando viene de un Excel, TXT o CSV vamos a tener que cuidar muy bien los tipos de dato.

4. Documentar tu trabajo

Se recomienda documentar tus pasos en las consultas renombrándolas o añadiendo una descripción de los pasos, por defecto Power Query nos hace una descripción bastante estándar que no hace falta ni que renombremos, pero si estamos haciendo algo complejo o difícil si es importante renombrarlo o describir el paso para cuando alguien vaya a observa ese proceso no sea un martirio.
Para añadir información al paso, seleccionamos el paso y le damos a “Propiedades”:
Podemos cambiar el nombre y darle una descripción del paso realizado:
Ahora ya nos saldrá la información que hemos estimado oportuna escribir:

5. Crear grupos

A medida que vamos aprendiendo Power BI y Power Query, vamos aumentando el número de consultas de nuestros modelos con funciones, hechos, dimensiones, tablas auxiliares u otro tipo de consultas por lo que es de relevada importancia ir agrupándolos en carpetas para navegar con facilidad y que todo esté bien ordenado.

Además de eso es de relevante importancia saber cuales son nuestras tablas de hechos y cuales son nuestras dimensiones, nosotros os recomendamos usar para las tablas de hechos una “f” delante y para las dimensiones una “d”, como por ejemplo fPedidos, dCliente, dProveedor.