Mapear Bases de Datos con Power Query

Nov 5 / Elías Ortiz
El primer reto que nos enfrentamos siempre en cualquier proyecto con Power BI es la conexión a la base de datos, pero una vez que hemos sido capaces de conectarnos a la misma empieza la labor más tediosa de nuestro día a día que no es otra cosa que saber dónde se encuentran la información en el sistema de gestión que estemos mapeando, normalmente la mayoría de los profesionales del sector empiezan a realizar esta labor sin una estrategia determinada tabla a tabla intentando detectar cuales son las más importantes.
Cuando nos enfrentamos de nuevas a un nuevo ERP u otro sistema de gestión de primeras nos encontramos con una gran cantidad de tablas, imaginaros que os conectáis a la base de datos de vuestra compañía y una vez que os habéis conectado os encontráis con 1.305 tablas y la pregunta ahora es ¿qué hago? ¿ponerme una a una a ver si tiene datos? y ¿de aquellas que tengan datos ponerme a ver si son relevantes? puede ser un trabajo totalmente eterno que va a aportar poco valor y va a retrasar cualquier proyecto que tengamos entre manos.
Justo para este trabajo tan tedioso Power Query dispone de una serie de funciones en M que nos van a permitir volar en este proceso ya que nos van a indicar:

  • Objetos de la Base de Datos

Prototipo de un Mapeo de Proyecto

  • Registros de cada tabla

  • Relaciones de cada tabla

  • Cada campo y su tipología

Detalle de Prototipo de un Mapeo de Proyecto

Simplemente con saber cuántos registros tiene cada tabla ya nos da una visión rápida del lugar al que vamos a tener que prestar toda nuestra atención, ya que ordenando de mayor a menor justo como la imagen de arriba nos va a indicar cuales son las tablas que más registros tienen en la base de datos y por tanto nos va a permitir focalizar nuestra atención. Y si os dijera que de las 1.305 tablas iniciales con estas funciones solo tendríamos que revisar unas 30 tablas, ¿increíble verdad?

Dependiendo a que se dedique la organización a la que vamos a hacer el mapping de datos dependerá de cuales son las tablas que más registros van a tener pero en su mayoría serán las tablas de hechos que contengan las compras, los pedidos, los albaranes, las facturas, el diario y posteriormente nos encontraremos con tablas complementarias o directamente con dimensiones como la de cliente, producto, proveedor, almacén, dirección...

Es tremendamente importante tener una estrategia clara cuando nos vamos a enfrentar a una nueva base de datos y poner todo el foco de nuestra atención en las tablas que realmente tengan valor para la compañía a la que le vayamos a automatizar el sistema de reporting.

Si quieres conocer las funciones de Power Query que te van a permitir tener toda esta información te lo contamos en el siguiente curso.

Contenidos del curso