Power BI – Data Flows

En ocasiones dentro de Power BI se presentan diferentes situaciones en donde el proceso de extracción, transformación y carga (ETL) realizado en este caso desde Power Query Editor tiende a volverse un poco lento o tedioso, esto se debe generalmente a que el volumen de datos es muy grande o porque se está sobrecargando la memoria de la máquina, pues bien, ahora dentro de Power BI se encuentra una herramienta que ayuda a unificar los datos de diferentes fuentes y prepararlos para el modelado directamente en Power BI Service, dejando toda esta carga de procesamiento de datos a la nube y optimizando el trabajo de Power BI Desktop.

Data flows es una herramienta dentro de Power BI Service que se compone de Power Query el cual permite realizar todo el proceso de ETL directamente en la nube, y además permite a otras personas sacar provecho a los pasos de la ETL ya creada. Hay que tener muy claro que cuando se está creando un dataflow no se esta creando un dataset, es necesario a través de Power BI Desktop y Service crear el dataset, reportes y tableros de control como regularmente se hacía. A continuación, se va a construir un reporte en Power BI utilizando data flows con un dataset almacenado en un Blob Container en un servidor en Azure.

Lo primero que se debe realizar es crear el dataflow en el área de trabajo que se quiera en Power BI Service, para este caso se va a crear el dataflow en el area de trabajo IWWORKSPACE.

Para crear el data flow es necesario crear una entidad en donde se especifica la fuente de datos, existen múltiples fuentes de datos de igual forma que cuando se realiza una conexión en Power BI Desktop, desde archivos de Excel hasta bases de datos SQL, es muy importante tener en cuenta que es necesario garantizar la cadena de conexión entre Power BI Service y la maquina o servidor donde este alojado el datset, dicha conexión se puede realizar por medio de la instalación de un data getway si es necesario o simplemente ingresar las especificaciones de autentificación al conectarse. Para este caso se va a conectar a un archivo .csv que se encuentra almacenado en un Blob Container en un servidor en Azure de la siguiente manera.

Después de crear una entidad nueva y realizar la conexión con la fuente, se realizan las transformaciones que se requieran en Power Query desde Power BI Service, y al final se le asigna un nombre al data flow creado.

Ya se tiene un dataflow creado en un área de trabajo dentro de Power BI Service, ahora se es necesario conectarse desde Power BI Desktop a dicho dataflow llamado Dataflow1.

Al conectase desde Power BI Desktop al dataflow creado solo se tendrían que crear las relaciones en el modelo si es el caso y empezar a diseñar el reporte con los objetos visuales que se requieran, todo el trabajo que generalmente realiza Power Query Editor se realizó previamente en la nube.

Luego de realizar el diseño del reporte e insertar los objetos visuales requeridos en Power BI Desktop se publica en Power BI Service en la misma área de trabajo que se encuentra el dataflow y se programan para que se refresquen automáticamente si se requiere.

El uso de dataflows en Power BI puede ser muy útil para aprovechar lo que ya han hecho otras personas, además para restarle carga de procesamiento a Power BI Desktop y realizar todo de manera más rápida y eficaz.

¡Es hora de maximizar el uso de Power BI!

comments powered by Disqus
Information Workers
Explore, extract, refine and consume your data to get valuable information
Visit us