Tutorial: Dar forma a los datos y combinarlos en Power BI Desktop
Con Power BI Desktop, puede conectarse a muchos tipos de orígenes de datos distintos y dar forma a la información para que se ajuste a sus necesidades. De este modo, podrá crear informes visuales y compartirlos con otras personas. Dar forma a los datos significa transformar los datos: cambiar el nombre de las columnas o las tablas, convertir texto en números, quitar filas, configurar la primera fila como encabezado, etc. Combinar datos significa conectarse a dos o más orígenes de datos, darles la forma necesaria y consolidarlos después en una consulta individual.
En este tutorial, aprenderá a:
- Dar forma a los datos con el Editor de Power Query.
- Conectarse a diferentes orígenes de datos.
- Combinar esos orígenes de datos y crear un modelo de datos para usarlo en los informes.
El Editor de Power Query en Power BI Desktop usa los menús contextuales y la cinta de opciones Transformar. La mayor parte de los elementos que se pueden seleccionar en la cinta también están disponibles en el menú contextual que aparece al hacer clic con el botón derecho en un elemento (por ejemplo, en una columna).
Dar forma a los datos
Para dar forma a los datos en el Editor de Power Query, tiene que proporcionar instrucciones paso a paso para que esta característica ajuste los datos a medida que se cargan y se presentan. El origen de datos del que procede la información no se verá afectado. Los únicos datos a los que se va a dar forma o que se van a ajustar son los de esta vista concreta.
El Editor de Power Query registra los pasos especificados (por ejemplo, cambiar el nombre de una tabla, transformar un tipo de datos o eliminar una columna). Cada vez que esta consulta se conecte al origen de datos, el Editor de Power Query llevará a cabo esos pasos para que los datos siempre tengan la forma indicada. Este proceso tendrá lugar siempre que utilice el Editor de Power Query o que otra persona utilice su consulta compartida; por ejemplo, en el servicio Power BI. Estos pasos se capturan, de manera secuencial, en el panel Configuración de consulta, en PASOS APLICADOS. Explicaremos cada uno de estos pasos en este artículo.
Importe los datos desde un origen web. Seleccione la lista desplegable Obtener datos y, a continuación, elija Web.
Pegue esta dirección URL en el cuadro de diálogo De web y seleccione Aceptar.
https://www.fool.com/research/best-states-to-retire
En el cuadro de diálogo Navegador, seleccione la casilla de la entrada que comienza por
Individual factor scores
y, a continuación, elija Transformar datos.Sugerencia
Algunas informaciones de las tablas de la dirección URL anterior pueden cambiar o actualizarse ocasionalmente. Como resultado, es posible que tenga que ajustar las selecciones o los pasos de este artículo en consecuencia.
Se abre la ventana Editor de Power Query. Puede ver los pasos predeterminados aplicados hasta ahora, en el panel Configuración de consulta en PASOS APLICADOS.
- Origen: conexión con el sitio web.
- Tabla extraída de HTML: selección de la tabla.
- Encabezados promovidos: cambiar la fila superior de datos en los encabezados de columna.
- Tipo cambiado: cambiar los tipos de columna, que se importan como texto, a sus tipos inferidos.
Cambie el nombre de la tabla del valor predeterminado
Individual factor scores...
aRetirement Data
y, después, presione Entrar.Los datos existentes se ordenan por una puntuación ponderada, como se describe en la página web de origen en Metodología. A continuación, ordenaremos la tabla de esta columna para comparar la clasificación de la puntuación personalizada con la clasificación existente.
En la cinta de opciones Agregar columna, seleccione Columna personalizada.
En el cuadro de diálogo Columna personalizada, en el campo Nuevo nombre de columna, escriba Nueva puntuación. En Fórmula de columna personalizada, especifique lo siguiente:
( [Quality of life] + [Cost of housing] + [Public health] + [Crime] + [Taxes] + [Weather] + [#"Non-housing cost of living"] ) / 7
Compruebe que el mensaje de estado es No se han detectado errores de sintaxis y seleccione Aceptar.
En Configuración de consulta, la lista PASOS APLICADOS ahora muestra el nuevo paso Personalizada agregada que acabamos de definir.
Ajuste de los datos
Antes de poder trabajar con esta consulta, hagamos algunos cambios para ajustar los datos:
Ajustar las clasificaciones quitando una columna.
Por ejemplo, supongamos que Weather no es un factor en nuestros resultados. Quitar esta columna de la consulta no afecta a los demás datos.
Corrija cualquier error.
Al quitar una columna, es necesario ajustar los cálculos de la columna Nueva puntuación mediante el cambio de su fórmula.
Ordenar los datos.
Ordene los datos en función de la columna Nueva puntuación y compare con la columna Clasificación existente.
Reemplazar los datos.
Es importante resaltar cómo se van a reemplazar valores específicos y cómo insertar un paso aplicado.
Estos cambios se describen en los pasos siguientes.
Para quitar la columna Weather, selecciónela, elija la pestaña Inicio de la cinta de opciones y haga clic en Quitar columnas.
Nota
Observe que los valores de Nueva puntuación no han cambiado, lo que se debe al orden de los pasos. Editor de Power Query registra los pasos secuencialmente, pero de forma independiente, entre sí. Para aplicar acciones en una secuencia diferente, puede mover cada paso aplicado hacia arriba o hacia abajo.
Haga clic con el botón derecho en un paso para ver su menú contextual.
Seleccione Mover antes en el menú contextual para subir al último paso, Columnas quitadas, y colóquelo justo encima del paso Personalizada agregada. También puede usar el ratón para mover un paso a la posición deseada.
Seleccione el paso Personalizada agregada.
Observe que la columna Nueva puntuación ahora muestra Error en lugar del valor calculado.
Hay varias maneras de obtener más información sobre cada error. Si selecciona la celda sin hacer clic en la palabra Error, el Editor de Power Query mostrará la información del error.
Si selecciona la palabra Error directamente, el Editor de Power Query crea un Paso aplicado en el panel Configuración de la consulta y muestra información sobre el error. Como no necesitamos mostrar información sobre los errores en ningún otro lugar, seleccione Cancelar.
Para corregir los errores, es necesario realizar dos cambios: quitar el nombre de la columna Weather y cambiar el divisor de 7 a 6. Puede realizar estos cambios de dos maneras:
Haga clic con el botón derecho en el paso Agregar personalizado y seleccione Editar configuración o haga clic en el icono de engranaje situado junto al nombre del paso para abrir el cuadro de diálogo Columna personalizada que usó para crear la columna Nueva puntuación. Edite la fórmula como se ha descrito anteriormente, hasta que tenga este aspecto:
Seleccione la columna Nueva puntuación, luego muestre la fórmula de datos de la columna seleccionando la casilla Barra de fórmulas de la pestaña Ver.
Edite la fórmula como se ha descrito anteriormente, hasta que tenga este aspecto y luego presione Entrar.
= Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Cost of housing] + [Public health] + [Crime] + [Taxes] + [#"Non-housing cost of living"] ) / 6)
El Editor de Power Query reemplaza los datos por los valores revisados y el paso Personalizada agregada se completa sin errores.
Nota
También puede seleccionar Quitar errores en la cinta o el menú contextual, lo que quitará todas las filas que contienen errores. Sin embargo, en este tutorial queremos conservar todos los datos de la tabla.
Ordene los datos con arreglo a la columna Nueva puntuación. En primer lugar, seleccione el último paso aplicado, Personalizada agregada para mostrar los datos más recientes. Después, seleccione la lista desplegable situada junto al encabezado de columna Nueva puntuación y elija Orden descendente.
Ahora, los datos están ordenados con arreglo a la columna Nueva puntuación. Puede seleccionar un paso aplicado en cualquier parte de la lista y seguir dando forma a los datos en ese momento en la secuencia. El Editor de Power Query insertará de forma automática un paso nuevo inmediatamente después del paso aplicado seleccionado actualmente.
En PASOS APLICADOS, seleccione el paso anterior a la columna personalizada, que es el paso Columnas quitadas. Aquí reemplazaremos el valor de la clasificación Housing cost de Oregón. Haga clic con el botón derecho en la celda que contiene el valor Housing cost de Oregón y seleccione Reemplazar valores. Observe cuál es el paso aplicado que está seleccionado actualmente.
Seleccione Insertar.
Como vamos a insertar un paso, el Editor de Power Query nos recuerda que los pasos posteriores podrían hacer que la consulta se interrumpiera.
Cambie el valor de los datos a 100,0.
El Editor de Power Query reemplaza los datos de Oregón. Cuando se crea un paso aplicado nuevo, el Editor de Power Query le asigna un nombre en función de la acción; en este caso, Valor reemplazado. Si tiene varios pasos con el mismo nombre en la consulta, el Editor de Power Query agrega un número creciente al nombre de cada paso aplicado posterior.
Seleccione el último Paso aplicado y Filas ordenadas.
Observe que los datos han cambiado con respecto a la nueva clasificación de Oregón. Este cambio se produce porque hemos insertado el paso Valor reemplazado en la ubicación correcta, antes del paso Personalizada agregada.
Ahora, hemos dado a los datos la forma que necesitábamos. A continuación, vamos a conectarnos a otro origen de datos y combinar datos.
Combinar datos
Los datos sobre los diferentes estados son interesantes y serán útiles para crear otras consultas y análisis. Sin embargo, la mayoría de los datos sobre los estados usan una abreviatura de dos letras para los códigos de estado, no el nombre completo del estado. Debemos encontrar un modo de asociar las abreviaturas con los nombres de los estados.
Hay otro origen de datos públicos que proporciona esa asociación, pero necesita unos buenos ajustes para que podamos conectarlo a nuestra tabla sobre la jubilación. Para dar forma a los datos, siga estos pasos:
En la cinta de opciones Inicio de Editor de Power Query, seleccione Nuevo origen > Web.
Escriba la dirección del sitio web que contiene las abreviaturas de los estados, https://en.wikipedia.org/wiki/List_of_U.S._state_and_territory_abbreviations, y seleccione Aceptar.
En Navegador, se muestra el contenido del sitio web.
Seleccione Códigos y abreviaturas para estados estadounidenses, distrito federal, territorios y otras regiones.
Sugerencia
Llevará algo de tiempo dar forma a los datos de la tabla para reducirlos y que se adapten a lo que queremos. ¿Hay una forma más rápida o fácil de realizar los siguientes pasos? Sí, podríamos crear una relación entre las dos tablas y dar forma a los datos según esa relación. Los pasos de ejemplo siguientes son útiles para aprender a trabajar con tablas. Sin embargo, las relaciones pueden ayudarle a usar rápidamente datos de varias tablas.
Para ajusta los datos, siga estos pasos:
Quite la fila superior. Esta fila es el resultado del modo en que se creó la tabla de la página web, así que no la necesitamos. Desde la cinta de opciones Inicio, seleccione Quitar filas > Quitar filas superiores.
Aparece el cuadro de diálogo Quitar filas superiores. Especifique 1 fila para quitar.
Como la tabla Datos de jubilación no tiene información sobre Washington D. C. ni territorios, debemos filtrarlos en nuestra lista. Seleccione la lista desplegable de la columna Estado de región y desactive todas las casillas excepto Estado y Estado (oficialmente Commonwealth).
Quite todas las columnas innecesarias. Dado que solo necesitamos la asignación de cada estado a su abreviatura oficial de dos letras (columnas Nombre y ANSI), podemos quitar las demás columnas. En primer lugar, seleccione la columna Nombre y mantenga presionada la tecla CTRL para seleccionar la columna ANSI. En la pestaña Inicio de la cinta de opciones, seleccione Quitar columnas > Quitar otras columnas.
Nota
La secuencia de los pasos aplicados en el Editor de Power Query es importante y afecta a la forma en que se ajustan los datos. También es importante tener en cuenta cómo un paso puede afectar a otro paso posterior. Por ejemplo, si quita un paso de los pasos aplicados, es posible que los pasos posteriores no se comporten según lo previsto originalmente.
Nota
Al cambiar el tamaño de la ventana del Editor de Power Query para reducir el ancho, algunos elementos de la cinta de opciones se comprimen para optimizar el uso del espacio visible. Al aumentar el ancho de la ventana de Editor de Power Query, se expanden los elementos de la cinta de opciones para hacer el mayor uso posible del área aumentada de esta.
Cambie el nombre de las columnas y la tabla. Hay un par de formas de cambiar el nombre de una columna. En primer lugar, seleccione la columna y, después, puede seleccionar Cambiar nombre en la pestaña Transformar de la cinta de opciones o bien hacer clic con el botón derecho y seleccionar Cambiar nombre. En la siguiente imagen se muestran ambas opciones, pero solo necesitará elegir una.
Vamos a llamarlas Nombre de estado y Código de estado. Para cambiar el nombre de la tabla, escriba Códigos de estado en el campo Nombre en el panel Configuración de consulta.
Combinación de consultas
Ahora que hemos dado a la tabla Códigos de estado la forma que queríamos, vamos a combinar estas dos tablas (o consultas) en una sola. Como las tablas que tenemos ahora son el resultado de las consultas que aplicamos a los datos, a menudo también se les llama consultas.
Hay dos formas principales de combinar las consultas: combinar y anexar.
- Si desea agregar una o más columnas a otra consulta, combine las consultas.
- Si desea agregar una o más filas de datos que desea agregar a una consulta existente, asocie la consulta.
En este caso, lo que vamos a hacer es combinar las consultas:
En el panel izquierdo de Editor de Power Query, seleccione la consulta en la que quiere combinar la otra consulta. En este caso, será Datos de jubilación.
Seleccione Combinar consultas > Combinar consultas en la pestaña Inicio de la cinta de opciones.
Es posible que tenga que establecer los niveles de privacidad para garantizar que los datos se combinan sin que se incluyan o transfieran datos no deseados.
Aparece la ventana Combinar. Le pedirá que seleccione la tabla que desea combinar con la tabla seleccionada y las columnas correspondientes que se van a utilizar para realizar la combinación.
Seleccione Estado en la tabla Datos de jubilación y, después, seleccione la consulta Códigos de estado.
Cuando haya seleccionado las columnas correspondientes, se habilitará el botón Aceptar.
Seleccione Aceptar.
El Editor de Power Query crea una columna al final de la consulta con el contenido de la tabla (consulta) que se ha combinado con la consulta actual. Todas las columnas de la consulta combinada se comprimen en la columna, pero puede expandir la tabla e incluir las columnas que quiera.
Para expandir la tabla combinada y seleccionar las columnas que desea incluir, haga clic en el icono de Expandir ( ).
Aparecerá la ventana Expandir.
En este caso, solo vamos a utilizar la columna Código de estado. Seleccione esa columna, desactive Usar el nombre de columna original como prefijo y seleccione Aceptar.
Si dejáramos activada la casilla Usar el nombre de columna original como prefijo, la columna combinada se llamaría Códigos de estado.Códigos de estado.
Nota:
Si desea explorar cómo incorporar la tabla Códigos de estado, puede experimentar un poco. Si no le gustan los resultados, elimine ese paso de la lista PASOS APLICADOS del panel Configuración de consulta y la consulta regresará al estado anterior a la aplicación del paso Expandir. Puede realizar esta operación tantas veces como quiera hasta que el proceso de expansión tenga la apariencia deseada.
Ahora tiene una única consulta (tabla) con dos orígenes de datos combinados, a los que se les dio forma para que se adecuaran a sus necesidades. Esta consulta puede ser una base para conexiones de datos interesantes, como estadísticas de costos de vivienda, calidad de vida o tasa de criminalidad en cualquier estado.
Para aplicar los cambios y cerrar Editor de Power Query, seleccione Cerrar y aplicar en la pestaña Inicio de la cinta de opciones.
El modelo semántico transformado aparece en Power BI Desktop, listo para usarse para crear informes.
Contenido relacionado
Para más información sobre Power BI Desktop y sus funcionalidades, consulte los siguientes recursos: