Recientemente Google ha introducido en su famosa herramienta de creación de dashboards nuevas formas de combinar fuentes de datos. Hasta el momento solo disponíamos de la opción de combinar fuentes por medio del sistema left outer join, pero con la nueva actualización ahora vamos a poder realizar esta función de cinco formas distintas.
Esto supone una importante mejora en Data Studio que con la cual se multiplican las posibilidades de obtención y visualización de datos.
Con cada combinación se obtienen distintos resultados. En este post veremos cómo configurar una combinación de datos, cuales son los distintos métodos de combinación y en qué momento merece la pena utilizar cada uno de ellos.
Con cada combinación se obtienen distintos resultados. En este post veremos cómo configurar una combinación de datos, cuales son los distintos métodos de combinación y en qué momento merece la pena utilizar cada uno de ellos.
Cómo configurar una combinación de datos
Acceder a la configuración de una combinación de fuentes de datos en Data Studio es sumamente sencillo. Simplemente nos situaremos sobre un gráfico, y en el apartado de “fuentes de datos” en la barra de herramientas de la izquierda podremos ver la opción de combinar fuentes.En la ventana que se nos abrirá deberemos incluir las fuentes a combinar, las cuales, como es lógico, deberán tener algunos datos que las relacionen. El orden que ocupan las fuentes será determinante a la hora de obtener un resultado.
Podremos configurar de forma independiente cada una de las fuentes. Esto también resulta muy útil cuando cuando queremos mostrar en un mismo gráfico datos con varios filtros y segmentos.
Una vez añadidas las fuentes de datos deberemos seleccionar la forma en la que data Studio las va a combinar. Para ello y, por medio de un Diagrama de Venn, podremos ver de una forma visual qué combinación podemos utilizar y empezar a intuir cuál será el resultado.

Métodos de combinación
Los métodos de combinación de datos están basados en las sentencias Join SQL, que son operaciones de consulta con la cual se combinan tablas de una base de datos por medio de columnas.A pesar de contar con nuevos métodos de combinación sigue siendo importante el orden secuencial, de izquierda a derecha, que ocupan nuestras fuentes de datos. Este orden va a determinar la dominancia de una de las dos fuentes de datos en función del método que seleccionemos.
Como es lógico, para poder combinar dos fuentes de datos es necesario que ambas estén relacionadas. Esta relación se dará por medio de una o varias dimensiones que harán de nexo de unión para hacer posible dicha combinación.
A continuación, combinaremos estas dos pequeñas tablas a través de los distintos métodos y utilizando la dimensión hostname como nexo de unión.

- Left Outer Join
Este método de combinar fuentes de datos es el más común y el único que hasta ahora disponíamos en Data Studio. En este método la fuente situada a la izquierda actúa como tabla dominante, lo que quiere decir que el resultado será igual a los datos de esta tabla a la que se sumarán los datos coincidentes de la tabla derecha.
En el ejemplo anterior se incluirá los datos de leads en la tabla de la izquierda solo en aquellas filas en las que el valor de hostname coincida. En el resto, el valor de la columna lead quedará en 0 o nulo.

Si nos fijamos el valor de hostname www.host4.com no aparece en la tabla resultante. Eso es por que este host nunca estuvo en la tabla de la izquierda.
- Right Outer Join
Este método de combinación es igual que el anterior con la diferencia de que en esta ocasión la tabla de la derecha actuará como tabla dominante.

Como vemos, en este caso www.host3.com no aparecerá en la combinación, ya que este nunca estuvo en la tabla de la derecha.
- Inner Join
Con este método no se determinará la dominancia de ninguna de las tablas, si no que se mostrarán los datos únicamente en aquellas filas en las que el valor de la dimensión de unión coincida. Es, junto con los dos anteriores, el método de combinación más útil.

Como vemos, en este caso www.host3.com y www.host4.com no aparecerán en la combinación ya que no son comunes de ambas tablas.
- Full Outer
Con este método cabría pensar que se mostrarán todas las filas comunes y no comunes. Sin embargo, no es así. Con él, Data Studio mostrará en la tabla resultante los datos no coincidentes de la tabla de la izquierda y los datos coincidentes de la tabla de la derecha.
Es un método similar al Left Outer Join con la particularidad de que tendremos desdoblada la dimensión de unión en dos, una con los valores de la tabla de la izquierda, y otra con los valores comunes de la de la derecha.

- Cross join
Con este método Data Studio devolverá todas las combinaciones posibles de la tabla de la izquierda y de la derecha sumando sus valores