Módulo 1. Introducción A La Visualización y Aplicaciones en Tableau

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 26

IntroducciónInmersiónUnidad 1Unidad 2HabilidadesCierreGlosarioReferencias

Módulo 1. Introducción a la visualización


y aplicaciones en Tableau
Introducción

En este módulo estudiaremos qué son los datos y cómo los analizaremos utilizando
visualizaciones. A su vez, aprenderemos cómo aplicarlos en la herramienta Tableau.

​Abordaremos los conceptos más importantes que nos permitirán formularnos preguntas y generar
resoluciones en nuestro rol de científico de datos.

Video de inmersión

01:29

Unidad 1: Introducción a la visualización de datos e


información

Tema 1: Datos vs información. Análisis e insights

Un dato es una representación de algún fenómeno o aspecto del mundo real, se puede presentar
en forma de números, textos o imágenes. Decimos que es una representación por dos motivos:
por un lado, es una variable entre distintas posibilidades (por ejemplo, podríamos representar la
temperatura en grados centígrados o fahrenheit). Por otro lado, podría ser más o menos fiel a la
realidad que busca reflejar. A este aspecto lo llamamos calidad de los datos.

Entonces, ¿cuál es la diferencia entre datos e información? Podemos responder a esa pregunta
de forma fácil: la mayor diferencia es el contexto. Antes de poder obtener información que sirva y
agregue valor a nuestros clientes, es necesario procesar los datos, agregarles contexto y darles
sentido ya que ellos “no hablan por sí solos”. Un ejemplo de la diferencia puede ser una tabla de
información nutricional y un análisis clínico (ambos incluyen una columna con valores de
referencia que le brinda contexto a la persona que los lee).

Para comprender dichos conceptos, te presentamos la pirámide DIKW (data, information,


knowledge and wisdom). También la podemos conocer como pirámide de la jerarquía del
conocimiento:

Figura 1. Pirámide

Fuente: elaboración propia.


Los datos, la información y el conocimiento tienen y agregan valor económico en la medida en
que sean accionables. Significa que permitirán a una organización poder tomar decisiones
informadas para alcanzar sus objetivos (los cuales pueden cambiar con el tiempo). Son un
insumo clave en la gestión y permiten, entre otras cosas, identificar oportunidades y prioridades.
Analizar datos es, entonces, agregar valor, enriquecimiento, contexto y sentido para pasar a
convertirlos en información útil y de calidad.

Cuando realizamos un análisis de datos buscamos encontrar patrones no triviales, por ejemplo:
tendencias, similitudes o diferencias que nos ayuden a entender el fenómeno que estamos
estudiando. En las empresas u organizaciones surgen problemas de forma periódica que
podemos resolver con el análisis de datos.

Finalmente, el dato pasa a ser información y se toman decisiones en base a ella. Es probable que
en esta última etapa surjan nuevas dudas o preguntas: a esto lo conocemos como el ciclo
analítico.

A su vez, el grado de importancia que una organización le otorga al análisis de datos e


información en sus procesos de decisiones, (en vez de, por ejemplo, guiarse por la intuición,
convención o tradición) determina su cultura analítica. Este concepto también está relacionado
con el de madurez analítica, que representa la medida en la que se aprovechan los datos de
negocio y no todas las empresas u organizaciones poseen el mismo nivel de madurez.

También es necesario entender que dentro de una misma organización (incluso dentro de un
mismo proyecto) suelen existir distintos usuarios de la información. La principal diferencia la
determina el nivel dentro de la organización y cuán técnicos son los perfiles. Por ejemplo, los
niveles gerenciales pueden preferir recibir información a un “más alto nivel” y con menor detalle,
mientras que los perfiles en áreas de operaciones pueden necesitar información con mucho más
detalle técnico. Esto nos va a orientar en el tipo de información que vayamos a producir y
entregar a nuestros clientes.

El análisis de datos tiene un flujo de trabajo con distintas etapas:

1. La obtención de los datos: es nuestra “materia prima”. Puede provenir de distintas fuentes
(propias o externas).
2. El procesamiento de esos datos: incluye los chequeos de calidad y las transformaciones
necesarias.
3. El análisis de los datos en sí: es un proceso iterativo que surge hasta encontrar las
respuestas a las preguntas originales.
4. La etapa de comunicar las conclusiones o los hallazgos a los clientes.

A lo largo de este flujo de trabajo vamos a usar distintas herramientas, principalmente de


estadística y de programación, y las complementaremos con distintos recursos de comunicación.
Pregunta de repaso

1. ¿Cuál de las siguientes afirmaciones es incorrecta?


Los datos deben ser procesados y contextualizados para convertirse en información.

Los datos crudos no nos cuentan una historia ni agregan valor, es necesario su procesamiento para que brinden
información.

Una de las limitaciones para el análisis de datos es el conocimiento que existe dentro de la organización (cultura y
madurez analítica).

La cultura y madurez analítica de una empresa u organización pueden limitar cómo se procesa y usa la
información dentro de una organización.

Existe una única forma de representar la realidad en forma de dato y siempre es fiel a ella.

Dentro de una misma organización pueden existir distintas audiencias o usuarios de la información.

Pueden existir distintos usuarios, perfiles con conocimientos y necesidades diferentes.

Justificación
Tema 2: Visualización de datos e información

Ahora que sabemos qué es el análisis de datos podemos comprender el término visualización
de datos. Consta de representar, de manera visual o gráfica, un conjunto de datos, sus distintas
variables, sus comportamientos y sus relaciones entre las variables. Podemos entender que
visualizar es “traducir” distintos aspectos de los datos al lenguaje visual.

El lenguaje visual, tal como el lenguaje natural, tiene distintos elementos y distintas reglas que lo
componen. Los elementos son los atributos visuales (la forma, el color o el movimiento) y las
reglas son todas aquellas prácticas que aplicamos cuando nos comunicamos.

El sistema ojo-cerebro es el responsable de la percepción visual. Las personas no podemos


captar el mundo exactamente como es, sino que lo hacemos a través de órganos que sensan
(convierten la información de los estímulos que reciben en impulsos eléctricos) y órganos que
“interpretan” esa información basada en la experiencia previa. Por lo tanto, nuestra percepción
visual del mundo es imperfecta y está sujeta a distintas limitaciones y sesgos (como en el caso
de las ilusiones ópticas). Por ejemplo, nuestro cerebro no puede percibir las 3 dimensiones,
vemos solo dos de ellas e inferimos la tercera. Así podemos percibir la profundidad.

También podemos llamar a los elementos del lenguaje visual como atributos preatentivos
porque son aquellos que podemos percibir antes de ser conscientes de ello (entre 200 y 500
milisegundos previos). Usarlos facilita el procesamiento de información que el cerebro debe
realizar. Es importante aclarar que algunos atributos son más simples de discriminar que otros.
Dicho rasgo puede determinar la efectividad a la hora de usarlos en visualizaciones.
Atributos preatentivos

Forma

Los atributos más fáciles de discriminar son los de forma. La longitud y el tamaño pueden
usarse para representar variables cuantitativas (por ejemplo, en gráficos de barras). A su vez,
podemos relacionar a la forma con la posición a lo largo de un eje. Esto se utiliza para diagramas
de dispersión.

Por otro lado, las formas (círculos, cuadrados y triángulos, entre otras) pueden servir como
marcadores para diferenciar categorías. También podemos usar texturas o patrones geométricos
para distinguir información (sobre todo cuando los gráficos tienen que imprimirse en blanco y
negro).

Dentro de los atributos de forma, el ángulo o la orientación es el menos efectivo para comunicar
visualmente magnitudes (como vamos a ver más adelante). Se usa en gráficos de torta, de
pendiente o mapas de viento.

Por último, es desaconsejable usar el volumen (gráficos 3D) por la dificultad de percibir las
diferencias en los valores de las variables cuando están representadas en dos dimensiones.

Color

El color tiene distintos aspectos o propiedades que pueden usarse para construir paletas y
escalas que representen las distintas variables a analizar. Al igual que con los atributos de forma,
los del color pueden ser más o menos fáciles de distinguir. Uno de los modelos para definir el
color es el de tono, la saturación y la luminosidad (modelo HSL: hue, saturation and lightness).

Figura 2. Color

Fuente: [Imagen sin título sobre modelo HSL]. (s.f.). Recuperado de


https://www.dsigno.es/blog/diseno-de-moda/el-color-y-sus-cualidades
La propiedad más fácil de discriminar es la luminosidad. Ella representa cuán blanco o cuán
brillante es un color. Esto es especialmente importante a la hora de construir escalas (por
ejemplo, para representar la intensidad de alguna variable). Los colores son consecutivos deben
ser, únicamente, crecientes o decrecientes y sin puntos de inflexión. En la siguiente imagen
podrás ver un ejemplo:
Figura 3. Luminosidad

Fuente: Endolith [nombre de usuario]. (30 de mayo de 2012). Brewer blueish sequential vs
luminance. Recuperado de https://www.flickr.com/photos/omegatron/7298887952/
La saturación de un color indica cuán puro o cuánto gris tiene. También puede usarse para
representar la intensidad de alguna variable (por ejemplo, una ventaja electoral de algún
candidato o partido).

Lo más difícil de discriminar es el tono o matiz, que es lo que en general llamamos “color” (rojo,
azul, verde, etc.). Como esta propiedad suele usarse para representar distintas categorías, sobre
todo cualitativas y tiene más dificultad en ser percibida y distinguida, se recomienda no usar
demasiados tonos distintos (no más de ocho). Sin embargo, es común que en las empresas u
organizaciones haya colores institucionales o manuales de marca que indiquen el color que se
debe usar. Esto sirve para respetar la identidad de la marca y no utilizar cualquier color aparente.

Un dato no menor que debemos tener en cuenta es que una parte de la población (8% de
hombres y 0,5% de mujeres) tienen daltonismo y no logran percibir correctamente las diferencias
entre algunos colores. Como futuros profesionales en el rubro, debemos estar en todos los
detalles para generar una mejor experiencia a todos los usuarios.
Figura 4. Daltonismo

Fuente: Asociación Española de Optometristas Unidos. (s.f.). [Imagen sin título sobre daltonismo.
Recuperado de https://optometristas.org/tratamiento-del-daltonismo
Por último, la transparencia o canal alfa indica la opacidad que tiene un color. Puede usarse
para representar grados de certeza e incertidumbre, también para diagramas de dispersión o de
burbujas. Por ejemplo:
Figura 5. Transparencia

Fuente: Vizzlo. (2021). [Imagen sin título sobre transparencia. Recuperado de


https://vizzlo.com/uploads/changelog-smarter-bubble-chart.png
Movimiento e interactividad

Otro atributo visual importante es el movimiento. Este puede servir para convertir visualizaciones
estáticas en dinámicas y permitir agregar fácilmente más dimensiones a las visualizaciones.
También permite agregar interactividad a las visualizaciones (usando menús o botones) lo que
permite al usuario más control y rapidez en los análisis que obtiene.
Pregunta de repaso

2. El valor alfa indica la cantidad de gris que tiene un color y la saturación indica la
transparencia.
Verdadero

Falso
Justificación

Tema 3. Elementos de los gráficos

Cada gráfico tiene distintas partes o componentes que necesitamos entender, tanto para poder
leer e interpretar correctamente gráficos, como para diseñar de forma efectiva, sin distorsiones.
Por ejemplo, en el tema 4 de esta unidad vamos a ver los distintos tipos de gráficos y su utilidad,
pero también algunas variantes. Es decir, mientras conozcamos las reglas de cómo usar el
lenguaje visual, podemos usarlas de forma flexible según lo que necesitemos exponer con cada
visualización.
Figura 6. Gráficos

Fuente: Armstrong, R. (14 de agosto de 2017). [Imagen sin título sobre gráficos]. Recuperado de
https://www.ft.com/content/56d25a52-7df5-11e7-9108-edda0bcbc928
Tomá como referencia los números de la imagen para ver que es cada parte del gráfico.

1. Título: los gráficos deberían tener un título breve que describa qué se está mostrando (por
ejemplo: La inflación en Argentina en el año 2021). También puede incluir un subtítulo que
aclare más en detalle el objetivo de la visualización.
2. Ejes: a lo largo de ellos se representan distintas variables o dimensiones de análisis.
Pueden ser numéricas (por ejemplo, un diagrama de dispersión) o categóricas/cualitativas
(por ejemplo, un gráfico de barras).
Los ejes pueden ser, según la escala, lineales o logarítmicos (para graficar variables que
tienen un comportamiento exponencial, por ejemplo el PBI). Pueden incluir al número cero o
tener un quiebre (acompañado por un símbolo en el mismo eje) y pueden ser únicos o
dobles. Además, en algunos casos (por ejemplo, para variables como rankings) puede ser
útil invertir el eje, mostrarlo un orden inverso al original.
3. Marcas de graduación: son las subdivisiones de los ejes que señalan sus valores.
Además, pueden haber marcas principales y secundarias (más pequeñas).
4. Área de trazado: en ella van a estar incluidos los elementos (líneas, barras y puntos) que
van a representar los datos y las líneas de cuadrícula.
5. Líneas de la cuadrícula (opcional): son rectas horizontales o verticales en determinados
valores que ayudan a entender las magnitudes sobre los ejes.
6. Etiquetas de los ejes (opcional): explican las variables y escalas y pueden estar incluidas
en el texto.
7. Leyenda: explica la simbología que usamos en el gráfico (por ejemplo, colores o formas) si
representamos más de una categoría.
8. Marcadores: sirven para representar y resaltar observaciones individuales. Pueden usar
distintos símbolos (como círculos, cuadrados o triángulos). En algunos gráficos, por ejemplo
de línea, pueden ser opcionales.
9. Capa de anotaciones (opcional): son todos los elementos que se le pueden agregar al
gráfico para resaltar algunos aspectos y exponer más claramente lo que se quiere explicar.
Algunos ejemplos pueden ser: comentarios y etiquetas en datos individuales, líneas de
referencia y líneas de tendencia.
10. Notas: incluyen las fuentes u otras aclaraciones que sean necesarias.
11. Paneles (opcional): son subgráficos que se dividen por el valor de alguna variable. Por
ejemplo, podríamos tener gráficos de línea divididos en subgráficos por región geográfica.

Buenas prácticas y qué no hacer

Idealmente, un gráfico o visualización debería condensar la mayor cantidad de información con


la menor cantidad de elementos visuales posible. Es decir, debería maximizar la proporción entre
datos y “tinta”, lo que se conoce en inglés como data-ink ratio. También es importante que sea
comprensible a primera vista en la mayor medida posible.

Se debería tratar de no incluir elementos visuales que no codifican información nueva, que sean
redundantes o generen confusión, lo que podríamos llamar “basura” dentro del gráfico (en inglés,
chartjunk). Por ejemplo, hacer un gráfico de barras o torta en 3D o con perspectiva puede
distorsionar la percepción y conclusiones que se pueden extraer de la información brindada.
Otros ejemplos pueden ser colores de fondo, texturas o ilustraciones (en algunos casos).

Las distorsiones más comunes se dan cuando se manipulan los ejes y sus escalas. Por ejemplo,
cuando en un gráfico de barras no se incluye el cero y se truncan los ejes. Dicho rasgo dificultará
las comparaciones dentro del gráfico.
Figura 7. Gráfico
Fuente: How Deceptive are Deceptive Visualizations? Scientific Figure on ResearchGate. (2015).
Recuperado de https://www.researchgate.net/figure/Illustration-showing-Truncated-Axis-distortion-
which-leads-to-message_fig1_300726103
Tipos de variables

Los conjuntos de datos contienen distintas variables que representan distintos fenómenos o
aspectos de la realidad, tal como lo señalamos al principio. Desde el punto de vista estadístico,
estos son las principales variables que podemos encontrarnos:
Tabla 1. Variables

Variables Definición Ejemplo

Cualitativa Nominal Son atributos cualitativos que Nombre de persona, dirección.


pueden tomar distintos valores
pero sin un orden en particular.

Ordinal Variables cualitativas en las que Calificación o ranking. Por


las distintas categorías tienen un ejemplo: excelente, bueno o
orden. regular.

Binaria También llamada dicotómica (o Atributos binarios. Por ejemplo:


dummy en inglés), solo puede alumno aprobó/ no aprobó.
tomar dos valores opuestos.

Cuantitativa Discreta Representan cantidades pero Unidades vendidas.


solo puede tomar valores
enteros.

Continua Variable numérica que puede Precio.


tomar valores enteros o
decimales.

Fuente: elaboración propia.


Desde el punto de vista de las bases de datos hablamos de dimensiones y hechos: los
segundos (también llamados medidas) son aquellas variables que nos interesan analizar (por
ejemplo, precios o cantidades) y que varían en cada registro de una tabla. Las dimensiones de
análisis son los atributos de las entidades (personas, empresas y países) que analizamos para
obtener resultados.
Pregunta de repaso

3. ¿Cuál de estos elementos no puede pertenecer a la capa de anotaciones y es opcional?


Línea de referencia.

Línea de tendencia.

Comentarios.

Notas.

Justificación

Tema 4: Tipos de gráficos

Existen distintos tipos de gráficos que podemos usar para visualizar un conjunto de datos.
Dependiendo de qué aspectos busquemos mostrar o enfatizar, unos van a ser más útiles que
otros. Para elegirlos, debemos tener claro cuántas variables queremos mostrar, a qué tipo
pertenecen, cuántas categorías tienen y cuántas observaciones posee el conjunto de datos. A
continuación, te mostramos los gráficos más comunes según el objetivo de visualización:
Tabla 2. Gráficos
Fuente: elaboración propia con base en The data visualization catalogue. (s.f.). Recuperado de
https://datavizcatalogue.com/ES/index.html
Los gráficos pueden combinarse entre sí. También nos permiten crear variantes: si entendemos
los distintos elementos y cómo usarlos podemos generar nuevos tipos de gráficos.

Unidad 2. Implementación: visualizaciones con Tableau

Tema 1. Introducción y primeros pasos

En esta unidad aplicaremos lo visto en la anterior. Vamos a analizar datos usando Tableau, una
herramienta de visualización que está basada en una interfaz gráfica. Permite el análisis y
visualización de datos de forma amigable e intuitiva. Es una de los softwares de inteligencia de
negocios (business intelligence) más utilizados.

Tableau tiene distintas versiones, en nuestro caso vamos a trabajar con la de Escritorio (desktop).
Desde https://www.tableau.com/products/desktop/download se puede descargar una versión de
prueba gratuita por 14 días[1].
[1] El archivo de instalación ocupa aproximadamente 500 MB y requiere tener disponibles 1,5 GB
de espacio en el disco.

Figura 8. Tableau

Fuente: captura de pantalla de Tableau (2021).


Una vez instalado, podemos empezar a explorar el entorno y la interfaz. A su vez, practicaremos
sobre cómo importar datos.
Figura 9. Uso de Tableau

Fuente: captura de pantalla de Tableau (2021).


Lo que vemos en la figura 9 es la página de inicio de la aplicación. A la izquierda vamos a ver
distintas opciones para conectarnos a distintas fuentes de datos. Podemos hacerlo a través de
datos locales (en nuestro disco), de un servidor, de archivos planos (por ejemplo, csv y txt) o de
Excel. Más abajo, en ese menú, también vamos a poder acceder a fuentes de datos
precargadas.

En la sección del centro vamos a poder ver libros de trabajo abiertos recientemente y su vista
previa. Más abajo también están disponibles los tableros de muestra que podemos explorar. A la
derecha podemos encontrar más recursos, como videos gratuitos de entrenamiento.

Podemos empezar a explorar el entorno de Tableau usando datos precargados: en la parte
izquierda del menú, al final de la columna, elegimos la opción Fuentes de datos guardadas» e
«Indicadores mundiales».
Figura 10. Tableau
Fuente: captura de pantalla de Tableau (2021).
La pantalla se divide en secciones: en el margen superior tenemos los menús que contienen las
distintas herramientas y opciones. En el margen izquierdo tenemos acceso a las distintas
variables disponibles (que vamos a poder incorporar en las visualizaciones arrastrándolas con el
mouse) y podemos ver sus tipos (por ejemplo, numéricas, de texto y geográficas).

En el centro tenemos el área de trabajo en donde vamos a poder construir y personalizar


nuestras visualizaciones. En la parte derecha tenemos un menú con opciones de gráficos que
podemos generar según el tipo de variables que tengamos seleccionadas. Por último, en el
margen inferior tenemos una organización similar a la de Excel: en solapas podemos ver las
distintas hojas de trabajo. Además hay tableros e historias.

Para empezar a construir una visualización en el área de trabajo, tenemos que elegir los campos
o variables que queremos incluir y arrastrarlos en alguna de las distintas secciones en las que
queramos que estén representados. Por ejemplo, un campo puede estar representado en filas o
en columnas o con algún atributo visual como el color o la forma. También podríamos usar un
campo como filtro para que nuestro análisis solo contenga algunos de los registros de los datos
originales y no todos.
Pregunta de repaso

4. En la interfaz de Tableau, podemos encontrar las solapas con las hojas de trabajo,
tableros e historias en:
El margen superior.

La sección central.

Margen inferior.

Justificación
Tema 2: Visualizaciones estáticas

En este tema vamos a ver cómo construir algunos de los gráficos más usados. Vamos a empezar
con un gráfico de línea para representar la evolución del PBI por región a través del tiempo (en
años).
Figura 11. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Vamos a empezar eligiendo los campos «Año» y «PBI», ambos ubicados en el menú de la
izquierda. Vamos a arrastrarlos hasta el área de trabajo, poniendo al «Año» en las columnas (eje
horizontal) y el campo «PBI» en las filas (eje vertical). Además, queremos tener este gráfico
desagregado por región y que cada una esté representada con un color distinto. Entonces,
arrastramos el campo región al casillero de color en la sección de marcas. También podríamos
haberlo arrastrado al casillero de detalle, pero habría mostrado las regiones con el mismo color, y
no se hubieran distinguido.

En este caso Tableau generó por defecto un gráfico de líneas, pero podríamos cambiarlo según
lo que prefiramos mostrar. Para esto, vamos a la sección de marcas y abrimos el desplegable:
Figura 12. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Una opción posible es elegir el gráfico de barras apiladas:
Figura 13. Ejemplo de gráfico en Tableau
Fuente: captura de pantalla de Tableau (2021).
Si quisiéramos que las barras estuvieran ubicadas de forma contigua, podríamos agregar el
campo región a las columnas al lado del año.
Figura 14. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Como en Excel, podemos cambiar el nombre a la pestaña u hoja en la que estamos trabajando.
Ahora, vamos a agregar una nueva hoja haciendo click en el ícono a la derecha de «Hoja 1» que
contiene el signo «+».

Ahora vamos a construir un diagrama de dispersión o scatterplot:
Figura 15. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Vamos a elegir los campos para turismo entrante y saliente en las columnas y filas
respectivamente. Para el nivel de desagregación (casillero de detalle) podemos elegir el país y la
región con color. En este gráfico podemos analizar la relación entre la cantidad de turistas que
entran y salen de los distintos países. Por ejemplo, cómo Estados Unidos recibe muchos más
turistas de los que emite o Alemania, Reino Unido y Japón, tienen muchos más viajeros de los
que entran a sus países.

Para poder identificar observaciones individuales nos aproximamos a algunos de los puntos del
diagrama. Ubicando el cursor por encima de estos se muestra la descripción emergente
(tooltip) que es un cuadro que muestra más información sobre ese data point.
Figura 16. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Haciendo doble click en el casillero de «Descripción emergente» se abre una ventana en la que
podemos editar el contenido, agregar o quitar campos e incluir valores especiales usando el
menú «Insertar». Por ejemplo, nos servirá para ver la hora en la que se actualizaron los datos.
Figura 17. Uso de Tableau

Fuente: captura de pantalla de Tableau (2021).


Podríamos también agregar una dimensión adicional y convertir este gráfico en uno de burbujas.
En este caso, vamos a agregar la población total. Con esta nueva dimensión podemos ver cómo
cambia el patrón más visible en el gráfico.
Figura 18. Ejemplo de gráfico en Tableau
Fuente: captura de pantalla de Tableau (2021).
Un aspecto importante es que podemos cambiar la función que Tableau usa para agregar los
datos: por defecto usa la suma (como en los ejemplos anteriores) pero podemos cambiarla por
otra. Si hacemos click derecho en esa variable, en la opción «Medida» podremos elegir una
distinta a la promedio.
Figura 19. Uso de Tableau

Fuente: captura de pantalla de Tableau (2021).


También podemos construir un mapa de calor para la tasa de natalidad promedio por país.
Podemos usar los campos de «Latitud» y «Longitud» para las filas y columnas respectivamente,
detalle por país y color por promedio de la tasa de natalidad entre los distintos años.
Figura 20. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Podemos usar la ayuda del menú «Mostrarme» ubicado en la derecha para elegir que nos
muestre los datos como mapa. En los datos originales el país está como una variable de texto
que contiene el nombre, Tableau los reconoce y los grafica automáticamente.
Tema 3: Campos calculados y visualizaciones interactivas

Muchas veces necesitamos generar nuevas variables a partir de los datos originales o
necesitamos hacer correcciones y cambios para poder analizar de mejor forma los datos. En
estos casos es útil crear campos calculados. Estas nuevas variables van a estar disponibles
junto a las de los datos originales y vamos a poder usarlas en las visualizaciones.
Para esto, podemos ir al menú «Análisis» y hacer click en la opción «Campos calculados»: se va
a abrir una ventana en la que tenemos que elegir un nombre para el nuevo campo y debemos
insertar la fórmula (como lo haríamos en Excel, por ejemplo).
Como existe una gran cantidad de funciones disponibles, una forma de consultarlas es haciendo
click en el margen derecho de la ventana, en el ícono del triángulo. A partir de ahí se muestran
las distintas funciones (de número, de fecha, de texto y de agregación, entre otras).
Figura 21. Uso de Tableau

Fuente: captura de pantalla de Tableau (2021).


En este caso generamos un nuevo campo llamado PBI per cápita que resulta de la división entre
el PBI de cada país y su población. Al presionar «Aceptar» completamos esta tarea y vamos a
poder ver la nueva variable en el menú de la izquierda, junto con las que venían en los datos
originales. Vamos a poder distinguir los campos calculados porque tienen un signo «=» a la
izquierda del ícono. En caso de que tengamos que editar el campo podemos hacerlo desde el
mismo menú «Análisis».

Ahora podemos incluir la nueva variable que generamos en una visualización:
Figura 22. Ejemplo de gráfico en Tableau
Fuente: captura de pantalla de Tableau (2021).
Una función importante a la hora de analizar datos es la de filtrar registros u observaciones. Es
decir, conservar o excluir algunas filas del conjunto de datos originales y quedarnos con un
subconjunto de este. En este ejemplo podríamos querer excluir una región del gráfico.

Para esto, arrastramos el campo por el que queremos filtrar al casillero «Filtros» y vamos a ver
una ventana con distintas opciones para realizar la acción. En el caso de la región, podemos
seleccionar o excluir valores individuales:
Figura 23. Uso de Tableau

Fuente: captura de pantalla de Tableau (2021).


También podríamos filtrar dentro de la misma ventana en la solapa «Condición» por alguna otra
variable.
Figura 24. Uso de Tableau

Fuente: captura de pantalla de Tableau (2021).


Pregunta de repaso

5. ¿Cuál de estos enunciados es correcto?


Una vez seleccionado un campo como «Filtro» no se puede elegir otro campo distinto para filtrar.

Un campo calculado no se puede usar más de una vez.

Una vez creado un campo calculado se puede identificar por el signo «=» a la izquierda de su nombre.
Justificación

Tema 4: Visualizaciones interactivas y tableros

En este tema vamos a ver cómo agregar movimiento e interactividad a nuestras visualizaciones.
Tal como vimos en la primera parte, son recursos visuales que nos permiten mostrar distintos
aspectos de nuestro conjunto de datos.
Podemos tomar los filtros que vimos en el tema anterior y hacerlos dinámicos. Para esto vamos a
el casillero de «Filtros» y hacemos click derecho en el campo por el que estamos filtrando (puede
ser más de uno) y elegimos la opción de «Mostrar filtro».
Figura 25. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Ahora tenemos un menú en el que podemos filtrar este campo de forma interactiva. Cuando
construyamos tableros (dashboards) e historias, vamos a poder verlo así. También es importante
que podemos cambiar el tipo de widget, es decir, puede ser un desplegable, o una lista, y puede
elegirse un único valor o múltiples.
Figura 26. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Para incluir animación en una visualización usamos el casillero de «Páginas» en la esquina
superior izquierda del área de trabajo. En este caso, vamos a elegir el campo año para reflejar la
evolución en el tiempo de las variables. En este ejemplo hacemos un gráfico de burbujas con el
uso de internet y de teléfonos celulares, con desagregación por país, colores por región, y
tamaño por población total.
Figura 27. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Notamos que en la parte derecha aparece un slider que muestra los años. Si presionamos «Play»
se reproduce la animación. Esto también va a aparecer cuando armemos el tablero o dashboard.

Como mencionamos en la primera unidad, muchas veces es útil incluir en el gráfico una capa de
anotaciones que puede tener, por ejemplo, líneas de referencia mostrando el valor promedio de
las variables o líneas de tendencia. Para poder lograrlo, vamos al menú de la izquierda y en vez
de la pestaña «Datos» seleccionamos la pestaña «Análisis». Para incorporar una línea de
promedio elegimos esa opción y la arrastramos hasta el área de trabajo. Allí podemos elegir a
qué nivel queremos que calcule el promedio (por ejemplo: tabla, panel o celda).
Figura 28. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Para incluir una línea de tendencia podemos hacerlo desde el menú o haciendo click derecho en
el área de trabajo y seleccionando la opción «Mostrar líneas de tendencia».
Figura 29. Uso de Tableau
Fuente: captura de pantalla de Tableau (2021).
Para editar esta línea de tendencia presionamos «Editar todas las líneas de tendencia» y allí
podremos elegir entre distintas opciones.
Figura 30. Uso de Tableau

Fuente: captura de pantalla de Tableau (2021).


Una vez que tenemos construidas las visualizaciones que queremos mostrar, podemos generar
tableros (dashboards) agrupados en una o más hojas e historias (que son secuencias de tableros
con un hilo en común). Para crear dashboards e historias vamos a hacer click en la parte inferior
(en los íconos que están más a la derecha). El último de la lista es el de «Crear historias» y el
penúltimo el de crear «Dashboards». Para empezar, vamos a crear un tablero:
Figura 31. Uso de Tableau

Fuente: captura de pantalla de Tableau (2021).


Al crear un nuevo dashboard vamos a ver una pantalla distinta: ahora vamos a poder seleccionar
qué hojas incluir y la disposición de la página. Por ejemplo, en el desplegable de tamaño
podríamos seleccionar la opción «Automático» en vez de «Tamaño fijo» para que se adapte a los
dispositivos en los que se muestre. También, en objetos podemos agregar contenedores
verticales u horizontales o elementos de texto o imagen.
Figura 32. Ejemplo de gráfico en Tableau
Fuente: captura de pantalla de Tableau (2021).
Algo importante a tener en cuenta es que si queremos que los filtros apliquen a todas las hojas (y
no solo a la original), tenemos que: seleccionar al elemento que contiene el filtro, hacer click en la
parte izquierda («Más opciones») y en el desplegable elegir «Aplicar a hojas de trabajo» y elegir
la opción que corresponda.
Figura 33. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Figura 34. Ejemplo de gráfico en Tableau

Fuente: captura de pantalla de Tableau (2021).


Una vez creada la historia podemos agregar distintos dashboards y hojas de trabajo. Cada
historia puede tener varios puntos que incorporamos desde el menú de la izquierda, en la sección
«Agregar nuevo punto en la historia». Podemos aprovechar la descripción de cada punto para
contar una historia con las distintas visualizaciones.
Pregunta de repaso
6. Una hoja de trabajo puede incluir múltiples visualizaciones con un orden determinado y
la opción de armar una narración.
Verdadero

Falso

Justificación

Video de habilidades


Interactive
Video

Cierre

En este primer módulo vimos las bases de qué es y para qué nos sirve analizar datos:
comenzamos a aprender cómo comunicar visualmente distintos aspectos de los datos, cómo
hacernos preguntas y cómo responderlas con distintas herramientas gráficas.

Comenzamos a usar Tableau, una herramienta interactiva que nos permite construir rápidamente
visualizaciones estáticas o dinámicas, facilitando el análisis exploratorio de los datos.

Glosario

Glosario Interactivo

Buscar...
Accionable
A
Elemento que permitirá a una organización poder tomar decisiones informadas para
Accionable
alcanzar sus objetivos.
Análisis exploratorio de los datos

Atributos preatentivos

B
Boxplots

C
Calidad de datos

Campos calculados

Chartjunk

Ciclo analítico

Coeficiente de correlación

ANTERIOR SIGUIENTE

Referecias

[Imagen sin título sobre modelo HSL]. (s.f.). Recuperado de https://www.dsigno.es/blog/diseno-


de-moda/el-color-y-sus-cualidades
Armstrong, R. (14 de agosto de 2017). [Imagen sin título sobre gráficos]. Recuperado de
https://www.ft.com/content/56d25a52-7df5-11e7-9108-edda0bcbc928

Asociación Española de Optometristas Unidos. (s.f.). [Imagen sin título sobre daltonismo.
Recuperado de https://optometristas.org/tratamiento-del-daltonismo

Endolith [nombre de usuario]. (30 de mayo de 2012). Brewer blueish sequential vs luminance.
Recuperado de https://www.flickr.com/photos/omegatron/7298887952/

How Deceptive are Deceptive Visualizations? Scientific Figure on ResearchGate. (2015).


Recuperado de https://www.researchgate.net/figure/Illustration-showing-Truncated-Axis-distortion-
which-leads-to-message_fig1_300726103

Tableau (2021). Página web oficial. Recuperado de https://www.tableau.com/

The data visualization catalogue. (s.f.). Recuperado de


https://datavizcatalogue.com/ES/index.html

Vizzlo. (2021). [Imagen sin título sobre transparencia. Recuperado de


https://vizzlo.com/uploads/changelog-smarter-bubble-chart.png

También podría gustarte