Glosario: Términos y Definiciones
Glosario: Términos y Definiciones
Glosario: Términos y Definiciones
A
Agenda: Lista de citas programadas
Alcance del trabajo (SOW): Esquema acordado de las tareas a realizar durante un proyecto
Algoritmo: Proceso o conjunto de reglas a seguir para realizar una tarea específica
Análisis de déficits: Método para examinar y evaluar el estado actual de un proceso con el fin
de identificar las oportunidades de mejora en el futuro
Analista de datos: Persona que recopila, transforma y organiza los datos para sacar
conclusiones, hacer predicciones e impulsar la toma de decisiones fundamentada
Anidado: Código que realiza una función particular y está contenido dentro de código que
realiza una función más amplia
Anonimización de datos: Proceso de protección de los datos privados o confidenciales de las
personas mediante la eliminación de información que pueda asociarse a ellas
Anotación: Texto que explica brevemente los datos o ayuda al público a concentrarse en un
aspecto concreto de los datos en una visualización
Apertura: Aspecto de la ética de datos que promueve el acceso libre, el uso y el uso
compartido de los datos
Árbol de decisiones: Herramienta que ayuda a los analistas a tomar decisiones sobre características
esenciales de una visualización
Archivo CSV (valores separados por coma): Archivo de texto delimitado que utiliza una
coma para separar valores
Archivo de registro: Archivo generado por computadora que registra eventos de sistemas
operativos y otros programas de software
Asignación de alias: Nombrar temporalmente una tabla o columna en una consulta para que
sea más fácil de leer y escribir
Atributo: Característica o cualidad de los datos que se usa para etiquetar una columna en una
tabla
AVERAGEIF: Función de una hoja de cálculo que devuelve el promedio de todos los valores
de las celdas de un determinado rango que cumplen una condición especificada
B
Base de datos normalizada: Base de datos en la que solo se almacenan datos relacionados
en cada tabla
Base de datos relacional: Base de datos que contiene una serie de tablas que se pueden
conectar para formar relaciones
Biblioteca: Directorio que contiene todos los paquetes instalados de un analista de datos
Bordes: Líneas que se pueden agregar alrededor de dos o más celdas en una hoja de cálculo
C
C# : Lenguaje de programación orientado al objeto usado para crear juegos y aplicaciones
móviles en la plataforma de desarrollo de código abierto .NET
C++: Extensión del lenguaje de programación C que se usa para crear juegos de consola,
como los juegos para Xbox
Cadena de texto: Grupo de caracteres en una celda, mayormente compuesto por letras
Cálculo: Rama de la matemática que implica el estudio de las tasas de cambio y los cambios
entre valores que están relacionados por una función
Campo calculado: Campo nuevo dentro de una tabla dinámica que realiza ciertos cálculos en
función de los valores de otros campos
Campo: Información de una fila o columna de una hoja de cálculo; en una tabla de datos, suele
ser una columna de la tabla
Canal: Aspecto visual o variable que representa características de los datos en una
visualización
CASE: Instrucción de SQL que muestra resultados de registros que cumplen con las
condiciones al incluir una instrucción si/entonces en una consulta
Caso práctico: Una manera común en que los empleadores evalúan destrezas profesionales y
obtienen información sobre cómo un candidato aborda desafíos comunes relacionados con los
datos
Causalidad: Cuando una acción lleva directamente a un resultado, como una relación de
causa-efecto
Ciclo de vida de los datos: Secuencia de etapas por las que pasan los datos, que incluye
planificar, capturar, gestionar, analizar, archivar y destruir
Ciencia de datos: Campo de estudio que utiliza datos sin procesar para crear nuevas formas
de modelar y entender lo desconocido
Clasificación: Sistema para ubicar valores de un conjunto de datos en una escala de logro o
estado
Clave externa: Campo en una tabla de una base de datos que es una clave primaria en otra
tabla (Ver clave primaria)
Clave primaria: Identificador en una base de datos que hace referencia a una columna en la
que cada valor es único (Ver clave externa)
Clúster: Conjunto de puntos de datos en una visualización de datos con valores similares
COALESCE: Función de SQL que arroja valores que no son nulos en una lista
Código abierto: Código que está libremente disponible y puede ser modificado y compartido
por las personas que lo usan
Compatibilidad: Qué tan bien dos o más conjuntos de datos pueden trabajar juntos
Composición de datos: Proceso que combina las partes individuales en una visualización y
las muestra juntas como un todo
CONCAT: Función de SQL que une cadenas y crea nuevas cadenas de texto que se pueden
usar como claves únicas
CONCATENATE: Función de una hoja de cálculo que une dos o más cadenas de texto
Conjunto de datos: Recopilación de datos que pueden ser manipulados o analizados como
una unidad
Consulta interna: Subconsulta de SQL que está dentro de otra instrucción de SQL
CONVERT: Función de SQL que cambia la unidad de medida de un valor en los datos
Cookie: Pequeño archivo almacenado en una computadora que contiene información acerca
de sus usuarios
Correlación: Medición del grado de cambio de dos variables entre sí
COUNT DISTINCT: Función de SQL que solo devuelve los valores distintos en un rango
especificado
COUNT: Función de la hoja de cálculo que cuenta el número de celdas en un rango que
cumplen con una condición especificada
COUNTA: Función de la hoja de cálculo que cuenta el número total de valores en un rango
especificado que cumplen con un criterio especificado
COUNTIF: Función de la hoja de cálculo que devuelve el número de celdas dentro de un rango
que coinciden con un valor especificado
CRAN (Comprehensive R Archive Network) (R): Archivo en línea con paquetes R, código
fuente, manuales y documentación
CREATE TABLE: Cláusula de SQL que añade una tabla temporal a una base de datos que
puede ser utilizada por varias personas
CSS (Cascading Style Sheets): Lenguaje de programación usado para el diseño de páginas
web que controla los elementos gráficos y la presentación de la página
Cuarteto de Anscombe: Cuatro conjuntos de datos que tienen estadísticas de resumen casi
idénticas, pero contienen valores graficados diferentes
D
DATEDIF: Función de la hoja de cálculo que calcula el número de días, meses o años entre
dos fechas
Datos booleanos: Tipo de datos con solo dos valores posibles, generalmente verdadero o
falso
Datos continuos: Datos que se miden y que pueden tener casi cualquier valor numérico
Datos de primera fuente: Datos recopilados por una persona o por un grupo por medio de sus
propios recursos
Datos de segunda fuente: Datos recopilados por un grupo directamente de su audiencia y que
luego se venden
Datos de terceros: Datos proporcionados por fuentes externas que no los recopilaron de
forma directa
Datos desactualizados: Cualquier dato que haya sido reemplazado por información más
nueva y más precisa
Datos duplicados: Cualquier registro que inadvertidamente comparte datos con otro registro
Datos en formato ancho: Conjunto de datos en el que cada tema tiene una sola fila con varias
columnas para retener los valores de los distintos atributos del tema
Datos en formato largo: Conjunto de datos en el que cada fila es un punto de tiempo por
tema; por lo tanto, cada tema tiene datos en varias filas
Datos estructurados: Datos organizados en un cierto formato, por ejemplo, filas y columnas
Datos limpios: Datos que están completos y son correctos y pertinentes para el problema que
se está resolviendo
Datos no estructurados: Datos que no se organizan de forma que sea fácil identificarlos
Datos nominales: Tipo de datos cualitativos que se categorizan sin un orden establecido
Datos sucios: Datos que están incompletos o son incorrectos o irrelevantes para el problema a
resolver
Design Thinking: Proceso que se usa para resolver problemas complejos de una manera
centrada en el usuario
Diagrama de dispersión: Visualización de datos que representa relaciones entre las diferentes
variables con puntos de datos individuales sin una línea de conexión
DISTINCT: Palabra clave que se agrega a una instrucción SELECT en SQL para recuperar
solamente entradas no duplicadas
Dominio del problema: Área de análisis que abarca cada actividad que afecta a un problema
o se ve afectada por él
dplyr (R): Paquete de R en Tidyverse que ofrece un conjunto de funciones uniforme para
completar tareas comunes de manipulación de datos
DROP TABLE: Cláusula de SQL que elimina una tabla temporal de una base de datos
E
Ecosistema de datos: Los distintos elementos que interactúan entre sí para producir,
gestionar, almacenar, organizar, analizar y compartir datos
Ecuación: Cálculo que implica suma, resta, multiplicación o división (también se denomina
expresión matemática)
Eje X: Línea horizontal de un gráfico que suele situarse en la parte inferior y, a menudo, se usa
para representar escalas de tiempo y categorías puntuales
Eje Y: Línea vertical de un gráfico que suele situarse a la izquierda y, a menudo, se usa para
representar frecuencias y otras variables numéricas
Elemento de datos: Información en un conjunto de datos
Encabezado: Primera fila en una hoja de cálculo que hace referencia al tipo de datos en cada
columna
Énfasis: Principio de diseño que consiste en organizar los elementos visuales para centrar la
atención del público en la información importante de una visualización de datos
Equidad: Cualidad del análisis de datos que no genera sesgos ni los reafirma
Equilibrio: Principio de diseño que consiste en crear un atractivo estético y claridad en una
visualización de datos mediante la distribución uniforme de los elementos visuales
Esquema: Forma de describir cómo se organiza algo, por ejemplo, los datos
Estrategia de datos: Gestión de las personas, los procesos y las herramientas que se usan en
el análisis de datos
Ética de los datos: Normas justificadas respecto de lo que está bien y lo que está mal a la
hora de recopilar, compartir y usar datos
Ética: Normas justificadas respecto de lo que está bien y lo que está mal. Por lo general,
presuponen lo que deben hacer los seres humanos, usualmente en términos de derechos,
obligaciones, beneficios para la sociedad, equidad o virtudes específicas
Etiqueta: Texto en una visualización que identifica un valor o describe una escala
Etiquetas y anotaciones (R): Grupo de funciones de R para personalizar un diagrama
Exactitud: Grado de conformidad de los datos con respecto a la entidad real que se mide o
describe
Exhaustividad: Grado en que los datos contienen todas las medidas o componentes deseados
Expresión matemática: Cálculo que implica suma, resta, multiplicación o división (también se
denomina ecuación)
Expresión regular (RegEx): Regla que establece que los valores de una tabla deben coincidir
con un patrón prescrito
F
Facetas (R): Serie de funciones que divide datos en subconjuntos en una matriz de paneles
Factor (R): Objeto que almacena datos de categoría en el que los valores de datos están
limitados y generalmente se basan en un grupo finito, como país o año
Filtrado: Proceso que muestra solo los datos que cumplen con un criterio específico mientras
oculta el resto
Formato condicional: Herramienta de la hoja de cálculo que cambia la forma en que aparecen
las celdas cuando los valores cumplen con una condición específica
Formato visual: Apariencia de la visualización de datos que les aporta una estructura y un
atractivo estético
Fórmula: Conjunto de instrucciones que se utilizan para realizar un cálculo utilizando los datos
de una hoja de cálculo
Foto digital: Imagen electrónica o computarizada generalmente en formato BMP o JPG
Framework: Contexto que necesita una presentación para establecer conexiones lógicas entre
la tarea empresarial y las métricas
FROM: Sección de una consulta que indica de qué tabla(s) extraer los datos
Fuente de datos correctos: Fuente de datos que es confiable, original, integral, actual y citada
(ROCCC)
Fuente de datos erróneos: Fuente de datos que no es confiable, original, integral, actual ni
citada (ROCCC)
Función anidada: Función que está contenida completamente dentro de otra función
Función matemática: Función que se utiliza como parte de una fórmula matemática
Fusión de datos: Proceso de combinar dos o más conjuntos de datos en un único conjunto de
datos
FWF (archivo de ancho fijo): Archivo de texto con un formato específico que permite guardar
datos textuales de manera organizada
G
Geolocalización: Ubicación geográfica de una persona o dispositivo mediante información
digital
Geom (R): Objeto geométrico usado para representar datos
ggplot2 (R): Paquete de R en Tidyverse que crea diversas visualizaciones de datos aplicando
diferentes propiedades visuales a las variables de datos en R
Gobierno de datos: Proceso para garantizar la gestión formal de los recursos de datos de una
empresa
Gráfico circular: Visualización de datos que usa segmentos de un círculo para representar las
proporciones de cada categoría de datos en comparación con el total
Gráfico de áreas: Visualización de datos que utiliza puntos de datos individuales para una
variable cambiante conectados por una línea continua con un área de relleno debajo
Gráfico de barras: Visualización de datos que usa el tamaño para contrastar y comparar dos o
más valores
Gráfico de burbujas agrupadas: Visualización de datos que muestra los datos en círculos
agrupados
Gráfico de burbujas: Visualización de datos que muestra puntos de datos individuales como
burbujas, y compara valores numéricos por su tamaño relativo
Gráfico de columnas: Visualización de datos que usa puntos de datos individuales para una
variable cambiante, representada mediante columnas verticales
Gráfico de viñetas: Visualización de datos que muestra los datos como un gráfico de barras
horizontal que se mueve hacia un valor deseado
Gráfico dinámico: Gráfico creado a partir de los campos en una tabla dinámica
GROUP BY: Cláusula de SQL que agrupa las filas que tienen los mismos valores de una tabla
en filas de resumen
Guiones bajos: Líneas utilizadas para subrayar palabras y conectar caracteres de texto
H
Habilidades interpersonales: Rasgos y comportamientos no técnicos que se relacionan con la
manera en que las personas trabajan
Hacer contactos: Construir relaciones con otros tanto en persona como en línea
HAVING: Cláusula de SQL que añade un filtro a una consulta en lugar de la tabla subyacente
que solo se puede usar con funciones de agregado
head() (R): Función en R que devuelve una vista previa de los nombres de las columnas y las
primeras filas de un conjunto de datos
Histograma: Visualización de datos que muestra con qué frecuencia los valores de los datos
se encuadran en ciertos rangos
HTML5: Lenguaje de programación que brinda una estructura para páginas web y conecta a
plataformas de hosting
I
IDE (entorno de desarrollo integrado): Aplicación de software que junta todas las
herramientas que un analista de datos puede querer usar en un solo lugar
Ingeniero de datos: Profesional que transforma los datos en un formato útil para su análisis y
les da una estructura confiable
INNER JOIN: Función de SQL que devuelve registros con valores coincidentes en ambas
tablas
J
Java: Lenguaje de programación que se usa ampliamente para crear aplicaciones web de
empresas que pueden ejecutarse en múltiples clientes
JOIN: Función de SQL que se usa para combinar filas de dos o más tablas basadas en una
columna relacionada
L
LEFT JOIN: Función de SQL que devuelve todos los registros de la tabla izquierda y solo los
registros coincidentes de la tabla derecha
LEN: Función que indica la longitud de una cadena de texto al contar el número de caracteres
que contiene
Línea de suavizado (R): Línea en una visualización de datos que usa suavizado para
representar una tendencia
M
Macrodatos: Conjuntos de datos grandes y complejos que, generalmente, se recopilan durante
largos períodos y que permiten que los analistas de datos aborden los problemas comerciales
de gran alcance
Manipulación de datos: Proceso para cambiar los datos, de manera que estén más
organizados y sean más fáciles de leer
Mapa coroplético: Visualización de datos que colorea las áreas en un mapa según las
mediciones o las dimensiones
Mapa de densidad: Visualización de datos que representa concentraciones, con un color que
representa el número o la frecuencia de los puntos de datos en un área determinada de un
mapa
Mapa de símbolos: Visualización de datos que muestra una marca sobre una determinada
longitud y latitud
Mapa térmico: Visualización de datos que usa el contraste del color para comparar categorías
en un conjunto de datos
Mapeo (R): Proceso de emparejar una variable específica de un conjunto de datos con una
estética específica
Mapeo de datos: Proceso de hacer coincidir campos entre una fuente de datos y otra
Marca: Objeto visual en una visualización de datos, como un punto, una línea o una forma
Marco de datos: Conjunto de columnas que contienen datos, que es similar a una hoja de
cálculo o una tabla de SQL
Margen de beneficio: Porcentaje que indica cuántos centavos de ganancia se generaron por
cada dólar de venta
Margen de error: Cantidad máxima que se espera que los resultados de la muestra difieran de
los de la población real
MATCH: Función de la hoja de cálculo que se usa para ubicar la posición de un valor de
búsqueda específico
MAX: Función de la hoja de cálculo que muestra el resultado del valor numérico más alto de un
rango de celdas
MAXIFS: Función de la hoja de cálculo que devuelve el valor máximo de un determinado rango
que cumple una condición especificada
Mentalidad técnica: Capacidad de dividir las cosas en pasos o piezas más pequeñas y
trabajar con ellas de forma ordenada y lógica
Mentor: Persona que comparte su conocimiento, sus habilidades y su experiencia para ayudar
a otras personas a crecer, tanto en el campo profesional como en el personal
Metadatos descriptivos: Metadatos que describen datos y que se pueden utilizar para
identificarlos más adelante
Metadatos estructurales: Metadatos que indican cómo se organizan ciertos datos y si forman
parte de una recopilación de datos o de varias
Método McCandless: Método que se utiliza para presentar visualizaciones de datos y que
pasa de la información general a la específica
Métrica de negocios: Criterio de medición que se utiliza para resolver una tarea empresarial
Métrica: Tipo único y cuantificable de datos que pueden utilizarse para medición
MID: Función que extrae un segmento desde el medio de una cadena de texto
MIN: Función de la hoja de cálculo que muestra el resultado del valor numérico más bajo de un
rango de celdas
MINIFS: Función de la hoja de cálculo que devuelve el valor mínimo de un rango determinado
que cumple una condición especificada
Modelo de datos: Herramienta para organizar los elementos de los datos y la forma en que se
relacionan entre ellos
Modelo mental: Proceso de pensamiento del analista de datos y enfoque a un problema
Módulo: Operador (%) que devuelve el resto cuando se divide un número por otro
Movimiento: Principio de diseño que consiste en organizar los elementos visuales para guiar la
atención del público de una parte de una visualización de datos a otra
Muestreo aleatorio: Forma de seleccionar una muestra de una población para que todos los
tipos posibles de la muestra tengan la misma oportunidad de ser elegidos
mutate() (R): Función de R que realiza cambios a un marco de datos separando y combinando
columnas o creando nuevas variables
N
Narrativa de datos: Comunicar el significado de un conjunto de datos con elementos visuales
y una historia personalizada según el público
Nivel de confianza: Probabilidad de que el tamaño de una muestra refleje con precisión a la
porción más grande de la población
Notebook de Jupyter: Aplicación web de código abierto que se usa para crear documentos
que contienen código en vivo, ecuaciones, visualizaciones y textos, y compartirlos con otras
personas
Notebook de R: Documento para ejecutar códigos y ver los gráficos y tablas que permiten
visualizar el código
Notebook: Entorno de programación interactivo y editable para generar informes de datos y
mostrar destrezas en el uso de datos
Nube: Lugar para mantener los datos en línea, en vez de guardarlos en el disco duro de una
computadora
O
Objetivo métrico: Objetivo medible establecido por una empresa y evaluado mediante
métricas
Observación: Atributos que describen los datos contenidos en la fila de una tabla
Oficina del Censo de los Estados Unidos: Agencia del Departamento de Comercio de los
Estados Unidos que funciona como proveedor principal de la nación de datos de calidad sobre
las personas y la economía
Operador aritmético: Operador usado para realizar operaciones matemáticas básicas como
suma, resta, multiplicación y división
Operador relacional: Operador usado para comparar valores, también conocido como
comparador
Ordenación: Proceso de organizar los datos en un orden significativo para que sean más
fáciles de entender, analizar y visualizar
Ordenar hoja: Función del menú de la hoja de cálculo que ordena todos los datos por la
clasificación de una columna específica ordenada y mantiene los datos juntos a través de las
filas
ORDER BY: Cláusula de SQL que ordena los resultados devueltos en una consulta
OUTER JOIN: Función de SQL que combina RIGHT y LEFT JOIN para devolver todos los
registros coincidentes en ambas tablas
P
Paleta de color divergente: Tema de color que muestra dos rangos de valores de datos que
usan dos tonalidades diferentes, donde la intensidad del color representa la magnitud de los
valores
Patrón: Principio de diseño que usa elementos visuales similares para demostrar tendencias y
relaciones en una visualización de datos
Pensamiento analítico: Proceso de identificar y definir un problema para luego resolverlo
mediante el uso de datos de manera organizada, paso a paso
Poner de relieve: Explorar los datos para identificar rápidamente la información más
importante
Pregunta con límite de tiempo: Pregunta que especifica un plazo para ser analizada
Pregunta principal: Pregunta que orienta a las personas hacia cierta respuesta
Pregunta relevante: Pregunta que tiene importancia para el problema que se debe resolver
Privacidad de los datos: Preservación de la información sobre los datos de una persona cada
vez que ocurre una transacción de datos
Proceso de análisis de datos: Las seis fases de preguntar, preparar, procesar, analizar,
compartir y actuar cuyo propósito es el de obtener conocimiento que propicie la toma de
decisiones informada
Propiedad: Aspecto de la ética de datos que presupone que cada persona es dueña de los
datos sin procesar que proporciona y que tiene control primordial sobre su uso, procesamiento
y uso compartido
Proporción: Principio de diseño que consiste en usar el tamaño relativo y la disposición de los
elementos visuales para mostrar la información en una visualización de datos
Pruebas A/B: Proceso de probar dos variaciones de la misma página web para determinar qué
página es más exitosa para atraer el tráfico de usuarios y generar ingresos
Q
Quitar duplicados: Herramienta de la hoja de cálculo que busca y elimina automáticamente
las entradas duplicadas de una hoja de cálculo
R
R Markdown: Formato de archivo para crear documentos dinámicos con R
Rango de datos: Valores numéricos que se encuentran entre valores máximos y mínimos
predefinidos
Rango de ordenación: Función del menú de la hoja de cálculo que ordena un rango
especificado y preserva las celdas que no están incluidas en ese rango
Redes sociales: Sitios web y aplicaciones donde los usuarios crean y comparten contenido o
interactúan entre sí
Referencia absoluta: Referencia dentro de una función que está bloqueada para que las filas
y las columnas no cambien si se copia la función
Referencia de celda: Celda o rango de celdas en una hoja de cálculo que se usa
generalmente en fórmulas y funciones
Registro de cambios: Archivo que contiene una lista ordenada cronológicamente de las
modificaciones realizadas en un proyecto
Registro: Conjunto de datos relacionados en una tabla de datos, generalmente sinónimo de fila
Repetición: Principio de diseño que consiste en repetir elementos visuales para demostrar el
significado en una visualización de datos
Resaltar tabla: Visualización de datos que usa formato condicional y color en una tabla
Retorno de la inversión (ROI): Fórmula que utiliza las métricas de inversión y ganancias para
evaluar el éxito de una inversión
RIGHT JOIN: Función de SQL que devuelve todos los registros de la tabla derecha y solo los
registros coincidentes de la izquierda
RIGHT: Función que muestra un número establecido de caracteres a la derecha de una cadena
de texto
Ritmo: Principio de diseño que consiste en crear movimiento y fluidez en una visualización de
datos para captar la atención de una audiencia
ROUND: Función de SQL que devuelve un número redondeado hasta un número determinado
de decimales.
SELECT INTO: Cláusula de SQL que copia datos de una tabla a una tabla temporal sin añadir
la nueva tabla a la base de datos
SELECT: Sección de una consulta que indica de qué columna(s) extraer los datos
Sesgo de los datos: Cuando una preferencia a favor o en contra de una persona, un grupo de
personas o una cosa sesga sistemáticamente los resultados del análisis de datos en una cierta
dirección
Sesgo del muestreo: Representar en mayor o en menor medida a ciertos miembros de una
población debido a que se trabaja con una muestra que no representa a la población en su
totalidad
Sesgo del observador: Tendencia de distintas personas a observar las cosas de forma
diferente (también se denomina sesgo del investigador)
Shiny (R): Paquete de R que se utiliza para crear aplicaciones web interactivas usando
códigos R
Significancia estadística: Probabilidad de que los resultados de una muestra no se deban a
una posibilidad aleatoria
Sintaxis: Estructura predeterminada de un lenguaje que incluye todas las palabras, los
símbolos y la puntuación requeridos, así como su correcta ubicación
SPLIT: Función de la hoja de cálculo que divide el texto en base a un carácter específico y
ubica cada fragmento en una nueva celda separada
Suavizado (R): Proceso usado para hacer que las visualizaciones de datos en R sean más
claras y legibles
Suavizado con GAM (modelo aditivo generalizado) (R): Proceso para suavizar diagramas
con un gran número de puntos
Suavizado Loess (R): Proceso usado para suavizar diagramas con menos de 1,000 puntos
SUBSTR: Función de SQL que extrae una subcadena de una variable de cadenas
SUM: Función de una hoja de cálculo que suma los valores de un rango de celdas
seleccionadas
SUMIF: Función de una hoja de cálculo que suma datos numéricos basados en una condición
SUMPRODUCT: Función que multiplica las matrices y muestra el resultado de la suma de esos
productos
Swift: Lenguaje de programación para macOS, iOS, watchOS y tvOS
T
Tabla de resumen: Tabla que se usa para resumir información estadística sobre los datos
Tabla dinámica: Herramienta de resumen de datos que se utiliza para clasificar, reorganizar,
agrupar, contar, totalizar o promediar datos
Tabla temporal: Tabla de una base de datos que se crea y existe temporalmente en el servidor
de una base de datos
Tarea empresarial: Pregunta o problema que el análisis de datos resuelve para un negocio
Tasa de respuesta estimada: Número promedio de personas que suele completar una
encuesta
Tasa de rotación: Ritmo en el que los empleados abandonan voluntariamente una empresa
Texto alternativo: Texto que ofrece una alternativa al contenido no textual, como las imágenes
y los vídeos
tidyr (R): Paquete de R en Tidyverse usado para limpieza de datos para generar datos
ordenados
Tidyverse (R): Sistema de paquetes en R con una filosofía de diseño en común para la
manipulación, exploración y visualización de datos
Tipo de datos: Atributo que describe cierto dato según sus valores, su lenguaje de
programación o las operaciones que puede realizar
Tipos de problemas: Distintos problemas que encuentra el analista de datos; entre ellos,
categorizar elementos, descubrir conexiones, hallar patrones, identificar temas, hacer
predicciones y detectar algo inusual
Título: Texto en la parte superior de una visualización que comunica los datos que se están
presentando
Toma de decisiones basada en datos: Uso de datos para guiar la estrategia empresarial
Toma de decisiones inspirada en datos: Explorar diferentes fuentes de datos para descubrir
qué tienen en común
Transacciones: Aspecto de la ética de los datos que considera que las personas deben
conocer las transacciones financieras resultantes del uso de sus datos personales y la
dimensión de esas transacciones
TRIM: Función que quita los espacios al principio, al final o los repetidos en los datos
TSV (archivo con valores separados por tabuladores): Archivo de texto que almacena una
tabla de datos separando columnas de datos con tabuladores
U
Único: Valor que no puede tener un duplicado
Unidad: Principio de diseño que consiste en usar elementos visuales que se complementan
entre sí para crear un atractivo estético y claridad en la visualización de datos
V
Validación de campos cruzados: Proceso que garantiza el cumplimiento de ciertas
condiciones para múltiples campos de datos
Validez: Grado de conformidad de los datos con respecto a las restricciones cuando se los
ingresa, recopila o crea
VALUE: Función de la hoja de cálculo que convierte una cadena de texto que representa un
número en un valor numérico
Variable (R): Representación de un valor en R que puede almacenarse para uso posterior
Variedad: Principio de diseño que consiste en usar diferentes tipos de elementos visuales en
una visualización de datos para captar la atención del público
Vector (R): Grupo de elementos de datos del mismo tipo almacenados en una secuencia
unidimensional en R
Vista en círculo: Visualización de datos que muestra la fortaleza comparativa en los datos
Visualización estática: Visualización de datos que no cambia a lo largo del tiempo a menos
que se edite
VLOOKUP: Función de una hoja de cálculo que busca verticalmente cierto valor en una
columna y arroja la información correspondiente
W
WHERE: Sección de una consulta que especifica los criterios que deben cumplir los datos
solicitados
WITH: Cláusula de SQL que crea una tabla temporal que se puede consultar muchas veces
Y
YAML: Lenguaje que traduce datos para aumentar su legibilidad