Estadistica 3 Parciales

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 68

Unidad I, II, III

Estadística Descriptiva

ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO


FACULTAD DE ADMINISTRACIÓN DE EMPRESAS
CARRERA DE MERCADOTECNIA

ESTADÍSTICA DESCRIPTIVA

Estadística Descriptiva
Tercer Semestre Paralelo “1”

Elaborado por
[email protected]

Ing. Cristian Merino Sánchez

15 de Febrero de 2024

1
Unidad I, II, III
Estadística Descriptiva

Contenido
Unidad 1: Introducción a la Estadística...................................................................................................7
1.1 Generalidades.............................................................................................................................7
1.1.1 Lluvia de ideas.....................................................................................................................7
1.1.2 Tipos de Interpretación........................................................................................................7
1.1.3 Tipos de Estadística.............................................................................................................9
1.2 Variabilidades............................................................................................................................9
1.2.1 Tipos de Variables...............................................................................................................9
1.2.2 Variables Numéricas..........................................................................................................10
1.2.3 Variables Categóricas........................................................................................................10
1.3 Organización de datos y Distribución de Frecuencia............................................................10
1.3.1 Organización de datos........................................................................................................10
1.3.2 Conjunto de datos..............................................................................................................10
1.3.3 Para qué elaborar tablas de frecuencia...............................................................................10
1.3.4 Distribución de datos.........................................................................................................11
1.4 Construcción de tablas de frecuencia....................................................................................11
1.4.1 Definición de frecuencia....................................................................................................11
1.4.2 Tablas de frecuencia..........................................................................................................11
1.4.3 Tipos de frecuencia............................................................................................................11
1.5 Descripción gráfica de datos......................................................................................................12
1.5.1 Tipos de Gráficos...............................................................................................................12
1.6 Ejercicios de Datos no Agrupados.........................................................................................12
1.6.1 Ejercicio 1..........................................................................................................................12
1.6.2 Ejercicio 2..........................................................................................................................13
1.6.3 Ejercicio 3..........................................................................................................................14
Unidad 2: Estadígrafos............................................................................................................................15
2.1 Medidas de Tendencia Central...............................................................................................15
2.1.1 Tipos de datos para las medidas de tendencia central:.......................................................15
2.2 Media........................................................................................................................................15
2.2.1 Tipos de Media..................................................................................................................15
2.2.2 Media para datos no Agrupados.........................................................................................16

2
Unidad I, II, III
Estadística Descriptiva
2.2.3 Ejercicios de Media en Datos no Agrupados......................................................................16
2.2.4 Media para datos Agrupados..............................................................................................17
2.2.5 Ejercicios de Media en Datos Agrupados..........................................................................17
2.3 Mediana....................................................................................................................................17
2.3.1 Mediana para datos no agrupados......................................................................................18
2.3.2 Ejercicios de Mediana en Datos no Agrupados..................................................................18
2.3.3 Mediana para datos agrupados...........................................................................................19
2.4 Moda.........................................................................................................................................19
2.4.1 Tipos de Moda...................................................................................................................19
2.4.2 Moda para datos no agrupados...........................................................................................20
2.4.3 Ejemplo de Moda...............................................................................................................21
2.4.4 Moda para datos agrupados................................................................................................21
2.5 Ejercicios de Medidas de Tendencia Central datos agrupados............................................22
2.6 Campos de Aplicación de las Medidas de Tendencia Central..............................................22
2.7 Tipos de Gráficos para las Medidas de Tendencia Central..................................................23
2.8 Formulario de Medidas de Tendencia Central......................................................................23
2.9 Medidas de Dispersión.............................................................................................................24
2.9.1 Generalidades....................................................................................................................24
2.10 Tipos de medidas de dispersión..............................................................................................25
2.11 Medidas de Dispersión Absolutas...........................................................................................25
2.11.1 Rango.................................................................................................................................25
2.11.2 Desviación media...............................................................................................................26
2.11.3 Desviación estándar o típica...............................................................................................26
2.11.4 Varianza.............................................................................................................................28
2.12 Medidas de Dispersión Relativas............................................................................................28
2.12.1 Coeficiente de variación.....................................................................................................28
2.12.2 Rango Intercuartil..............................................................................................................29
2.12.3 Rango Percentil..................................................................................................................29
2.13 Ejercicio con datos agrupados................................................................................................30
2.14 Formulario de Medidas de Dispersión...................................................................................30
2.15 Medidas de Posición.................................................................................................................31
2.16 Importancia de medidas de posición......................................................................................31

3
Unidad I, II, III
Estadística Descriptiva
2.17 Campos de Aplicación de las Medidas de Tendencia Central..............................................31
2.18 Tipos de medidas de posición..................................................................................................32
2.18.1 Medidas de posición central...............................................................................................32
2.18.2 Medidas de posición no central..........................................................................................32
2.19 Cuartiles...................................................................................................................................32
2.19.1 Primer cuartil.....................................................................................................................33
2.19.2 Segundo cuartil..................................................................................................................33
2.19.3 Tercer cuartil......................................................................................................................33
2.20 Fórmula para calcular cuartiles.............................................................................................33
2.20.1 Ejercicio 1..........................................................................................................................33
2.21 Quintiles....................................................................................................................................34
2.22 Fórmula para calcular Quintiles.............................................................................................34
2.23 Deciles.......................................................................................................................................34
2.24 Fórmula para calcular Deciles................................................................................................35
2.24.1 Ejercicio 2..........................................................................................................................35
2.25 Percentil....................................................................................................................................35
2.26 Fórmula para calcular Percentiles.........................................................................................36
2.26.1 Ejercicio 3..........................................................................................................................36
2.27 Formulario de Medidas de Posición.......................................................................................36
2.28 Medidas de Forma...................................................................................................................37
2.29 Tipos de medidas de Forma....................................................................................................37
2.30 Asimetría..................................................................................................................................37
2.31 Tipos de asimetría....................................................................................................................38
2.31.1 Asimetría positiva..............................................................................................................38
2.31.2 Simetría..............................................................................................................................38
2.31.3 Asimetría negativa.............................................................................................................38
2.32 Coeficiente De Asimetría.........................................................................................................38
2.32.1 Coeficiente De Asimetría De Fisher..................................................................................38
2.32.2 Ejercicios de Coeficiente de Fisher....................................................................................39
2.32.3 Coeficiente De Asimetría De Pearson................................................................................41
2.32.4 Ejercicio De Coeficiente De Pearson.................................................................................41
2.33 Curtosis......................................................................................................................................43

4
Unidad I, II, III
Estadística Descriptiva
2.34 Tipos de Curtosis.......................................................................................................................43
2.34.1 Leptocúrtica.......................................................................................................................43
2.34.2 Mesocúrtica.......................................................................................................................44
2.34.3 Platicúrtica.........................................................................................................................44
2.35 Coeficiente De Curtosis.............................................................................................................44
2.35.1 Ejercicio De Curtosis.........................................................................................................45
2.35.2 Ejercicio de Asimetría y Curtosis.......................................................................................46
2.36 Formulario de Medidas de Forma..........................................................................................47
Unidad 3: Análisis de datos e Introducción a la Probabilidad.............................................................48
3 ...........................................................................................................................................................48
3.1 Análisis de datos.......................................................................................................................48
3.2 Aplicaciones del Análisis de Datos..........................................................................................48
3.2.1 Estadística..........................................................................................................................48
3.2.2 Mercadotecnia....................................................................................................................48
3.2.3 Recursos Humanos............................................................................................................48
3.2.4 Ámbito Académico............................................................................................................48
3.3 Tipos de Análisis de datos.......................................................................................................49
3.3.1 Análisis de Datos Cualitativos...........................................................................................49
3.3.2 Análisis de Datos Cuantitativos.........................................................................................49
3.4 Ventajas del Análisis de Datos................................................................................................49
3.5 Métodos de análisis de datos...................................................................................................50
3.5.1 Análisis Descriptivo...........................................................................................................50
3.5.2 Análisis Exploratorio.........................................................................................................50
3.5.3 Análisis de Diagnóstico.....................................................................................................50
3.5.4 Análisis Predictivo.............................................................................................................50
3.5.5 Análisis Prescriptivo..........................................................................................................50
3.6 Diagrama de Árbol..................................................................................................................51
3.7 Ventajas del Diagrama de Árbol............................................................................................51
3.7.1 Ejemplo de Diagrama de Árbol..........................................................................................51
3.8 Diagramas de Caja..................................................................................................................52
3.9 Ventajas del Diagrama de Caja..............................................................................................53
3.9.1 Ejemplo de Diagrama de Caja............................................................................................53

5
Unidad I, II, III
Estadística Descriptiva
3.10 Terminología y conceptos básicos en probabilidades............................................................54
3.10.1 Conceptualización..............................................................................................................54
3.11 Terminología de probabilidades.............................................................................................55
3.11.1 Frecuencial.........................................................................................................................55
3.11.2 Matemática........................................................................................................................55
3.11.3 Binomial............................................................................................................................55
3.11.4 Objetiva.............................................................................................................................55
3.11.5 Subjetiva............................................................................................................................56
3.11.6 Hipergeométrica.................................................................................................................56
3.11.7 Lógica................................................................................................................................56
3.12 Combinaciones y Permutaciones............................................................................................57
3.13 Permutaciones:.........................................................................................................................57
3.14 Tipos de Permutaciones:.........................................................................................................57
3.14.1 Permutación Simple (o sin repetición)...............................................................................57
3.14.2 Permutación con Repetición..............................................................................................57
3.14.3 Permutación Lineal............................................................................................................57
3.14.4 Permutación Circular.........................................................................................................57
3.15 Combinaciones:........................................................................................................................58
3.16 Tipos de Combinaciones..........................................................................................................58
3.16.1 Combinación Simple (o sin repetición):.............................................................................58
3.16.2 Combinación con Repetición:............................................................................................58
3.17 Fórmulas....................................................................................................................................58
3.17.1 Permutaciones:...................................................................................................................58
3.17.2 Combinaciones:.................................................................................................................59
3.18 Ejemplos / Ejercicios...............................................................................................................59
3.18.1 Ejemplo 1:..........................................................................................................................59
3.18.2 Ejemplo 2:........................................................................................................................59
3.18.3 Ejercicio 1:........................................................................................................................59
3.18.4 Ejercicio 2:........................................................................................................................60
3.19 Distribuciones de Probabilidad...............................................................................................60
3.20 Distribución Discreta:..............................................................................................................60
3.20.1 Distribuciones Discretas más utilizadas.............................................................................61

6
Unidad I, II, III
Estadística Descriptiva
3.21 Distribución Continua:............................................................................................................61
3.21.1 Distribuciones Continuas más utilizadas............................................................................61
3.22 Cuadro comparativo................................................................................................................61
3.22.1 Distribución Discreta:........................................................................................................61
3.22.2 Distribución Continua:.......................................................................................................63
3.23 Ejemplificación........................................................................................................................64
3.23.1 Distribución Poisson..........................................................................................................64
3.24 Distribución Hipergeométrica................................................................................................65

Unidad 1: Introducción a la Estadística


1.1 Generalidades

1.1.1 Lluvia de ideas

 Organizar  Información
 Segmentar  Recopilación
 Procesos  Interpretación
 Resultados  Probabilidad
 Análisis  Toma de Decisiones

 Datos: Son representaciones de una variable o elemento.


 Información: Producto o resultado de la recopilación de datos.
 Números reales: Representan todos los valores posibles en la línea numérica, incluyendo números
racionales e irracionales. Los números reales abarcan desde los enteros y fraccionarios hasta las raíces
cuadradas, pi (π), y otros números que pueden expresarse en la línea numérica continua.
 Números porcentuales: Valores expresados como fracciones de 100, utilizados para describir
proporciones o porcentajes relativos a un total. Se expresan comúnmente con el símbolo "%" y son
útiles para comparar y entender relaciones proporcionales en contextos como estadísticas, finanzas y
diversas áreas de la vida cotidiana.

7
Unidad I, II, III
Estadística Descriptiva
1.1.2 Tipos de Interpretación

Numéricos

Gráficos

Analíticos

Interpretación Numérica: Análisis basado en valores numéricos para describir un conjunto de datos.

Nombre Edad Semestre

Juan 19 Tercero

Paco 19 Tercero

Pedro 18 Segundo

María 20 Tercero

Interpretación Gráfica: Uso de gráficos y diagramas para visualizar patrones y distribuciones en datos
de manera comprensible.

Edad
María Juan
27% 27%

Pedro Paco
18% 27%

Juan Paco Pedro María

8
Unidad I, II, III
Estadística Descriptiva

Semestre

27% 27%

18%
27%

Juan Paco Pedro María

Interpretación Analítica: Análisis profundo de datos para descubrir patrones y tendencias, utilizando
métodos lógicos y estadísticos.

 Edad: El 50% de los encuestados tienen 19 años, el 25% tiene 18 y el otro 25% tiene 20 años.
 Semestre: El 75% de encuestados está en 3er semestre y el 25% de encuestados están en 2do
semestre.

1.1.3 Tipos de Estadística

Descriptiva Inferencial

Recopilar datos Efectuar (fenómenos, hechos,


Organizarlos escenarios)
Analizar y tabular Pronosticar
Información Probabilidades (hipótesis nula
Tomar Decisiones e hipótesis alternativa)

Estadística: Se encarga de recopilar, organizar, analizar e interpretar la información con el fin de obtener
conclusiones y tomar decisiones.

 Recopilar datos: Es el proceso de recolectar datos ya sean cuantitativos y cualitativos mediante las
encuesta, censos, entrevistas y otros.
 Organizar: Se refiere a la clasificación de los datos de la manera que sean fáciles de entender estos
datos, pueden ser clasificadas mediante tablas y otros.
 Analizar: Implica la aplicación de métodos y técnicas estadísticas como el análisis descriptivo que
se encargan de resumir y describir los datos de manera concisa.
 Interpretar: Es entender o comprender los resultados obtenidos para la toma de decisiones.

9
Unidad I, II, III
Estadística Descriptiva
1.2 Variabilidades

 Población: Conjunto completo de elementos o individuos que comparten una característica común y
son objeto de estudio en estadística descriptiva.
 Muestra: Subconjunto representativo de la población, utilizado para realizar inferencias sobre
características o comportamientos de la población total.
 Dato: Valor individual o unidad de información recopilada sobre una variable en un estudio
estadístico.
 Variable: Característica o atributo que puede medirse u observarse en distintas unidades de una
población, generando datos variados en un estudio estadístico descriptivo.
 Caracteristicas: Atributo almacenamiento o escenario qué puede ocurrir dentro de la estadística.

1.2.1 Tipos de Variables


Las variables se utilizan para representar características o atributos que se mide en el sujeto del estudio
pueden ser numéricas y categóricas y su elección depende de la naturaleza de los datos del tipo de análisis
que se desea realizar.

1.2.2 Variables Numéricas


Representan valores numéricos y se pueden clasificar de las siguientes variables:

 Variables Continuas: Son valores dentro del rango y pueden tener decimales fracciones todos los
números. Ej. el peso, temperatura y altura.
 Variables Discretas: Son valores específicos que no pueden tener decimales son valores enteros o la
cantidad de algo. Ej. Número de dedos.

1.2.3 Variables Categóricas


Representan características cualitativas y se clasifican las siguientes variables:

 Variables Nominales: Representan categorías o jerarquías sin ningún orden. Ej. Color de cabello,
color de ojos, país, etc.
 Variables Ordinales: Representan una categoría o jerarquía, con un orden o una clasificación
específica. Ej. lugar de un podio, nivel de estudio, etc.

10
Unidad I, II, III
Estadística Descriptiva
1.3 Organización de datos y Distribución de Frecuencia

1.3.1 Organización de datos


Proceso de estructurar y ordenar información de manera sistemática para facilitar su comprensión y
análisis, utilizando métodos como tablas, gráficos o listados.

1.3.2 Conjunto de datos


Conjunción de información recopilada o registrada, que puede consistir en números, observaciones o
cualquier tipo de datos relacionados entre sí, siendo la unidad básica de análisis en estadística. Entre más
encuestados es necesario construir tablas de frecuencia para cada una de las variables.

1.3.3 Para qué elaborar tablas de frecuencia


Elaboramos tablas de frecuencia en estadística con el objetivo de organizar y resumir datos de manera
clara y comprensible. Estas tablas proporcionan una visión ordenada de la distribución de frecuencias de
diferentes valores en un conjunto de datos.

 Mejor presentación.
 Objetivizar los datos y analizar.
 Interpretar los resultados y generar la toma de decisiones.

1.3.4 Distribución de datos


 Datos agrupados: Conjunto de datos en bruto que no ha sido organizado ni clasificado en categorías
o intervalos. Cada valor individual se considera como un punto de datos único y se utiliza
directamente en análisis estadísticos.
 Datos no Agrupados: Conjunto de datos organizado en categorías o intervalos para simplificar el
análisis. En lugar de usar valores individuales, se agrupan en rangos, facilitando la interpretación y
visualización de la distribución de frecuencias.
 Distribución de Frecuencia: Es organizar y resumir datos en categorías o intervalos mostrando la
frecuencia con la que ocurren diferentes valores en un conjunto de datos. La distribución de
frecuencia muestra la cantidad de veces que aparece cada valor o rango de valores, proporcionando
una visión clara de la variabilidad y patrones presentes en los datos.

11
Unidad I, II, III
Estadística Descriptiva
1.4 Construcción de tablas de frecuencia

1.4.1 Definición de frecuencia


En estadística, la frecuencia se refiere al número de veces que ocurre un valor específico en un conjunto
de datos. La frecuencia es una medida clave para analizar la distribución y patrones en conjuntos de datos.

1.4.2 Tablas de frecuencia


Son útiles para mostrar/ resumir grandes conjuntos de datos y facilita el análisis que permite identificar
patrones tendencias y características.

1.4.3 Tipos de frecuencia


 Frecuencia Absoluta: La cantidad de veces que un valor específico aparece en un conjunto de
datos. Es un recuento directo de la ocurrencia de cada valor individual.
 Frecuencia Relativa: La proporción o porcentaje de veces que ocurre un valor particular en
relación con el tamaño total del conjunto de datos. Se calcula dividiendo la frecuencia absoluta del
valor entre el tamaño total del conjunto de datos.
 Frecuencia Acumulada: La suma acumulativa de las frecuencias absolutas o relativas a medida
que avanzamos a través de los valores en un conjunto de datos ordenado. La frecuencia acumulada
proporciona una visión acumulativa del patrón de distribución de los datos. Puede ser acumulativa
ascendente (sumando desde el valor más bajo) o descendente (sumando desde el valor más alto).

Variables
Nombre Edad Ciudad
Cristian 37 Penipe
Datos

Luis 27 Riobamba

Rosa 21 Guayaquil

1.5 Descripción gráfica de datos

La descripción gráfica de datos implica representar visualmente la información para facilitar la


comprensión y el análisis. Estas representaciones gráficas permiten identificar patrones, tendencias y
relaciones en un conjunto de datos, haciendo que la información sea más accesible y clara.

1.5.1 Tipos de Gráficos


Gráfico de Barras: Utiliza barras rectangulares para representar datos, donde la longitud de cada barra es
proporcional a la cantidad que representa. Es efectivo para comparar diferentes categorías.

12
Unidad I, II, III
Estadística Descriptiva
Histograma: Similar al gráfico de barras, pero utilizado para representar la distribución de frecuencias en
datos continuos. Las barras están contiguas, sin espacios entre ellas.

Gráfico de Líneas: Conecta puntos de datos mediante líneas rectas, mostrando la relación y tendencias
entre los valores a lo largo de una variable continua o a través del tiempo.

Diagrama Circular: Divide un círculo en sectores proporcionales a la frecuencia o proporción de cada


categoría. Es útil para mostrar la relación de cada categoría con el total.

Diagrama de Caja y Bigotes (Boxplot): Representa la distribución estadística de un conjunto de datos a


través de cuartiles. Muestra la mediana, los cuartiles y los valores atípicos.

Diagrama de Dispersión: Muestra la relación entre dos variables representando puntos en un plano
cartesiano. Es útil para identificar patrones, correlaciones o tendencias.

1.6 Ejercicios de Datos no Agrupados


1.6.1 Ejercicio 1
En un mercado objetivo, se recolecta información que indica el color favorito de los stakeholders
(clientes) obteniendo los siguientes resultados.

A B C D E
Negro Azul Amarillo Rojo Azul
Azul Rojo Negro Amarillo Rojo
Rojo Amarillo Amarillo Azul Rojo
Negro Azul Rojo Negro Amarillo

Interpretación numérica

Frecuencia %
Frecuencia Frecuencia %
Color X Relativa Frecuencia
Relativa Absoluta Frecuencia
Absoluta Absoluta
Negro 4 0.20 4 0.20 20% 20%
Azul 5 0.25 9 0.45 25% 45%
Rojo 6 0.30 15 0.75 30% 75%
Amarillo 5 0.25 20 1 25% 100%
total 20 1 48

13
Unidad I, II, III
Estadística Descriptiva
Interpretación gráfica

Color Favorito
35%
30%
25%
20%
15%
10%
5%
0%
Negro Azul Rojo Amarillo

Interpretación analítica

 El 25% tiene preferencia por el color azul, otro 25% es afín al color amarillo, un 20% prefiere el color
negro y como un porcentaje mayor de 30% prefieren el color rojo.
 Se llega a la conclusión que un 45% tiene preferencias con los colores oscuros y un 55% prefiere los
colores vibrantes.

1.6.2 Ejercicio 2
En una concesionaria de vehículos se ha registrado la cantidad de autos de cierta marca (x) vendidos cada
día del mes de septiembre. obteniendo estos resultados.

0, 1, 2, 1, 2, 0, 3, 2, 4, 0, 4, 2, 1, 0, 3, 0, 0, 3, 4, 2, 0, 1, 1, 3, 0, 1, 2, 1, 2, 3

Construya la tabla de frecuencia para la toma de decisiones.

Frecuencia % %
Autos Frecuencia Frecuencia
X Relativa Frecuencia Frecuencia
Vendidos Relativa Absoluta
Acumulada Absoluta Relativa
0 8 0.2666 8 0.2666 26.66% 26.66%
1 7 0.2333 15 0.4999 23.33% 49.99%
2 7 0.2333 22 0.7332 23.33% 73.32%
3 5 0.1666 27 0.8998 16.66% 89.83%
4 3 0.1 30 1 10% 100%
total 30 1 100%

14
Unidad I, II, III
Estadística Descriptiva
1.6.3 Ejercicio 3
En la ciudad de Riobamba se desea construir una tabla de frecuencias para conocer el día más caluroso y
el día más frío del mes de agosto.

15º, 16º, 15º, 18º, 20º, 18º, 18º, 19º, 20º, 20º, 16º, 17º, 18º, 20º, 21º, 18º, 18º, 15º, 22º, 23º, 23º, 22º, 20º,
18º, 18º, 19º, 20º, 21º, 22º, 23º, 23º

Tabla 1: Temperatura en la ciudad de Riobamba en agosto de 2023

Frecuencia Frecuencia
Frecuencia Frecuencia
Valor Absoluta Absoluta %
Absoluta Relativa
Acumulada Relativa
15 3 0.09 3 0.09 9.7%
16 2 0.06 5 0.15 6.5%
17 1 0.03 6 0.18 3.2%
18 8 0.26 14 0.44 25.8%
19 2 0.06 22 0.5 6.5 %
20 6 0.19 24 0.69 19.4%
21 2 0.06 27 0.75 6.5%
22 3 0.09 31 0.84 9.7%
23 4 0.13 0.97 12.9%
Total 31 1 1 100%

Unidad 2: Estadígrafos
1.7 Medidas de Tendencia Central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un
conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central más utilizadas son: media, mediana y moda.

1.7.1 Tipos de datos para las medidas de tendencia central:

 Datos no agrupados: Son aquellos que no han recibido ningún tratamiento o clasificación luego de
ser recolectados.

15
Unidad I, II, III
Estadística Descriptiva
 Datos agrupados: Son aquellos que están clasificados en función a un criterio, mostrando una
frecuencia para cada clase o grupo formado.

1.8 Media

La media también conocida como media aritmética es básicamente la cantidad que se obtiene al sumar
todos los datos de un conjunto de valores o cantidades para posteriormente dividir la cifra obtenida entre
la cantidad de valores que tenemos dentro del conjunto.

1.8.1 Tipos de Media


La media en estadística puede tener diferentes clasificaciones:

1.8.1.1 Según el número de variables:


 Media aritmética: es la suma de todos los valores dividida por el número total de valores. Se aplica a
una sola variable.
 Media geométrica: es la raíz enésima del producto de n números. Se aplica a una sola variable.
 Media harmónica: es el recíproco de la media aritmética de los recíprocos. Se aplica a una sola
variable.
 Media ponderada: es la suma de valores ponderados por ciertos pesos dividida por la suma total de
los pesos. Se aplica a una sola variable.
 Medias marginales: son medias de diferentes variables calculadas por separado. Se aplican a dos o
más variables.

1.8.1.2 Según el conjunto de datos:


 Media muestral: se calcula a partir de una muestra.
 Media poblacional: se calcula considerando todos los valores de la población.

1.8.2 Media para datos no Agrupados

La medida de tendencia central más conocida y utilizada es la media aritmética. La población se


representa por a µ y la muestra se representa por x .

Fórmula de la Media

Población Parámetro Muestra Estadístico


(X 1 + X 2 + X 3 + …+ X n ) Σ X i ( X 1 + X 2+ X 3+ …+ X n) Σ X i
μ= = X= =
N N n n

16
Unidad I, II, III
Estadística Descriptiva
1.8.3 Ejercicios de Media en Datos no Agrupados

Ejemplo 1

Encuentre la media del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.

Hay 8 números en el conjunto. Súmelos, y luego divida entre 8.

x 1+ x 2 + x 3+ …+ x n 2+5+ 5+6+8+ 8+9+11 54


x= = = =6 , 75
n 8 8

Así, la media es 6.75.

Ejemplo 2

La temperatura diaria en una ciudad durante una semana fue 28, 30, 26, 32, 29, 31, y 27 grados
Celsius. ¿Cuál es la temperatura media?

x 1+ x 2 + x 3+ …+ x n 28+ 30+26+32+29+31+27 203


x= = = =29
n 7 7

Así, la media es 29.

1.8.4 Media para datos Agrupados

La media para datos agrupados o conocida también como media ponderada, como su nombre lo dice es
un promedio que se obtiene multiplicando cada valor con su respectiva frecuencia, sumo dichos productos
y luego se divide para la suma total de sus frecuencias.

Fórmula de la Media de datos agrupados

Población Parámetros Muestra Estadístico

( m1∗f 1 +m2∗f 1+ …+mn∗n ) Σ m j f i (m 1∗f 1+ m2∗f 1+ …+m n∗n) Σ m j f i


μ= = X= =
( f 1+ f 2 +…+ f n ) Σ fi (f 1 + f 2 +…+ f n) Σ fi

1.8.5 Ejercicios de Media en Datos Agrupados

Ejemplo 1

Las calificaciones en HMKTONLINE en los exámenes finales son (8, 7, 9, 10) y sus frecuencias son (3,
5, 4, 2) ¿Cuál será la media ponderada?

17
Unidad I, II, III
Estadística Descriptiva
( 8∗3 ) + ( 7∗5 ) + ( 9∗4 ) + ( 10∗2 )
x=
3+ 5+4 +2

24+35+ 36+20
x=
14

115
x=
14

x=8 , 21

La media ponderada en este ejercicio es: 8,21

1.9 Mediana

La mediana es importante porque proporciona una medida de tendencia central que es robusta ante
cambios en el conjunto de datos. A diferencia de la media aritmética, la mediana no se ve afectada por
valores extremos, por lo que es particularmente útil en un conjunto de datos con distribución sesgada o
valores atípicos.

1.9.1 Mediana para datos no agrupados

Para encontrar la mediana muestral o poblacional de un conjunto de datos no agrupados se realizan los
siguientes pasos:

1. Se ordenan los datos de la serie del valor más pequeño al valor más grande, es decir, se organiza la
serie en orden creciente.

2. Observamos cuál es el tamaño de la muestra (n) o de la población (N) que se pretende analizar y
procedemos a encontrar la mediana bajo uno de los siguientes criterios:

a) Si el total de datos analizados es un número impar, entonces la mediana es el valor que se


encuentra exactamente en el centro de la serie ordenada. Es decir, es el valor del dato que ocupa la
(n+1)
posición de la serie ordenada.
2

b) Si el total de datos analizados es un número par, entonces la mediana es el promedio de los dos
valores que se encuentran en el centro de la serie ordenada. Es decir, es el promedio de los valores
n (n+ 2)
de los datos que ocupan las posiciones y de la serie ordenada.
2 2

18
Unidad I, II, III
Estadística Descriptiva
1.9.2 Ejercicios de Mediana en Datos no Agrupados

Ejemplo 1

Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.

Primero, arregle los números en orden ascendente.

{3, 5, 8, 10, 24, 36, 79, 255}

Hay 8 números en el conjunto (un número par). Así, encuentre el promedio de los dos números medios,
10 y 24.

Mⅇ =x n+1
2

10+24
Mⅇ =
2

34
Mⅇ = =17
2

Así, la mediana es 17.

Ejemplo 2
 En el conjunto de datos ya ordenados 1,2,3,4,7,8,9.12,13,14,16. La mediana será
8.
 1,2,3,4,6,7,9,10,12,13,14. La mediana es 7.
1.9.3 Mediana para datos agrupados

Si la variable es de tipo discreto la mediana será el valor de la variable que corresponda a la


frecuencia acumulada.

Donde:

[ ]
Li= Límite inferior de la clase mediana

Fórmula M =L +
( n
2
−F )
I
a N= Número de datos observados
Fa= Frecuencia acumulada anterior a la clase mediana
d i
fm I= Amplitud del intervalo
fm= Frecuencia de la clase media

19
Unidad I, II, III
Estadística Descriptiva
1.10 Moda

En estadística, la moda se refiere al valor que aparece con mayor frecuencia en un conjunto de datos. Es
una medida de tendencia central que identifica el valor más común o repetido en una distribución de
datos. Un conjunto de datos puede no tener moda, tener una moda (unimodal), dos modas (bimodal), o
más de dos modas (multimodal). La moda es especialmente útil en conjuntos de datos donde la frecuencia
de ciertos valores es más pronunciada.

1.10.1 Tipos de Moda

Unimodal: cuando el máximo número de repeticiones que se da es solo para un solo número.

 [ 3, 5, 5, 5, 6, 8, 9, 10,12,14]

UNIMODAL
3

0
3 5 6 8 9 10 12 14

La moda del conjunto es 5 porque se repite en tres ocasiones, mientras que el resto de los números se
repiten únicamente una vez.

Bimodal: cuando el número de repeticiones se da para dos números.

 [ 3, 5, 5, 5, 6, 7, 8, 8, 8, 9]

3.5 BIMODAL
3
2.5
2
1.5
1
La moda en este 0.5
conjunto sería 5 y 8 porque ambos números se repiten tres veces mientras que lo otros
0
3 5 6 8 9
números se repiten una vez.

Multimodal: cuando el máximo número de repeticiones se da para tres o más números.

 [ 3, 3, 3, 3, 4, 5, 5, 5, 5, 6, 8, 8, 8, 8, 9]

20
Unidad I, II, III
Estadística Descriptiva

MULTIMODAL
5
4
3
2
1
0
3 4 5 6 8 9

La moda del conjunto en este caso serían tres números, porque los tres se repiten el mismo número de
veces: 3, 5, 8. Aunque no es muy común ver gráficas cuando se da este caso porque simplemente
visualizaremos una curva constante.

1.10.2 Moda para datos no agrupados

La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de
frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una
muestra puede tener más de una moda.

Para calcular la moda de un conjunto de datos estadísticos basta con contar el número de veces que
aparece cada dato en la muestra, y el dato más repetido será la moda.

1.10.3 Ejemplo de Moda

Encuentre la moda del conjunto {2, 3, 5, 5, 7, 9, 9, 9, 10, 12}.

El 2, 3, 7, 10 y 12 aparecen una vez cada uno.

El 5 aparece dos veces y el 9 aparece tres veces.

Así, el 9 es la moda.

1.10.4 Moda para datos agrupados

Si la variable es de tipo discreto la moda o modo será al valor de la variable que tenga la mayor
frecuencia absoluta.
Donde:
Mo= Moda.
Li= Limite real inferior de la clase modal.

Fórmula M o=Li +
[ ∆1
∆ 1+ ∆ 2]I
∆ 1= Diferencia entre la mayor frecuencia y la
frecuencia anterior.
∆ 2= Diferencia entre la mayor frecuencia y la
frecuencia que le sigue.
I= Amplitud del intervalo de la clase modal.
21
Unidad I, II, III
Estadística Descriptiva
1.11 Ejercicios de Medidas de Tendencia Central datos agrupados

1.12 Campos de Aplicación de las Medidas de Tendencia Central

Las medidas de tendencia central como la media, mediana y moda tienen aplicaciones importantes en
diversos campos:

 Estadística: Son las medidas más utilizadas para caracterizar conjuntos de datos tanto a nivel
descriptivo como inferencial. Permite resumir y representar el centro o valor típico de una
distribución.
 Economía: Se utilizan para analizar variables económicas como ingresos, gastos, inflación, tipo de
cambio. Por ejemplo, calcular la media o mediana del PIB.
 Demografía y ciencias sociales: Sirven para estudiar características de poblaciones como edad
media, ingreso per cápita, nivel educativo modal.
 Psicometría: Se emplean para desarrollar test psicológicos estandarizados basándose en la media y
desviación estándar de las puntuaciones.
 Medicina: La media y percentiles de valores como peso, talla, presión arterial, colesterol se usan para
evaluación de pacientes.

22
Unidad I, II, III
Estadística Descriptiva
 Control de calidad: Permite establecer especificaciones y rangos de variación aceptables de
parámetros como dimensiones, concentraciones químicas, etc.
 Meteorología: Para obtener valores típicos de temperatura, precipitaciones, velocidad del viento.
 Negocios: Para evaluar desempeño de ventas, costos de producción, audiencia de marketing.
 Educación: Como indicadores del rendimiento académico a través del promedio de calificaciones.

1.13 Tipos de Gráficos para las Medidas de Tendencia Central

Existen varios tipos de gráficos que se pueden utilizar para representar visualmente las medidas de
tendencia central como la media, mediana y moda:

 Diagrama de caja y bigotes (box plot): Es muy útil para observar la mediana. La caja representa la
línea central que es la mediana.
 Histograma: Permite visualizar la distribución de los datos y ubicar la media o moda como el pico o
columna más alta.
 Diagrama circular o de torta: Es útil para datos categóricos donde se pueden graficar fracciones
según la moda.
 Diagrama de Pareto: Ordena los valores de forma descendente, permitiendo identificar rápidamente
la moda.
 Histograma apilado: Separando categorías o segmentos para comparar medias o medianas entre
grupos.

La elección del gráfico dependerá del tipo y distribución de los datos, así como del objetivo del análisis.
Pero en general estos gráficos permiten visualizar fácilmente las medidas de tendencia central.

1.14 Formulario de Medidas de Tendencia Central

M.T.C Tipo de
Datos no Agrupados Datos Agrupados
. datos

(X 1 + X 2 + X 3 + …+ X n ) Σ X i ( m1∗f 1 +m2∗f 1+ …+mn∗n ) Σ m j f i


Paramétrico μ= = μ= =
N N ( f 1+ f 2 +…+ f n ) Σ fi
MEDIA

( X 1 + X 2+ X 3+ …+ X n) Σ X i (m1∗f 1+ m2∗f 1+ …+mn∗n) Σ m j f i


Estadístico X= = X= =
n n (f 1 + f 2 +…+ f n) Σ fi

23
Unidad I, II, III
Estadística Descriptiva

(
[ ]
−F )
N M e =x N +1 N
M e= o 2 a
Paramétrico 2 2
MEDIANA

M =L +d i I
fm

[ ]
Estadístico
M e=
n
2
o
M e =x n+1
2
M d =Li+
n
2
−F a( )
I
fm
Paramétrico

[ ]
MODA

La moda se define como el valor de la ∆1


Estadístico variable que más se repite.
M o=Li + I
∆ 1+ ∆2

1.15 Medidas de Dispersión

Las medidas de dispersión muestran la variabilidad de una distribución. Hay dos tipos de medidas de
dispersión: las absolutas, que incluyen el recorrido, la desviación media, la varianza y la desviación típica,
que se utilizan con frecuencia en análisis estadísticos generales; y las relativas, que muestran la
distribución estadística de manera independiente de las unidades en las que se expresan las
variables. Entre ellos se encuentran los coeficientes de apertura, el recorrido relativo y los coeficientes de
variación forman un sistema de datos no definidos que se organizan en variables para buscar un patrón o
esquema.

1.15.1 Generalidades
¿Qué son las medidas de dispersión?

Es una ciencia formal e instrumental que estudia cada análisis y cada uso que se deriva del modelo. El
propósito es describir la relación entre dos variables numéricas, especialmente si los datos aumentan o
disminuyen.

¿Para qué sirven las medidas de dispersión?

Las medias de dispersión son valores numéricos que proporcionan información sobre la variabilidad de
los datos. En otras palabras, muestra la proximidad o separación de datos distribuidos entre sí. Los datos
están altamente clasificados, ampliamente distribuidos o similares.

Características de las medidas de dispersión

 Una medida de dispersión muestra la dispersión de los datos en una distribución.


 Esto le permitirá saber qué tan lejos o cerca están sus datos del promedio.

24
Unidad I, II, III
Estadística Descriptiva
 Las medidas de variabilidad describen la uniformidad o varianza de la distribución de datos. Aplicar
es rápido y fácil.
 Los valores impares son siempre positivos, o 0 si son pares.
 Las técnicas de degradación se pueden utilizar en una variedad de sectores, incluidos la salud, la
industria y la economía empresarial, etc.

¿Dónde se aplican las medidas de dispersión?

Esto nos ayuda a comprender el conjunto de datos y uno de los principales usos de las medidas de
dispersión es ayudarnos a comprender la distribución de los datos. A medida que los datos se vuelven más
variables, aumenta el valor de la medida de dispersión.

1.16 Tipos de medidas de dispersión

Medidas de dispersión absolutas

Se refieren a conceptos que evalúan la dispersión o la extensión de los datos en un conjunto sin tener en
cuenta su relación con la magnitud de otros aspectos del conjunto. Estas medidas indican cuán dispersos
están los valores en relación con la media o entre sí.

Medidas de dispersión Relativas

Se centran en expresar la variabilidad de un conjunto de datos en términos proporcionales o relativos al


tamaño del conjunto. Estas medidas permiten comparar la dispersión en diferentes conjuntos de datos,
independientemente de la escala de las observaciones, proporcionando una perspectiva relativa de la
variabilidad.

25
Unidad I, II, III
Estadística Descriptiva
1.17 Medidas de Dispersión Absolutas

1.17.1 Rango
El rango o recorrido es una medida de dispersión que describe la diferencia entre valores extremos de un
conjunto. Es decir, la resta entre el valor máximo y el valor mínimo.

R=Max x −Min x

Ejercicio

Libros Precio
1 $33,00 Min(x)
R= Max(x)-Min(x)
2 $37,00
3 $50,00 R= 110-33

4 $110,00 R= 77
Max(x)
5 $95.00

1.17.2 Desviación media


Esta medida de dispersión es la diferencia entre los valores de la variable estadística y la media
aritmética. En otras palabras, el promedio de la medición real se muestra a continuación:

DM =∑∨X i− X∨ ¿ ¿
N
Ejercicio

Vamos a suponer que tenemos el siguiente conjunto de datos: 3, 5, 7, 9, 11.

Para calcularla, primero necesitamos calcular la media de los datos:

X = (3 + 5 + 7 + 9 + 11) / 5 = 7

Ahora, podemos calcular la desviación utilizando la fórmula:

DM =∑∨X i− X∨ ¿ ¿
N

(|3−7|+|5−7|+|7−7|+|9−7|+|11−7|)
DM =
5

26
Unidad I, II, III
Estadística Descriptiva
( 4+2+ 0+2+4 )
DM = =2 , 4
5
1.17.3 Desviación estándar o típica

Otra medida de dispersión es la desviación estándar o típica. Este es el método de la raíz cuadrada
de la media aritmética para calcular los cuadrados de diferentes valores. En resumen, es la raíz
cuadrada de la varianza y se expresa como:

σ =√ ∑1N ¿ ¿ ¿

Ejercicio

Se pide calcular la varianza y la desviación estándar de los siguientes datos: 1, 4, 6 y 9 sabiendo que
corresponden a una población.

En este caso nos indica que los datos forman una población, por lo que usaremos las fórmulas de varianza
y desviación estándar para la población, teniendo en cuenta que tenemos

4 datos, es decir, N = 4.

La medida poblacional se calcula primero de la siguiente forma:

N
∑ i=1 X i
μ=
N
X 1+ X 2+ X 3 + X 4
μ=
N
1+ 4+6+ 9
μ=
4
20
μ=
4
μ=5
Después se calcula la varianza poblacional:

2 N
σ =∑1 ¿ ¿
2
σ =¿ ¿
2
σ =¿ ¿
2
σ =¿ ¿
2 16+ 1+ 1+ 16 34
σ = = =8 , 5
4 4

27
Unidad I, II, III
Estadística Descriptiva
El resultado de la varianza poblacional es 8,5

Ahora calculamos la desviación estándar, tomando en cuenta la raíz cuadrada de la varianza.

2
σ =√ σ
σ =√ 8 ,5=2,915
1.17.4 Varianza
Representa la variabilidad de un conjunto de datos con respecto a su media aritmética. Se expresa como el
cuadrado de las desviaciones de la media de una distribución estadística y se expresa utilizando la
siguiente sintaxis:
σ =∑ ¿ ¿ ¿
2

Ejercicio

1.18 Medidas de Dispersión Relativas

1.18.1 Coeficiente de variación

(CV): Esta es una medida de dispersión relativa calculada como la relación entre la desviación
estándar y la media del conjunto de datos y multiplicada por 100 para expresarla como porcentaje.
El coeficiente de variación permite comparar la diferencia entre conjuntos de datos con diferentes
medidas. Cuanto mayor sea el coeficiente de variación, mayor será la dispersión relativa.

σ s
CV = ∗100 CV = ∗100
X X

Ejercicio

Una población de alumnos tiene una estatura media de 1,65cm con una desviación estándar de

28
Unidad I, II, III
Estadística Descriptiva
17cm. Estos mismos alumnos, tienen un peso medio de 65kg con una desviación estándar de 15kg.
¿Cuál de las dos variables presenta mayor variabilidad relativa?

Estatura (E) Peso (P)

X E =165 cmσ E =17 cm X E =65 kg S E=15 kg


σP 15 kg
σE CV = ∗100= ∗100=23 %
17 cm P
XP 65 kg
CV E = ∗100= ∗100=10.3 %
XE 165 cm

1.18.2 Rango Intercuartil

(RI): Esta es una medida de dispersión relativa calculada como la diferencia entre el tercer cuartil
(Q3) y el primer cuartil (Q1) del conjunto de datos. El rango intercuartil representa el rango en el
que se encuentra el 50% central de los datos y es útil para comparar la diferencia entre diferentes
distribuciones. Cuanto mayor sea el rango promedio, mayor será la dispersión relativa.

RIC=Q3−Q1

1.18.3 Rango Percentil

(RP): Esta es una medida de dispersión relativa expresada como porcentaje dividiendo la diferencia entre
los valores máximo y mínimo de los datos establecidos por el máximo y multiplicando por 100. El rango
percentil es la diferencia relativa a todo el rango de datos. Cuanto mayor sea el rango porcentual, mayor
será la dispersión relativa.
f
f a+
2
RP= ∗100
N
Ejercicio
Obtención del rango percentil de la puntuación 7
X=2.3.4.6,7,7,7,7,8,8,8,9
4
4+
2
RP= ∗100
12

6
RP= ∗100
12
RP=0 , 5∗100
RP=50 %

29
Unidad I, II, III
Estadística Descriptiva

Se dirá que el Rango Percentil de 7 es igual a 50, lo que significa que el 50% de las puntuaciones presenta
valores inferiores a 7.

1.19 Ejercicio con datos agrupados

Los siguientes datos representan las edades en las que crece el consumo de comida
chatarra. 2,3,4,4,6,6,8,9,10,11,12,13,14,15,15,16,17,17,20

Sub Marca Frecuencia Frecuencia n %f.r Frecuencia F.R.A %F.R.A


intervalo clase absoluta
Fx x f ~f= fi/n ~fx100 f ~F=f/n ~Fx100
(2-3) 2,5 2 0,105 10,5% 2 0,105 10,5%
(4-6) 5 4 0,211 21,1% 6 0,316 31,6%
(7-8) 7,5 1 0,053 5,3% 7 0,368 36,8%
(9-10) 9,5 2 0,105 10,5% 9 0,474 47,4%
(11-13) 12 3 0,158 15.8% 12 0,632 63,2%
(14-20) 17 7 0,368 36,8% 19 1 100%
x // 19 1 100% // // //

1.20 Formulario de Medidas de Dispersión

Medidas De Dispersión Datos No Agrupados Datos Agrupados


n k

VARIANZA
∑ ¿ 1 ∙ ( xi−x ) ² ∑ ¿ 1 f 1 ∙ ( xi−x ) ²
2 1 2 1
S= S=
N −1 n−1
n k

DESVIACIÓN TÍPICA
∑ ¿ 1∙ ( xi−x ) ² ∑ ¿ 1 f 1 ∙ ( xi−x ) ²
i i
S=√ S=√
N −1 N −1

30
Unidad I, II, III
Estadística Descriptiva
k N

DESVIACIÓN MEDIA
∫ ¿ 1 f 1 ∙|xi− x| ∑ ¿ 1|xi− x|
T i
MAD= MAD=
N N
Coeficiente De CV =
S
∙ 100
RANGO R=Max x−Min x
|x|
Variación

1.21 Medidas de Posición

Las medidas de posición son herramientas estadísticas que nos permiten describir la ubicación o posición
central de un conjunto de datos. Estas medidas nos brindan información sobre dónde se encuentra el valor
típico de un conjunto de datos y nos ayudan a entender su distribución.

1.22 Importancia de medidas de posición

Las medidas de posición en estadística son indicadores que nos permiten organizar los datos, además las
medidas son importantes en el análisis descriptivo, ya que permite agrupar y codificar los datos obtenidos,
también ayuda a comprender de mejor manera como se distribuyen, proporcionando información calve
que van a ser analizados dando la facilita de representar e interpretar los resultados generando un visión
clara y general de los datos recopilados.

1.23 Campos de Aplicación de las Medidas de Tendencia Central


Campo Concepto
Para realizar análisis de datos de mercado, se puede utilizar percentiles

Mercadotecnia permite comprender los comportamientos de los clientes o consumidores


esto ayuda tomar decisiones estratégicas.

En la estadística podemos aplicar el cuartil en segmentación de mercado,


analizando el ingreso o el gasto del consumidor al dividir los cuartiles se
Estadística puede identificar a diferentes grupos como los consumidores y
comportamientos similares loque facilita hacer estrategias de marketing
eficaz.
Los quintiles se podrían utilizar para dividir las población en 5 partes
Economía iguales ejemplo, el primer quintil agrupa a los individuos con los ingresos
más bajos en el quinto quintil las personas con ingresos más altos.

31
Unidad I, II, III
Estadística Descriptiva
Los centiles en el área de ingeniería pueden ser utilizados para diseñar
Ingeniería motores y otros componentes que puedan soportar condiciones extremas,
por ejemplo, para determinar la temperatura máxima que puede soportar un
motor sin sufrir daños.

1.24 Tipos de medidas de posición

1.24.1 Medidas de posición central

Medidas de posición central: indica los valores centrales de una distribución.

 Media: es el valor del medio de todos los datos ordenados de menor a mayor.
 Mediana: La mediana es el valor central en un conjunto de datos ordenado.
 Moda: es el valor que más se repite del conjunto de datos.

1.24.2 Medidas de posición no central

Las medidas de posición no central son aquellas que no se centran en el valor central de los datos, si no
que se centran en otro valores de la distribución, que se dividen el conjunto de datos en partes iguales.

 Cuartiles: dividen la muestra de datos en cuatro partes idénticas.


 Quintiles: separan los datos en cinco partes iguales.
 Deciles: parten el conjunto de datos en diez intervalos de la misma amplitud.
 Percentiles: dividen los datos en cien partes equivalentes.

1.25 Cuartiles

Los cuartiles son tres valores que dividen un conjunto de datos ordenados en cuatro partes iguales.
 El primer cuartil (Q1) representa el 25% de los datos, es decir, la mitad de los datos están por
encima de Q1 y la otra mitad por debajo.
 El segundo cuartil (Q2) representa el 50% de los datos, es decir, la mediana de los datos.
 El tercer cuartil (Q3) representa el 75% de los datos, es decir, la mitad de los datos están por
encima de Q3 y la otra mitad por debajo.
Los cuartiles se utilizan en una variedad de campos, como la estadística, la investigación y la economía.
Por ejemplo, los cuartiles se pueden utilizar para comparar conjuntos de datos diferentes o para identificar
valores atípicos.
Cuartiles

32
Unidad I, II, III
Estadística Descriptiva

100%
25% 50%

Q1 Q2 Q3

1.25.1 Primer cuartil


El primer cuartil, conocido como Q1, es el valor que está por encima del 25% de los datos estadísticos de
una muestra esto quiere decir que el primer cuartil es mayor que el 25% de los datos observados. Q1 se
utiliza para representar los valores más pequeños de la muestra

1.25.2 Segundo cuartil


El segundo cuartil, también conocido como Q2, es el valor que está por encima del 50% de los datos
estadísticos de una muestra. Esto significa que el segundo cuartil divide el conjunto de datos en dos partes
iguales y coincide con la mediana y el quinto decil.

1.25.3 Tercer cuartil


El tercer cuartil, conocido como Q3, es el valor que está por encima del 75% de los datos estadísticos de
una muestra. En otras palabras, el tercer cuartil es mayor que el 75% de los datos recopilados.

Q3 se representa mediante el símbolo Q3 y representa los valores más grandes de la muestra.

1.26 Fórmula para calcular cuartiles

Datos no Agrupados Datos Agrupados


PAR

( )
K∗( n+1 ) k xN
QK k=1 , 2 ,3 −Fi−1
4 4
Q k =Li + xA
fⅈ
IMPAR

Kn
QK
4

1.26.1 Ejercicio 1

Calcular Q 1 ,Q 2 , Q 3 de los siguientes datos de edades: 15, 17, 16, 16, 15, 17, 15, 18, 14, 16, 15

33
Unidad I, II, III
Estadística Descriptiva
14 15 15 15 15 16 16 16 17 17 18

2∗( 11+1 )
Qk =
4
24
Qk = =6
4
1∗(11+1)
Qk =
4
12
Qk = =3
4
1.27 Quintiles

Los quintiles son una herramienta estadística que divide una muestra o población en cinco grupos iguales
según determinadas variables, permitiendo analizar la distribución de estas variables y comprender las
características de diferentes segmentos de la población.

El primer, segundo, tercer y cuarto quintil representa respectivamente el 20%, 40%, 60% y 80%
de los datos de la muestra. Los quintiles se representan mediante la letra K mayúscula junto con
el subíndice del quintil. El primer quintil es K1, el segundo quintil es K2, el tercer quintil es K3,
y el cuarto quintil es K4.

1.28 Fórmula para calcular Quintiles

Datos No Agrupados Datos Agrupados

( )
k x (n+1)
−F i−1
5 k= 1,2,3,4
k∗(n+1) Qk =Li + x li
k=1 , 2, 3 , 4 fⅈ
5

34
Unidad I, II, III
Estadística Descriptiva

1.29 Deciles

Los deciles son medidas de posición que dividen a un conjunto de datos ordenados en diez partes iguales,
cada decil representa el valor 1/ 10 de la muestra o población, por debajo del cual se encuentra un
porcentaje específicos en datos.
Dividen a la distribución en 10 partes iguales (9 divisiones). D1,..,D9, correspondientes a
10%,...,90%

Formula Datos No Agrupados Formula Datos Agrupados


Par

( )
k ⋅(n) K (N )
−F1−1
10
D K =Li +
10 *A
IMPAR fi
k ⋅(n+ 1)
10

1.30 Fórmula para calcular Deciles

1.30.1 Ejercicio 2

¿Cuál es el valor del decil 8 de los siguientes datos 2,5,5,7,10,13,32,34,20,8,3,0


0 2 3 5 5 7 8 10 13 20 32 24
8∗12
Dk =
10
96
Dk = =9 , 6 es la posición
10
1.31 Percentil

Son medidas de posición que dividen un conjunto de datos ordenados en 100 partes iguales. Cada
percentil representa el valor por debajo del cual se encuentra un porcentaje específico de los datos. Es una

35
Unidad I, II, III
Estadística Descriptiva
medida de posición no central dónde se puede observar el porcentaje de una variable ordenados de menor
a mayor.

1.32 Fórmula para calcular Percentiles

Datos Agrupados Datos No Agrupados


PAR
k ⋅(n)
k ⋅N 100
−Fi−1
100
Pk =Li + ⋅A
fi IMPAR
k ⋅(n+ 1)
100

1.32.1 Ejercicio 3

Cuál es el valor del percentil 80 de los siguientes datos 0,2,3,5,5,7,8,10,13,20

80∗10
100
800
=8 es la posición
100

1.33 Formulario de Medidas de Posición

FORMULAS DE MEDIDAS DE POSICIÓN


Medida Datos Agrupados Datos No Agrupados
PERCENTILES PAR
k ⋅(n)
k ⋅N 100
−Fi−1
100
Pk =Li + ⋅A
fi IMPAR

36
Unidad I, II, III
Estadística Descriptiva
k ⋅(n+ 1)
100

Par
k ⋅(n)

( )
k⋅N 10
−F i−1
DECILES 10 Impar
Dk = Li + .A k ⋅(n+ 1)
fi
10

( )
k x (n+1)
−F i−1
5
QUINTILES Q k =Li + x li k∗(n+1)
fⅈ k=1 , 2, 3 , 4
5
k= 1,2,3,4

Par
K∗( n+1 )
QK k=1 , 2 ,3

( )
k.N 4
−F i−1
CUARTILES 4 Impar
Qk =Li + xA Kn
fⅈ QK
4

1.34 Medidas de Forma

Las medidas de forma son estadísticas descriptivas que se utilizan para describir la forma de la
distribución de un conjunto de datos. En otras palabras, nos permiten analizar cómo se agrupan los
valores en torno a la media y si hay valores extremos o anomalías en datos.

1.35 Tipos de medidas de Forma

Hay dos tipos de medidas de forma:

 Asimetría: indica el grado de simetría (o asimetría) de una distribución, es decir, muestra si una
distribución es simétrica o asimétrica.
 Curtosis: indica el grado de concentración de una distribución alrededor de su media, es decir,
determina si una distribución es escarpada o achatada.

1.36 Asimetría

Las medidas de asimetría son indicadores que permiten establecer el grado de simetría (o asimetría)
que presentan los datos de la distribución sin tener que representarlos gráficamente. Para medir la simetría

37
Unidad I, II, III
Estadística Descriptiva
de una distribución de frecuencias se toma como eje de asimetría la recta paralela al eje de ordenadas que
pasa por la media aritmética de la muestra.

1.37 Tipos de asimetría

1.37.1 Asimetría positiva


La distribución tiene más valores diferentes a la derecha de la media que a su izquierda.

1.37.2 Simetría
La distribución tiene el mismo número de valores a la izquierda que a la derecha de la media.

1.37.3 Asimetría negativa


La distribución tiene más valores diferentes a la izquierda de la media que a su derecha.

1.38 Coeficiente De Asimetría

El coeficiente de asimetría, o índice de asimetría, es un coeficiente estadístico que permite determinar la


asimetría de una distribución. De manera que calculando el coeficiente de asimetría se pude saber qué
tipo de asimetría posee la distribución sin tener que hacer su representación gráfica.

1.38.1 Coeficiente De Asimetría De Fisher

El coeficiente de asimetría de Fisher es igual al tercer momento en torno a la media dividido por la
desviación estándar de la muestra.

Por lo tanto, la fórmula del coeficiente de asimetría de Fisher es la siguiente:

38
Unidad I, II, III
Estadística Descriptiva
3
μ
Fórmula para Población g1 = 3
σ

3
m
Fórmula para Muestra g1 = 3
s

Equivalentemente, se puede usar cualquiera de las siguientes dos fórmulas para calcular el coeficiente de
Fisher:

∑ ( x i−x )3 . fi
As= i=1
n . s3

Por otro lado, si los datos están agrupados puedes usar la siguiente fórmula:
N

∑ ( x i−μ ) 3 . fi
As= i=1
N . σ3

Varianza poblacional y varianza muestral en datos agrupados.

N N
2 2

Población
∑ ( xⅈ −μ ) . fi ∑ xi fi
2 i =1 2 i =1
σ = σ = −μ2
N N

N N
2 2

Muestral
∑ ( x i−x ) . fi ∑ xi f i−n x 2

2 i=1 2 i=1
s= s=
n−1 n−1

1.38.2 Ejercicios de Coeficiente de Fisher

Datos No Agrupados
Las puntuaciones de 10 personas de un test de ansiedad se muestran a continuación:
10, 12, 12, 10, 12, 15, 11, 13, 11, 14

39
Unidad I, II, III
Estadística Descriptiva
xi f x 3
( x i−x ) . fi
2
( x i−x ) . fi
10 2 20 -16 8
11 2 22 -2 2
12 3 36 0 0
13 1 13 1 1
14 1 14 8 4
15 1 15 27 9

Total 120/10=12 18 24

N
2
∑ ( x i−x ) . fi
1. s 2= i=1
n−1
2 24
s= =2.67
10−1

s= √ s2
s= √ 2.67=1.63
N

∑ ( x i−x )3 . fi
2. As= i=1
n . s3
18
As= 3
=0.41
10. ( 1.63 )
Datos Agrupados
De los siguientes datos sacar la asimetría de Fisher

x fi xi xi.fi 2
x . fi
3
( x i−x ) . fi
[26, 35) 1 30.5 30.5 930.25 -26463.592
[35, 44) 4 39.5 158 6241 -35995.648
[44, 53) 5 448.5 242.5 11761.25 -8215.16
[53, 62) 14 57.5 805 46287.5 -307.328
[62, 71) 14 66.5 931 61911.5 3336.592
[71, 80) 5 75.5 377.5 28501.25 17559.04
[80, 89] 2 84.5 169 14280.5 28344.976
45 2713.5 169913.25 -21741.12

∑ x i f i 2713.5
1) µ= = =60.3
n 45

40
Unidad I, II, III
Estadística Descriptiva
N
2

2)
∑ xi fi
2 i =1
σ = −μ2
N

2 169913.25 2
σ = −60.3 =139.7 6
45

σ =√ ( 139.76 ) = 11.822
2

N
2

3)
∑ xi f i−n x 2

169913.25−45 ( 60.3 )
2
2 i=1
s= = =142,9364
n−1 45−1

s= √ 142.9364=11.95

4)
∑ ( x i−x )3 . fi −2174.12
As= i=1 3
= 3
=−0.2827
n.s 45 ( 11.9556 )

1.38.3 Coeficiente De Asimetría De Pearson

El coeficiente de asimetría de Pearson es igual a la diferencia entre la media y la moda de la muestra


partido por su desviación típica o desviación estándar. De modo que la fórmula del coeficiente de
asimetría de Pearson es la siguiente:

μ−Mo
Población Ap=
σ

x−Mo
Muestra Ap=
S

Para Datos Agrupados

41
Unidad I, II, III
Estadística Descriptiva
3 ( μ−Md )
Población As=
σ

3 ( x−Md )
Muestra As=
S

1.38.4 Ejercicio De Coeficiente De Pearson

Datos no agrupados
La siguiente tabla muestra la distribución de la variable “número de hijos”, definida sobre un conjunto de
25 personas tomadas al azar

x f X.f 2
x .f
1 3 0 0
2 7 7 7
3 4 8 16
4 6 18 54
5 2 8 32
6 1 5 25
7 1 6 36
8 1 8 64
sumatoria 25 60 234

∑ x . f 60
1) x= = =2.4
n 25

∑ x 2 ⋅ f −( n−x 2 ) (25.8 (2.4)¿¿ 2)


2) s2= =234− =3.75 ¿
n−1 25−1

3) s= √ s2

s= √ 3.75=1.9 4

42
Unidad I, II, III
Estadística Descriptiva
x−Mo 2.4−1
4) Ap= = =0.72
S 1.94

Datos Agrupados

La siguiente tabla corresponde a la temperatura (°F) máxima diaria registrada durante 45 días. A las 14:00
en una cierta estación meteorológica.

x f Fa xi xi . f 2
xi . f
26-35 1 1 30.5 30.5 930.25
35-44 4 5 39.5 158 6241
44-53 5 10 48.5 242.5 11761.25
53-62 14 24 57.5 805 46287.5
62-71 14 38 66.5 931 61911.5
71-80 5 43 75.5 377.5 28.501.25
80-89 2 45 84.5 169 14280.5
45 2713.5 169913.25

∑ xi . f 2713.5
1) x= = =60.3
n 45

( )
N
−faa
2)
Md=Lri+
2
fmd
⋅ A=53+
22.5−10
14 (
⋅9=61.04 )
n 45
3) Md= = =22.5=24
2 2

2
∑ xi ⋅f 2 169913.25 2
4) σ 2= −μ = − ( 60.3 ) =¿139.76
n 45

5) σ =√ σ 2

σ =√ 139.76=11.82

3 ( μ−Md ) 3 ( 60.3−61.04 )
A s= = =−0.187 8
σ 11.82

43
Unidad I, II, III
Estadística Descriptiva
1.39 Curtosis

La curtosis, también llamada apuntamiento, indica el grado de concentración de una distribución


alrededor de su media. Es decir, la curtosis muestra si una distribución es escarpada o achatada. En
concreto, cuanto mayor sea la curtosis de una distribución más escarpada.

1.40 Tipos de Curtosis

1.40.1 Leptocúrtica
La distribución es muy apuntada, es decir, los datos están muy concentrados alrededor de la media. En
concreto, las distribuciones leptocúrticas se definen como aquellas distribuciones más apuntadas que la
distribución normal.

1.40.2 Mesocúrtica
La curtosis de la distribución es equivalente a la curtosis de la distribución normal. Por tanto, no se
considera ni apuntada ni achatada.

1.40.3 Platicúrtica
La distribución es muy achatada, es decir, la concentración en torno a la media es baja. Formalmente, las
distribuciones platicúrticas se definen como aquellas distribuciones más achatadas que la distribución
normal.

1.41 Coeficiente De Curtosis

La fórmula del coeficiente de curtosis para datos no agrupados:

4
∑ ( x1 −x )
k= 4
−3
ns

44
Unidad I, II, III
Estadística Descriptiva

k=
(
1 Q3−Q1
2 P90−P10 )
La fórmula del coeficiente de curtosis para datos agrupados

Muestra
N

∑ ( x i−x ) 4 fi
K= i=1 −3
n s4

Población
N

∑ ( x i−μ )4 fi
K= i=1 −3
nσ4

Por último, la fórmula del coeficiente de curtosis para datos agrupados en intervalos.
N

∑ ( c i−μ ) 4 fi
1 i=1
K= . −3
N σ4

Una vez se ha calculado el coeficiente de curtosis, se debe interpretar de la siguiente manera para
identificar qué tipo de curtosis se trata:

 Si el coeficiente de curtosis es positivo, significa que la distribución es leptocúrtica.

 Si el coeficiente de curtosis es igual a cero, significa que la distribución es mesocúrtica.

 Si el coeficiente de curtosis es negativo, significa que la distribución es platicúrtica.

1.41.1 Ejercicio De Curtosis

Datos No Agrupados
Determine el coeficiente de curtosis de los siguientes datos.
10, 11, 11, 12, 12, 13, 13, 13, 14, 15, 17, 18, 20
Solución:
N= 12

Posición Valor del percentil


Q1 25% (13+1) = 3.5 11+0.5(12-11) = 11.5
Q3 75% (13+1) = 10.5 15+0.5(17-15) = 16

45
Unidad I, II, III
Estadística Descriptiva
P10 10% (13+1) = 1.4 10+0.4(11-10) = 10.4
P90 90% (13+1) =12.6 18+0.6(20-18) = 19.2

k=
(
1 Q3−Q1
2 P90−P10 )
(
1 16−11.5
k= ⋅
2 19.2−10.4 )
k =0.255>0

Datos Agrupados

x fi xi xi . f 2
xi . f
4
( x i−x ) . fi
[26, 35) 1 30.5 30.5 930.25 788615.042
[35, 44) 4 39.5 158 6241 748709.478
[44, 53) 5 48.5 242.5 11761.25 96938.888
[53, 62) 14 57.5 805 46287.5 860.5184
[62, 71) 14 66.5 931 61911.5 20686.8704
[71, 80) 5 75.5 377.5 28501.25 266897.408
[80, 89) 2 84.5 169 14280.5 685948.419
45 2713.5 169913.25 2608656.62

N
2

1) ∑ xi f i−n∗ x 2

169913.25−45 ( 60.3 )
2
2 i=1
s= = =142.9364
n−1 45

s= √ 142.9364=11.9556

2) K= i=1
∑ ( x i−μ )4 fi 2608656.62
4
−3= 4
−3=−0.1626
nσ 45 ( 11.9556 )

K <0

46
Unidad I, II, III
Estadística Descriptiva
1.41.2 Ejercicio de Asimetría y Curtosis

1.42 Formulario de Medidas de Forma

Medidas de Forma
Coeficiente De
Población Muestra
Asimetría
3
3 m
μ g1 =
g1 = 3 s
3
Coeficiente de σ
asimetría de fisher

N N
Coeficiente de fisher 2 2
∑ xi fi ∑ ( x i−x ) . fi
σ 2= i =1 −μ2 s2= i=1
N n−1

47
Unidad I, II, III
Estadística Descriptiva
N
2
∑ xi f i−n x 2

2 i=1
s=
n−1

N N
2 2
∑ ( xⅈ −μ ) . fi ∑ ( x i−x ) . fi
σ 2= i =1 s2= i=1
N n−1
Varianza poblacional
y varianza muestral N N
2 2
en datos agrupados ∑ xi f i ∑ xi f i−n x 2

2 i =1 2 2 i=1
σ = −μ s=
N n−1

μ−Mo x−Mo
Ap= Ap=
Coeficiente de σ S
asimetría de pearson

3 ( μ−Md ) 3 ( x−Md )
Coeficiente de As= As=
asimetría de pearson σ S
Datos agrupados
Datos No Agrupados Datos Agrupados Agrupados En Intervalos
COEFICIENTE DE CURTOSIS

MUESTRA

∑ ( x1 −x ) 4 ∑ ( x i−x ) 4 fi
k= −3 K= i=1 −3
ns 4
n s4
N
POBLACIÓN
1 i=1
∑ ( c i−μ ) 4 fi
K= . −3
( ) σ4
1 Q3−Q1 N N
k=
2 P90−P10 ∑ ( x i−μ )4 fi
K= i=1 −3
nσ4

48
Unidad I, II, III
Estadística Descriptiva
Unidad 3: Análisis de datos e Introducción a la Probabilidad
1.43 Análisis de datos

El análisis de datos constituye la disciplina que aborda la evaluación minuciosa de conjuntos de datos,
con el fin de extraer conclusiones, informar decisiones, y expandir la comprensión de diversos temas.
Involucra la exploración y modelado de la información para identificar patrones y tendencias,
respaldando así la toma de decisiones informadas y el enriquecimiento del conocimiento en distintos
ámbitos.

1.44 Aplicaciones del Análisis de Datos

El análisis de datos encuentra diversas aplicaciones en distintos contextos, proporcionando la base para
tomar decisiones fundamentadas y validar hipótesis. Este proceso es esencial para evaluar la viabilidad de
decisiones y confirmar o refutar suposiciones.

1.44.1 Estadística
En el ámbito estadístico, el análisis de datos desempeña un papel fundamental al explorar patrones y
relaciones en conjuntos de datos. Proporciona información esencial para tomar decisiones informadas y
formular conclusiones significativas. Este proceso estadístico permite comprender la variabilidad de los
datos y realizar inferencias basadas en evidencia.

1.44.2 Mercadotecnia
Dentro del campo de la mercadotecnia, el análisis de datos se emplea primordialmente para anticipar y
evaluar el comportamiento de los consumidores. También se utiliza para clasificar a los consumidores y
perfeccionar estrategias de campañas publicitarias.

1.44.3 Recursos Humanos


En el área de recursos humanos, el análisis de datos resulta valioso para mantener un ambiente laboral
positivo y para evaluar candidatos potenciales para puestos de trabajo.

1.44.4 Ámbito Académico


En el entorno académico, el análisis de datos se emplea para la selección de estudiantes de nuevo ingreso
y para evaluar el desempeño académico de los estudiantes.

49
Unidad I, II, III
Estadística Descriptiva
1.45 Tipos de Análisis de datos

Para obtener datos valiosos, es esencial someterlos a análisis, y este proceso requiere la aplicación de
diversas técnicas que varían según el tipo de información recopilada. Es crucial tener una técnica definida
antes de su implementación.

1.45.1 Análisis de Datos Cualitativos

El análisis de datos cualitativos implica la presentación verbal o gráfica de la información y se


fundamenta en la interpretación. La obtención de esta información suele realizarse mediante entrevistas
abiertas, grupos de discusión y observación, donde los investigadores analizan patrones en las
observaciones durante todo el proceso de recolección de datos.

1.45.2 Análisis de Datos Cuantitativos

Contrastando con los datos cualitativos, el análisis de datos cuantitativos implica información presentada
de manera numérica y se basa en resultados tangibles. La recopilación de esta información suele llevarse
a cabo mediante métodos cuantitativos, como encuestas estructuradas, experimentos y análisis
estadísticos.

1.46 Ventajas del Análisis de Datos

Realizar un análisis exhaustivo de datos mediante técnicas y herramientas apropiadas puede ofrecer
diversas ventajas para tu investigación. Entre estas destacan:

 Facilita la toma de decisiones empresariales de manera más ágil y fundamentada, respaldada por
datos concretos.
 Contribuye a que las empresas identifiquen problemas de rendimiento que requieren intervención.
 Proporciona una comprensión más profunda de las necesidades de los clientes, generando relaciones
comerciales más sólidas.

50
Unidad I, II, III
Estadística Descriptiva
 Aumenta la conciencia sobre riesgos, permitiendo la implementación de medidas preventivas.
 Permite una visualización clara de la información, agilizando el proceso decisional.
 Brinda a las empresas una posible ventaja competitiva.
 Mejora la comprensión del rendimiento financiero del negocio.
 Se ha demostrado que reduce costos, contribuyendo así al aumento de beneficios.

Además de los previamente mencionados tipos de análisis, existen diversos métodos para analizar datos,
los cuales pueden ser implementados según las necesidades y preguntas que orientan tu investigación:

1.47 Métodos de análisis de datos


1.47.1 Análisis Descriptivo

Este método, esencial como punto de partida, busca responder a la pregunta "¿qué ha pasado?" mediante
la ordenación, manipulación e interpretación de datos brutos de diversas fuentes. El análisis descriptivo
organiza los datos, preparándolos para investigaciones posteriores. Sin embargo, por sí solo, no puede
prever resultados futuros ni abordar cuestiones sobre por qué ocurrieron ciertos eventos.

1.47.2 Análisis Exploratorio

Realizado como parte de la investigación exploratoria, el análisis exploratorio busca conexiones y genera
hipótesis en situaciones donde aún no se comprende completamente la relación entre datos y variables. Es
especialmente útil en la minería de datos.

1.47.3 Análisis de Diagnóstico

Este análisis proporciona una comprensión contextual de por qué ocurrieron ciertos eventos, permitiendo
la identificación precisa de enfoques para abordar problemas o desafíos. Ofrece respuestas directas y
procesables a preguntas específicas.

1.47.4 Análisis Predictivo

Centrándose en el futuro, el análisis predictivo responde a la pregunta "¿qué pasará?" utilizando


resultados de análisis descriptivos, exploratorios y de diagnóstico, junto con herramientas de aprendizaje
automático e inteligencia artificial. Identifica tendencias futuras, posibles problemas y conexiones en los
datos.

51
Unidad I, II, III
Estadística Descriptiva
1.47.5 Análisis Prescriptivo

Este método se enfoca en la identificación y aplicación de patrones o tendencias para desarrollar


estrategias empresariales prácticas y ágiles. Permite a la organización desempeñar un papel activo en la
generación de datos, utilizándolos como soluciones poderosas para abordar problemas en diversas áreas
clave, como marketing, ventas, recursos humanos, finanzas y logística.

1.48 Diagrama de Árbol

Un diagrama de árbol es una representación gráfica jerárquica que utiliza ramificaciones y elementos para
mostrar de manera estructurada las relaciones entre diferentes conceptos o eventos. En este tipo de
diagrama, un elemento principal se divide en elementos secundarios, y así sucesivamente, creando una
estructura similar a la de un árbol.

Cada elemento representa un componente específico, y las conexiones entre elementos indican las
relaciones o dependencias entre esos componentes. Los diagramas de árbol son comúnmente utilizados en
diversas disciplinas, como la toma de decisiones, la planificación de proyectos y la representación visual
de sistemas de clasificación o estructuras de información.

1.49 Ventajas del Diagrama de Árbol

Dadas las características inherentes al diagrama de árbol, las ventajas de este tipo de representación
gráfica incluyen:

 Facilita la toma de decisiones de manera efectiva.


 Permite la representación visual de las relaciones entre todos los resultados posibles.
 Resulta altamente útil para identificar la causa principal de un problema de forma gráfica.
 Simplifica la resolución de problemas relacionados con la probabilidad y la estadística.
 Contribuye a organizar ideas y realizar un análisis exhaustivo de la situación.

1.49.1 Ejemplo de Diagrama de Árbol

Construye el diagrama de árbol de probabilidades del lanzamiento de tres monedas independientes. Luego
calcula la probabilidad de obtener cara en los tres lanzamientos.

1
P ( cara )= =0 ,5
2

52
Unidad I, II, III
Estadística Descriptiva
1
P ( sello )= =0 , 5
2

Debido a la independencia de los lanzamientos de monedas, la probabilidad de obtener cara o cruz


permanece constante en cada lanzamiento. En consecuencia, al construir el diagrama de árbol, se deben
incluir dos ramas (una para cara y otra sello) con igual probabilidad en cada lanzamiento realizado.

Así, en esta situación, se hace necesario multiplicar todas las probabilidades de obtener cara, ya que estas
representan las probabilidades a lo largo del camino que nos conduce al resultado deseado.

P ( cara−cara−cara )=0 ,5 ∙ 0 ,5 ∙ 0 , 5=0,125

En definitiva, la probabilidad de conseguir tres veces cara de manera consecutiva es del 12,5%.

1.50 Diagramas de Caja

Los diagramas de caja, también conocidos como boxplots, son representaciones gráficas que muestran la
distribución de un conjunto de datos y resumen varias medidas estadísticas clave. En un diagrama de caja
típico, se traza una caja que abarca el rango intercuartílico (IQR), que es la distancia entre el primer

53
Unidad I, II, III
Estadística Descriptiva
cuartil (Q1) y el tercer cuartil (Q3). Dentro de la caja, se dibuja una línea para representar la mediana
(Q2).

Las "alas" o líneas que se extienden desde la caja, llamadas "bigotes", indican la dispersión de los datos
más allá de los cuartiles. Los puntos que pueden aparecer más allá de los bigotes se consideran valores
atípicos.

Los diagramas de caja son útiles para comparar la distribución y dispersión de diferentes conjuntos de
datos, identificar valores atípicos y tener una comprensión visual rápida de la variabilidad de los datos.

1.51 Ventajas del Diagrama de Caja

Las ventajas de utilizar diagramas de caja (boxplots) incluyen:

 Visualización de Distribución: Proporcionan una representación visual clara de la distribución de


los datos, permitiendo observar la dispersión, la simetría y la presencia de valores atípicos de manera
eficiente.

 Comparación de Grupos: Facilitan la comparación entre diferentes grupos o conjuntos de datos,


ayudando a identificar diferencias en la ubicación y dispersión de manera rápida.

 Identificación de Valores Atípicos: Permiten detectar de manera efectiva valores atípicos o


extremos en el conjunto de datos, destacándolos visualmente fuera de los bigotes.

 Resumen Estadístico: Resumen varias medidas estadísticas clave, como los cuartiles y la mediana,
proporcionando una visión rápida de la distribución central y la variabilidad.

 Manejo de Datos Asimétricos: Son útiles para representar y comparar la distribución de datos
asimétricos o sesgados.

 Facilidad de Interpretación: Son intuitivos y fáciles de interpretar, lo que los hace accesibles para
audiencias no especializadas en estadísticas.

 Efectividad en Muestras Pequeñas: Son especialmente útiles para muestras pequeñas, donde otros
métodos gráficos podrían no ser tan informativos.

1.51.1 Ejemplo de Diagrama de Caja

Los siguientes datos son las estaturas de 40 estudiantes en una clase de Estadística.

54
Unidad I, II, III
Estadística Descriptiva
59; 60; 61; 62; 62; 63; 63; 64; 64; 64; 65; 65; 65; 65; 65; 65; 65; 65; 65; 66; 66; 67; 67; 68; 68; 69; 70; 70;
70; 70; 70; 71; 71; 72; 72; 73; 74; 74; 75; 77

Construya un diagrama de caja con las siguientes propiedades; las instrucciones de la calculadora para los
valores mínimo y máximo, así como los cuartiles, siguen el ejemplo.

 Valor mínimo = 59

 Valor máximo = 77

 Q1: Primer cuartil = 64,5

 Q2: Segundo cuartil o mediana= 66

 Q3: Tercer cuartil = 70

1.52 Terminología y conceptos básicos en probabilidades

La probabilidad, es una disciplina fascinante y esencial en el ámbito de las matemáticas y la estadística,


que nos permite cuantificar la incertidumbre y modela el azar en diversos contextos o situaciones. Su
fundamento radica en la asignación de números, permitiendo expresar la certeza o posibilidad de que
ocurran, así como analizar y combinar estas probabilidades. Esta ciencia no solo es una herramienta
fundamental en el ámbito teórico, sino que también se extiende a numerosos campos del conocimiento,
incluyendo la física, biología, economía, ingeniería, medicina y ciencias sociales.

1.52.1 Conceptualización

La probabilidad se define como la medida cuantitativa de la certeza o posibilidad de que un evento


aleatorio ocurra. Al asignar valores numéricos a eventos, se crea una representación precisa de las
distintas situaciones inciertas que se pueden encontrar en la realidad. La escala de probabilidad va desde
0, que indica imposibilidad absoluta, hasta 1, que representa certeza total. Este enfoque proporciona una
base sólida para cuantificar la incertidumbre y tomar decisiones informadas.

55
Unidad I, II, III
Estadística Descriptiva
1.53 Terminología de probabilidades

La probabilidad es una rama de las matemáticas que estudia la posibilidad de que ocurran ciertos eventos
o sucesos, basándose en el análisis de datos, la lógica y el azar. Existen diferentes tipos de probabilidad,
según el método o el enfoque que se utilice para calcularla. Algunos de los tipos más comunes son las
siguientes.

1.53.1 Frecuencial
Es la probabilidad que se obtiene al observar la frecuencia o el número de veces que se repite un evento,
en relación con el total de oportunidades o ensayos que se realizan.

Ejemplo

Si lanzamos una moneda 100 veces y sale cara 60 veces, la probabilidad frecuencial de que salga cara es
60/100 = 0.6.

1.53.2 Matemática
Es la probabilidad que se deduce a partir de principios lógicos y reglas matemáticas, sin necesidad de
realizar experimentos o ensayos. Se basa en el concepto de espacio muestral, que es el conjunto de todos
los posibles resultados de un experimento.

Ejemplo

Si lanzamos un dado, el espacio muestral es {1, 2, 3, 4, 5, 6}, y la probabilidad matemática de que salga
un número par es 3/6 = 0.5.

1.53.3 Binomial
Es un caso especial de probabilidad matemática, en el que el experimento solo tiene dos posibles
resultados: éxito o fracaso. Se utiliza cuando se realizan varios ensayos independientes y con la misma
probabilidad de éxito.

Ejemplo

Si lanzamos una moneda 10 veces, la probabilidad binomial de que salga cara 5 veces es

(105) ( 0.5) ⁵ ( 0.5) ⁵= 0.246

56
Unidad I, II, III
Estadística Descriptiva
1.53.4 Objetiva
Es la probabilidad que se basa en hechos o datos conocidos y verificables, que permiten estimar la
ocurrencia de un evento. Se suele expresar como una proporción o un porcentaje.

Ejemplo

Si sabemos que en una población hay 40% de hombres y 60% de mujeres, la probabilidad objetiva de que
al elegir una persona al azar sea mujer es 0.6 o 60%.

1.53.5 Subjetiva
Es la probabilidad que se basa en opiniones, creencias o intuiciones personales, que no se pueden
comprobar ni medir con exactitud. Depende de la información o la experiencia que tenga cada individuo
sobre el evento.

Ejemplo

Si alguien cree que tiene más posibilidades de ganar la lotería que de ser atropellado por un coche, esa es
su probabilidad subjetiva, pero no tiene que coincidir con la realidad.

1.53.6 Hipergeométrica
Es la probabilidad que se calcula cuando se extraen elementos de una población sin reemplazo, es decir,
que cada elemento que se extrae se descarta y no se vuelve a considerar.

Ejemplo

Si tenemos una urna con 10 bolas, 6 blancas y 4 negras, y extraemos 3 bolas sin reemplazarlas, la
probabilidad hipergeométrica de que las 3 sean blancas es

(63)( 40) = 0.238


(103)
1.53.7 Lógica
Es la probabilidad que se basa en las leyes del razonamiento inductivo, que consiste en inferir
conclusiones generales a partir de observaciones particulares. Se utiliza cuando no se dispone de
suficiente información o datos para calcular la probabilidad de un evento.

Ejemplo

57
Unidad I, II, III
Estadística Descriptiva
Si vemos que todos los cisnes que hemos observado son blancos, podemos asignar una alta probabilidad
lógica a que todos los cisnes sean blancos, aunque no podamos asegurarlo con certeza.

1.54 Combinaciones y Permutaciones

Las permutaciones y combinaciones son conceptos fundamentales en combinatoria, una rama de las
matemáticas que se ocupa de contar y organizar elementos en conjuntos. Ambos conceptos se utilizan
para calcular el número de formas distintas en que se pueden organizar o seleccionar elementos de un
conjunto.

1.55 Permutaciones:

Las permutaciones se refieren a la disposición ordenada de los elementos de un conjunto, donde el orden

de los elementos es crucial. Este proceso implica organizar los elementos de manera única, teniendo en

cuenta su posición. Es importante destacar que en las permutaciones no se permiten repeticiones, y cada

elemento es considerado único en su posición

1.56 Tipos de Permutaciones:

1.56.1 Permutación Simple (o sin repetición)


En una permutación simple, cada elemento en el conjunto es único, y no hay elementos repetidos.

El enfoque está en organizar los elementos en diferentes órdenes.

1.56.2 Permutación con Repetición


En una permutación con repetición, algunos elementos del conjunto pueden repetirse. La

consideración de repeticiones afecta el número total de maneras en que se pueden organizar los

elementos.

1.56.3 Permutación Lineal

Una permutación lineal implica organizar los elementos en una línea recta. Cada disposición única

de los elementos en la línea se cuenta como una permutación diferente.

58
Unidad I, II, III
Estadística Descriptiva
1.56.4 Permutación Circular

En una permutación circular, los elementos se organizan en un círculo. Se considera equivalente

cualquier disposición que pueda obtenerse mediante rotaciones del círculo. Cada disposición única

se cuenta como una permutación circular diferente.

1.57 Combinaciones:

En contraste, las combinaciones se centran en la selección de elementos de un conjunto sin tener en


cuenta

el orden. Es decir, en las combinaciones, el orden de los elementos no importa; lo que importa es

simplemente su presencia en la selección. A diferencia de las permutaciones, en las combinaciones se

pueden tener repeticiones de elementos, ya que el enfoque está en la elección sin considerar el orden.

1.58 Tipos de Combinaciones

1.58.1 Combinación Simple (o sin repetición):

En una combinación simple, se selecciona un subconjunto de elementos de un conjunto sin tener en

cuenta el orden. En otras palabras, el arreglo de los elementos no importa; solo se trata de elegir un

grupo específico de elementos sin repetición.

1.58.2 Combinación con Repetición:

En una combinación con repetición, se selecciona un subconjunto de elementos permitiendo que

algunos o todos los elementos se repitan. A diferencia de la combinación simple, la repetición de

elementos se permite en este tipo de combinación.

1.59 Fórmulas

1.59.1 Permutaciones:

Tipos de Permutación Fórmula

59
Unidad I, II, III
Estadística Descriptiva
n!
Permutación Simple nPr=
( n−r ) !
n!
Permutación Con Repetición Pr ( n )=
k1 ∙ k2 ∙ … kn !

Permutaciones Lineal P ( n )=n!

Permutación Circular P Cn−1= ( n−1 ) !

1.59.2 Combinaciones:

Tipo de Combinación Fórmula

()
n!
C n= n =
r
Combinación Simple
r r ! ∙ ( n−r ) !

( n+r−1 ) !
Combinación con Repetición
(
CR rn= n+r −1 =
r )
r ! ( n−1 ) !

1.60 Ejemplos / Ejercicios

1.60.1 Ejemplo 1:

¿De cuántas formas se pueden ordenar las letras A, B y C?


Solución: En este caso, se trata de una permutación de 3 elementos tomados de 3 en 3, es decir, P(3,3).
Aplicando la fórmula, tenemos que:
3! 3! 6
P ( 3 ,3 )= = = =6
( 3−3 ) ! 0 ! 1
Por lo tanto, hay 6 formas de ordenar las letras A, B y C. Estas son: ABC, ACB, BAC, BCA, CAB y
CBA.

1.60.2 Ejemplo 2:

¿De cuántas formas se pueden escoger dos letras del conjunto {A, B, C, D} sin importar el orden?
Solución: En este caso, se trata de una combinación de 4 elementos tomados de 2 en 2, es decir, C(4,2).
Aplicando la fórmula, tenemos que:
4! 4! 24
P ( 4 ,2 ) = = = =6
2 ! ( 4−2 ) ! 2 ! 2! 4

60
Unidad I, II, III
Estadística Descriptiva
Por lo tanto, hay 6 formas de escoger dos letras del conjunto {A, B, C, D} sin importar el orden. Estas
son: AB, AC, AD, BC, BD y CD.

1.60.3 Ejercicio 1:

¿De cuántas formas se pueden ordenar las letras de la palabra COPA?


Solución: En este caso, se trata de una permutación de 4 elementos tomados de 4 en 4, es decir, P(4,4).
Aplicando la fórmula, tenemos que:
4! 4 ! 24
P ( 4 , 4) = = = =24
( 4−4 ) ! 0 ! 1
Por lo tanto, hay 24 formas de ordenar las letras de la palabra COPA.

1.60.4 Ejercicio 2:

¿De cuántas formas se pueden escoger tres letras de la palabra COPA sin importar el orden?
Solución: En este caso, se trata de una combinación de 4 elementos tomados de 3 en 3, es decir, C(4,3).
Aplicando la fórmula, tenemos que:
4! 4! 24
P ( 4 ,3 )= = = =4
3 ! ( 4−3 ) ! 3 ! 1 ! 6
Por lo tanto, hay 4 formas de escoger tres letras de la palabra COPA sin importar el orden. Estas son:
COP, COA, CPA y OPA.

1.61 Distribuciones de Probabilidad

La distribución de probabilidades se refiere a la asignación de probabilidades a distintos resultados


potenciales en un experimento aleatorio, proporcionando información sobre la probabilidad de ocurrencia
de cada resultado en un conjunto de eventos. En el contexto de una variable aleatoria, esta distribución
describe las probabilidades asociadas con cada posible resultado y se establece sobre el conjunto de todos
los resultados posibles, asignando a cada uno su respectiva probabilidad.

61
Unidad I, II, III
Estadística Descriptiva
1.62 Distribución Discreta:

Una distribución discreta describe las probabilidades asociadas con los posibles valores de una variable
aleatoria discreta, que son valores contables, como enteros no negativos. Cada valor de la variable
aleatoria discreta tiene asignada una probabilidad no nula, lo que se representa de manera tabular en
una distribución de probabilidad discreta.

1.62.1 Distribuciones Discretas más utilizadas

 Uniforme discreta
 Binomial
 Hipergeométrica
 Geométrica
 Binomial negativa
 Pascal
 Poisson

1.63 Distribución Continua:

Una distribución continua describe las probabilidades de los valores posibles de una variable aleatoria
continua. En el caso de variables aleatorias continuas, cuyo conjunto de valores posibles es infinito y no
contable, las probabilidades se definen como áreas bajo la curva de su función de densidad de
probabilidad (PDF). En este contexto, la probabilidad de que la variable aleatoria continua sea igual a un
valor específico es siempre cero, y las probabilidades se asocian con rangos de valores en lugar de valores
individuales.

1.63.1 Distribuciones Continuas más utilizadas

 Uniforme o rectangular  Gama  Cauchy


 Normal  Exponencial  Weibull
 Lognormal  Ji cuadrado  Laplace
 Logística  T de student  Pareto
 Beta  F de Snedecor  Triangular

62
Unidad I, II, III
Estadística Descriptiva
1.64 Cuadro comparativo

1.64.1 Distribución Discreta:

Distribuciones Definición Características Aplicación


Discretas
Cada resultado tiene la Igual probabilidad Modelar situaciones
Uniforme
misma probabilidad de para todos los donde cada resultado es
Discreta
ocurrir. resultados posibles. igualmente probable.

Modela el número de
Número fijo de Experimentos con
éxitos en una cantidad fija
ensayos resultados binarios, como
Binomial de ensayos independientes,
independientes con lanzar una moneda varias
con probabilidades
dos resultados. veces.
constantes.

Modela la probabilidad de
Muestreo sin Muestreo en poblaciones
obtener cierto número de
Hipergeométrica reemplazo, con éxito finitas, donde cada
éxitos en una muestra sin
y fracaso. resultado es exclusivo.
reemplazo.

Modela la probabilidad de Tiempo hasta que se


Ensayos
tener que realizar varios observa un evento exitoso
Geométrica independientes hasta
ensayos antes de obtener el en una secuencia de
el primer éxito.
primer éxito. ensayos independientes.

Modela el número de
Número de ensayos Situaciones donde se
ensayos necesarios para
Binomial hasta obtener un repiten ensayos hasta que
obtener un número fijo de
Negativa número fijo de se alcanza un número fijo
éxitos en una secuencia de
éxitos. de éxitos.
ensayos.

63
Unidad I, II, III
Estadística Descriptiva
Similar a la binomial Modelar el número de
Número de ensayos
negativa, pero generaliza a ensayos necesarios para
hasta obtener un
Pascal casos donde se obtienen alcanzar un cierto número
número fijo de
éxitos después de varios de éxitos en una
éxitos.
intentos. secuencia.

Modela la probabilidad de
Aplicaciones en teoría de
un número fijo de eventos Número de eventos
colas, eventos raros como
Poisson en un intervalo dado, en un intervalo de
llamadas a una central
cuando los eventos son tiempo o espacio.
telefónica en un minuto.
raros.

1.64.2 Distribución Continua:

Distribuciones
Definición Características Aplicación
Continuas

Modelar situaciones
Todos los puntos en el Igual probabilidad
Uniforme o donde cada punto en el
intervalo tienen la misma para todos los puntos
Rectangular intervalo es igualmente
densidad de probabilidad. en un intervalo.
probable.

Ampliamente utilizada en
Distribución simétrica que estadística y ciencias,
Simetría, campana de
Normal describe muchos fenómenos modelando datos como
Gauss.
naturales. alturas, IQ, errores de
medición.

Modela la probabilidad de Modelar intervalos de


Tiempo entre eventos
tiempo entre eventos tiempo entre eventos,
Exponencial sucesivos en un
sucesivos en un proceso de como tiempos de espera
proceso de Poisson.
Poisson. entre llegadas de clientes.

Utilizada en pruebas de Suma de cuadrados de Pruebas estadísticas y


Ji-Cuadrado independencia y bondad de variables normales análisis de datos
ajuste. estándar. categóricos.

64
Unidad I, II, III
Estadística Descriptiva
Utilizada para estimar la Relacionada con la Pruebas de hipótesis y
media de una población normal, pero adecuada estimación de parámetros
t de Student
cuando la desviación para muestras poblacionales con
estándar es desconocida. pequeñas. muestras pequeñas.

Cociente de dos
Utilizada en análisis de variables con Comparación de varianzas
F de Snedecor
varianza y regresión. distribución chi- en análisis estadístico.
cuadrado.

Modela fenómenos con


No tiene momentos Tails más pesadas que
colas pesadas y sin
Cauchy definidos y puede no tener la normal, sin media o
restricciones en la
media o varianza finitas. varianza finitas.
variabilidad.

Ampliamente utilizado en
Puede describir diferentes Modela tiempos de
ingeniería para analizar
Weibull patrones de fallo en la vida vida o duración hasta
tiempos de vida y
de un producto. un evento.
fiabilidad de sistemas.

Modelar datos que pueden


Tiene colas más pesadas
Distribución doble tener valores atípicos, con
Laplace que la normal y picos más
exponencial. mayor robustez que la
agudos.
normal.

Aplicaciones en
Describe fenómenos donde economía, ciencias
algunos valores son Distribución de cola sociales y finanzas,
Pareto
significativamente mayores larga, eventos raros. modelando la distribución
que otros. de riqueza y eventos
extremos.

Triangular Simétrica, con mayor Distribución con Modelar situaciones con


densidad de probabilidad en valores extremos valores extremos
el centro. improbables. improbables, como
estimaciones basadas en

65
Unidad I, II, III
Estadística Descriptiva
expertos.

1.65 Ejemplificación

1.65.1 Distribución Poisson

Ejercicio 1:

Suponga que los accidentes en una cierta calle siguen un proceso de poisson con una tasa de 2 accidentes
por semana.

a) Halle la probabilidad de que ocurran 5 accidentes durante la próxima semana.


b) Halle la probabilidad de que lo ocurran 3 accidentes durante las próximas dos semanas.
x=número de accidentes durante la proxima semana

a) λ=2
b) λ=4
a. P ( x=5 )=¿
b. P ( x ≤ 3 )=¿

66
Unidad I, II, III
Estadística Descriptiva

1.66 Distribución Hipergeométrica

Ejercicio 2:
Supongo que un proceso de control de calidad se inspecciona un lote de 10 artículos, de los cuales cuatro
son defectuosos. sí se eligen 5 artículos al azar y sin reemplazo.
a) calcule la probabilidad de elegir dos artículos defectuosos.
P= ( x =2 )
b) calcule la probabilidad de elegir a lo más dos artículos defectuosos.
P= ( x ≤ 2 )
N=10
M =4
n=5

67
Unidad I, II, III
Estadística Descriptiva

68

También podría gustarte