Unidad1 1
Unidad1 1
Unidad1 1
UNIDAD 1
Introducción al análisis
estadístico descriptivo
univariado
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Introducción
La estadística es una
disciplina que facilita el
procesamiento, análisis
e inferencia de
información con miras a
fundamentar la toma de
decisiones.
En la vida cotidiana, las personas, las empresas, las economías desarrollan una serie de actividades y
operaciones que demandan diferentes tipos de información para poder llevarlas a cabo. Esto con el
propósito de realizar cada actividad de la mejor manera posible, evitando riesgos y disminuyendo los grados
de incertidumbre.
Visto así, la información es fundamental y es la base para tomar decisiones más acertadas reduciendo el
margen de error que pueda significar la elección de una alternativa de acción.
Según Chiavenato (2006), la información son datos con significado, es decir, aportan en un determinado
contexto conocimientos que permiten reducir la incertidumbre a la hora de tomar decisiones.
La información debe contar con ciertas características para que se pueda cumplir el objetivo de tomar
decisiones acertadas, entre ellas: ser verdadera, verificable, significativa, suficiente, óptima, que tenga un
procesamiento correcto de datos y por sobre todo que la información sea oportuna para tomar decisiones a
tiempo.
Existen distintas técnicas que aportan al proceso de procesamiento de datos y la entrega de información
para tomar decisiones, entre ellas la Estadística.
Estadística
1
Unidad 1: Introducción al análisis estadístico descriptivo univariado
1. Definición de Estadística
Estadística
DIFERENCIA
1. Describir información para un conjunto de datos, lo cual se realiza a través de tablas de frecuencia,
medidas de tendencia (media, moda, varianza, otras) y gráficos. Así se condensan los datos, se resumen
y luego pueden ser interpretados.
Estadística
2
Unidad 1: Introducción al análisis estadístico descriptivo univariado
La estadística descriptiva
permite responder a la
pregunta cómo se comporta el
objeto de estudio, la
inferencial, a cómo podría
comportarse.
Se tienen dos tipos de estadísticas: Estadística descriptiva o deductiva y Estadística inferencial o inductiva.
La estadística descriptiva es útil para ayudar a obtener una comprensión rápida y sencilla de un conjunto de
datos sin tener que pasar por todos los valores individuales de los datos.
La Estadística inferencial, también denominada analítica o inductiva, tiene como propósito analizar el
objeto de estudio y luego hacer deducciones. Dependiendo de las preguntas que desee responder sobre
una población, se pueden utilizar uno o más de los siguientes métodos: pruebas de hipótesis, intervalos de
confianzas y análisis de regresión.
2. Población y muestra
PREGUNTA
Estadística
3
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Población
Universo
Muestra
Fuente: elaboración propia, basada en Rustom (2012). Estadística descriptiva, probabilidad e inferencia. Una visión
conceptual y aplicada
Estadística
4
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Variable
Tipos de variables
Número de
empleados Temperatura Sexo Ocupación Calificación (excelente,
por sucursal Número bueno, regular, malo)
Sueldo
de recién
Estatura Profesión Estado civil Grado de calidad(extra,
Número nacidos en
un hospital Edad primera, segunda)
de hijos
por familia Peso Color de pelo Religión Nivel socioeconómico
(ABc1, c2, c3, d,)
Además, cada una de las variables anteriores podría tener más subclasificaciones. Por ende, se tienen
variables de tipo económico, dicotómicas, dependientes, independientes, etc. Por ejemplo, se podría tener
una variable estadística de tipo cuantitativa, discreta y dependiente.
Estadística
5
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Un dato representa a una variable, por tanto, se le puede asignar un número, letra o signo. Los datos
ofrecen información sobre la realidad, no obstante, para estudiar esa realidad será necesario organizar esos
datos, en este caso, antes de hacer un análisis estadístico. Además, los datos suelen estar relacionados
unos con otros aun cuando corresponden al mismo elemento en estudio. Por ejemplo, para que la
información sea útil, será necesario organizar con base en los nombres de las personas en estudio su edad,
profesión, número de hijos, etc., pues de lo contrario sería imposible describirlo. De allí la importancia de
un buen proceso de obtención y organización de los datos.
Entrevista
Se escuchan Preguntando
Encuesta
Leyendo y revisando
Se leen Revisión documental
material documental
Se perciben directamente
Preguntando Sesión en profundidad
y se escuchan
Los datos deben presentarse de manera ordenada y estructurada para que sea más sencillo entender,
analizar e interpretar. Una de las maneras de organizar los datos es a través de tablas, por ejemplo las
tablas de distribución de frecuencias.
Estadística
6
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Se divide cada
¿Cuántas Se van Se van
fi entre N y
veces se repite sumando los sumando los
se multiplica
la variable? valores de fi valores de hi
por 100
Clase Frecuencia
Frecuencia absoluta Frecuencia absoluta a Frecuencia
relativa acumulada
(fi o ni) cumulada (Fi o Ni) relativa (hi= fi/N*100)
(Hi)
FEMENINO 24 24 86 86
MASCULINO 4 28 14 100
TOTAL 28 100%
La última Fi
La última Hi debe
siempre debe ser
ser 100
igual a N
La suma de todas La suma de todas
las fi debe ser las Fi siempre
igual a debe ser igual a
N (muestra) 100%
Estadística
7
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Fuente: Rustom (2012, pág. 14). Estadística descriptiva, probabilidad e inferencia. Una visión conceptual y aplicada.
Cuando las variables son continuas se deben construir “Intervalos de clases”, que contienen rangos de
información de una variable en estudio, el número de intervalos puede obedecer a una elección quizás
arbitraria de parte del investigador, sin embargo, para que tenga peso estadístico es mejor aplicar la “regla
de sturgen”, cuya fórmula es la que sigue:
𝐾 = 1 + 3,322 log∗ 𝑛
• Donde:
• K= Número de intervalos de clase de variables continuas, debe ser siempre entero. Si del cálculo resulta
un número entero y decimales, debe ser aproximado al entero mayor o menor según la regla de los
decimales
𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚í𝑛
• Donde:
• R= Rango de datos
• Luego, se debe determinar la amplitud del intervalo de clase (A), que se calcula como rango dividido
entre el número de intervalos de clase (que debe ser solo el número entero sin decimales)
𝑅
• 𝐴=𝐾
Estadística
8
Unidad 1: Introducción al análisis estadístico descriptivo univariado
• Donde:
• R= Rango de datos
• Es importante destacar que cada “intervalo de clase”, se construye con un límite inferior 𝒙𝒊−𝟏 y un límite
superior 𝒙𝒊
• El primer límite inferior que corresponde al primer número de clase intervalo (primera fila de la tabla de
frecuencias) comienza con la observación de menor valor calculado en el estudio
• El último límite de intervalo que corresponde al último número de clase de intervalo (última fila de la
tabla de frecuencias), debiera coincidir con la observación de mayor valor calculado en el estudio
• La marca de clase (Xi) corresponde al punto medio de cada intervalo y es el valor que representa a todo
el intervalo y es necesario determinarla para el cálculo de los estadísticos o estadígrafos como la media
aritmética, la varianza, etc. Se determina con la siguiente fórmula:
𝒙𝒊−𝟏 + 𝒙𝒊
𝒙𝒊 =
𝟐
Para complementar el análisis descriptivo de las tablas de frecuencias, se necesitan determinados valores
numéricos que permitan cuantificar ciertas características de la distribución de frecuencias, estos son los
estadígrafos o estadísticos si son calculados a partir de los datos de una muestra y parámetros si son
calculados a partir de los datos de una población.
Entre los estadígrafos que se utilizan para describir y resumir un conjunto de datos están: medidas de
tendencia central y las medidas de dispersión, las cuales se abordarán a continuación.
Las medidas de tendencia central permiten resumir en un número los datos analizados. Ese número viene
a representar el centro sobre el cual giran los valores estudiados. Responden a preguntas como: cuál es el
dato que más se repite (moda), cuál es el promedio de los datos (media), cuál es el valor que queda en el
medio una vez ordenados los datos (mediana).
6.1 Moda
Ejemplo:
2 3 12 12 17 22 10 10 3 4 6 7 9 10 21
El valor que más se repite es el 10, por ende, la Mo=10, hay una sola moda, recibe el nombre de
“Unimodal”
Estadística
9
Unidad 1: Introducción al análisis estadístico descriptivo univariado
2 3 12 12 17 22 10 10 3 4 12 7 9 10 21
Los valores que más se repiten son el 10 y el 12 en tres oportunidades cada uno de ellos, Mo =10,12, ahora
se tiene una “bimoda”
Cuando el conjunto de datos posea más de dos modas, se llama “trimodal” o “multimodal”
En el caso de los datos que están agrupados de manera discreta, la moda estará dada por la fi que tenga
mayor valor, dado que está referida a la frecuencia con que se repite la característica de la variable.
b) Se calculan las diferencias entre d1=fi - fi-1 y d2=fi - fi+1, donde: fi-1, es la frecuencia absoluta del intervalo
anterior al intervalo modal, y fi+1, es la frecuencia absoluta del intervalo siguiente al intervalo modal
Ejemplo:
Estadística
10
Unidad 1: Introducción al análisis estadístico descriptivo univariado
6.2 Mediana
La mediana es el estadígrafo que da cuenta del valor que queda en el medio, una vez ordenados los datos. A
continuación, la explicación para su ubicación y cálculo.
Ejemplo:
Procedimiento: los datos se ordenan de menor a mayor {1, 2, 4, 7, 8, 9, 10, 12,15} n=9, número impar,
entonces Me= Valor central X5= 8
Si a los datos anteriores, se le sacara un número, por ejemplo, el 9, quedaría {4, 7, 1, 2, 15, 8, 10,12}
Procedimiento: los datos se ordenan de menor a mayor {1, 2, 4, 7, 8, 10, 12,15} n=8, número par, entonces
la Mediana sería el promedio de los dos valores centrales Me=(X4+X5)/2 = (7+8)/2 = 7,5
Ejemplo:
Estadística
11
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Tabla de distribución de frecuencias: número de hermanos que integran el núcleo familiar de los alumnos
de un curso
Número de Frecuencias
Hermanos Absoluta Fi 𝑛 20
(Xi) (fi) = = 10
2 2
n=20
Donde:
Ejemplo:
Estadística
12
Unidad 1: Introducción al análisis estadístico descriptivo univariado
6.3 Media
También se denomina media aritmética. Es el promedio del total de los datos de la muestra.
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏 52
ഥ=
𝒙 = = 2,6
𝒏 20
Estadística
13
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Ejemplo:
Tabla de distribución de frecuencias: número de hermanos que integran el núcleo familiar de los alumnos
de un curso
Número de Frecuencias
Xi*fi
Hermanos (Xi) Absoluta (fi)
0 2 0
1 4 4
2 4 8
3 4 12
Ⴟ = 52 = 2,6
4 3 12 20
5 2 10 Promedio de hermanos por estudiante
6 1 6
n=20 52
Donde Xi representa al valor de la marca de clase, de la clase i-ésima, fi a la frecuencia absoluta de la clase y
n al tamaño de la muestra.
Ejemplo:
Estadística
14
Unidad 1: Introducción al análisis estadístico descriptivo univariado
7. Medidas de dispersión
Las medidas de dispersión son estadígrafos que permite conocer cuán dispersos están los datos que
conforman una muestra.
1
Otra forma 𝑠 2 = 𝑛 𝛴 𝑥𝑖 − 𝑥ҧ 2
∗ 𝑓𝑖
𝛴𝑥𝑖2 ∗𝑓𝑖
Otra forma 𝑠 2 = − 𝑥ҧ 2
𝑛
Ejemplo:
Se desea hacer un estudio para conocer la estatura de un grupo de niños de educación básica. Los datos
son como siguen:
Estadística
15
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Intervalos de clase
Xi "Marca de fi "frec.
XI * fi (Xi - Ⴟ)^2*fi
Límite inferior Límite superior Clase" absoluta"
(Li) (LS)
1,180 1,203 1,192 6 7,150 0,019
1,204 1,228 1,216 3 3,648 0,003
1,229 1,252 1,240 12 14,884 0,001
1,253 1,276 1,265 5 6,323 0,001
1,277 1,301 1,289 9 11,601 0,015
1,302 1,325 1,313 1 1,313 0,004
Sumas 36 44,920 0,044
Fuente: elaboración propia.
La media fue:
Para el ejemplo de la estatura de los niños de un curso (tabla previa), la desviación estándar sería:
𝒔= 𝒔𝟐
𝒔 = 0,001211
𝒔 = 0,0348
El resultado es cercano a “0”, significa que no hay mayor variabilidad y los datos se encuentran cerca de la
media.
Estadística
16
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Cuando se quiere comparar la dispersión de dos conjuntos de datos, con unidad de medida diferente, surge
una medida de varianza relativa llamada coeficiente de variación, la cual expresa la desviación estándar
como un porcentaje de la media.
Puede revelar si la muestra es homogénea o heterogénea. En la medida que los datos sea más homogénea,
más significativa la información y se pueden tomar mejores decisiones.
𝑆
La fórmula de cálculo es: 𝑐𝑣 = 𝑥ҧ ∗ 100% y se expresa en porcentaje.
El CV, va entre 0 y 100%, mientras más cercano a “0”, más significativa la información para llevar a cabo
análisis. Por ejemplo, se tiene 2 grupos, el grupo 1 presenta un CV=35% y el grupo un CV= 52%, ¿cuál de los
dos grupos presenta información más homogénea, más concentrada, no tan dispersa? La respuesta es el
grupo 1, pues tiene un CV más bajo.
El rango suele ser utilizado para obtener la dispersión total. Es decir, si tenemos una muestra con dos
observaciones 1,70 cms. y 1,65 cms., el rango será 5 cms.
Se debe recordar que la estadística descriptiva es una estadística de resumen que utiliza tablas de
frecuencias, medidas estadísticas y, para complementar la información y hacer análisis, presenta gráficos
estadísticos.
PREGUNTA
Estadística
17
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Estadística
18
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Conclusión
La estadística permite
disminuir la incertidumbre a la
hora de decidir.
La estadística es una herramienta fundamental en la economía y las empresas, e incluso en nuestra vida
diaria. Basándose en lo estudiado en este documento, la estadística es una herramienta que recoge datos
sobre un determinado estudio, luego procesa estos datos y los resume a través de distintas técnicas, como
lo es la tabla de frecuencias, las medidas estadísticas y los gráficos. Esto permite que se analicen los
distintos fenómenos y se pueda llegar a conclusiones válidas.
La estadística es una ciencia transversal a todas las áreas del saber, dado que se puede aplicar en la
biología, la física, la sociología, las finanzas y el mercado en general.
Las empresas cada día valoran más el aporte de las técnicas estadísticas, ya que entregan información
valiosa para la toma de decisiones en este ambiente cada vez más cambiante e incierto en el cual se
desenvuelven los mercados y la economía en general.
Estadística
19
Unidad 1: Introducción al análisis estadístico descriptivo univariado
Referencias bibliográficas
Pérez Tejada, A. (2008). Estadística, ciencias sociales, del comportamiento y de la salud. Cengage Learning
Editores.
Ramos Ramírez, J. C., Del Águila Ríos, V. R., & Bazalar Boulangger, A. C. (2017). Estadística básica para los
negocios. Universidad de Lima.
Rustom Jabbaz, A. (2012). Estadística descriptiva, probabilidad e inferencia. Una visión conceptual y
aplicada.
https://repositorio.uchile.cl/bitstream/handle/2250/120284/Rustom_Antonio_Estadistica_descrip
tiva.pdf
Estadística
20