Unidad1 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 21

Estadística

UNIDAD 1
Introducción al análisis
estadístico descriptivo
univariado
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Introducción

La estadística es una
disciplina que facilita el
procesamiento, análisis
e inferencia de
información con miras a
fundamentar la toma de
decisiones.

En la vida cotidiana, las personas, las empresas, las economías desarrollan una serie de actividades y
operaciones que demandan diferentes tipos de información para poder llevarlas a cabo. Esto con el
propósito de realizar cada actividad de la mejor manera posible, evitando riesgos y disminuyendo los grados
de incertidumbre.

Visto así, la información es fundamental y es la base para tomar decisiones más acertadas reduciendo el
margen de error que pueda significar la elección de una alternativa de acción.

Según Chiavenato (2006), la información son datos con significado, es decir, aportan en un determinado
contexto conocimientos que permiten reducir la incertidumbre a la hora de tomar decisiones.

La información debe contar con ciertas características para que se pueda cumplir el objetivo de tomar
decisiones acertadas, entre ellas: ser verdadera, verificable, significativa, suficiente, óptima, que tenga un
procesamiento correcto de datos y por sobre todo que la información sea oportuna para tomar decisiones a
tiempo.

Existen distintas técnicas que aportan al proceso de procesamiento de datos y la entrega de información
para tomar decisiones, entre ellas la Estadística.

La estadística proporciona la metodología para recolectar, procesar y sintetizar datos referidos a un


estudio de interés, transformándolos en información que debe ser interpretada correctamente para poder
obtener conclusiones válidas.

Estadística
1
Unidad 1: Introducción al análisis estadístico descriptivo univariado

La estadística se ha convertido en el fundamento de las actividades académicas, de investigación y


profesionales. Sin ella se corre el riesgo de que las conclusiones no sean tomadas como válidas (Rustom,
2012).

A continuación, se abordarán los conceptos básicos asociados a la estadística y se profundizará en su rol


descriptivo en el procesamiento de datos de cualquier análisis o estudio para cumplir con el propósito de
proporcionar la información necesaria para la toma de decisiones.

1. Definición de Estadística

Estadística
DIFERENCIA

Según Spiegel y Stephens (2009), la estadística se ocupa de los métodos


científicos que se utilizan para recolectar, organizar, resumir, presentar y
analizar datos, así como para obtener conclusiones válidas y tomar
decisiones razonables con base en este análisis (pág. 1).

1.1 Uso de la Estadística


La estadística cumple dos funciones elementales:

1. Describir información para un conjunto de datos, lo cual se realiza a través de tablas de frecuencia,
medidas de tendencia (media, moda, varianza, otras) y gráficos. Así se condensan los datos, se resumen
y luego pueden ser interpretados.

2. Hacer inferencias: corresponde a la obtención de conclusiones acerca de las características de una


población a través de una muestra determinada (Rustom, 2012).

1.2 Objetivos de la Estadística


“El principal objetivo de la estadística es hacer inferencias acerca de una población, con base en la
información contenida en una muestra” (Pérez, 2008, pág. 172). Algunos objetivos específicos son, de
acuerdo con Martínez (2012): conocer la realidad del objeto de estudio, estudiar los cambios de un
fenómeno, identificar las causas de un fenómeno, conocer las relaciones entre dos o más fenómenos, hacer
estimaciones, “determinar el grado de validez y confiabilidad ya sea de las predicciones o las conclusiones
obtenidas a partir de una muestra”. (pág. 9)

Estadística
2
Unidad 1: Introducción al análisis estadístico descriptivo univariado

1.3 División de la Estadística

La estadística descriptiva
permite responder a la
pregunta cómo se comporta el
objeto de estudio, la
inferencial, a cómo podría
comportarse.

Se tienen dos tipos de estadísticas: Estadística descriptiva o deductiva y Estadística inferencial o inductiva.

La estadística descriptiva tiene como propósito resumir la información de un conjunto numeroso de


datos de un determinado objeto de estudio. Para ello, utiliza herramientas de resumen: tablas de
frecuencias, gráficos para representar los datos y calcula indicadores o estadísticos como lo son la media,
moda, varianza y otros, y en base a estos datos describe y realiza análisis de un grupo de datos, sin sacar
conclusiones.

La estadística descriptiva es útil para ayudar a obtener una comprensión rápida y sencilla de un conjunto de
datos sin tener que pasar por todos los valores individuales de los datos.

La Estadística inferencial, también denominada analítica o inductiva, tiene como propósito analizar el
objeto de estudio y luego hacer deducciones. Dependiendo de las preguntas que desee responder sobre
una población, se pueden utilizar uno o más de los siguientes métodos: pruebas de hipótesis, intervalos de
confianzas y análisis de regresión.

Hasta el momento resulta recurrente el uso de algunos términos propios de la estadística.

2. Población y muestra
PREGUNTA

¿Qué diferencias hay entre universo, población y muestra?

Hay términos estadísticos que deben manejarse correctamente, entre


ellos universo, población y muestra.

Estadística
3
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Ejemplo gráfico de universo, población y muestra

Población

Universo

Muestra

Fuente: elaboración propia, basada en Anónimo (2020).

En la siguiente tabla, se definen los términos referidos:

Comparando universo, población y muestra

Medidas más utilizadas para


Definición Ejemplo
estudiarlo
Totalidad de individuos o Todos los clientes No aplica.
Universo

elementos de los cuales se de la empresa X.


puede recopilar una
información.
Parte de los individuos del Todas las mujeres Parámetros: valor de una
Población

universo que comparten clientes de una variable de la población.


características que empresa X. Ejemplo: promedio poblacional,
interesan para un estudio moda poblacional, etc.
determinado.
Una muestra representa Un grupo de 30 Estadígrafos: valor de una
parte de los individuos de mujeres clientes variable de la muestra.
la población, dado que no de la empresa X. Ejemplo: promedio muestral,
Muestra

es posible estudiarlos a mediana muestra, etc.


todos, normalmente. El objetivo del estadístico es
Las muestras aleatorias inferir características de una
son las que tienen validez población y sirve para estimar un
estadística. determinado parámetro.

Fuente: elaboración propia, basada en Rustom (2012). Estadística descriptiva, probabilidad e inferencia. Una visión
conceptual y aplicada

Estadística
4
Unidad 1: Introducción al análisis estadístico descriptivo univariado

3. Variables y tipos de variables


DIFERENCIA

Variable

Las variables estadísticas son características que poseen las personas,


cosas o lugares y que pueden ser medidas.

3.1 Tipos de variables


En el siguiente esquema se pueden distinguir los tipos y subtipos de variables.

Clasificación de las variables

Tipos de variables

Cuantitativa: número Cualitativa: palabras

Discreta Continua Nominal Ordinal

Se expresa en Puede asumir Conllevan


Sin orden
valores enteros cualquier valor un orden

Número de
empleados Temperatura Sexo Ocupación Calificación (excelente,
por sucursal Número bueno, regular, malo)
Sueldo
de recién
Estatura Profesión Estado civil Grado de calidad(extra,
Número nacidos en
un hospital Edad primera, segunda)
de hijos
por familia Peso Color de pelo Religión Nivel socioeconómico
(ABc1, c2, c3, d,)

Fuente: elaboración propia.

Además, cada una de las variables anteriores podría tener más subclasificaciones. Por ende, se tienen
variables de tipo económico, dicotómicas, dependientes, independientes, etc. Por ejemplo, se podría tener
una variable estadística de tipo cuantitativa, discreta y dependiente.

Estadística
5
Unidad 1: Introducción al análisis estadístico descriptivo univariado

4. Obtención y organización de los datos

Un dato representa a una variable, por tanto, se le puede asignar un número, letra o signo. Los datos
ofrecen información sobre la realidad, no obstante, para estudiar esa realidad será necesario organizar esos
datos, en este caso, antes de hacer un análisis estadístico. Además, los datos suelen estar relacionados
unos con otros aun cuando corresponden al mismo elemento en estudio. Por ejemplo, para que la
información sea útil, será necesario organizar con base en los nombres de las personas en estudio su edad,
profesión, número de hijos, etc., pues de lo contrario sería imposible describirlo. De allí la importancia de
un buen proceso de obtención y organización de los datos.

4.1 Obtención de datos


Los datos se pueden obtener de diferentes formas:

Formas de obtener datos

Tipo de indicio Obtención de la información Técnica

Se perciben directamente Observando o experienciando​ Observación​

Entrevista
Se escuchan​ Preguntando​
Encuesta

Leyendo y revisando
Se leen Revisión documental
material documental​

Se perciben directamente
Preguntando Sesión en profundidad​
y se escuchan​

Fuente: elaboración propia, basada en Hurtado de Barrera (2010, pág. 772).

4.2 Datos agrupados y no agrupados


Cuando se trabaja con grandes cantidades de datos, se hace necesario agruparlos para poder manejarlos y
realizar un análisis más adecuado.

Los datos deben presentarse de manera ordenada y estructurada para que sea más sencillo entender,
analizar e interpretar. Una de las maneras de organizar los datos es a través de tablas, por ejemplo las
tablas de distribución de frecuencias.

5. Tablas de distribución de frecuencia unidimensionales

Este documento se concentra en variables unidimensionales o univariadas, que es el estudio de una


variable en el objeto de estudio.

Estadística
6
Unidad 1: Introducción al análisis estadístico descriptivo univariado

5.1 Tabla de frecuencias


La estadística descriptiva, que utiliza la estadística de resumen, emplea las tablas de frecuencia para
representar de manera ordenada los datos recopilados de un determinado estudio. Con el término
frecuencia se hace referencia a la cantidad de veces que se repite un dato.

5.1.1 Tipos de frecuencias


Los tipos de frecuencias son: absoluta (fi o ni), absoluta acumulada (Fi o Ni), relativa (hi) y relativa
acumulada (Hi).

5.2 Tabla de distribución frecuencias para variable discreta


Para una muestra de tamaño N=28, de la cual se han extraído dos clases distintas (femenino y masculino),
una tabla de frecuencia de variable discreta se representa así:

Tabla de distribución frecuencias para variable discreta

Se divide cada
¿Cuántas Se van Se van
fi entre N y
veces se repite sumando los sumando los
se multiplica
la variable?​ valores de fi valores de hi
por 100

Clase​ Frecuencia
Frecuencia absoluta Frecuencia absoluta a Frecuencia
relativa acumulada
(fi o ni)​ cumulada (Fi o Ni)​ relativa (hi= fi/N*100)​
(Hi)​
FEMENINO​ 24​ 24​ 86​ 86​
MASCULINO​ 4​ 28​ 14​ 100​
TOTAL 28 100%

La última Fi
La última Hi debe
siempre debe ser
ser 100​
igual a N​
La suma de todas La suma de todas
las fi debe ser las Fi siempre
igual a debe ser igual a
N (muestra) 100%

Fuente: elaboración propia.

5.3 Tabla de distribución frecuencias para variables continuas


Cuando las variables son continuas o si el análisis comprende una gran cantidad de datos heterogéneos,
estos se deben agrupar en intervalos de clase (en el caso de las variables discretas, se definen números de
clases en vez de intervalos). Para una muestra de tamaño “n”, de la cual se han extraído K intervalos de
clases, la tabla de distribución de frecuencias se presenta de la siguiente manera:

Estadística
7
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Elementos de una tabla de distribución de frecuencias para variables continuas

Fuente: Rustom (2012, pág. 14). Estadística descriptiva, probabilidad e inferencia. Una visión conceptual y aplicada.

De la tabla de distribución se desprende lo siguiente:

Cuando las variables son continuas se deben construir “Intervalos de clases”, que contienen rangos de
información de una variable en estudio, el número de intervalos puede obedecer a una elección quizás
arbitraria de parte del investigador, sin embargo, para que tenga peso estadístico es mejor aplicar la “regla
de sturgen”, cuya fórmula es la que sigue:
𝐾 = 1 + 3,322 log∗ 𝑛

• Donde:

• K= Número de intervalos de clase de variables continuas, debe ser siempre entero. Si del cálculo resulta
un número entero y decimales, debe ser aproximado al entero mayor o menor según la regla de los
decimales

Log=Logaritmo en base 10 (Log10)

n= Número de observaciones de la muestra


Para construir un intervalo de clase (𝒙𝒊−𝟏 + 𝒙𝒊 ), se debe determinar el rango de los datos (R), como la
diferencia entre la observación con mayor valor y la observación con menor valor del objeto de estudio:

𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚í𝑛
• Donde:

• R= Rango de datos

• Xmáx.= Observación con el mayor valor

• Xmin. = Observación con el menor valor

• Luego, se debe determinar la amplitud del intervalo de clase (A), que se calcula como rango dividido
entre el número de intervalos de clase (que debe ser solo el número entero sin decimales)
𝑅
• 𝐴=𝐾

Estadística
8
Unidad 1: Introducción al análisis estadístico descriptivo univariado

• Donde:

• A= Amplitud de cada intervalo de clase

• R= Rango de datos

• K= Número de intervalos de clase

• Es importante destacar que cada “intervalo de clase”, se construye con un límite inferior 𝒙𝒊−𝟏 y un límite
superior 𝒙𝒊

• El primer límite inferior que corresponde al primer número de clase intervalo (primera fila de la tabla de
frecuencias) comienza con la observación de menor valor calculado en el estudio

• El último límite de intervalo que corresponde al último número de clase de intervalo (última fila de la
tabla de frecuencias), debiera coincidir con la observación de mayor valor calculado en el estudio

• La marca de clase (Xi) corresponde al punto medio de cada intervalo y es el valor que representa a todo
el intervalo y es necesario determinarla para el cálculo de los estadísticos o estadígrafos como la media
aritmética, la varianza, etc. Se determina con la siguiente fórmula:
𝒙𝒊−𝟏 + 𝒙𝒊
𝒙𝒊 =
𝟐
Para complementar el análisis descriptivo de las tablas de frecuencias, se necesitan determinados valores
numéricos que permitan cuantificar ciertas características de la distribución de frecuencias, estos son los
estadígrafos o estadísticos si son calculados a partir de los datos de una muestra y parámetros si son
calculados a partir de los datos de una población.

Entre los estadígrafos que se utilizan para describir y resumir un conjunto de datos están: medidas de
tendencia central y las medidas de dispersión, las cuales se abordarán a continuación.

6. Medidas de posición de tendencia central

Las medidas de tendencia central permiten resumir en un número los datos analizados. Ese número viene
a representar el centro sobre el cual giran los valores estudiados. Responden a preguntas como: cuál es el
dato que más se repite (moda), cuál es el promedio de los datos (media), cuál es el valor que queda en el
medio una vez ordenados los datos (mediana).

6.1 Moda
Ejemplo:

Dado el conjunto de los siguientes datos, calcule la moda

2 3 12 12 17 22 10 10 3 4 6 7 9 10 21

El valor que más se repite es el 10, por ende, la Mo=10, hay una sola moda, recibe el nombre de
“Unimodal”

Estadística
9
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Qué sucede si tenemos los siguientes datos:

2 3 12 12 17 22 10 10 3 4 12 7 9 10 21

Los valores que más se repiten son el 10 y el 12 en tres oportunidades cada uno de ellos, Mo =10,12, ahora
se tiene una “bimoda”

Cuando el conjunto de datos posea más de dos modas, se llama “trimodal” o “multimodal”

En el caso de los datos que están agrupados de manera discreta, la moda estará dada por la fi que tenga
mayor valor, dado que está referida a la frecuencia con que se repite la característica de la variable.

6.1.1 Cálculo de la Moda para datos agrupados de manera continua


a) Se identifica el intervalo que posee mayor frecuencia absoluta (fi), o intervalo modal (𝑋𝑖−1´ − 𝑋𝑖´)

b) Se calculan las diferencias entre d1=fi - fi-1 y d2=fi - fi+1, donde: fi-1, es la frecuencia absoluta del intervalo
anterior al intervalo modal, y fi+1, es la frecuencia absoluta del intervalo siguiente al intervalo modal

c) Se identifica el límite inferior del intervalo moda Li

La fórmula de la moda es la siguiente:

Ejemplo:

La siguiente tabla resume el peso de un grupo de 50 recién nacidos.

Tabla de distribución de frecuencias: peso de un grupo de recién nacidos

Intervalos Marca de clase Frecuencia


de clase Recién nacidos Absoluta De la tabla de datos continuos, el
(Xi-1 - Xi) (Xi) (fi) intervalo modal es (2,7 – 3,0), dado que
1,8 - 2,1 1,95 4 posee la frecuencia mayor f4=13

2,1 - 2,4 2,25 4 Se calcula d1=13-7 = 5 y d2=13-11= 2


2,4 - 2,7 2,55 7
Aplicando la fórmula:
2,7 – 3,0 2,85 13
5
3,0 – 3,3 3,15 11 𝑀𝑒 = 2,7 + 5+2 ∗ 0,3 = 2,91 kgs.
3,3 – 3,6 3,45 8
El peso de los recién nacidos más
3,6 – 3,9 3,75 3 frecuente es 2,91 Kg.
n=50

Fuente: elaboración propia.

Estadística
10
Unidad 1: Introducción al análisis estadístico descriptivo univariado

6.2 Mediana
La mediana es el estadígrafo que da cuenta del valor que queda en el medio, una vez ordenados los datos. A
continuación, la explicación para su ubicación y cálculo.

6.2.1 Cálculo de la mediana para datos no agrupados


Las reglas para calcular la mediana son las siguientes:

a) Se ordenan los datos u observaciones “n” de la muestra de menor a mayor.

b) Si “n” es impar, entonces la mediana corresponde a la observación central.

c) Si “n” es par, entonces la mediana corresponde al promedio de los valores central.

Ejemplo:

Se tiene los siguientes datos: {4, 7, 1, 2, 15,8, 9, 10,12}

Procedimiento: los datos se ordenan de menor a mayor {1, 2, 4, 7, 8, 9, 10, 12,15} n=9, número impar,
entonces Me= Valor central X5= 8

Si a los datos anteriores, se le sacara un número, por ejemplo, el 9, quedaría {4, 7, 1, 2, 15, 8, 10,12}

Procedimiento: los datos se ordenan de menor a mayor {1, 2, 4, 7, 8, 10, 12,15} n=8, número par, entonces
la Mediana sería el promedio de los dos valores centrales Me=(X4+X5)/2 = (7+8)/2 = 7,5

6.2.2 Cálculo de la mediana para datos agrupados discretos


𝑛
Para calcular la mediana, se debe identificar la primera frecuencia absoluta acumulada (Fi) que supere a 2
Frente a ello, existen dos alternativas:
𝑛
1. Fi-1 < 2 , en este caso Me = Xi
𝑛 𝑥𝑖−1 +𝑥𝑖
2. Fi-1 = 2 , en este caso Me = 2

Ejemplo:

La siguiente tabla resume la cantidad de hermanos por estudiante:

Estadística
11
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Tabla de distribución de frecuencias: número de hermanos que integran el núcleo familiar de los alumnos
de un curso

Número de Frecuencias
Hermanos Absoluta Fi 𝑛 20
(Xi) (fi) = = 10
2 2

0 2 2 Como se ve en la tabla que la primera


1 4 6 frecuencia acumulada absoluta que
supera a n/2 = 10, es F4 = 14, como
2 4 10 F3=10 = a n/2 = 10, entonces, se tiene:
3 4 14
𝑥𝑖−⊥ +𝑥𝑖 2+3 5
4 3 17 Me = = = 2 = 2,5
2 2

5 2 19 El 50% de los estudiantes tiene a los más


6 1 20 2,5 hermanos en su composición familia

n=20

Fuente: elaboración propia.

6.2.3 Cálculo de la mediana para datos agrupados continuos


𝑛
Para calcular la mediana, se debe identificar la primera frecuencia absoluta acumulada (Fi) que supere a ,
2
𝑛
esto es 𝐹𝑖 > 2
𝑛
Si 𝐹𝑖 = 2 , la mediana será Me=𝑥𝑖−1
𝑛 𝑛
Si 𝐹𝑖 > , pero Fi−1 < , la mediana se encontrará en el i-ésimo intervalo, esto es, en el intervalo (Xi−1’ − Xi’).
2 2
Cuando se determine el intervalo mediano, se debe calcular la mediana (Me), con la siguiente fórmula:

Donde:

𝑿𝒊−𝟏 − 𝑿𝒊 = Intervalo mediano

𝑿𝒊−𝟏 = límite inferior del intervalo mediano

𝑭𝒊−𝟏 = Frecuencia absoluta acumulada del intervalo anterior al intervalo mediano

𝑨𝒊 = Amplitud del intervalo

𝒇𝒊 = Frecuencia absoluta del intervalo mediano

Ejemplo:

La siguiente tabla resume información sobre el peso de un grupo de 50 recién nacidos.

Estadística
12
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Tabla de distribución de frecuencias: peso de un grupo de recién nacidos

Intervalos Marca de Frecuencia Frecuencia 𝑛 50


De la tabla anterior, 2 = = 25
de clase clase Recién Absoluta Absoluta 2
(Xi-1 - Xi) nacidos (Xi) (fi) Acum. (Fi) 𝑛 𝑛
1,8 - 2,1 1,95 4 4 Si 𝐹𝑖 = 28 > 2 , pero Fi−1 = 15 < 2

2,1 - 2,4 2,25 4 8


Entonces, el intervalo mediano será:
2,4 - 2,7 2,55 7 15 (2,7 – 3,0)
2,7 – 3,0 2,85 13 28 Aplicando la fórmula:
3,0 – 3,3 3,15 11 39
3,3 – 3,6 3,45 8 47 50
− 15
3,6 – 3,9 3,75 3 50 𝑀𝑒 = 2,7 + 2 ∗ 0,3 = 2,93
n=50 13

Fuente: elaboración propia.

6.3 Media
También se denomina media aritmética. Es el promedio del total de los datos de la muestra.

6.3.1 Cálculo de la media cuando los datos están sin agrupar


Si se tiene un conjunto de n mediciones x1, x2, x3,..., xn, de una variable x, entonces la media se puede
calcular como la suma de los valores, dividida por el número total de observaciones (n), de la siguiente
manera:
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
𝑥ҧ = =
𝑛
Ejemplo:

La tabla presenta el número de hermanos en un grupo de estudiantes.

𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏 52
ഥ=
𝒙 = = 2,6
𝒏 20

2,6 es el promedio de hermanos por


estudiante

6.3.2 Cálculo de la media cuando los datos están tabulados como


variable discreta
Para calcular la media cuando los datos están tabulados como variables discretas, la fórmula a utilizar es:

Estadística
13
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Donde xi representa al valor de la clase i-ésima, fi a la frecuencia absoluta de la clase y n al tamaño de la


muestra

Ejemplo:

La tabla resume el número de hermanos en un grupo de estudiantes.

Tabla de distribución de frecuencias: número de hermanos que integran el núcleo familiar de los alumnos
de un curso

Número de Frecuencias
Xi*fi
Hermanos (Xi) Absoluta (fi)

0 2 0
1 4 4
2 4 8
3 4 12
Ⴟ = 52 = 2,6
4 3 12 20
5 2 10 Promedio de hermanos por estudiante

6 1 6
n=20 52

Fuente: elaboración propia.

6.3.3 Cálculo de la media cuando los datos están tabulados como


variable continua
La fórmula es la misma que las variables discretas, la diferencia radica en que hay que hacer un cálculo
previo de la marca de clase:

Donde Xi representa al valor de la marca de clase, de la clase i-ésima, fi a la frecuencia absoluta de la clase y
n al tamaño de la muestra.

Ejemplo:

La tabla resume información sobre el peso de un grupo de 50 recién nacidos.

Estadística
14
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Tabla de distribución de frecuencias: peso de un grupo de recién nacidos

Intervalos de Marca de Frecuencia


clase clase Recién Absoluta Xi*fi
(Xi-1 - Xi) nacidos (Xi) (fi)
1,8 - 2,1 1,95 4 7,8
2,1 - 2,4 2,25 4 9
2,4 - 2,7 2,55 7 17,85
2,7 – 3,0 2,85 13 37,05
3,0 – 3,3 3,15 11 34,65
3,3 – 3,6 3,45 8 27,6
3,6 – 3,9 3,75 3 11,25
n=50 145,2

Fuente: elaboración propia.

7. Medidas de dispersión

Las medidas de dispersión son estadígrafos que permite conocer cuán dispersos están los datos que
conforman una muestra.

7.1 Tipos de medidas de dispersión


Entre las medidas de dispersión se tienen la varianza, la desviación estándar o típica, el coeficiente de
variación y el rango.

7.1.1 Varianza (𝒔𝟐 )


La varianza se utiliza para conocer cómo varían los datos teniendo como referencia la media aritmética de
tales datos.

La fórmula para calcular la varianza es la siguiente:


𝛴 𝑥𝑖 −𝑥ҧ 2 ∗𝑓𝑖
𝑠2 = 𝑛

1
Otra forma 𝑠 2 = 𝑛 𝛴 𝑥𝑖 − 𝑥ҧ 2
∗ 𝑓𝑖

𝛴𝑥𝑖2 ∗𝑓𝑖
Otra forma 𝑠 2 = − 𝑥ҧ 2
𝑛

Cuando los datos están agrupados, se considera la frecuencia absoluta (fi).

Ejemplo:

Se desea hacer un estudio para conocer la estatura de un grupo de niños de educación básica. Los datos
son como siguen:

Estadística
15
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Tabla de distribución de frecuencias: estatura de un grupo de niños de educación básica

Intervalos de clase
Xi "Marca de fi "frec.
XI * fi (Xi - Ⴟ)^2*fi
Límite inferior Límite superior Clase" absoluta"
(Li) (LS)
1,180 1,203 1,192 6 7,150 0,019
1,204 1,228 1,216 3 3,648 0,003
1,229 1,252 1,240 12 14,884 0,001
1,253 1,276 1,265 5 6,323 0,001
1,277 1,301 1,289 9 11,601 0,015
1,302 1,325 1,313 1 1,313 0,004
Sumas 36 44,920 0,044
Fuente: elaboración propia.

La media fue:

MEDIA 44.920 / 36 1,25 en promedio de estatura

Aplicando cualquiera de las fórmulas de la varianza se tiene:


𝛴 𝑥𝑖 −𝑥ҧ 2 ∗𝑓𝑖 0,044
𝑠2 = = = 0,001211 es la variabilidad de la estatura respecto al promedio.
𝑛 34

7.1.2 Desviación estándar o desviación típica (S)


La desviación estándar permite conocer cuán separados están los datos de la media. Una desviación
estándar cercana a 0 indica proximidad de los datos a la media. A mayor lejanía, mayor el resultado de la
desviación estándar. La fórmula para su cálculo es la siguiente:

Para el ejemplo de la estatura de los niños de un curso (tabla previa), la desviación estándar sería:
𝒔= 𝒔𝟐
𝒔 = 0,001211
𝒔 = 0,0348

El resultado es cercano a “0”, significa que no hay mayor variabilidad y los datos se encuentran cerca de la
media.

Estadística
16
Unidad 1: Introducción al análisis estadístico descriptivo univariado

7.1.3 Coeficiente de variación (CV)


El coeficiente de variación permite conocer la dispersión relativa de un conjunto de datos.

Cuando se quiere comparar la dispersión de dos conjuntos de datos, con unidad de medida diferente, surge
una medida de varianza relativa llamada coeficiente de variación, la cual expresa la desviación estándar
como un porcentaje de la media.

Puede revelar si la muestra es homogénea o heterogénea. En la medida que los datos sea más homogénea,
más significativa la información y se pueden tomar mejores decisiones.
𝑆
La fórmula de cálculo es: 𝑐𝑣 = 𝑥ҧ ∗ 100% y se expresa en porcentaje.

El CV, va entre 0 y 100%, mientras más cercano a “0”, más significativa la información para llevar a cabo
análisis. Por ejemplo, se tiene 2 grupos, el grupo 1 presenta un CV=35% y el grupo un CV= 52%, ¿cuál de los
dos grupos presenta información más homogénea, más concentrada, no tan dispersa? La respuesta es el
grupo 1, pues tiene un CV más bajo.

7.1.4 Rango (R)


El rango permite conocer cómo los datos individuales difieren de la media. Se obtiene restando el valor
mínimo del máximo del conjunto.

El rango suele ser utilizado para obtener la dispersión total. Es decir, si tenemos una muestra con dos
observaciones 1,70 cms. y 1,65 cms., el rango será 5 cms.

El rango, se calcula como: 𝑅 = 𝑥𝑀𝐴𝑥 − 𝑥𝑀𝑖𝑁

8. Representaciones gráficas: histogramas y polígonos de frecuencia

Se debe recordar que la estadística descriptiva es una estadística de resumen que utiliza tablas de
frecuencias, medidas estadísticas y, para complementar la información y hacer análisis, presenta gráficos
estadísticos.
PREGUNTA

¿Qué son los gráficos estadísticos?

Un gráfico estadístico es una representación gráfica que resume datos.


Existen distintos gráficos, pero se presentará dos de ellos: histograma de
frecuencias y polígono de frecuencias.

Estadística
17
Unidad 1: Introducción al análisis estadístico descriptivo univariado

8.1 Histograma de frecuencias


Un histograma permite representar una variable usando barras. Las barras son proporcionales a la
frecuencia de los valores representados.

8.2 Polígono de frecuencias


Un polígono de frecuencia es un gráfico que se obtiene uniendo los puntos medios del lado superior de
cada barra del histograma de frecuencias.

Tanto el histograma como el polígono de frecuencias se utilizan para representar distribuciones de


frecuencias de datos agrupados, de ahí su nombre.

Ejemplo de histograma y polígono de frecuencias

Fuente: elaboración propia.

Estadística
18
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Conclusión

La estadística permite
disminuir la incertidumbre a la
hora de decidir.

La estadística es una herramienta fundamental en la economía y las empresas, e incluso en nuestra vida
diaria. Basándose en lo estudiado en este documento, la estadística es una herramienta que recoge datos
sobre un determinado estudio, luego procesa estos datos y los resume a través de distintas técnicas, como
lo es la tabla de frecuencias, las medidas estadísticas y los gráficos. Esto permite que se analicen los
distintos fenómenos y se pueda llegar a conclusiones válidas.

La estadística es una ciencia transversal a todas las áreas del saber, dado que se puede aplicar en la
biología, la física, la sociología, las finanzas y el mercado en general.

Las empresas cada día valoran más el aporte de las técnicas estadísticas, ya que entregan información
valiosa para la toma de decisiones en este ambiente cada vez más cambiante e incierto en el cual se
desenvuelven los mercados y la economía en general.

Estadística
19
Unidad 1: Introducción al análisis estadístico descriptivo univariado

Referencias bibliográficas

Anónimo. (22 de julio de 2020). El universo, la población y la muestra. Datafluency.academy.


https://datafluency.academy/el-universo-la-poblacion-y-la-muestra/

Chiavenato, I. (2006). Introducción a la teoría general de la administración. Mc Graw Hill Interamericana.

Hurtado de Barrera, J. (2010). Metodología de la investigación. Guía para la comprensión Holística de la


ciencia. (4a edición). Ciea-Sypal.

Martínez Bencardino, C. (2012). Estadística básica aplicada. Ecoe Ediciones.

Pérez Tejada, A. (2008). Estadística, ciencias sociales, del comportamiento y de la salud. Cengage Learning
Editores.

Ramos Ramírez, J. C., Del Águila Ríos, V. R., & Bazalar Boulangger, A. C. (2017). Estadística básica para los
negocios. Universidad de Lima.

Rustom Jabbaz, A. (2012). Estadística descriptiva, probabilidad e inferencia. Una visión conceptual y
aplicada.
https://repositorio.uchile.cl/bitstream/handle/2250/120284/Rustom_Antonio_Estadistica_descrip
tiva.pdf

Spiegel, M. R., & Stephens, L. J. (2009). Estadística. Mc Graw Hill.

Estadística
20

También podría gustarte