3) Estadística Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 35

Tema 3.

Estadística
Descriptiva
Ing. José Eduardo Fernández C.
Quién tiene la información tiene el
poder.

Es importante para la toma de


LA decisiones.

ESTADÍSTICA
Consiste en proporcionar una
DESCRIPTIVA información buena, suficiente y
mediante un procesamiento correcto.

Buscamos obtener, recopilar, procesar,


resumir y presentar datos referentes a un
estudio de interés.
TÉRMINOS
ESTADÍSTICOS
BÁSICOS

• UNIVERSO. Conjunto de
individuos objeto de nuestro
interés o estudio.
• POBLACIÓN. Conjunto de datos
de una característica medida en
cada individuo del universo.
• MUESTRA. Subconjunto de la
población.
• PARÁMETRO. Cualquier valor
característico de la población.
ANÁLISIS DE ESTADÍSTICOS

Medidas de Medidas de Medidas de Medidas de


tendencia central posición dispersión forma
Media Aritmética. Es la medida de tendencia
central más utilizada por lo general se ubica
hacia el centro de distribución estadística. Es la
suma de todas las puntuaciones de una
distribución dividida por el número total de
casos.

Medidas
de Moda. Es el valor que más se repite en un

Tendencia conjunto de datos.

Central
Mediana. Es el valor que divide al conjunto
ordenado de datos, en dos subconjuntos con la
misma cantidad de elementos.
Medidas de
tendencia central
Medidas de Tendencia Central: Media
aritmética

Para Datos sin Agrupar


La media de una población es el parámetro 𝜇 (que se lee “miu”). Si hay N observaciones en el conjunto de
datos de la población, la media se calcula así:

La media de una muestra es un estadístico 𝑥̅ (que se lee “x barra”). Con n observaciones en el conjunto de
datos de la muestra (𝑥1,𝑥2,…), la media se determina así:
Medidas de Tendencia Central: Media
aritmética

Para Datos Agrupados en Tablas de Frecuencias.- Cuando una serie se la agrupa en serie simple con
frecuencias para obtener la media aritmética, se multiplica la variable por la frecuencia respectiva (f), luego se
obtiene la suma de todos estos productos y luego a este valor se lo divide para el número de elementos (n). Todo
esto puede representarse mediante una fórmula matemática, así:

Donde 𝑛=Σ𝑓 es la frecuencia total (o sea, el número total de casos)


Medidas de Tendencia Central: Media
aritmética

Para Datos Agrupados en Intervalos.- Cuando una serie se la agrupa en intervalos para obtener la media
aritmética, se multiplica la marca de clase de intervalo (𝑥𝑚) por la frecuencia respectiva (𝑓), luego se
obtiene la suma de todos estos productos y luego a este valor se lo divide para el número de elementos.
Todo esto se representa mediante la siguiente fórmula matemática:

xm= (Lim. Inf. x Lim. Sup.)/2


Medidas de Tendencia Central: Mediana

• Para datos sin agrupar


Para conjuntos de datos impares Para conjuntos de datos pares
Medidas de Tendencia Central: Mediana

• Para datos en tablas de frecuencia

Si el resultado es entero, se ubica la posición y valor, si es fraccionario se determina los


dos valores centrales y se los promedia.
Medidas de Tendencia Central: Mediana

Para Datos Agrupados en Intervalos

En donde:
𝐿𝑖𝑚𝑑= Límite inferior del intervalo de clase de la mediana
𝑛= Número total de datos
𝐹𝑎=Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase de la mediana.
𝑓𝑚𝑑= Frecuencia absoluta del intervalo de clase de la mediana
𝑐= Ancho del intervalo

Se calcula la posición del intervalo de la clase de la mediana: 𝑛/2 luego se busca que contenga en la fa
Medidas de Tendencia Central: Moda

• Para datos sin agrupar


Medidas de Tendencia Central: Moda

• Para datos en tablas de frecuencia

El valor se calcula observando las frecuencias abasolutas. La


frecuencia absoluta más alta se constituye en la moda.
Medidas de Tendencia Central: Moda

Para Datos Agrupados en Intervalos

En donde:
Li: límite inferior del intervalo en el cual se encuentra la moda.
fi-1: frecuencia absoluta del intervalo anterior en el que se encuentra la moda.
fi: frecuencia absoluta del intervalo en el que se encuentra la moda.
fi+1: frecuencia absoluta del intervalo siguiente en el que se encuentra la moda.
Ai: amplitud del intervalo en el que se encuentra la moda.

Encontrar el intervalo en el cual se encuentra la moda, que es el intervalo con mayor frecuencia absoluta.
Medidas de
posición
Percentiles

Un percentil aporta En los conjuntos de


información acerca de la datos que no tienen
dispersión de los datos muchos valores
en el intervalo que va del repetidos, el percentil p
menor al mayor valor de divide a los datos en dos
los datos. partes.
• Es una medida de posición no central que nos
dice cómo está posicionado un valor respecto al
total de una muestra.
• Si tenemos una muestra con muchos valores y
la dividimos en 100 partes, cada una de ellas
es un percentil. Y cada valor de la muestra estará
en alguna de esas cajitas percentiles.
Percentiles • El percentil está referenciado de 0 a 100.
• El Percentil 0 es el menor valor de la muestra y el
Percentil 100 el mayor valor.
• Técnicamente Pi es el percentil i-ésimo, donde la i
toma valores del 1 al 100. El i% de los valores de
muestra son menores que ese Pi y el (100-i)%
restante son mayores.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

4, 5, 5, 6, 6, 6, 7, 7, 7, 8 n=10
Encontrar el Percentil 60

i = (p/100) x n
i = (60/100) x 10 = 6
i = 6 ------ P60 = 6

X1 X2 X3 X4 X5 X6 X7
700, 750, 750, 750, 800, 850, 900 n=7
Encontrar el Percentil 70

i=(p/100) x n

i = (70/100) x 7 = 4,9 = 5
i = 5 esto promediar con el valor de i+1 ---- i = 6

P70 = (800+850)/2 = 825 ------ P70=825


Cuartiles
Deciles

Decil 1 Decil 5 Decil 10


(Percentil 10) (Percentil 50) (Percentil 100)
Medidas de
dispersión
Suponga que usted es el encargado de compras de una
empresa grande y que con regularidad envía órdenes de
compra a dos proveedores.
• La medida de variabilidad más sencilla es el
rango.
• Aunque el rango es la medida de variabilidad

Rango más fácil de calcular, rara vez se usa como


única medida.
• La razón es que el rango se basa sólo en dos
observaciones y, por tanto, los valores
extremos tienen una gran influencia sobre él.
Rango

A Mayor Rango ► Mayor Dispersión


Rango Intercuartílico

• Una medida que no es afectada por los valores extremos es


el rango intercuartílico (IQR). Esta medida de variabilidad
es la diferencia entre el tercer cuartil Q3 y el primer cuartil
Q1. En otras palabras, el rango intercuartílico es el rango en
que se encuentra el 50% central de los datos.
Varianza

• La varianza es una medida de variabilidad que utiliza todos los datos, está
basada en la diferencia entre el valor de cada observación (xi) y la media.
• A la diferencia entre cada valor xi y la media (cuando se trata de una
muestra, μ cuando se trata de una población) se le llama desviación
respecto de la media.
• Si se trata de una muestra, una desviación respecto de la media se escribe
. , y si se trata de una población se escribe .
• Para calcular la varianza, estas desviaciones respecto de la media se elevan
al cuadrado.
Varianza
Varianza

• Las unidades al cuadrado de la varianza dificultan la


comprensión e interpretación intuitiva de los valores numéricos
de la varianza.
• Aquí lo recomendable es entender la varianza como una medida
útil para comparar la variabilidad de dos o más variables.
• Al comparar variables, la que tiene la varianza mayor, muestra
más variabilidad.
• Otra interpretación del valor de la varianza suele ser innecesaria.
Desviación Estándar

• La desviación estándar se define como la raíz cuadrada positiva


de la varianza.
• Continuando con la notación adoptada para la varianza muestral
y para la varianza poblacional, se emplea s para denotar la
desviación estándar muestral y σ para denotar la desviación
estándar poblacional.
• La desviación estándar se obtiene de la varianza como sigue en
las fórmulas siguientes.
Desviación Estándar
¿Qué se gana con convertir la varianza en la
correspondiente desviación estándar?
La desviación estándar se mide en las mismas unidades que
los datos originales. Por esta razón es más fácil comparar la
desviación estándar con la media y con otros estadísticos que
se miden en las mismas unidades que los datos originales.
Coeficiente de variación

• En algunas ocasiones se requiere un estadístico descriptivo


que indique cuán grande es la desviación estándar en
relación con la media.
• Esta medida es el coeficiente de variación y se representa
como porcentaje.

También podría gustarte