Sesión 3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 28

UNIVERSIDAD NACIONAL DEL CENTRO DE PERÚ

ESCUELA DE POSGRADO
UNIDAD DE POSGRADO DE LA FACULTAD
DE EDUCACIÓN

ASIGNATURA:
ANÁLISIS DE DATOS CUANTITATIVOS Y CUALITATIVOS

Mg. JAIME WALTER MENDOZA AYRE


I UNIDAD: TÉCNICAS DESCRIPTIVAS

CAPACIDADES:
• Calcula e interpreta los estadígrafos de posición,
centralización, dispersión, deformación y apuntamiento.
• Calcula la confiabilidad, nivel de dificultad, sensibilidad y
poder discriminativo de los instrumentos de recolección
de datos.
Estadística descriptiva
■ Está formada por procedimientos empleados para resumir y describir las características
importantes de un conjunto de mediciones.
■ Hace uso de tablas, gráficas (barras, pasteles, líneas, histogramas, etc.) o mediciones
numéricas (media aritmética, desviación estándar, etc.)
Estadística inferencial
■ Está formada por procedimientos empleados para hacer inferencias
(Generalizaciones) acerca de características poblacionales, a partir de
información contenida en una muestra extraída de una población.
■ Su objetivo es sacar conclusiones, hacer predicciones y tomar
decisiones .
Medidas de tendencia central o de centralización
■ Las medidas que describen el comportamiento de un conjunto de
datos pueden ser: de tendencia central o centralización, las de
colocación (o de posición relativa), las de dispersión o de variabilidad
y las de forma.
■ Comenzaremos en esta unidad con las medidas de tendencia
central, entendiéndose como el estudio del comportamiento de los
datos cuya frecuencia es mayor que otros y, generalmente la mayor
densidad de frecuencia está en la parte central de las gráficas:
■ El objetivo principal es poder representar por medio de un solo
número al conjunto de datos, es decir, dar valores representativos de
la distribución de frecuencias, situados en algún lugar intermedio,
alrededor del cual, se encuentran los otros valores. Estas medidas
nos indican dónde tienden a concentrarse los valores
Media Aritmética
Si se tiene un conjunto de “n” mediciones 𝑋𝑋1, 𝑋𝑋2, 𝑋𝑋3, . . , 𝑋𝑋𝑛𝑛,
existen varias formas de describir su promedio o su punto
medio.
Media aritmética para datos NO agrupados:

Media aritmética para datos agrupados:


Media Aritmética - Ejemplo
Media Aritmética - Ejemplos Media aritmética para datos NO agrupados: La
profesora de la materia de estadística desea conocer el promedio de las notas
finales de los 5 alumnos de clase, ¿Cuál es el promedio?

Media aritmética para datos agrupados: La siguiente tabla de frecuencia muestra


el número de preguntas de 81 encuestados sobre un test que consta de solo 6
preguntas:

El promedio de los encuestados contestó aproximadamente 3 preguntas


buenas
Media Aritmética - Ejemplos

■ Media aritmética para datos agrupados caso con intervalos: Calcular


el promedio de los pesos de un grupo de 50 personas que se
distribuyen de la siguiente manera:

El promedio de los pesos de las 50 personas encuestadas es de 69,4 kg.


Mediana
■ Mediana para datos NO agrupados: Si el número de datos es impar, la
mediana es el dato que se encuentra en la mitad de la lista ordenando los
datos en forma creciente. La siguiente formula determina la mediana:

■ Si el número de datos es par, la mediana es la semisuma de los datos


centrales, con previa ordenación de los datos.
Mediana para datos NO agrupados - Ejemplos
Mediana para datos NO agrupados caso número de datos IMPAR:
Sea el conjunto de datos 13, 21, 17, 12, 14, 15, 19 (7 datos)
Ordenando los datos obtenemos: 12, 13, 14, 15, 21, 17, 19.

Mediana para datos NO agrupados caso número de datos PAR: Sea el conjunto
de datos 8, 10, 12, 16, 21, 24, 27, 32 (8 datos)

El 50% de los datos, es decir, 8, 10,12,16 están por debajo


de la mediana. Y el otro 50% están por encima 21,24,27 y
32
Mediana para datos agrupados:
■ Para poder calcular la mediana dentro de la tabla de frecuencias, hay
que seguir los siguientes pasos:
■ 1. Calcular la frecuencia absoluta acumulada.
■ 2. Hallar la mitad total de los datos N/2
■ 3. Se busca la mitad total de los datos en la frecuencia absoluta
acumulada, y si no se encuentra se toma el valor inmediatamente
superior donde se ubica el intervalo de clase correspondiente.
■ 4. Luego, se empleará la siguiente formula:
Li= Límite inferior de la clase donde se
encuentra la mediana.
Fi-1= Frecuencia absoluta acumulada anterior a
la clase mediana.
fi= Frecuencia absoluta del intervalo mediano.
ti= Valor absoluto de las diferencias entre dos
marcas de clase consecutivas
Mediana para datos agrupados – Ejemplos

Ahora reemplacemos en la formula


Moda
■ La moda es el valor de la variable con mayor frecuencia absoluta.
Se simboliza 𝑀𝑀𝑜𝑜. Cuando los datos están agrupados en
intervalos, se habla de intervalo modal.
■ Importante tener presente que puede haber más de una moda.
Si hay dos datos que representan la misma frecuencia absoluta
más alta, se dice que la distribución es bimodal
■ Si la frecuencia absoluta mayor se repite varias veces, entonces
la distribución es multimodal.
Moda para datos agrupados

Li= Límite inferior de la clase modal


fi= Frecuencia absoluta del intervalo modal
fi-1= Frecuencia absoluta no acumulada de la clase anterior a la clase modal.
fi+1= Frecuencia absoluta no acumulada de la clase siguiente a la clase modal.
ti= Valor absoluto de las diferencias entre dos marcas de clase consecutivas.
Moda para datos agrupados - Ejemplo
Moda para datos agrupados - Ejemplo
Interpretación de la media, mediana y moda
■ La distribución de frecuencias dada describe la velocidad de los conductores
multados por la policía de una ciudad, donde el límite de velocidad es de 55
km/h. Halle e interprete la media aritmética, la mediana y la moda.
Media: 𝑥𝑥̅ =73,33 km/h
Interpretación: el promedio de la velocidad de los conductores multados por la
policía de una ciudad es aproximadamente 73,33 km/h,

Mediana: Me=73,18 km/h


Interpretación: ▪ El 50% de los conductores multados por la policía de una ciudad
han manejado a una velocidad menor o igual a 73,18 km/h. ▪ El 50% de los
conductores multados por la policía de una ciudad han manejado a una velocidad
mayor o igual a 73,18 km/h.

Moda: Mo=72,78 km/h Interpretación: La velocidad más frecuente de los


conductores multados por la policía de una ciudad es de 72,78 km/h, donde la
velocidad límite es de 55 km/h.
Medidas de posición
Las medidas de posición dividen a los datos en partes
porcentualmente iguales. Las medidas de posición son : Cuartiles,
Deciles y Percentiles. Los cuartiles son las medidas que dividen un
conjunto de datos en cuatro partes iguales. Cada una representa el
25% del total

■ Los cuartiles son tres valores y se simbolizan 𝑞𝑞1, 𝑞𝑞2 , 𝑞𝑞3


■ El primer cuartil 𝑞𝑞1 representa el 25%.
■ El segundo cuartil 𝑞𝑞2 representa el 50% o la mediana.
■ El tercer cuartil 𝑞𝑞3 representa el 75%.
¿Cómo se calculan los cuartiles?
■ Se ordenan los datos de menor a mayor.
■ 1. Se halla la mediana, es decir 𝑞𝑞2
■ 2. Luego, se considera la primera mitad de los datos y se calcula la mediana.
Esto dará el primer cuartil 𝑞𝑞1
■ 3. Igualmente, se considera la segunda mitad de los datos y se calcula la
mediana. Esto corresponde al tercer cuartil 𝑞𝑞3
■ Si el número de datos menores a la mediana es par, para calcular 𝑞𝑞1 la
mediana se incluye. De la misma forma se procede para 𝑞𝑞3
Cuartiles - Ejemplo
■ En un almacén de ropa informal se reporta la cantidad de dinero
recaudada al finalizar el día. El reporte de ventas, en miles de
unidades monetarias, de la última quincena se relaciona a
continuación.

Calcular el valor de los cuartiles y obtener algunas conclusiones de los resultados.


Cuartiles - Ejemplo
■ Al escribir lo datos de forma ordenada se tiene:
309 – 350 – 450 – 450 – 467 – 540 – 548 – 602 – 657 – 678 – 704 – 758 – 780 – 789 – 1325
Como hay 15 datos, el valor de la mediana corresponde al dato ubicado en la posición 8. Luego, 𝑋𝑋 ̂
=602= 𝑞𝑞2
■ Para calcular 𝑞𝑞1 se consideran los datos que están antes de la mediana y se repite el proceso.
■ 309 – 350 – 450 – 450 - 467 – 540 – 548
■ Entonces 𝑞𝑞1 =450
■ De la misma forma, al considerar los datos mayores a la mediana, se tiene
■ 657 – 678 – 704 – 758 – 780 – 789 – 1325
■ Entonces 𝑞𝑞3 =758
■ Se puede concluir que el 25% de los días las ventas fueron de 450 mil o menos. El 25% de los días
las ventas estuvieron entre 450 mil y 602 mil pesos. El 50% de los días las ventas estuvieron entre
450 mil y 758 mil pesos. El 75% de los días las ventas fueron superiores a 450 mil pesos
Deciles
Los deciles son valores que dividen el conjunto de datos en 10 partes
iguales.
Cada parte representa al 10% del total.
Los deciles son nueve datos y se simbolizan 𝑑𝑑1, 𝑑𝑑2, … , 𝑑𝑑9
El valor del quinto decil corresponde a la mediana.
El proceso para calcular los deciles es semejante al que se utilizó
para calcular los cuartiles.
Primero, la mediana, luego los cuartiles y la mediana de la primera
parte de los datos y así sucesivamente hasta obtener los nueve
deciles.
Percentiles
■ Son valores que dividen el conjunto de datos en 100 partes
iguales. Cada parte representa el 1% de los datos.
■ Los percentiles son 99 y el percentil 50 corresponde al valor de
la mediana.
■ Estas dos medidas de posición se utilizan en contextos donde
la cantidad de datos que se va a caracterizar es grande y en
contexto relacionados con distribuciones de probabilidad.
Medidas de dispersión:
Las medidas de dispersión miden el grado de variabilidad de los
datos independientemente de su causa. Al analizar un conjunto de
datos es necesario establecer algunas medidas que determinan esa
dispersión de los datos entre sí.
Las medidas de dispersión tratan de describir cuan agrupados o
alejados están los datos observados de su promedio. Entre mas
dispersos estén las observaciones individuales, mayor es la medida
de dispersión, y menos adecuado será el promedio como medida
descriptiva. Por eso es importante que después de elegir y calcular
un promedio se determina el grado de variación de los datos.
Medidas de dispersión:
 Varianza: la varianza es la más generalizada y la mejor medida de dispersión.
 Rango de variación: es una medición que se define como la diferencia que
existe entre valor mayor de una variable y el valor menor de la misma.
 Desviación estándar: también llamada desviación típica, es la medida la cual
nos ofrece información sobre la dispersión de la media de las variables, está por
lo general es mayor o igual a cero.
 Coeficiente de variación: se describe como la medida relativa de la dispersión
de los datos, pues la podemos definir como una desviación estándar que se
realiza de una muestra, por ejemplo; un porcentaje de la media central.
Actividad 1
Genere una base de datos en el SPSS sobre los datos generales y del estado
nutricional de una muestra de niños/as de una comunidad del Perú

De la preg. 1 y preg 7, genere sus estadísticos descriptivos

De las demás preguntas construya su tabla de frecuencia y un gráfico


representativo.

También podría gustarte