Estadística Aplicada
Estadística Aplicada
Estadística Aplicada
CUANTITATIVOS APLICADOS
REFLEXIONES
• J Cachanosky
CONCEPTUALIZACIÓN
PRUEBAS DE
LA ESTIMACIÓN
HIPÓTESIS
Nivel de Confianza y de
Significancia
INFERENCIA ESTADÍSTICA
Ejemplo:
Una empresa de automóviles ofrece tres tipos de marcas, Mazda, Chevrolet y Ford, si
tiene nueve automóviles y tiene de 2 de Mazda, 3 de Chevrolet y 4 de Ford, Cuál es la
probabilidad que: se venda un automóvil de marca Mazda?
INFERENCIA ESTADÍSTICA
•Distribución
de probabilidad Discreta
• Distribución Binomial
Ejemplo:
Ejemplo:
Ejemplo:
µ x X
𝑋−µ
𝑍 = 1
σ
Z
0 z
DISTRIBUCIÓN CONTINUA
Ejemplo 1:
Ejemplo 2:
Ejemplo:
Ejemplo:
Ciertas encuestas a televidentes revelan que el 25% de los hombres y 33% de las
mujeres ven televisión en la noche. Cuál es la probabilidad que en 2 muestras
aleatorias de 150 hombres y 100 mujeres respectivamente, sea igual la proporción
entre ellos.
DISTRIBUCIONES MUESTRALES
• Medidas para muestras grandes
Una población
Ejemplo.
Ejemplo:
Una empresa estima en dos sucursales que las ventas mensuales son en
promedio $60 millones y $50 millones respectivamente, con una desviación
estándar de $10 millones y $ 5 millones respectivamente. Si se escoge 80 y 60
facturas de un mes al azar respectivamente, cuál es la probabilidad que la
diferencia entre las ventas medias de ambas muestras sea mayor a $15
millones?.
DISTRIBUCIONES MUESTRALES
• Medidas para muestras pequeñas
Una población
Ejemplo:
2 ( 𝑛 𝑥 − 1 ) 𝑆 2𝑥 +(𝑛 𝑦 −1) 𝑆 2𝑦
𝑆 𝑝=
𝑛 𝑥+ 𝑛 𝑦 − 2
INTERVALOS DE CONFIANZA
Nivel de Confianza
(1-)
/2 /2
INTERVALOS DE CONFIANZA
Una muestra aleatoria de 36 los cigarrillos de una marca determinada dio un contenido
promedio de nicotina de 3.0 miligramos. Suponga que el contenido de nicotina de estos
cigarrillos sigue una distribución normal con una desviación estándar σ = 1.0 miligramo. a)
Obtenga e interprete un intervalo de confianza del 95% para el verdades; contenido promedio
de nicotina en estos cigarrillos. b) El fabricante garantiza que et contenido promedio de nicotina
es de 2.9 miligramos, ¿qué puede decirse de acuerde con el intervalo hallado?
Sea µx= contenido promedio de nicotina.
Una vez que hemos precisado la fórmula a emplear, pasamos a determinar los valore de los
elementos que la componen. En este caso, (según la tabla II), σx = 1, n =36.
Al reemplazar en (8-7) se tiene,
Ejemplo:
Los siguientes son los registros de las mediciones del tiempo (en minutos) que
tardaron 15 operarios para familiarizarse con el manejo de una máquina
moderna recientemente adquirida por la empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4.0, 4.8,
2.9, 5.6, 5.2, 3.7, 3.0, 3.6, 2.8, 4.8. Suponga que los tiempos se distribuyen
normalmente. A) Determine e interprete un intervalo del 95% de confianza para
el verdadero tiempo promedio, b) el instructor considera que el tiempo
promedio requerido por la población de los trabajadores que reciben instrucción
sobre el manejo de esta máquina está por encima de los cinco minutos, ¿qué se
puede decir de acuerdo con el intervalo hallado?
INTERVALOS DE CONFIANZA
Solución :
En esta situación hay que distinguir dos casos: Cuando las varianzas de las
poblaciones involucradas son conocidas y cuando las varianzas de las dos
poblaciones son desconocidas, pero se suponen iguales. Cuando se trata de
poblaciones con varianzas conocidas emplearemos la fórmula,
(8-9)
para determinar un intervalo de confianza para la diferencia µx — µy (en este
orden)
Nota. Usualmente la diferencia de los
parámetros se toma en el orden tal que la
diferencia muestral quede positiva.
INTERVALOS DE CONFIANZA
Ejemplo:
Suponga que se desea medir la diferencia entre dos categorías de empleados en la actividad
de seguros. Una está formada por personas con título superior y la otra por personas que
sólo tienen estudios secundarios. Se toma una muestra de 45 empleados entre los primeros
y la media de ventas resulta ser 32, en tanto que la media de una muestra de 60 empleados
con estudios secundarios solamente, es 25. Suponga también que las ventas de los dos
grupos se distribuyen normalmente con varianzas respectivas de 48 para los titulados y 56
para los que sólo tienen estudios secundarios. a) Calcule e interprete un intervalo del 90% de
confianza para la verdadera diferencia de las medias, b) de acuerdo con el intervalo hallado,
¿hay evidencia de que las ventas medias de los grupos son iguales?
Definamos las variables, X = venta de un titulado, Y = venta de uno con sólo estudios
secundarios. Los parámetros a considerar son:
µx = venta promedio de los titulados, µy = venta promedio de los que tienen sólo estudios
secundarios.
INTERVALOS DE CONFIANZA
Solución:
, así que para que la igualdad entre las medias no pueda descartarse, el cero
tiene que estar incluido en el intervalo. Como en el presente caso esto no
sucede, entonces no hay evidencia de una igualdad entre las dos medías.
Se registraron los siguientes datos, en minutos, que tardan algunos hombres y
mujeres en realizar cierta actividad en una empresa, los cuales fueron
seleccionados aleatoriamente.
INTERVALOS DE CONFIANZA
Suponga que los tiempos para los dos grupos se distribuyen normalmente y que las
varianzas son iguales, aunque desconocidas. a) Calcule e interprete un intervalo de
confianza del 99% para la verdadera diferencia de medias. b) De acuerdo con el intervalo
hallado. ¿Hay evidencia de que los dos tiempos promedios son iguales? Como puede
observarse en este caso, no hay conocimiento de las varianzas poblacionales. Cuando
esto ocurre, el intervalo para, se calcula mediante la fórmula,
(8-10)
INTERVALOS DE CONFIANZA
Es la varianza ponderada.
Como se indicó para el caso anterior, la diferencia de los parámetros se toma de tal
forma que la diferencia muestral sea positiva.
INTERVALOS DE CONFIANZA
(8-11)
INTERVALOS DE CONFIANZA
Como la fórmula (8-11) es una consecuencia del teorema del límite central, se recomienda para su aplicación tomar
muestras de tamaño grande.
Una fábrica desea saber la proporción de amas de casa que preferirían una aspiradora "Central", dados la calidad y el
precio. Se toma al azar una muestra de 100 amas de casa; 20 dicen que les gustaría la máquina. Calcule e interprete un
intervalo del 95% de confianza para la verdadera proporción de amas de casa que preferirían la citada aspiradora.
Los datos para la aplicación de la fórmula (8-11) son
Al reemplazar se tiene:
•La verdadera proporción de amas de casa que preferirían la aspiradora está entre 12.2% y 27.8%
INTERVALOS DE CONFIANZA
(8-13)
INTERVALOS DE CONFIANZA
En donde
valor de la variable con distribución ji cuadrado con (n – 1) grados de libertad que determina un área inferior
de medida
-Valor de la variable con distribución ji cuadrado con (n - 1) grados de libertad que determina un área superior
de medida
Un fabricante de baterías para automóvil asegura que las baterías que produce duran en promedio 2 años, con una desviación
estándar de 0,5 años. Si 5 de estas baterías tienen duración 1.5, 2.5, 2.9, 3.2, 4.0 años, determine un intervalo de confianza del
95% para σ2 e indique si es válida la afirmación del fabricante.
Como se trata de un intervalo de confianza para la varianza aplicamos la fórmula (8-13)
INTERVALOS DE CONFIANZA
es,
para
(8-14)
Donde
.
Determine un intervalo del 90% de confianza al tomar las variables definidas en el segundo ejercicio
para el coeficiente de la sección 8.5.3.
En ese ejercicio se tuvieron valores de varianzas
muéstrales
Al reemplazar en (8-14)
Es el intervalo pedido.
PRUEBAS DE HIPÓTESIS
¿Qué es una hipótesis?
Una creencia sobre la población,
principalmente sus parámetros: Creo que el porcentaje
de devoluciones será
Media
inferior al 5%
Varianza
Proporción/Tasa
p , ,
H0 5%
p , ,
: 5%
Contrastes: unilateral y
bilateral
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
H1: P < H1: P >
0.05 0.05
Significancia de la prueba:
Valor P
El contraste es estadísticamente significativo cuando:
Valor P <
Es decir, si el resultado experimental discrepa más de “lo
tolerado” a priori.
Valor P
Frontera Estadístico
de Rechazo de
Significancia de la prueba: Valor P
El contraste es No significativo cuando: Valor P >
Por lo tanto no hay evidencia significativa para rechazar la
Hipótesis Nula
No se rechaza
H0: P = 0.05
P
Estadístico Frontera
de de Rechazo
Resumen: , Valor P y
criterio de rechazo
Sobre Sobre
Valor P
Es número pequeño, Es conocido
preelegido al diseñar el tras realizar el
experimento experimento
Probabilidad β
Diferencia de dos
Proporciones Poblacionales con n 30
Una Población
VARIABILIDA
D Comparación de dos Poblaciones
APLICACIONES PRUEBA DE
HIPÓTESIS
COMPARACIÓ
ANOVA – PRUEBA F
N VARIAS
POBLACIONES
PRUEBAS DE
HIPOTESIS
CHI CUADRADO
PRUEBA DE
VARIABLES CUALITATIVAS
INDEPENDENCIA