Estimación y Pruebas de Hipótesis

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 25

Estimación y Pruebas de

Hipótesis
MSc. Washington Rodríguez
Estimación
Estimación

 La estimación es parte de nuestra vida diaria, todos los días


hacemos estimaciones.
 La inferencia estadística es la rama de la estadística que usa el
concepto de probabilidad para manejar la incertidumbre en la
toma de decisiones.
 La inferencia estadística está basada en la estimación y prueba de
hipótesis, misma que hará inferencias acerca de los parámetros
poblacionales a partir de la información proporcionada en una
muestra.
 Existen dos tipos de estimaciones: la estimación puntual y la
estimación por intervalo.
Estadístico, estimador y estimaciones

 Estadístico.- Es una medida cuantitativa, derivada de las observaciones de


la muestra.
 Estimador.- Es cualquier estadístico de la muestra que se utilice para
estimar un parámetro poblacional.
 Estimación.- Es un valor específico observado de un estadístico.
Criterios para elegir un buen estimador
 Insesgado.- La media de la población es igual a la media de la muestra
tomada de la misma población.
 Eficiencia.- Se refiere al tamaño de error estándar del estadístico. Ejemplo.-
La media de la muestra (𝑥)ҧ es un estimador más eficiente que la mediana.
Estadístico, estimador y estimaciones

 Consistencia.- Si se aumenta el tamaño de la muestra, se tiene casi


la certeza de que el valor del estadístico se aproxima al valor del
parámetro poblacional.
 Suficiencia.- Si un estimador utiliza tanta información de la muestra
que ningún otro estimador puede extraer información adicional
acerca del parámetro de la población que se está estimando.
Estimaciones puntuales
 Estimador de la media poblacional 𝜇 .- El estimador de la media
poblacional 𝜇 es la media de la muestra 𝑥,ҧ cuyo valor se obtiene
mediante la siguiente expression:
𝑛
1
𝑥ҧ = ෍ 𝑋𝑖
𝑛
𝑖=1

Ejemplo: Considere los datos de la tabla mostrados en la figura. Los datos


representan el número de jeringas por caja inspeccionadas en 35 cajas de
cartón. Estime el número promedio de jeringas por caja.

Figura 1: Datos del número de jeringas por caja.


Estimaciones puntuales de la varianza
y desviación estándar de la población
 El estimador puntual de la varianza poblacional es la varianza de la
muestra, 𝑆 2
𝑛 2
𝑋𝑖 − ത
𝑋
𝑆2 = ෍
𝑛−1
𝑖=1

El estimador 𝑆 2 cumple con todas las propiedades que debe tener un


estimador.
Ejemplo: Considere los datos de la tabla mostrados en la figura 1, encuentre
el estimador de la varianza y desviación estándar poblacionales.
Estimación puntual de una proporción
poblacional
 Sea 𝑝 la proporción poblacional que tiene una característica de interés.
 Sea 𝑝Ƹ la proporción de unidades que tienen la característica de interés en
la muestra.
 𝑝Ƹ es un estimador que cumple con todas las propiedades de los
estimadores.
 𝑝Ƹ es un estimador de la proporción poblacional.
 Ejemplo. Continuado con los datos de la figura 1, si se considera que una
caja está dentro de especificaciones cuando el número de jeringas está
en el intervalo 𝜇 ± 1𝜎 , encuentre la proporción de cajas que están fuera
de especificaciones.
Estimaciones
de intervalo
 La estimación de intervalo
describe un conjunto o
rango de valores dentro del
cual es posible que esté un
parámetro de la población
y el nivel de confianza que
el intervalo contiene del
parámetro.
 El intervalo de confianza
(IC) tiene un límite inferior
de confianza (LIC) y un
límite superior de confianza
(LSC).
Intervalo de confianza para la media
poblacional muestras grandes
 Se considera muestra grande un valor de n superior o igual a 30.
𝐿𝐼𝐶 = 𝑋ത − 2𝜎𝑋ത y LSC = 𝑋ത + 2𝜎𝑋ത
 Por tanto el intervalo de confianza se expresa como:
𝐼𝐶 = 𝑋ത ± 2𝜎𝑋ത
𝜎
Donde,𝜎𝑋ത = y 𝜎 es la desviación estándar de la población.
𝑛

Si 𝜎 es desconocida se debe usar el estimador S


 Ejemplo.- Para los datos de la figura 1, encuentre un intervalo del
95% de confianza para el número de jeringas promedio por caja.
Intervalo de confianza para la proporción
poblacional muestras grandes

 Se considera muestra grande un valor de n superior o igual a 30.


𝐿𝐼𝐶 = 𝑝Ƹ − 2𝜎𝑝ො y LSC = 𝑝Ƹ + 2𝜎𝑝ො
 Por tanto el intervalo de confianza se expresa como:
𝐼𝐶 = 𝑝Ƹ ± 2𝜎𝑝ො
ො 1−𝑝ො
𝑝×
Donde,𝜎𝑝ො = y 𝑝Ƹ es la proporción de la muestra.
𝑛

 Ejemplo.- Para los datos de la figura 1, encuentre un intervalo del


95% de confianza para la proporción de cajas que están fuera de
especificaciones.
Planteamiento y prueba
de hipótesis
Formulación de hipótesis

 Las variables adquieren valor para la investigación científica cuando llegan a


relacionarse con otras variables, es decir, si forman parte de la hipótesis o de
una teoría. Cuando eso ocurre se denominan constructos o construcciones
hipotéticas.
 Las hipótesis surgen del planteamiento del problema; incluso si este fuera
modificado fruto de la revisión de la literatura.
 Pueden surgir hipótesis útiles y fructíferas en planteamientos del problema
revisados cuidadosamente, aunque el cuerpo teórico que lo sustente no sea
abundante.
 La hipótesis debe referirse a una situación real (“a la realidad”).
 Las variables de las hipótesis deben ser comprensibles, concretos y lo más
concretos posible.
 Los términos y variables de la hipótesis deben ser observables y medibles, así
como la relación planteada entre ellos.
Tipos de hipótesis

 Se pueden plantear las siguientes hipótesis:


 Hipótesis de investigación.- Son las proposiciones tentativas sobre la(s)
posible(s) relaciones entre dos o más variables. Pueden ser: Descriptivas,
Correlacionales, De diferencia entre grupos o Causales.
 Hipótesis nulas (Ho).- Proposiciones que niegan o refutan la relación entre
variables.
 Hipótesis alternativas (Ha).- Son posibilidades alternas o diferentes ante las
hipótesis de investigación y nula.
 Hipótesis estadísticas.- Son exclusivas del enfoque cuantitativo y
representan la transformación de las hipótesis de investigación, nula y
alternativa en símbolos estadísticos.
Ejemplo

 Parkhill Associates, tiene que construir un techo. Las especificaciones de


construcción indican un techo móvil de aproximadamente 10.000 láminas
de aluminio con un grosor de 0,04 in. Las láminas de aluminio no pueden
ser considerablemente más gruesas que 0,04 in porque la estructura no
podría soportar el peso adicional. Y tampoco pueden ser más delgadas
porque la fuerza estructural del techo sería inadecuada.
 Debido a estas restricciones en el grosor, Parkhill revisa cuidadosamente las
láminas de aluminio de su proveedor. Es claro que Parkhill no desea medir
cada lámina, así que toma una muestra aleatoria de 100 láminas. Las
láminas de la muestra tienen un grosor medio de 0.0408 in.
 Por experiencia con este proveedor, Parkhill cree que esas láminas
provienen de una población que tiene una desviación estándar de 0.004
in de grosor. Con base en estos datos, Parkhill debe decidir si las 10,000
láminas cumplen con las especificaciones.
Prueba de hipótesis de una sola
muestra
 La prueba de hipótesis inicia con una suposición, llamada hipótesis, que se
hace acerca de un parámetro poblacional.
 Se recolectan los datos de la muestra y se calculan los estadísticos de la
muestra.
 Se usan esos estadísticos para decidir qué tan probable es que el
parámetro poblacional hipotético sea el correcto.
 La prueba de hipótesis tiene dos elementos:
 La hipótesis nula: Ho: 𝜇 = 0.04 pulgadas.
 La hipótesis alternativa Ha: 𝜇 ≠ 0.04 pulgadas.
Nivel de significancia de la prueba

 El propósito de una prueba estadística no es cuestionar el valor del


estadístico calculado de la muestra, sino hacer un juicio sobre la diferencia
entre el estadístico y el parámetro hipotético poblacional.
 Asumiendo que la hipótesis nula es correcta, el nivel de significancia es la
probabilidad de que la media muestral esté fuera de los límites.
Generalmente en pruebas de hipótesis se usa un nivel de significancia del
5%.
Error de tipo I y tipo II

 Error tipo I.- Se comete este error cuando se rechaza la hipótesis


nula siendo ésta verdadera. La probabilidad de cometer el error
tipo I se denomina alfa (𝛼).
 Error tipo II.- Se comente este error cuando se acepta la hipótesis
nula siendo ésta falsa. La probabilidad de cometer el error tipo II se
denota como beta (𝛽).
 Generalmente en pruebas de hipótesis estadísticas se fija el error
tipo I y es el que se conoce como nivel de significancia de la
prueba (𝛼).
Región de aceptación y de rechazo
Más sobre el error de tipo I y tipo II

 Suponga que cometer el error tipo I (rechazar una hipótesis nula cuando
es cierta) implica el tiempo y los problemas de volver a muestrear un lote
de pollos reportados con posible contaminación.
 Al mismo tiempo, cometer un error tipo II (aceptar una hipótesis nula
cuando es falsa) significa arriesgarse a que todo un grupo de
consumidores de este lote de producción se enfermen.
Prueba de hipótesis para la media de
una sola muestra
 La hipótesis nula: Ho: 𝜇 = 0.04 pulgadas.
 La hipótesis alternativa Ha: 𝜇 ≠ 0.04 pulgadas.
 Estadístico de la prueba
𝑋ത − 𝜇0
𝑍=
𝜎/ 𝑛
Región de rechazo:
𝑋ത − 𝜇0
𝑍= < −𝑍𝛼/2
𝜎/ 𝑛
𝑋ത − 𝜇0
𝑍= > 𝑍𝛼/2
𝜎/ 𝑛
Región de aceptación y rechazo
Parkhill Associates…continuación

 Si la media de la muestra fue de 0.0408 pulgadas y la desviación estándar


0.004 pulgadas, ¿hay evidencia para concluir que la media de la muestra
difiere de 0.04?
 Calculamos el estadístico de la prueba Z
0.0408 − 0.04
𝑍= =2
0.004/ 100
 Calculamos los límites par𝑍a la región de rechazo, considerando un nivel
𝛼 = 0.05:
𝑃 −𝑍𝛼/2 ≤ 𝑍 ≤ 𝑍𝛼/2 = 95%
𝑍𝛼/2 = 1.96
Comprobamos que 𝑍 > 1.96, por tanto se rechaza la hipótesis nula, es decir,
no hay evidencia para concluir que la media de las láminas es de 0.04 in.
Ejercicio

 Diámetro de naranjas: Un exportador de naranjas debe enviar


contenedores con naranjas según las especificaciones del cliente. El
cliente ha solicitado que el diámetro promedio de las naranjas debe ser
de 70 mm con una desviación de 5 mm. El responsable de control de
calidad ha examinado 30 naranjas de un contendor y mide los diámetros
de las naranjas una a una. Los datos son los siguientes:
80 68 76 73 67 81
70 75 71 73 84 77
70 83 85 74 81 73
79 71 82 65 72 67
65 76 68 78 65 74

 De los datos históricos se sabe que el diámetro de las naranjas tienen una
desviación estándar de 2 mm. ¿Presentan los datos evidencia suficiente
para concluir que el promedio del diámetro de las naranjas es de 70 mm?

También podría gustarte