EI1 - 3I1 - T2Portafolio Estadística Inferencial
EI1 - 3I1 - T2Portafolio Estadística Inferencial
EI1 - 3I1 - T2Portafolio Estadística Inferencial
ESTADÍSTICA INFERENCIAL I
UNIDAD 2: ESTIMACIONES
PORTAFOLIO DE EVIDENCIAS
GRUPO: 3I1.
2. ESTIMADORES .................................................................................................. 3
Conclusión............................................................................................................. 39
Referencias ........................................................................................................... 40
2. ESTIMADORES
En fin esperemos sea de su agrado nuestro trabajo y cumpla con sus expectativas
la verdad para nosotros fue muy interesante este tema.
2.2 Características de un estimador
Sesgo.
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho
un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100)
y hallan que la Media de las Medias muéstrales es igual a 5.09, (la media poblacional
y la media de las medias muéstrales coinciden). En cambio, la Mediana de la
población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay
diferencia ya que la Mediana es un estimador sesgado.
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho
tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:
Vemos que el muestreo en que n=100 la Media de las Medias muéstrales toma el
mismo valor que la Media de la población.
Eficiencia.
Ejemplo
Robustez
Suficiencia
Ejemplo.-
Para obtener una estimación puntual se usa un estadístico que recibe el nombre de
estimador o función de decisión. Algunos ejemplos de estadísticos son:
Los valores más habituales del nivel de confianza 1 − 𝛼 son 0.9, 0.95 O 0.99 (la
confianza es del 90%,95% o 99%. En ocasiones también se emplea la
terminología nivel de significación para el valor 𝛼
En la estimación por intervalos de confianza partimos de una muestra 𝑥1 , … , 𝑥𝑛. A
partir de estos valores obtenemos un intervalo numérico. Por ejemplo, podríamos
hablar de que, con una confianza del 99 por ciento, la proporción de voto al partido
político “Unidas Ciudadanas” está entre el 29 y el 31 por ciento. O que, con una
confianza del por ciento, la estatura media está entre 1.80 y 1.84.
Igual que vimos antes con las encuestas de las estaturas, o de la proporción de
gente que cree en los extraterrestres, con cada muestra obteníamos 𝑛 datos
diferentes, y valores diferentes (de la media muestral o de la proporción muestral).
Así, por ejemplo, un intervalo de confianza al 95% garantiza que, si tomamos 100
muestras, el verdadero valor del parámetro estará dentro del intervalo
en aproximadamente el 95 de los intervalos construidos.
Por una vez, y sin que sirva de precedente, vamos a ver cómo es la construcción
matemática del intervalo de confianza. Consideremos la variable X∈N(μ,σ), que
representa a la característica que estamos midiendo (altura, peso…). Supongamos
que σ es conocida.
𝑋̅ − 𝜇
𝑍=
𝜎/√𝑛
𝜎
𝑋̅ ∈ 𝑁 (𝜇, )
√𝑛
𝑋̅ − 𝜇
1 − 𝛼 = 𝑃 (−𝑍𝛼/2 < <𝑍𝛼/2 )
𝜎/√𝑛
𝜎 𝜎
1 − 𝛼 = 𝑃 (𝑋̅−𝑍𝛼/2 < 𝜇 <𝑋̅+𝑍𝛼/2 )
√𝑛 √𝑛
𝜎 𝜎
(𝐿, 𝑈) = (𝑋̅ −𝑍𝛼/2 , 𝑋̅ +𝑍𝛼/2 )
√𝑛 √𝑛
El procedimiento teórico para llegar a esta fórmula es simple, aunque difícil de seguir
para cualquiera con pocos conocimientos matemáticos. En todo caso, lo importante
es que la fórmula del intervalo no tiene excesiva dificultad. El intervalo está centrado
en el estimador media muestral, y los extremos consisten en restar y sumar la misma
cantidad: un valor que depende del nivel de confianza utilizado, multiplicado por el
error muestral de la media.
EJERCICIO
Aceptando que la variable aleatoria X = “grados que dobla la rodilla” sigue una
distribución normal, y suponiendo que 𝜎 = 0.30 grados,
SOLUCION
La media muestral es
10
1 419.47
𝑥 = ∑ 𝑥𝑖 = = 41.947
𝑛 10
𝑖=1
𝜎 𝜎 0.3
(𝑋̅−𝑍𝛼/2 , 𝑋̅ +𝑍𝛼/2 ) = (41.947 ± 𝑍𝛼/2 )
√𝑛 √𝑛 √10
Donde el valor 𝑍𝛼/2 = 1.645 se puede obtener como:
Calculamos el cuartil de una normal (por defecto, los parámetros 0 y 1 no hace falta
escribirlos).
0.3
(41.947 ± 1.96 ) = (41.947 ± 0.186) = (41.761, 42.133)
√10
𝜎 𝜎
(𝑋̅−𝑍𝛼/2 , 𝑋̅ +𝑍𝛼/2 )
√𝑛 √𝑛
Para ver que, con una probabilidad 1−α el parámetro verdadero (µ) esta dentro de
ese intervalo; es decir, que la distancia entre µ y 𝑋̅ es, como mucho,
𝜎
𝑍𝛼/2 ,
√𝑛
𝜎
|𝑋̅ − 𝜇| ≤ 𝑍𝛼/2 ,
√𝑛
Si queremos calcular el tamaño muestral necesario para que el error sea menor o
igual a una cantidad 𝑒 (0.05 en este caso), hacemos:
2
𝜎 𝑍𝛼/2 ∙ 𝜎2 1.96 ∙ 0.3 2
𝑍𝛼/2 , ≤𝑒⇔𝑛≥ = ( ) = 138.298
√𝑛 𝑒2 0.05
2 2
𝑍𝛼/2 ∙ 𝜎2 𝑍𝛼/2 ∙ 𝜎2
𝑛≥ =4×
(𝑒/2)2 𝑒2
Es decir, habría que tomar una muestra 4 veces más grande.
𝑆̂𝑛−1
(𝑋̅ ± 𝑡𝑛−1,𝛼/2 )
√𝑛
Siendo 𝑡𝑛−1,𝛼/2 el valor de una t de Student con n-1 grados de libertad que deja a la
derecha 𝛼/2 de área (mismo significado que en el caso anterior, pero debemos
biscar dicho valor en la densidad t con n-1 grados de libertad).
Como parece lógico, si se desea una mayor confianza de que el parámetro buscado
esté dentro del intervalo, el intervalo va a salir más grande. La única manera de
obtener intervalos más pequeños sería aumentar el tamaño muestral (recordemos
que la forma del intervalo es
𝑆̂
(𝑋̅ ± 𝑡𝑛−1,𝛼/2 𝑛−1 ), donde la longitud es inversamente proporcional a √𝑛
√𝑛
porque desconocemos σ y una condición para ser pivote es que, excepto por el
parámetro a estimar (en este caso μ), todos los parámetros que aparecen en él
deben ser conocidos. Entonces proponemos como pivote una variable aleatoria
definida en forma parecida a Z pero reemplazando σ por un estimador adecuado.
Ya vimos que la varianza muestral definida
1
𝑆 2 = 𝑛−1 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2 ,
𝑋̅ − 𝜇
𝑇=
𝑆/√𝑛
Pero para poder usar a T como pivote debemos conocer su distribución. Se puede
probar que la distribución de T es una distribución llamada Student con parámetro
n-1. Luego, para construir el intervalo de confianza buscado a partir del pivote T
procedemos como en los casos anteriores:
𝑃(−𝑡 ≤ 𝑇 ≤ 𝑡) = 1 − 𝛼
𝑋̅ −𝜇 𝑆 𝑆 𝑆 𝑆
𝑃 (−𝑡 ≤ ≤ 𝑡)= 𝑃 (−𝑡 ≤ 𝑋̅ − 𝜇 ≤ 𝑡 ) = 𝑃 (−𝑋̅ − 𝑡 ≤ −𝜇 ≤ −𝑋̅ + 𝑡 )= 1−𝛼
𝑆/√𝑛 √𝑛 √𝑛 √𝑛 √𝑛
Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros
se invierte) llegamos a:
𝑆 𝑆
𝑃 (𝑋̅ − 𝑡 ≤ 𝜇 ≤ −𝑋̅ + 𝑡 ) = 1−𝛼
√𝑛 √𝑛
EJERCICIO
1
𝑆 = √9 ∑10 2 2
𝑖=1(𝑥𝑖 − 𝑥̅ ) = 1.36 𝑜ℎ𝑚𝑠. Supongase que 𝑋~𝑁(𝜇,𝜎 ).
𝑆 𝑆 1.36 1.36
[𝑥̅ − 𝑡𝛼 ,𝑛−1 , 𝑥̅ + 𝑡𝛼 ,𝑛−1 ] = [10.48 − 1.8331 , 10.48 + 1.8331 ]
2 √𝑛 2 √𝑛 √10 √10
𝑋̅−𝜇
𝑍 = 𝑆/ ~𝑁(0,1) aproximadamente y puedo construir el intervalo para µ como
√𝑛
antes:
𝑆 𝑆
[𝑥̅ − 𝑧𝛼,𝑛−1 , 𝑥̅ + 𝑧𝛼,𝑛−1 ], pero su nivel es aproximadamente 1 − 𝛼.
2 √𝑛 2 √𝑛
2.4.2 Intervalos de confianza para la diferencia de medias.
De la misma forma, vamos a realizar otro tipo de situación, en la cual nos solicitan
un intervalo de confianza pero en esta ocasión para la diferencia de medias, en el
cual hay 2 casos típicos, cuando se conoce la varianza, y cuando esta es
desconocida.
𝑋1 ~𝑁(𝜇1 𝜎12 )
{ y suponemos que las varianzas 𝜎12 y 𝜎22 son conocidas.
𝑋2 ~𝑁(𝜇2 𝜎22 )
Sean además
Por lo tanto:
La variable aleatoria Z cumple con todas las condiciones para servir de pivote y
construiremos nuestro intervalo en forma análoga a como hicimos en los casos
anteriores:
𝑃 (−𝑧 ≤ 𝑍 ≤ 𝑧) = 1 − 𝛼
EJERCICIO
El intervalo será
Si se conocen las desviaciones estándar y los tamaños de las muestras son iguales
(es decir 𝑛1 = 𝑛2 = 𝑛), entonces puede determinarse el tamaño requerido de la
muestra de manera tal que la longitud del intervalo sea menor que ℓ
𝑋1 ~𝑁(𝜇1 𝜎12 )
{ y suponemos que las varianzas 𝜎12 y 𝜎22 son desconocidas.
𝑋2 ~𝑁(𝜇2 𝜎22 )
Sean, además
Sean 𝑋̅1 𝑦 𝑋̅2 las medias muestrales y 𝑆12 𝑦 𝑆22 las varianzas muestrales. Como
𝑆12 𝑦 𝑆22 son los estimadores de la varianza común 𝜎 2 , entonces construimos un
estimador combinado de 𝜎 2 .
Este estimador es
𝑃 (−𝑡𝛼 ,𝑛 + 𝑛2 −2
≤ 𝑇 ≤ 𝑡𝛼 ,𝑛 + 𝑛2 −2
)
2 1 2 1
1 1 1 1
𝑃 (𝑋̅1 − 𝑋̅2 −𝑡𝛼 ,𝑛 𝑆𝑃 √ + ≤ 𝜇1 − 𝜇2 ≤ ̅1 − 𝑋̅2 + 𝑡𝛼
𝑋 𝑆𝑃 √ + )
2 1 + 𝑛2 −2 𝑛1 𝑛2 ,𝑛 + 𝑛2−2
2 1 𝑛1 𝑛2
= 1−𝛼
1 1 1 1
[𝑋̅1 − 𝑋̅2 −𝑡𝛼 ,𝑛 𝑆𝑃 √ + ; ̅1 − 𝑋̅2 +𝑡𝛼
𝑋 𝑆𝑃 √ + ]
2 1 + 𝑛2 −2 𝑛1 𝑛2 ,𝑛 + 𝑛2−2
2 1 𝑛1 𝑛2
Cuanto mayor sea 1-α , mayor será zα/2 y , por tanto, también el error.
Tamaño de la muestra
Ejemplo 1:
Hallar:
Ejemplo:
Solución:
para la distribución .
con una confianza del 95%, que por supuesto contiene a las estimaciones
Arreglando el cociente
Tendríamos que:
Donde está incluida la razón de varianza para a cuál queremos crear un intervalo.
A.1. Estimar una proporción: Si deseamos estimar una proporción, debemos saber:
Donde:
• Zα 2 = 1.962 (ya que la seguridad es del 95%).
• p = proporción esperada (en este caso 5% = 0.05).
• q = 1 – p (en este caso 1 – 0.05 = 0.95).
• d = precisión (en este caso deseamos un 3%).
Donde:
N=Total de la población.
Estos estudios pretenden comparar si las medias o las proporciones de las muestras
son diferentes. Habitualmente el investigador pretende comparar dos tratamientos.
Para el cálculo del tamaño muestral se precisa conocer:
Donde:
Donde:
En todos los estudios es preciso estimar las posibles pérdidas de pacientes por
razones diversas (pérdida de información, abandono, no respuesta…) por lo que se
debe incrementar el tamaño muestral respecto a dichas pérdidas.
Como un buen aprendizaje nos percatamos de definir de manera clara y breve todos
los intervalos de confianza, ya que como comentaba anteriormente, estos temas
son de suma importancia, las estimaciones son como su nombre lo dice, un estimo
de alguna situación, y eso es lo que nos encargamos de reportar y de estudiar, para
obtener valores que por medio del empirismo y la teoría ya están definidos, y
principalmente, la idea principal es que conozcamos que existe un universo del cual
dependen todas las estimaciones.
Para concluir, los intervalos de confianza son eso, intervalos entre las posibilidades
de que un evento suceda o no, demostrando que el universo de una forma se
equivoca o esta formulado de manera acertada.
Referencias
Web gib. (2020, febrero). 4.2 Características estimadores. Recuperado de
https://www.uv.es/webgid/Inferencial/42_caractersticas_estimadores.html
http://matematicas.unex.es/~mota/ciencias_ambientales/tema7_nuevo.pdf