Estimación Puntual e Interválica en Media y Proporciones
Estimación Puntual e Interválica en Media y Proporciones
Estimación Puntual e Interválica en Media y Proporciones
Introducción
Para la estimación puntual hay varios métodos, entre los que destacan el de los
momentos, el de máxima verosimilitud y el de los mínimos cuadrados, este último se utilizó en
ESTADISTICA GENERAL para estimar los parámetros de regresión lineal.
proporcional poblacional.
Estimación Puntual
2 ∑𝑛 ̅) 2
𝑖=1 (𝑥𝑖 −𝑥
𝑆 = 𝑛−1
, si n < 30
2 ∑𝑛 ̅) 2
𝑖=1 (𝑥𝑖 −𝑥
𝑆 = 𝑛
, si n ≥ 30
Algunos estadígrafos son mejores estimadores son mejores estimadores que otros, sin embargo,
se mide cuando este se cumple las siguientes propiedades:
i) Debe ser NO SESGADO; es decir debe cumplir que la media aritmética de las medias de
todas las muestras debe ser igual a la media poblacional.
ii) Debe ser EFICIENTE, es decir de todos los estimadores de la población, es el mejor el que
tiene menor varianza.
iii) Debe ser CONSISTENTE, es decir si Ud. Esta seguro, que a medida que la muestra se hace
más grande, el estimador se hace más próximo al parámetro
iv) Debe ser SUFICIENTE, es decir, el estimador hace tanto uso de la información de la
muestra, que ningún otro estimador puede obtener información adicional de la muestra,
acerca del parámetro que se está estimando.
De la figura se tiene:
P(-𝑍0 ≤ Z ≤ 𝑍0 ) = 1 – 𝛼
𝑥− 𝜇
Utilizando 𝑍 = ơ/ de la distribución muestral de la media; se tiene que:
√𝑛
𝑋− 𝜇
𝑃 (−𝑧0 ≤ 𝜎 ≤ 𝑧0 ) = 1 − 𝛼
⁄ 𝑛
√
De donde efectuando operaciones en los miembros de la desigualdad, se obtiene:
𝜎 𝜎
𝑃 (𝑥 − 𝑧0 ≤ 𝜇 ≤ 𝑥 + 𝑧0 )=1−𝛼
√𝑛 √𝑛
Luego:
𝜎 𝜎
𝑥 − 𝑧0 ≤ 𝜇 ≤ 𝑥 + 𝑧0
√𝑛 √𝑛
𝜎 𝜎
3. Calcular 𝑥̅ − 𝑧0 𝑦 𝑥̅ + 𝑧0 con la información de la muestra
√𝑛 √𝑛
EJEMPLO 1
Se seleccionó una muestra aleatoria de 30 docentes de la Universidad Nacional de la Amazonía
Peruana con el objetivo de estimar la experiencia docente media de ellos. Los resultados
obtenidos en la muestra (en años) fueron:
3 4 4 6 2 3 4 6 2 4
6 4 3 4 4 7 3 4 5 6
1 6 4 5 4 3 2 4 3 4
Utilizando la información anterior, obtener un intervalo con un 99% de confianza para estimar
la experiencia docente media de los profesores de la UNAP.
SOLUCIÓN
Como la población no es normal, el tamaño de la muestra es n= 30 y la desviación estándar “ơ”
es desconocida la estimamos por la desviación estándar muestral “S” a partir de la fórmula:
∑𝑛 2
𝑖=1 𝑥 𝑖
𝑆2 = 𝑛
− 𝑥̅ 2
𝑆 2 = 1,93
∑𝑛
𝑖=1 𝑥𝑖
120
𝑥̅ = 𝑛
= =4
30
ơ S = 1,39
n = 30
1 − 𝛼 = 0,99 𝑧0 = 2,58
Luego en (*):
1,39 1,39
4 − 2,58 ≤ 𝜇 ≤ 4 + 2,58
√30 √30
4 – 0,6547 ≤ 𝜇 ≤ 4 + 0,6547
3,3453 ≤ 𝜇 ≤ 4,6547
3. Un agricultor desea determinar el peso total de una partida de 10 000 naranjas. Como el
agricultor cuenta con una balanza pequeña y no cuenta con tiempo para pesarlas todas,
selecciona una muestra de 36 naranjas, la cual arroja una media de 175 gramos y una
desviación estándar de 25 gramos. Determinar el peso total de la partida de naranjas
mediante un intervalo de confianza del 95%.
Como ya vimos, cuando el tamaño de la muestra “n” es igual o mayor que 30, el intervalo de
confianza para estimar la media poblacional es:
ơ ơ
𝑥−𝑧 ≤ 𝜇 ≤𝑥+𝑧
√𝑛 √𝑛
Sin embargo, cuando el tamaño de la muestra es pequeño, digamos n < 30, esta estimación ya
no es apropiada, en consecuencia, se hace necesario considerar una forma alternativa para
estimar la media poblacional a partir de una muestra pequeña.
Supongamos primero que la población tiene distribución normal con media “μ” y desviación
estándar poblacional “ơ” desconocida, la cual se estima con la desviación estándar muestral “S”
insesgada, a partir de:
2
∑(𝑥𝑖 − 𝑥̅ )2
𝑆 =
𝑛−1
Supongamos además que se seleccionan muestras aleatorias simples de tamaño “n” de esta
población y que se determina la media x y la media estándar S de cada una de estas muestras.
Ahora, si se calcula la variable “t, donde:
𝑥− 𝜇
𝑡=
𝑆/ √𝑛
Para cada muestra, entonces, de acuerdo con la teoría estadística los valores de “t” están
distribuidos según la llamada distribución “t” de Student con (n - 1) grados de libertad (g.l) como
se muestra en la figura, la distribución “t” al igual que la distribución normal “z”, tiene la forma
de campana y es simétrica. Sin embrago a diferencia de la distribución normal, tiene una
dispersión mayor, la cual se hace más grande a medida que el tamaño de la muestra disminuye
En la tabla adjunta para una muestra de tamaño 6(n =6) y el nivel de confianza 95% (1 − 𝛼 =
0,95), se ingresa a la tabla con los valores:
----------------5---------------------------------------------------2,57----------------------------
Finalmente, el intervalo del 100(1 − 𝛼)% de confianza para muestras pequeñas (n < 30), con
desviación estándar poblacional es normal, está dado por:
𝑆 𝑆
𝑥 − 𝑡0 ≤ 𝜇 ≤ 𝑥 + 𝑡0
√𝑛 √𝑛
EJEMPLO 2
Las edades de 5 estudiantes seleccionados aleatoriamente de colegios vespertinos del país son
en años:
21, 19, 23, 19, 23. Obtener un intervalo del 99% de confianza para estimar la edad media de
todos los estudiantes de colegios vespertinos, si las edades siguen una distribución normal.
SOLUCIÓN
El intervalo del 99% de confianza para la edad media de todos los estudiantes del país es:
𝑆 𝑆
𝑥 − 𝑡0 ≤ 𝜇 ≤ 𝑥 + 𝑡0
√𝑛 √𝑛
Donde:
21+19+23+19+23 105
𝑥̅ = = = 21 𝑎ñ𝑜𝑠
5 5
2
∑(𝑥𝑖 − 𝑥
̅) 16
𝑆2 = = =4 → 𝑆=2
𝑛−1 4
𝛼
1 − 𝛼 = 0,99 1− = 0,995 𝑡0 = 4,60
2
𝛼
𝛼 = 0,01 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 = 0,005
2
g.l = 5 - 1 = 4
Luego en (*):
2 2
21 − 4,6 ≤ 𝜇 ≤ 21 + 4,6
√5 √5
16,89 ≤ 𝜇 ≤ 25,11
NOTA
Para muestras pequeñas (n < 30) el intervalo de confianza para estimar la media Poblacional:
𝑆 𝑆
𝑥 − 𝑡0 ≤ 𝜇 ≤ 𝑥 + 𝑡0
√𝑛 √𝑛
Es un intervalo exacto solo en el caso que la población que se estudia siga una distribución
Normal
Estimación por intervalos para la Diferencia de Dos Medias Poblacionales
De la figura, se tiene que:
P(-𝑍0 ≤ Z ≤ 𝑍0 ) = 1 – 𝛼
𝑥− ӯ−(𝜇1 − 𝜇2 )
Utilizando 𝑧= de la distribución muestral de la diferencia de
𝜎 2 𝜎2 2
√ 1 +
𝑛1 𝑛2
𝑥 − ӯ − (𝜇1 − 𝜇2 )
𝑃 −𝑍0 ≤ Z = ≤ 𝑍0 = 1– 𝛼
𝜎2 𝜎2
√ 1 + 2
( 𝑛1 𝑛2 )
De donde efectuando operaciones en los tres miembros de la desigualdad, se obtiene:
𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
𝑃 (𝑥 − ӯ − 𝑍0 √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥 − ӯ + 𝑍0 √ + )= 1– 𝛼
𝑛1 𝑛2 𝑛1 𝑛2
Luego:
𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
𝑥 − ӯ − 𝑍0 √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥 − ӯ + 𝑍0 √ +
𝑛1 𝑛2 𝑛1 𝑛2
EJEMPLO 3
Una muestra aleatoria de 200 pilas de la marca A para calculadoras arroja una vida media de
140 horas y una desviación estándar de 10 horas. Una muestra aleatoria de 120 pilas de la marca
B arroja una vida media de 125 horas y una desviación estándar de 9 horas. Determinar un
intervalo de confianza del 99% para la diferencia de la vida media de las pilas de las marcas A y
B.
SOLUCIÓN
El intervalo pedido es:
𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
𝑥 − ӯ − 𝑍0 √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥 − ӯ + 𝑍0 √ +
𝑛1 𝑛2 𝑛1 𝑛2
Donde la información la encontramos en el cuadro:
PILAS MARCA “A” PILAS MARCA “B”
Luego:
𝑥 − ӯ = 15
1 – 𝛼 = 0,99 𝑍0 = 2,58
𝑆1 2 𝑆2 2 100 81
𝑍0 √ + = 2,58√ + = 2,7967
𝑛1 𝑛2 200 120
En (*)
15 − 2,7967 ≤ 𝜇1 − 𝜇2 ≤ 15 − 2,7967
12,2033 ≤ 𝜇1 − 𝜇2 ≤ 17,7967
𝑝−𝑝
P(-𝑍0 ≤ ≤ 𝑍0 ) = 1 – 𝛼
𝑝𝑞
√𝑛
𝑝𝑞 𝑝𝑞
𝑝 − 𝑍0 √ ≤ 𝑝 ≤ 𝑝 + 𝑍0 √
𝑛 𝑛
Es el llamado intervalo del 100(1 − 𝛼)% de confianza o seguridad de contener a la proporción
poblacional “p”
4. Una muestra aleatoria de 100 estudiantes varones de la Universidad Inca Garcilaso indica
que 10 estudiantes practican deportes en forma activa. Obtenga un intervalo de confianza
del 95% para estimar la proporción de estudiantes varones de la Universidad Inca Garcilaso
que practican deportes activamente.
5. Se selecciona una muestra de 500 fumadores y se encuentra que el 86% tiene preferencia
por la marca “CANCERIN”. Determinar un intervalo de confianza del 90% para la proporción
poblacional de fumadores que prefieren “CANCERIN”
7. De 256 pacientes que sufren de una cierta enfermedad que fueron tratados con un nuevo
medicamento, 128 se curaron ¿con que grado de confianza puede afirmarse que la
efectividad del medicamento no es menor del 45% ni mayor del 55%?