Estimación Puntual e Interválica en Media y Proporciones

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

LA ESTIMACIÓN ESTADÍSTICA

Introducción

Las que aparecen en las distribuciones de probabilidades tales como: p en la binominal,


λ en la distribución de Poisson, μ y ơ en la distribución normal, etc., son los parámetros de las
poblaciones respectivas.

La estimación es el proceso mediante el cual se intenta determinar el valor del


parámetro de una población a partir de la información de una muestra. La estimación de un
parámetro puede adoptar la forma de un solo punto, o la forma de un intervalo o rango de
valores dentro del cual se encuentra el valor del parámetro. En el primer caso tenemos la
llamada ESTIMACION PUNTUAL y en el segundo caso la ESTIMACION POR INTERVALOS DE
CONFIANZA.

Para la estimación puntual hay varios métodos, entre los que destacan el de los
momentos, el de máxima verosimilitud y el de los mínimos cuadrados, este último se utilizó en
ESTADISTICA GENERAL para estimar los parámetros de regresión lineal.

En cuanto a la estimación por intervalos de confianza, es el tema que estudiaremos con


mayor detalle en esta unidad. En la práctica los intervalos de confianza usuales son: el de la

media poblacional “μ”, el de la diferencia de dos medias poblacionales (μx-μy) y el de la

proporcional poblacional.

Estimación Puntual

Un estimador puntual es un número único que es para estimar un parámetro poblacional


desconocido.

Para calcular un estimador de un parámetro, se selecciona una muestra aleatoria de la población


y luego se calcula el estadígrafo, a este único número obtenido se le considera el estimador del
parámetro. Los estadígrafos estudiados en ESTADISTICA GENERAL, como son la media (x) y
varianza (𝑆 2 ) de una muestra, se les considera estimadores de la media (μ) y varianza (ơ2 ) de
una población, respectivamente. Estos estadígrafos se calculaban con las fórmulas siguientes:
∑𝑛
𝑖=1 𝑥𝑖
𝑥̅ = 𝑛
Para la varianza (𝑆 2 ):

2 ∑𝑛 ̅) 2
𝑖=1 (𝑥𝑖 −𝑥
𝑆 = 𝑛−1
, si n < 30

2 ∑𝑛 ̅) 2
𝑖=1 (𝑥𝑖 −𝑥
𝑆 = 𝑛
, si n ≥ 30

Algunos estadígrafos son mejores estimadores son mejores estimadores que otros, sin embargo,
se mide cuando este se cumple las siguientes propiedades:

i) Debe ser NO SESGADO; es decir debe cumplir que la media aritmética de las medias de
todas las muestras debe ser igual a la media poblacional.
ii) Debe ser EFICIENTE, es decir de todos los estimadores de la población, es el mejor el que
tiene menor varianza.
iii) Debe ser CONSISTENTE, es decir si Ud. Esta seguro, que a medida que la muestra se hace
más grande, el estimador se hace más próximo al parámetro
iv) Debe ser SUFICIENTE, es decir, el estimador hace tanto uso de la información de la
muestra, que ningún otro estimador puede obtener información adicional de la muestra,
acerca del parámetro que se está estimando.

Estimación por intervalos para la Media Poblacional

De la figura se tiene:

P(-𝑍0 ≤ Z ≤ 𝑍0 ) = 1 – 𝛼
𝑥− 𝜇
Utilizando 𝑍 = ơ/ de la distribución muestral de la media; se tiene que:
√𝑛

𝑋− 𝜇
𝑃 (−𝑧0 ≤ 𝜎 ≤ 𝑧0 ) = 1 − 𝛼
⁄ 𝑛

De donde efectuando operaciones en los miembros de la desigualdad, se obtiene:
𝜎 𝜎
𝑃 (𝑥 − 𝑧0 ≤ 𝜇 ≤ 𝑥 + 𝑧0 )=1−𝛼
√𝑛 √𝑛
Luego:
𝜎 𝜎
𝑥 − 𝑧0 ≤ 𝜇 ≤ 𝑥 + 𝑧0
√𝑛 √𝑛

Es el llamado intervalo con el 100 (1 − 𝛼) % de confianza o seguridad de contener a la media


poblacional “μ”. Este intervalo se utiliza para todos los casos presentados para la distribución
muestral de la media.

a) PASOS PARA DETERMINAR UN INTERVALO DE CONFIANZA PARA “μ”


1. Elegir un nivel de confianza (1 − 𝛼)
2. determinar “𝑧0 ” mediante la tabla “z”, siendo algunos valores los siguientes:

NIVEL DE CONFIANZA (1 − 𝛼) 0,90 0,92 0,95 0,98 0,99

LÍMITE DE CONFIANZA (𝑧0 ) 1,64 1,75 1,96 2,33 2,58

𝜎 𝜎
3. Calcular  𝑥̅ − 𝑧0 𝑦 𝑥̅ + 𝑧0 con la información de la muestra
√𝑛 √𝑛

EJEMPLO 1
Se seleccionó una muestra aleatoria de 30 docentes de la Universidad Nacional de la Amazonía
Peruana con el objetivo de estimar la experiencia docente media de ellos. Los resultados
obtenidos en la muestra (en años) fueron:
3 4 4 6 2 3 4 6 2 4
6 4 3 4 4 7 3 4 5 6
1 6 4 5 4 3 2 4 3 4

Utilizando la información anterior, obtener un intervalo con un 99% de confianza para estimar
la experiencia docente media de los profesores de la UNAP.

SOLUCIÓN
Como la población no es normal, el tamaño de la muestra es n= 30 y la desviación estándar “ơ”
es desconocida la estimamos por la desviación estándar muestral “S” a partir de la fórmula:
∑𝑛 2
𝑖=1 𝑥 𝑖
𝑆2 = 𝑛
− 𝑥̅ 2
𝑆 2 = 1,93

Luego, el intervalo es:


𝑆 𝑆
𝑥 − 𝑧0 ≤ 𝜇 ≤ 𝑥 + 𝑧0 ……………………………(*)
√𝑛 √𝑛
Donde:

∑𝑛
𝑖=1 𝑥𝑖
120
𝑥̅ = 𝑛
= =4
30
ơ  S = 1,39
n = 30
1 − 𝛼 = 0,99 𝑧0 = 2,58

Luego en (*):
1,39 1,39
4 − 2,58 ≤ 𝜇 ≤ 4 + 2,58
√30 √30
4 – 0,6547 ≤ 𝜇 ≤ 4 + 0,6547
3,3453 ≤ 𝜇 ≤ 4,6547

Desarrollo en equipo de trabajo:

1. Se aplicó una prueba de aptitud a 36 estudiantes de Educación a distancia. Los resultados


arrojaron una calificación media de 82 y una desviación estándar de 49. Determinar un
intervalo de confianza del 90% para la calificación de Educación a Distancia.

2. Se ha medido el contenido de nicotina 36 cigarrillos de la marca “CANCERIN”. A


continuación, se resume los resultados obtenidos.
Xi = contenido de nicotina por cigarrillo, (en miligramos)
∑ 𝑥𝑖 = 756 miligramos
∑(𝑥𝑖 − 𝑥)2 = 315 miligramos
Determinar un intervalo de confianza de 95% para el contenido promedio de nicotina de
los cigarrillos de esta marca.

3. Un agricultor desea determinar el peso total de una partida de 10 000 naranjas. Como el
agricultor cuenta con una balanza pequeña y no cuenta con tiempo para pesarlas todas,
selecciona una muestra de 36 naranjas, la cual arroja una media de 175 gramos y una
desviación estándar de 25 gramos. Determinar el peso total de la partida de naranjas
mediante un intervalo de confianza del 95%.

Intervalo de confianza para “μ” a partir de una muestra pequeña

Como ya vimos, cuando el tamaño de la muestra “n” es igual o mayor que 30, el intervalo de
confianza para estimar la media poblacional es:
ơ ơ
𝑥−𝑧 ≤ 𝜇 ≤𝑥+𝑧
√𝑛 √𝑛

Sin embargo, cuando el tamaño de la muestra es pequeño, digamos n < 30, esta estimación ya
no es apropiada, en consecuencia, se hace necesario considerar una forma alternativa para
estimar la media poblacional a partir de una muestra pequeña.
Supongamos primero que la población tiene distribución normal con media “μ” y desviación
estándar poblacional “ơ” desconocida, la cual se estima con la desviación estándar muestral “S”
insesgada, a partir de:

2
∑(𝑥𝑖 − 𝑥̅ )2
𝑆 =
𝑛−1

Supongamos además que se seleccionan muestras aleatorias simples de tamaño “n” de esta
población y que se determina la media x y la media estándar S de cada una de estas muestras.
Ahora, si se calcula la variable “t, donde:
𝑥− 𝜇
𝑡=
𝑆/ √𝑛

Para cada muestra, entonces, de acuerdo con la teoría estadística los valores de “t” están
distribuidos según la llamada distribución “t” de Student con (n - 1) grados de libertad (g.l) como
se muestra en la figura, la distribución “t” al igual que la distribución normal “z”, tiene la forma
de campana y es simétrica. Sin embrago a diferencia de la distribución normal, tiene una
dispersión mayor, la cual se hace más grande a medida que el tamaño de la muestra disminuye
En la tabla adjunta para una muestra de tamaño 6(n =6) y el nivel de confianza 95% (1 − 𝛼 =
0,95), se ingresa a la tabla con los valores:

𝑛−1=5 Y 𝑡0 = 𝑡1− 𝛼/2 = 𝑡0,975 , entonces

El valor buscado es 𝑡0 = 2,57


n -1 𝑡0,975

----------------5---------------------------------------------------2,57----------------------------

Finalmente, el intervalo del 100(1 − 𝛼)% de confianza para muestras pequeñas (n < 30), con
desviación estándar poblacional es normal, está dado por:

𝑆 𝑆
𝑥 − 𝑡0 ≤ 𝜇 ≤ 𝑥 + 𝑡0
√𝑛 √𝑛

EJEMPLO 2
Las edades de 5 estudiantes seleccionados aleatoriamente de colegios vespertinos del país son
en años:

21, 19, 23, 19, 23. Obtener un intervalo del 99% de confianza para estimar la edad media de
todos los estudiantes de colegios vespertinos, si las edades siguen una distribución normal.

SOLUCIÓN
El intervalo del 99% de confianza para la edad media de todos los estudiantes del país es:
𝑆 𝑆
𝑥 − 𝑡0 ≤ 𝜇 ≤ 𝑥 + 𝑡0
√𝑛 √𝑛
Donde:

21+19+23+19+23 105
𝑥̅ = = = 21 𝑎ñ𝑜𝑠
5 5
2
∑(𝑥𝑖 − 𝑥
̅) 16
𝑆2 = = =4 → 𝑆=2
𝑛−1 4
𝛼
1 − 𝛼 = 0,99 1− = 0,995 𝑡0 = 4,60
2

𝛼
𝛼 = 0,01 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 = 0,005
2
g.l = 5 - 1 = 4
Luego en (*):

2 2
21 − 4,6 ≤ 𝜇 ≤ 21 + 4,6
√5 √5
16,89 ≤ 𝜇 ≤ 25,11

NOTA
Para muestras pequeñas (n < 30) el intervalo de confianza para estimar la media Poblacional:

𝑆 𝑆
𝑥 − 𝑡0 ≤ 𝜇 ≤ 𝑥 + 𝑡0
√𝑛 √𝑛
Es un intervalo exacto solo en el caso que la población que se estudia siga una distribución
Normal
Estimación por intervalos para la Diferencia de Dos Medias Poblacionales
De la figura, se tiene que:

P(-𝑍0 ≤ Z ≤ 𝑍0 ) = 1 – 𝛼
𝑥− ӯ−(𝜇1 − 𝜇2 )
Utilizando 𝑧= de la distribución muestral de la diferencia de
𝜎 2 𝜎2 2
√ 1 +
𝑛1 𝑛2

dos medias, se tiene que:

𝑥 − ӯ − (𝜇1 − 𝜇2 )
𝑃 −𝑍0 ≤ Z = ≤ 𝑍0 = 1– 𝛼
𝜎2 𝜎2
√ 1 + 2
( 𝑛1 𝑛2 )
De donde efectuando operaciones en los tres miembros de la desigualdad, se obtiene:

𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
𝑃 (𝑥 − ӯ − 𝑍0 √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥 − ӯ + 𝑍0 √ + )= 1– 𝛼
𝑛1 𝑛2 𝑛1 𝑛2

Luego:

𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
𝑥 − ӯ − 𝑍0 √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥 − ӯ + 𝑍0 √ +
𝑛1 𝑛2 𝑛1 𝑛2

Es el llamado intervalo del 100(1 − 𝛼)% de confianza o seguridad de contener a la diferencia


(𝜇1 − 𝜇2 ) de las medias poblacionales. Este intervalo se utiliza para todos los casos presentados
para la distribución muestral de la diferencia de dos medias.

EJEMPLO 3
Una muestra aleatoria de 200 pilas de la marca A para calculadoras arroja una vida media de
140 horas y una desviación estándar de 10 horas. Una muestra aleatoria de 120 pilas de la marca
B arroja una vida media de 125 horas y una desviación estándar de 9 horas. Determinar un
intervalo de confianza del 99% para la diferencia de la vida media de las pilas de las marcas A y
B.

SOLUCIÓN
El intervalo pedido es:

𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
𝑥 − ӯ − 𝑍0 √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥 − ӯ + 𝑍0 √ +
𝑛1 𝑛2 𝑛1 𝑛2
Donde la información la encontramos en el cuadro:
PILAS MARCA “A” PILAS MARCA “B”

X = 140 horas Ӯ = 125 horas


𝑆1 = 10 horas 𝑆2 = 9 horas
𝑛1 = 200 𝑛2 = 120

Luego:

𝑥 − ӯ = 15
1 – 𝛼 = 0,99 𝑍0 = 2,58

𝑆1 2 𝑆2 2 100 81
𝑍0 √ + = 2,58√ + = 2,7967
𝑛1 𝑛2 200 120

En (*)
15 − 2,7967 ≤ 𝜇1 − 𝜇2 ≤ 15 − 2,7967
12,2033 ≤ 𝜇1 − 𝜇2 ≤ 17,7967

Estimación por intervalos para la proporción poblacional

De la figura se tiene que:


P(-𝑍0 ≤ Z ≤ 𝑍0 ) = 1 – 𝛼
𝑝−𝑝
Utilizando 𝑍= 𝑝𝑞
de la distribución muestral de la proporción, se tiene que:
√𝑛

𝑝−𝑝
P(-𝑍0 ≤ ≤ 𝑍0 ) = 1 – 𝛼
𝑝𝑞
√𝑛

De donde efectuando operaciones en los tres miembros de la desigualdad, se obtiene:


𝑝𝑞 𝑝𝑞
𝑃 (𝑝 − 𝑍0 √ ≤ 𝑝 ≤ p + 𝑍0 √ ) = 1 – 𝛼
𝑛 𝑛
Luego:

𝑝𝑞 𝑝𝑞
𝑝 − 𝑍0 √ ≤ 𝑝 ≤ 𝑝 + 𝑍0 √
𝑛 𝑛
Es el llamado intervalo del 100(1 − 𝛼)% de confianza o seguridad de contener a la proporción
poblacional “p”

4. Una muestra aleatoria de 100 estudiantes varones de la Universidad Inca Garcilaso indica
que 10 estudiantes practican deportes en forma activa. Obtenga un intervalo de confianza
del 95% para estimar la proporción de estudiantes varones de la Universidad Inca Garcilaso
que practican deportes activamente.

5. Se selecciona una muestra de 500 fumadores y se encuentra que el 86% tiene preferencia
por la marca “CANCERIN”. Determinar un intervalo de confianza del 90% para la proporción
poblacional de fumadores que prefieren “CANCERIN”

6. Se realizó una investigación preelectoral en cierta ciudad mediante una muestra de 64


votantes seleccionada aleatoriamente. De estos, el 36% declaro que votarían por Juan
Pérez para alcalde. Calcular el intervalo de confianza del 90% para la proporción de votantes
de la ciudad que votara por Juan Pérez.

7. De 256 pacientes que sufren de una cierta enfermedad que fueron tratados con un nuevo
medicamento, 128 se curaron ¿con que grado de confianza puede afirmarse que la
efectividad del medicamento no es menor del 45% ni mayor del 55%?

También podría gustarte