Estadistica Estimaciones

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 20

Estimaciones

Una estimacin es alguna funcin de los resultados de una muestra que


produce un valor, llamado estimador.
Un estimador de un parmetro poblacional es una variable aleatoria que depende
de la informacin de la muestra y cuyas realizaciones proporcionan
aproximaciones al valor desconocido del parmetro. Se llama estimacin a una
realizacin especfica de esta variable aleatoria.
Pueden dividirse los procedimientos de estimacin en dos tipos, estimacin
puntual y estimacin por intervalo.


Ejemplo.
Se quiere estimar la altura media de los alumnos de un determinado curso. Se
puede dar la estimacin diciendo que la altura media es de 1.65 m (estimacin
puntual).
O bien decir que la altura media estar entre 1.6 m y 1.7 m (estimacin por
intervalo).


Estimacin Puntual

Un estimador puntual de un parmetro poblacional es una funcin de la muestra
que da como resultado un nico valor. La correspondiente realizacin se llama
estimacin puntual del parmetro.
Un procedimiento de estimacin puntual utiliza la informacin de una muestra para
llegar a un solo nmero, o punto, que se estima el parmetro de inters. La
estimacin real se efecta mediante un estimador. Un estimador es una regla que
expresa cmo calcular la estimacin, basndose en la informacin de la muestra y
se enuncia, en general, mediante la media muestral.
La estimacin puntual consiste en obtener un nico nmero calculado a partir de
las observaciones muestrales, y que es utilizado como estimacin del valor del
parmetro . Se le llama estimacin puntual porque a ese nmero, que se utiliza
como estimacin del parmetro , se le puede asignar un punto sobre la recta real.
Una estimacin puntual del valor de un parmetro poblacional desconocido (como
puede ser la media , o la desviacin estndar ), es un nmero que se utiliza
para aproximar el verdadero valor de dicho parmetro poblacional. A fin de realizar
tal estimacin, tomaremos una muestra de la poblacin y calcularemos el
parmetro muestral asociado ( x para la media, s para la desviacin estndar,
etc.). El valor de este parmetro muestral ser la estimacin puntual del parmetro
poblacional.




Ejemplo desarrollado 1

La cantidad de azufre encontrado en plantas secas de mostaza sigue una
distribucin normal X. se ha observado una muestra de extensin 9 con los
siguientes resultados:

0,7 0,8 0,6 0,95 0,65 1 0,9 0,2 0,55.

Si aceptamos como valor de el valor calculado de la cuasi-desviacin tpica
muestral Cul sera el tamao mnimo de la muestra que habra de ser
considerada para que el intervalo de confianza al 95% para el nivel medio de
azufre tenga una longitud inferior a 0,1?

Solucin:

datos muestrales
n = 9, xi=6,35 , 2ix = 4,9675

por tanto procedemos a hacer los siguientes clculos respectivos:


Teniendo en cuenta que si aceptamos el valor que nos da la
longitud del intervalo de confianza para una muestra de extensin n y un nivel de
confianza del 95% es:

Resolviendo la inecuacin:


obtenemos un n>93.59.











Ejemplo desarrollado 2

Una muestra de tamao 10 de una poblacin de mujeres presenta una altura
media de 172 cm. y una muestra de 12 varones de otra poblacin presenta una
altura media de 176,7 cm. Sabiendo que ambas poblaciones son normales con
varianzas 225 y 256 respectivamente, se trata de analizar si con una probabilidad
del 95% se puede asegurar que los varones son ms altos en media que las
mujeres o viceversa.

Solucin: Para resolver este problema hallaremos un intervalo de confianza para
la diferencia de medias al 95% y comprobaremos si dicho intervalo contiene el
valor cero, en cuyo caso se puede aceptar la hiptesis de que las alturas medias
son iguales con una probabilidad del 95%. Estamos entonces ante el caso del
clculo de intervalos de confianza para la diferencia de medias de dos
distribuciones normales con varianzas conocidas. En esta situacin el intervalo de
confianza para la diferencia de medias se basa en el siguiente estadstico:


lo que nos lleva al intervalo de confianza para la varianza definido por:


por tanto nos da como resultado el siguiente intervalo de confianza:


Como este intervalo contiene el valor cero, se puede aceptar con una probabilidad
del 95%

que Por tanto, aceptaremos la hiptesis de que la estatura de los varones y las
mujeres de ambas poblaciones es similar con un coeficiente de confianza del
95%.





Estimacin por intervalo

Un estimador por intervalos de un parmetro poblacional es una regla (basada en
informacin muestral) para determinar un rango, o un intervalo, en el cual
posiblemente se encuentre dicho parmetro. La estimacin correspondiente se
denomina estimacin por intervalos.
Estimacin por intervalo: la estimacin se representa mediante dos nmeros
que determinan un intervalo sobre la recta.

Ejemplo
Hallemos un intervalo de confianza, del 95%, de , nmero medio de microgramos
de partculas en suspensin por metro cbico de aire, sobre la base de una
muestra aleatoria de tamao 5 dada en la que se ha calculado que una estimacin
puntual de es . Supongamos que por experiencias anteriores se sabe
que , nmero de microgramos de partculas en suspensin por metro cbico de
aire, est normalmente distribuido, con varianza . Queremos extender la
estimacin puntual a un intervalo, de forma talque podamos tener una confianza
del 95 % de que el intervalo obtenido contenga al verdadero valor de . Es decir,
queremos determinar y de forma que As:


Para hacerlo as, consideremos la particin de la curva normal tipificada dibujada
en la siguiente figura:

Particin de Z para obtener un intervalo de confianza de del 95
%
Puede verse que
En este caso, , por tanto, podemos concluir que

Veamos que los lmites superior e inferior del intervalo de confianza del 95% son:

Puesto que se supone que es 9, y y , son estadsticos. Sus valores
observados por la muestra son


Puesto que este intervalo se obtuvo usando un procedimiento que, en muestreos
repetidos, contendr a la media en un 95% de confianza de que est
verdaderamente entre 58.37y 63.63:

58.37 = 61 - 2.63 61 61 +2.63 = 63.63
Dos observaciones son evidentes a partir de esta frmula:
La primera es que cada intervalo de confianza est centrado en
La segunda es que la amplitud del intervalo depende de tres factores :
- La confianza deseada.
- La desviacin estndar
- El tamao muestral
INTERVALO DE CONFIANZA
En el contexto de estimar un parmetro poblacional, un intervalo de confianza es
un rango de valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parmetro, con una probabilidad determinada.

Un estimador por intervalo utiliza los datos de la muestra para obtener dos valores
numricos entre los cuales se dice que est el valor del parmetro estimado.

Se espera que el estimador por intervalo, es decir, el procedimiento que se est
usando para determinar cada intervalo, sea tal que un gran porcentaje de estos
intervalos contenga.

El razonamiento anterior se puede hacer con cualquier otro parmetro .

Cada uno de estos intervalos se llama intervalo de confianza y la probabilidad de
que el intervalo contenga a se llama coeficiente de confianza.

El objetivo que se pretende con los intervalos de confianza es obtener un intervalo
de poca amplitud y con una alta probabilidad de que el parmetro se encuentre
en su interior. As pues, elegiremos probabilidades cercanas a la unidad, que se
representan por 1- y cuyos valores ms frecuentes suelen ser 0'90, 0'95 y 0'99.
Luego si deseamos obtener una estimacin por intervalo del parmetro
poblacional desconocido, tendremos que obtener dos estadsticos
( )
1 2
, ,...,
n
X X X u y
( )
1 2
, ,...,
n
X X X u que nos darn los valores extremos del
intervalo, tales que

( ) ( )
1 2 1 2
, ,..., , ,..., 1
n n
P X X X X X X u u u o
(
s s =



Al valor 1- se le llama coeficiente de confianza, y
Al valor 100(1-) % se le llama nivel de confianza.

a) Intervalo de confianza para la proporcin poblacional.

Si p representa la proporcin de xitos en una muestra aleatoria de tamao n
suficientemente grande y q=1-p, entonces un intervalo de confianza aproximado
para la proporcin poblacional p al nivel de confianza del 100(1-)% viene dado
por:
(

+
n
q p
z p
n
q p
z p

,

2 2
o o


en donde
/ 2
z
o
es tal que
P[Z>
/ 2
z
o
]=
2
o

y la variable aleatoria Z sigue una distribucin N(0,1).

b) Intervalo de confianza para la media de una poblacin normal, siendo
conocida

Supongamos que tenemos una muestra aleatoria de n observaciones de una
distribucin N(, ). Si es conocida, y la media muestral observada es x ,
entonces el intervalo de confianza para la media poblacional , al nivel de
confianza del 100(1-)% viene dado por:


/ 2 / 2
, x z x z
n n
o o
o o (
+
(


donde
/ 2
z
o
es tal que

/ 2
( )
2
P Z z
o
o
> =
y la variable aleatoria ZN(0,1).




c) Intervalo de confianza para la media de una poblacin normal, siendo
desconocida y n<30.

Supongamos que tenemos una muestra aleatoria de n<30 observaciones de una
distribucin N(,). Si es desconocida, y la media y la desviacin tpica muestral
observadas son x y s, respectivamente, entonces el intervalo de confianza para
la media poblacional , al nivel de confianza del 100(1-)% viene dado por:

/ 2 / 2
,
s s
x t x t
n n
o o
(
+
(
(


donde
/ 2
t
o
es tal que
| |
1 / 2
2
n
P t t
o
o

> =
y la variable
1 n
t

sigue una distribucin t-Student con n-1 grados de libertad.


d) Intervalo de confianza para la varianza de una poblacin normal.
Supongamos una muestra aleatoria de n observaciones de una distribucin
N(,). Si es desconocida y la varianza muestral observada es
2
s entonces el
intervalo de confianza para la varianza poblacional
2
o al nivel de confianza del
100(1-)% viene dado por:
(
(



2
2 / 1 , 1
2
2 / , 1
) 1 (
,
) 1 (
o o
_ _
n n
s n s n


donde
2
1,1 / 2 n o
_

es tal que:

2 2
1 1,1 / 2
2
n n
P
o
o
_ _

( s =


y
2
1, / 2 n o
_

es tal que:

2 2
1 1, / 2
1
2
n n
P
o
o
_ _

( s =



y la variable aleatoria
2
1 n
_

sigue una distribucin
2
_ de Pearson con n-1
grados de libertad.


e) Intervalo de confianza para la diferencia de medias en poblaciones
normales independientes

Supongamos dos muestras independientes de tamao
x
n y
y
n procedentes
de poblaciones normales.
( ) ,
x x
N o y
( )
,
y y
N o , respectivamente. Si las medias para las muestras
observadas son x e y , entonces un intervalo de confianza, al nivel de confianza
del 100(1-)%, para las diferencias de medias poblacionales
x y
viene dado
por:
(
(

+ + +
y
y
x
x
y
y
x
x
n n
z y x
n n
z y x
2
2
2 /
2
2
2 /
) ( , ) (
o
o
o
o
o o



en donde
/ 2
z
o
es el nmero tal que: | |
/ 2
2
P Z z
o
o
> = y la variable aleatoria Z sigue
una N(0, 1).



INTERVALO DE CONFIANZA DE LA PROPORCIN
Una proporcin es: La fraccin, razn o porcentaje que indica la parte de la
muestra o la poblacin que tiene un riesgo de inters en particular.
La proporcin de la poblacin se identifica con por tanto, se refiere al
porcentaje de xitos en la poblacin.
A fin de desarrollar un intervalo de confianza para una proporcin, se necesita
cumplir con las suposiciones siguientes:
1) Se cumple con las condiciones binomiales
2) La informacin de la muestra es el resultado de los conteos.
3) Slo hay dos resultados posibles, por lo general uno es considerado como
xito y el otro como fracaso.
4) La probabilidad de xito sigue siendo la misma de un intento al otro.
5) Los ensayos son independientes. Esto significa que el resultado de un
ensayo noafecta el resultado de otro.
Los valores n y n(1 ) deben ser mayores o iguales a 5. Esta condicin nos
permite recurrir al teorema del lmite central y utilizar la distribucin normal
estndar, es decir, z, para completar un intervalo de confianza.

Ejemplo:
Una encuesta reciente indic que 92 de cada 100 entrevistados estuvieron a favor
del uso continuo de la hora de verano para ahorrar energa. La proporcin de la
muestra es 92/100, o 0.92, o 92% Si p representa la proporcin de la muestra, X
el nmero de xitos y n el nmero de elementos en la muestra, podemos
determinar la proporcin de la muestra cmo sigue.

x

P= ______

n

El desarrollo de un estimador puntual para la proporcin de la poblacin y un
intervalo de confianza para la proporcin de la poblacin es similar hacerlo para
una media. Para ilustrar El seor John Pedraza es candidato para representar en
el congreso al tercer distrito de Nebraska. De una muestra aleatoria de 100
votantes en el distrito, 60 indican que planean votar por l en las prximas
elecciones. La proporcin es de 0.60, pero la proporcin de la poblacin e
desconoce. Es decir, sabemos cul es la proporcin de votantes en la poblacin
que van a votar por el seor Pedraza. El valor de la muestra, 0.60 es el mejor
estimador que tenemos del parmetro de la poblacin desconocido. Entonces sea
p, que es 0.60, un estimador de , que desconocemos. A fin de desarrollar el
intervalo de confianza de una proporcin, cambiamos la formula.

Intervalo de confianza para la proporcin de una poblacin.

El termino
p
es el error estndar de la proporcin. Mide la variabilidad en la
distribucin de muestreo de la proporcin de la muestra.

Error estndar de la proporcin de la muestra


Asi podemos construir el intervalo de confianza para la proporcin de una
poblacin a partir de la formula siguiente.

Intervalo de confianza para la proporcin de una poblacin:




Ejemplo desarrollado:
El sindicato que representa a Kitty Corporation of San Francisco considera la
propuesta de fusin con Temasters Union. Segn el reglamento del sindicato Kitty
Corporation, por lo menos tres cuartas partes de sus miembros deben aprobar
cualquier fusin. Una muestra aleatoria de 2000 miembros actuales de Kitty
Corporation revela que 1600 planean votar a favor de la propuesta. Cul es el
estimador de la proporcin de la poblacin? Desarrolle un intervalo de confianza
del 95% para la proporcin de la poblacin. Basando su decisin en esta
informacin de la muestra, puede llegar a la conclusin de que la proporcin
necesaria de miembros de Kitty Corporation estn a favor de la fusin Por qu?
Solucin:
Primero, calcule la proporcin de la muestra a partir de la frmula de Intervalo de
confianza para la proporcin de una poblacin. Es 0.80, que se calcul como
sigue.
x

P= ______

n

1600

P= ________ =
0.80
2000
Por tanto, calculamos que 80% de la poblacin est a favor de la propuesta de
fusin. Determinamos el intervalo de confianza del 95% utilizando la frmula del
intervalo de confianza para la proporcin de una poblacin. El valor de z que
corresponde al nivel de confianza del 95% es 1.96



Los puntos extremos del intervalo de confianza son 0.782 y 0.818. El punto
extremo ms bajo es mayor que 0.75. De modo que llegamos a la conclusin de
que es probable que se apruebe la propuesta de la fusin porque el estimador de
intervalo incluye valores mayores al 75% de los miembros del sindicato.

FACTOR DE UNA POBLACIN FINITA
Una poblacin que tiene un lmite superior fijo es finita. Por ejemplo, hay 21376
estudiantes inscritos en la Eastern Illinois University, hay 40 empleados en Space
Sprockets, ayer Daimler Chrysler arm 917 jeep Wranglers en la planta de Alexis
Avenue o ayer haba 65 pacientes programados para ciruga en el St. Rose
Memorial Hospital en Sarasota. Una poblacin finita puede ser pequea; pueden
ser todos los estudiantes registrados para una clase. Pero tambin puede ser
grande, como todas las personas de la tercera edad que viven en florida.
Para una poblacin finita, donde el nmero total de objetos es N y el tamao de la
muestra es n, se realiza el ajuste siguiente a los errores estndar de las medias y
proporciones de la muestra:
Error estndar de la media de las muestras, utilizando el factor de correccin
para poblaciones finitas.

Error estndar de las proporciones de las muestras, utilizando el factor de
correccin para poblaciones finitas.

Por qu es necesario aplicar un factor y que efecto tiene? Lgicamente, si la
muestra es un porcentaje significativo de la poblacin, el estimador es ms
preciso. Observe el efecto del trmino (N n)(N 1). Suponga que la poblacin es
1000 y la muestra es 100. Entonces, esta razn es (1000 100)/(1000 1), o
900/999. La raz cuadrada da el factor de correccin 0.9492. Si multiplicamos este
factor de correccin por el error estndar este ltimo se reduce alrededor de 5%
(1 0.9492 = 0.0508). Esta reduccin en el tamao del error estndar produce un
rango de valores ms pequeo al estimar la media de la poblacin o la proporcin
de la poblacin. Si la muestra es 200, el factor de correccin es 0.8949, que
significa que el error estndar se redujo ms de 10%. La regla comn es que si la
razn de n/N es menor que 0.05, se ignora el factor de correccin.

Ejemplo desarrollado:
En Scandia, Pennylvania, ay 250 familias. Una encuesta entre 40 familias revela
que la contribucin media anual a la iglesia es de $450, con una desviacin
estndar de $75. Elabore un intervalo de confianza del 90%para la contribucin
media anual.

Solucin:
Primero, observe que la poblacin es finita, Es decir, hay un lmite para el nmero
de personas en Scandia. En segundo lugar, observe que la muestra constituye
ms de 5% de la poblacin; es decir, n/N = 40/250 = 0.16. Por consiguiente,
utilizamos el factor de correccin de poblacin finita. El intervalo de confianza del
90% se construye como sigue utilizando la frmula de error estndar de la media
de las muestras.






Los puntos extremos del intervalo de confianza son $432.03 y $467.97 Es
probable que la media de la poblacin se encuentre en este intervalo.








ELECCIN DE UN TAMAO APROPIADO DE LA MUESTRA

Una preocupacin que surge a menudo al disear un estudio estadstico es:
Cuntos elementos debe haber en una muestra? Si la muestra es demasiado
grande, se gasta mucho dinero en recopilar la informacin. De modo similar, si la
muestra es demasiado pequea las conclusiones resultantes sern inciertas. El
tamao apropiado de la muestra depende de tres factores:
1) El nivel de confianza deseado.
2) El margen de error que el investigador va a tolerar.
3) La variabilidad en la poblacin que se estudia.

El primer factor es el nivel de confianza. Aquellos que disean el estudio
seleccionan el nivel de confianza. Los niveles de confianza de 95% y 99% son los
ms comunes, pero cualquier valor entre 0% y 100% es posible. El nivel de
confianza del 95% corresponde a un valor z de 2.58 Cuanto ms grande el nivel
de confianza seleccionado, mayor ser el tamao de la muestra correspondiente.
El segundo factor es el error admisible. El error mximo admisible, designado con
E es la cantidad que se suma y resta de la media de la muestra (o la proporcin de
la muestra) para determinar los unos extremos del intervalo de confianza. Es la
cantidad de error que las personas que realizan el estudio estn dispuestas a
tolerar. Asimismo, tiene la mitad del ancho del intervalo de confianza
correspondiente. Un error admisible bajo requiere de una muestra grande. Un
error admisible alto permite una muestra ms pequea.
El tercer factor al determinar el tamao de una muestra es la desviacin estndar
de la poblacin. Si la poblacin esta concentrada (es homognea), el tamao de la
muestra requerido ser menor. Sin embargo, tal vez sea necesario usar un
estimador para la desviacin estndar de la poblacin.

Algunas sugerencias para calcular ese estimador son:
Utilice un estudio comparativo: Emplee esta estrategia cuando haya disponible
un estimador de la dispersin de otro estudio. La informacin de ciertos
organismos estatales o federales que toman muestras regulares de la fuerza
laboral podra ser til para dar un estimado de la desviacin estndar.
Emplee una estrategia basada en el rango: Para esto necesitamos saber o
tener un estimador de los valores ms alto y ms bajo en la poblacin
Realice un estudio piloto: Este es el mtodo ms comn. Suponga que
queremos un estimado del nmero de horas a la semana que trabajan los
estudiantes inscritos en la Facultad de Negocios de la Universidad de la Salle
Bajo. Para probar la validez de nuestro cuestionario, usamos una muestra
pequea de estudiantes. A partir de esta, calculamos la desviacin estndar del
nmero de horas trabajadas y el uso de este valor para determinar el tamao
apropiado de la muestra.

Tamao de la muestra para estimar la media de la poblacin:



Donde:
n: es el tamao de la muestra.
z: es el valor normal estndar correspondiente al nivel de confianza deseado.
s: es un estimado de la desviacin estndar de la poblacin.
E: es el error mximo admisible.

El resultado de este clculo no siempre es un nmero entero. Cuando el resultado
no es un nmero entero, la prctica comn consiste en redondear cualquier
resultado fraccionario. Por ejemplo 201.22 se redondea a 202.






Ejemplo desarrollado:
Un estudiante de administracin publica quiere determinar la cantidad media que
los miembros de los consejos ciudadanos de las grandes ciudades ganan al mes
como remuneracin. El error al estimar la media debe ser menor de $100, con un
intervalo de confianza del 95% El estudiante encontr un informe del
departamento del trabajo en el que la desviacin estndar se calcula en $1000
Cul es el tamao de la muestra requerido?

Solucin:
El error mximo admisible, E, es $100. El valor de z para un nivel de confianza del
95% es 1.96 y el estimador de la desviacin estndar es $ 1000. Si sustituimos
estos valores en la frmula de tamao de la muestra para estimar la media de la
poblacin, el tamao de la muestra requerida es:

El valor calculado de 384.16 se redondea a 385. Para cubrir las especificaciones,
se requiere de una muestra de 385. Si el estudiante quiere aumentar el nivel de
confianza, por ejemplo al 99%, necesitar una muestra ms grande. El valor de z
corresponde al nivel de confianza del 99%, es 2.58.



Recomendamos una muestra de 666. Observe el grado en que el cambio en el
nivel de confianza afect el tamao de la muestra. Un incremento del 95% a 99%
en el nivel de confianza dio como resultado un aumento de 281 observaciones.
Esto podra aumentar en gran medida el costo del estudio, tanto en trminos de
tiempo como de dinero. De ah que el nivel de confianza se deba considerar con
detenimiento.


























Bibliografa:

1) Lind, D.; Mason, R.; Marchal, W. (2001): Estadstica para Administracin y Economa. Ed.
Irwin McGraw-Hill.F.

2) Kvanli, A. (2000) Introduction to Business Statistics South-Western.

3) Johnson, R. (1996): Elementary Statistics. Ed. Duxbury.

4) Levin, R.; Rubin, D. (1996): Estadstica para Administradores. Ed. Prentice Hall.

5) Farber, E. (1995): A Guide to Minitab. Ed. McGraw-Hill

6) Newbold, P. (1998): Estadstica para los Negocios y la Economa Ed. Prentice Hall

7) Anderson, Sweeney, Williams, (2001); Estadstica para Administracin y Economa. Ed. Thomson
editores.

También podría gustarte