Estimacion

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 5

ESTIMACION

Cuando queremos estudiar una característica de una población, esa característica que queremos
estudiar estará disponible en una muestra. La característica de la población puede estar
representada por una variable aleatoria, en este caso no se necesita contar con una muestra, ya que
a través de la distribución de la variable tendríamos la información que buscamos, pero no siempre
es el caso, regularmente ocurre que la información de la variable en estudio es parcial o más aún
desconocido. Podemos admitir por ejemplo que el promedio de notas de los estudiantes de una
universidad tiene una distribución normal, pero desconocemos los parámetros que lo caracterizan
como es la media o la varianza; en otros casos podemos tener una idea de la media y varianza, pero
desconocemos la forma de la gráfica de la función de densidad, etc. Entonces es necesario inferir
información acerca de una población a partir de muestras obtenidas de ellas. Estos estudios se
conocen como inferencia estadística.
DEFINICION 1 La estimación estadística consiste en utilizar datos muestrales para determinar los
valores de parámetros desconocidos de una población
DEFINICION 2 un estadístico utilizado para aproximar un parámetro de la población se denomina
estimador del parámetro. El numero obtenido cuando se evalúa el estimador para una muestra en
particular, se denomina una estimación del parámetro
Es decir, un estimador es un procedimiento expresado a manera de regla o de formula por medio de
la cual se obtiene un valor numérico denominado estimación
ESTIMACIONES INSESGADAS- ESTIMACIONES EFICIENTES
Un estimador debe estar próximo en algún sentido al valor verdadero del parámetro desconocido
DEFINICION 3 El estimador puntual θ^ es un estimador iinsesgado para el parámetro θ, si E(θ^ )=θ
Es decir, si la media de la distribución muestral de un estadístico es igual al parámetro poblacional
correspondiente se dice que es un estimador insesgado del parámetro, en caso contrario se dice
estimador sesgado
Si la distribución muestral de dos estadísticos tiene la misma media (o valor esperado) entonces al
estadístico que tiene la menor varianza se le llama estimador eficiente del parámetro
correspondiente, y al otro se le llama estimador ineficiente. (Murray R. Spiegel)
ESTIMACIONES PUNTUALES Y ESTIMACIONES INTERVALICAS
La estimación de un parámetro puede adoptar la forma de un solo punto, es decir la estimación de
un valor único de un parámetro de la población o la forma de un intervalo, en este caso la estimación
incluye un intervalo de valores posibles en la que se considera que esta comprendido el valor
verdadero del parámetro de la población. El primero se llama estimación puntual y el segundo
estimación por intervalos de confianza
DEFINICION 4 una estimación puntual de algún parámetro θ de la población es un valor numérico θ^
de la estadística
DENINICION 5 un intervalo estimador es un intervalo aleatorio, intervalo cuyos puntos extremos a, b
son estadísticos
Es decir, queremos proponer un intervalo donde se encontrará el parámetro a estimar con una
probabilidad de acierto alta al valor de esta probabilidad la representamos por 1-α, y la llamaremos
nivel de confianza. A mayor valor de 1-α más probabilidad de acierto es nuestra estimación, por
tanto, eso implica que α tendrá que ser pequeño (próximo a cero). Por ejemplo, un intervalo de
confianza para la media poblacional µ del 95% es un intervalo tal que P(a≤µ≤b) ≈ 0.95
EJEMPLO 1 En obtener la medición de cierta distancia se obtuvo y = 23.5, entonces la estimación
es puntual. Si decimos que la distancia es y= 23.5±0.04, se da una estimación por intervalo, en este
último diríamos que la distancia esta entre 23.54 y 23.46
EJEMPLO 2 supongamos que se toma una muestra aleatoria de tamaño “n=10” de una población
normal y se obtiene los datos: 12.8, 9.4, 8.7, 11.6, 13.1, 9.8, 14.1, 8.5, 12.1, 10.3; entonces la media
muestral ā= 11.04 es la estimación puntual de µ
EJERCICIO 1 supongamos que se toma una muestra aleatoria de tamaño n=10 de una población
normal y se obtienen los datos: 12.08, 9.4, 8.7, 11.6, 13.1, 9.8, 14.1, 8.5, 12.1, 10.3, obtener
estimaciones, puntual e interválica para la media
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL: µ (σ CONOCIDA)
x́−μ
z=
De la distribución muestral tenemos σ que sigue una distribución normal estandarizada,
√n
σ σ
despejando µ: x́−z 0 ≤ μ ≤ x́ + z 0 , que es el intervalo de confianza considerando dos colas,
√n √n
también se considera intervalos de confianza de otras formas, con una cola puede ser a la izquierda
o la derecha
EJEMPLO 3 Un científico interesado en vigilar contaminantes químicos en alimentos y por lo tanto,
la acumulación de contaminantes en la dieta humana, selecciono una muestra aleatoria de n=50
adultos hombres. Se encontró que el promedio de ingesta diaria de productos lácteos fue de x́=756
gramos por día, con una desviación estándar de 35 gramos por día. Use esta información muestral
para construir un intervalo de confianza del 95% para la ingesta diaria media de productos lácteos
para hombres
Solución: Como n=50 se considera la distribución normal con media µ y desviación estándar σ x́
El intervalo de confianza del 95% es [746.30,765.70]
INTERVALO DE CONFIANZA PARA LA MEDIA CON VARIANZA DESCONOCIDA (MUESTRA
PEQUEÑA)
Sea X una variable aleatoria con distribución aproximadamente normal con media µ y varianza σ2
(desconocida), en este caso usamos la distribución muestral de la variable aleatoria t-Student:
x́−μ
T=
s , con n-1 grados de libertad. El intervalo con coeficiente de confianza β=1-α, para µ es:
√n
s s
⟨ x́−t α ( n−1 )
2 √n
, x́+ t α /2 (n−1)
√n ⟩
EJEMPLO 4 Durante los 12 meses pasados el volumen diario de ventas de un restaurante fue de 20
000 soles. El gerente piensa que los próximos 25 días críticos con respecto al volumen de ventas
normal debido a las medidas económicas tomadas por el gobierno. Al finalizar los 25 días, el
volumen de ventas promedio y su desviación estándar fueron de 19 000 soles y 2 000 soles
respectivamente. Supóngase que el volumen de ventas es una variable aleatoria con distribución
normal. El gerente del restaurante, ¿tendría alguna razón para creer, con base a este resultado que
hubo una disminución en el volumen de ventas promedio diario?

Solución: tenemos en este caso que n=25, es decir muestra pequeña, según los datos
x́=19 000 y s=2 000.

β=1-α=95%, α/2=2.5% y tα/2 con 24 grados de libertar en la tabla es 2.064, luego el intervalo de

confianza resulta 19000−2.064 ⟨ ( 2000


√n ) ,19000+ 2.064 (
2000
√ n )⟩
= ⟨ 18174.4,19825.6 ⟩

podríamos concluir que hubo una disminución en el volumen de ventas promedio diario en el
restaurante

INTERVALOS DE CONFINZA PARA LA DIFERENCIA DE DOS MEDIAS (σ 12 y σ 22 CONOCIDAS)

Si x́ e ý son las medias de dos muestras aleatorias independientes de tamaño n y m, extraídas de


dos poblaciones distribuidas con medias µ1 y µ2 y varianzas σ 12 y σ 22 respectivamente, entonces el
intervalo de confianza 1000(1-α)% para la diferencia de medias µ 1 y µ2 es:

[ ( x́− ý )−z 0
√ σ 21 σ 22
n m √ ]
+ , ( x́− ý ) + z 0
σ 21 σ 22
n m
+ . Donde z0 es tal que P(z≤z0) = 1/2(1+β)

EJEMPLO 5 Un consumidor de cierto producto quiere aplicar la técnica de estimación estadística


para decidir si compra la marca A o la marca B del producto. Para esto va a estimar la diferencia
entre los tiempos de vida promedio de las dos marcas del producto. Si dos muestras aleatorias
independientes de 10 unidades de cada marca llevados a un laboratorio han dado las medias de vida
útil respectivamente de 1,230 horas y 1,190 hors. ¿es acertada la decisión del consumidor si decide
adquirir la marca A? suponga que las dos poblaciones tienen distribución normal con desviaciones
estándar de 120 y 60 horas.
Solución: considerando un nivel de confianza del 95%, tenemos x́ 1− x´2=1230-1190=40
σ 21 σ 22 2 2

√ + =
n1 n2 √
(120) (60)
10
+
10
=42.4264 , z0 = 1.96 . luego:

[ 40−1.96 ( 42.4264 ) , 40+1.96(42.4264)]=[ 40−83.1557,40+83.1557 ] =[−43.156,123 .156 ]


Como µ1 - µ2=0está en el intervalo, podemos concluir que µ1 = µ2, por tanto, el gerente de compras
puede adquirir cualquiera de las dos marcas
INTERVALO DE CONFIANZA PARA UNA PROPORCION
En este caso tenemos una población binomial y el parámetro a estimar es la proporción poblacional
^p −P PQ
P, recordando la distribución muestral de proporciones tenemos que
z=
PQ √
→ P= ^p ∓ z α / 2
n es

un intervalo de confianza del 100(1-α)% de dos colas


√ n

EJEMPLO 6 En un estudio sobre las razones por lo que los alumnos son suspendidos en el colegio,
un investigador tomo una muestra de 200 estudiantes de una población de 1500 que habían sido
suspendidos- de los 200 estudiantes suspendidos que fueron entrevistados 140 dijeron que habían
fallado debido a dificultades económicas en su familia. El investigador quería construir una
estimación del intervalo de confianza del 95% para la verdadera proporción de estudiantes que
habían fallado por esta razón
140
Solución: La estimación puntual de P consideramos ^p= =0.70 , resultando [ 0.64,0.76 ]
200
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE DOS PROPPRCIONES

p1 q^1 ^
^ p q^
Para un nivel de confianza del 95%, tenemos: ^
p1 − ^
p2 ± z α /2
√ n1
+ 2 2
n2

EJERCICIO 2 Una muestra aleatoria de 300 funcionarios reveló que el 75% ve regularmente un
determinado programa de televisión. De otra muestra aleatoria de 200 funcionarios, el 66%
manifestó que veían el programa regularmente. Construir el intervalo de confianza del 95% para la
diferencia entre las dos proporciones poblacionales
INTERVALOS DE CONFIANZA PARA LA VARIAZA

(xi − x́)2
Si S2= ∑ es la varianza de una muestra recogida al azar de tamaño “n” tomada de una
n−1
(n−1) S2
población normalmente distribuida con varianza σ2, la razón sigue una distribución Chi-
σ2
cuadrad con n-1 grados de libertad (gl), utilizando este hecho en la construcción de intervalos de
confianza para la varianza poblacional tenemos:

(n−1)S 20 2
2 (n−1) S0
2
≤σ ≤ 2 con 100(1-α)% de confianza
χ 1−α / 2 ,n−1 χ α /2 , n−1

EJEMPLO 7 Durante el mal tiempo invernal, se utiliza sal para quitar el hielo de las carreteras. Para
aproximar la cantidad de sal que se está introduciendo en el medio por esta causa, se realizó un
estudio. Se obtuvieron las siguientes observaciones sobre las variables aleatorias X, número total de
toneladas métricas de sal utilizadas sobre las carreteras por semana, en distritos aleatoriamente
seleccionados a lo largo de la región: 3.900, 3.875, 3.820, 3.860, 3.840, 3.852, 3.800, 3.825, 3.790,
suponga que X está normalmente distribuida; establecer un intervalo de confianza para σ2 del 90%
INTERVALOS DE CONFIANZA PARA LA RAZON ENTRE DOS VARIANZAS POBLACIONALES

S 21 σ 21
La razón entre dos varianzas muestrales 2 proporciona un estimador puntual de 2 que es la razón
S2 σ2
entre dos varianzas poblacionales. Se usa cuando tenemos interés en averiguar las magnitudes
comparativas de dos varianzas. Si dos varianzas de población son iguales entonces la razón de sus
varianzas es 1. Si la razón entre dos varianzas es diferente a 1, podemos buscar intervalos de
confianza para razón de varianzas utilizando la distribución F, entre dos poblaciones normalmente
distribuidos, en este caso
S 21
σ 21
sigue una distribución F con n1-1 y n2-1 grados de libertad y el intervalo de confianza esta
S 22
σ 22
expresada de la

S21 S21
Forma: S22σ 21 S22 para 100(1-α)%
≤ ≤
F 1−α /2 σ 22 F α /2

EJERCICIO 3 Las estaturas (en centímetros) de 25 niñas de 12 años de edad arrojaron una varianza
de 64 cm2. Para una muestra de 21 muchachos de 12 años de edad, la varianza de sus estaturas
fue de 36 cm2. Construir el intervalo de confianza del 95% para la razón entre las varianzas
poblacionales

También podría gustarte