FALSILLAS
FALSILLAS
FALSILLAS
ESTIMACIÓN DE VARIANZAS
function estima_var(n,m)
% Verificacion de las propiedades del Rango Muestral
% poblacion con distribucion normal estandar
% Entrada: n, entero, numero de elementos de cada muestra
% m, entero, numero de muestras para la prueba
% Salida: M, real, media de los rangos
% S, real, desviacion estandar de los rangos
>> estima_var(5,1000)
ans =
2.3180
ans =
0.8506
Cátedra Estadística II 1
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
(n < 5), proporciona una estimación de tan buena como s. Lo contrario sucede cuando
se incrementa el tamaño muestral.
El rango se emplea fundamentalmente en Control de Calidad.
R 280
120.378
d2 2.326
mientras que calculado directamente da:
2 21
2
( n 1) s
2
2 2
2 2
( n 1) s 2 ( n 1) s
21 2
2 2
Cátedra Estadística II 2
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
74.02 146.048
lo que supone una desigualdad, para un intervalo de confianza (1-).100%, del tipo:
s
z z
2 2 n 2
lo que lleva a:
Cátedra Estadística II 3
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
s s
z z
2 2
1 1
2 n 2 n
Hipótesis Se rechaza la
Alterna Hipótesis Nula si
2 < 2 2 < 21-
2 > 2 2 < 2
2 <> 2 2 < 21-
2 < 2
Ejemplo: El proceso de bruñido se usa para esmerilar ciertos discos de silicio al grueso
apropiado es aceptable sólo si (desviación estándar de la población de grosores de los
cubitos cortados de dichos discos) es a lo sumo 0.50 mil. Emplear el nivel de
significación de 0.05 para probar la hipótesis nula = 0.50 contra la hipótesis alterna
> 0.5 si el grosor de 15 cubitos cortados de tales discos tienen una desviación estándar
de 0.64 mil.
Cátedra Estadística II 4
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
s 0
z
0
2 n
ESTIMACIÓN DE PROPORCIONES
Cátedra Estadística II 5
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
n
b ( k n p)
2
k x1
1- Hay dos resultados posibles mutuamente excluyentes en cada ensayo. Para mayor
conveniencia estos se denominan éxito y fracaso.
2- La serie de ensayos u observaciones constituyen eventos independientes.
3- La probabilidad de éxito, designada por p, permanece constante de ensayo a ensayo.
Es decir el proceso es estacionario.
p (1 p)
x nx n x nx
b (x n p) Cn x p (1 p)
x(n x)
B(3 5 0.2) b(0 5 0.2) b(1 5 0.2) b(2 5 0.2) b(3 5 0.2)
B(3 5 0.2) 0.99328
En general:
x
k nk
B( x n p) Cn x p ( 1 p)
k0
si se quiere calcular b(3,5,0.2) se lo hace así:
Para calcular con la tabla valores de p > 0.5, se aplica la siguiente propiedad:
B(x,n,p) = 1 - B(n – x –1 , n, 1 - p)
Cátedra Estadística II 6
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Por medio de las tablas se calculan x0 y x1 para distintos valores de p, tales que
x0 sea el máximo entero de modo que:
más sencillamente, los valores correspondientes a los p del primer caso, se encuentran
restando el valor obtenido de n.
Implementando un programa Matlab como el siguiente:
function estima_prop(n,alfa)
Cátedra Estadística II 7
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
>> estima_prop(20,0.05)
A=
-1 0 1 3 5 7 9 11 14
C=
6 9 11 13 15 17 19 20 21
n 20 Tamaño de la muestra
qbinom
n p n 1 p
n qbinom
x0( p )
2 x1( p )
2
n n
Cátedra Estadística II 8
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
1
1
0.9
0.8
0.7
x0( p ) 0.6
0.5
x1( p )
0.4
0.3
0.2
0.1
0 0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0.1 p 0.9
Vale decir:
Hay gráficos de este tipo para niveles de confianza de 95 y 99% para varios
valores de n. Se emplea la proporción muestral (x/n) en lugar de x.
Cátedra Estadística II 9
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Vale decir, para el ejemplo n=20, x=10 y x/n=10/20=0.5. Con estos valores se
puede verificar lo correcto de lo realizado.
Como regla práctica para que una distribución binomial se acerque a la normal
basta con que n.p y (1-p).p sean a la vez mayores que 5. Por ejemplo, para n=200 se
puede usar la aproximación si p está entre 0.025 y 0.975. Esta es la significación de
hacer “n suficientemente grande”.
Se puede asegurar con una probabilidad 1- que se cumpla:
x np
z z
np ( 1 p)
2 2
para evitar cálculos complicados, se hace una aproximación más al sustituir x/n por p en
el denominador del segundo miembro:
x x x x
1 1
x n n x n n
z p z
n n n n
2 2
lo que permite lograr este intervalo de confianza para p en muestras de gran tamaño, con
un nivel de confianza (1-).100%.
Ejemplo: si x=36 de n=100 entrevistados están familiarizados con los incentivos en los
impuestos que se ofrecen por instalar ciertos dispositivos para ahorrar energía. Construir
un intervalo de confianza de 95% para la correspondiente proporción real.
x/p=36/100 z/2=1.96
0.36 ( 1 0.36)
1.96 0.094
100
0.36 0.094 p 0.36 0.094 0.266 p 0.454
Gráficamente:
Cátedra Estadística II 10
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
La magnitud del error cometido cuando se usa x/n como un estimador de p está
dada por |x/n – p|. En base a la distribución normal, se puede asegurar con probabilidad
1- que se cumplirá:
x p ( 1 p)
p z
n n
2
es decir que el error será a lo sumo:
p ( 1 p )
z
n
2 x p ( 1 p)
p z a p, esto produce el Error Máximo de Estimación:
Con x/n sustituyendo
n n
2
x x
1
n n
E z
n
2
Ejemplo: En una encuesta levantada en una gran ciudad, 136 de 400 personas
respondieron afirmativamente a la pregunta de si el sistema de transporte público es
adecuado. Con una confianza del 99% ¿Qué se puede decir acerca del error máximo si
x/n =136/400=0.34 se emplea como una estimación de la correspondiente población
real?.
x x
1
n n 0.34 ( 1 0.34)
E z 2.575 0.061
n 400
2
con lo que se puede construir el intervalo:
Cátedra Estadística II 11
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
function estima_prop1(n,alfa)
% Tabla de valores de x0 para determinacion de intervalo
% de confianza en proporciones
%
% Entrada: n, entero, tamaño de la muestra
% m, rel, nivel de significancia
% Salida: C, juego de valores de x1
% A, juego de valores de x0
i=1;
for p=0.1:0.1:0.99,
B=0;
if p<=0.5,
k=0;
while B<alfa/2,
n1=n;m1=k;F=1;
while m1>=1
F=F*n1/m1;m1=m1-1;n1=n1-1;
end
B=B+F*p^k*(1-p)^(n-k); k=k+1;
end
A(i)=k-2; i=i+1;
end
if p>0.5,
k=0;
while B<alfa/2,
n1=n;m1=k;F=1;
while m1>=1
F=F*n1/m1;m1=m1-1;n1=n1-1;
end
k1=n-k;p1=1-p;
B=B+F*p1^k1*(1-p1)^(n-k1);
k=k+1;
end
A(i)=k-2; i=i+1;
end
end
A
for k=1:i-1,C(k)=n-A(i-k);end
C
k=0.1:0.1:0.9;plot(k,A,k,C)
Ejecutando:
>> estima_prop1(400,0.01)
A=
24 59 96 134 173 214 255 298 343
C=
57 102 145 186 227 266 304 341 376
Cátedra Estadística II 12
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
a)
2
z
2
1 1 1.96
2
n 600.25
4 E 4 0.04
b)
Cátedra Estadística II 13
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
2
z
2
p ( 1 p)
2
1.96
0.127 ( 1 0.127)
n 266.201
E 0.04
Esto ilustra cómo conociendo alguna información auxiliar de p, se puede reducir
en gran medida el tamaño de la muestra requerida.
Cuando p es próximo a 0 (alto confiabilidad) y cuando p es la probabilidad de
fracaso, se necesitan intervalos de confianza unilaterales para p chico y n grande, la
distribución de Poisson se aproxima a la binomial. Se puede mostrar que:
Ejemplo: Si hay x=4 fallas en n=2000 partes utilizadas continuamente durante un mes,
construir un intervalo unilateral con un nivel de confianza del 99% para la probabilidad
de que una de tales partes falle en las condiciones establecidas.
x np0
z
npo 1 p0
Cátedra Estadística II 14
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
4 – Cálculos:
5 – Dado que –1.414 > z0.05 (z = -1.645) no se Rechaza la Hipótesis Nula. o hay
suficiente evidencia que la clase determinada de detonador no cumpla con las normas.
p1 = p2 = … = pk = p
contra la Hipótesis Alterna de que no lo sean. Bastaría con que uno de ellos fuese
significativamente distinto para que la Hipótesis Nula no se cumpla.
Para aplicar esta técnica se necesitan muestras aleatorias de tamaño n1, n2,.., nk
de las k poblaciones. Luego, si los números correspondientes de éxitos son x 1, x2,.., xk
respectivamente, la prueba que se utiliza se fundamenta en el hecho que:
en consecuencia:
k
xi nipi 2
2
nipi 1 pi
i 1
ya que la Hipótesis Nula se debe rechazar si las diferencias entre las xi y las son
grandes, la región crítica es 2 > 2 y el número de grados de libertad es k-1. La
pérdida de un grado de libertada surge de reemplazar a p por su estimación .
Cátedra Estadística II 15
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
k o1 j e1 j 2 o2 j e2 j 2
2
e 1 j e 2 j
j 1
2 k
oi j ei j 2
2
ei j
i 1 j 1
Cátedra Estadística II 16
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
utilizar el nivel de significación 0.05 para probar si, bajo las condiciones establecidas, la
probabilidad de desmoronamiento es la misma en los tres tipos de materiales.
e1 3 90 ( 36 24) 30
luego:
2 2 2
2 ( 41 36) ( 27 24) ( 22 30)
4.575
36 24 30
2 2 2
( 79 84) ( 53 56) ( 78 70)
84 56 70
5- Decisión: dado que 4.575 < no se Rechaza la Hipótesis Nula. Luego, la
2
Gráficamente:
Cátedra Estadística II 17
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
function hipo_prop(alfa)
obser =[41 27 22
79 53 78];
Ejecutando:
>> hipo_prop
chi =
4.5754
Verificación:
2 x1 n1 p 2 x2 n2 p 2
n1 p ( 1 p) n2 p ( 1 p)
2 2
x1 x2 x1 x2
x1 n1 x2 n2
2 n1 n2 n1 n2
n1 p ( 1 p) n2 p ( 1 p)
x1 x2 x1 n1 x1 n2 n1 x1 n1 x2 x1 n2 n1 x2
x1 n1
n1 n2 n1 n2 n1 n2
Cátedra Estadística II 18
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
2
1 1
p ( 1 p )
n1 n2
Ejemplo: Un estudio señala que 16 de 200 tractores producidos en una línea de
ensamblado requieren ajustes minuciosos y lo mismo sucede con 14 de 400 producidos
en otra línea. Con un nivel de significación de 0.01 ¿Apoya esto la afirmación de que la
segunda línea efectúa un trabajo superior?.
16 14
p 0.05
200 400
16 14
200 400
z 2.384
1 1
0.05 ( 1 0.05)
50.0
50.0
1 002
1 004
1 200 400
5. Decisión: dado que 2.384 < z se Rechaza la Hipótesis Nula. Luego, la segunda línea
z mejor que la primera
es
TABLAS r x c
Cátedra Estadística II 19
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Por sustracción o cálculo (por ejemplo: e1,3 = 112-(16.8+52.6) = 42.6, e2,3 =63.5,
e3,1 = 18.2, e3,2 =52.9, e3,3 =45.9)
2 2
2 ( 23 16.8) ( 63 45.9)
20.18
16.8 45.9
5- Decisión: dado que 20.18 > 13.277 Se Rechaza la Hipótesis Nula. Luego, existe
diferencia entre el aprovechamiento de un empleado en el programa de capacitación y
su éxito en el empleo.
Cátedra Estadística II 20
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
function hipo_rc
obser =[23 60 29
28 79 60
9 49 63];
% Prueba de Hipotesis para Tabla de Contingencia
%
% Entrada: obser, matriz con el cuadro de observaciones (externo)
% Salida: chi, estadistico chi-cuadrado
%
j=size(obser,1); %calcula numero de filas de la matriz de observaciones
k=size(obser,2); %calcula numero de columnas de la matriz de observaciones
suma_filas=sum(obser);suma_cols=sum(obser');
gt=sum(suma_filas); %gran total
for t=1:j,
for i=1:k, esper(t,i)=suma_filas(i)*suma_cols(t)/gt; end
end
chi=0;
for i=1:j,for h=1:k,
chi=chi+(obser(i,h)-esper(i,h))^2/esper(i,h);
end,end
chi
BONDAD DE AJUSTE
Cátedra Estadística II 21
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
k 3
4.6 4.6
e e 0.163
k 3
Problema I: En relación con el caso anterior, probar con un nivel de significación 0.05 si
los datos pueden considerarse como una variable aleatoria que tiene distribución de
Poisson con =4.6.
1. Hipótesis Nula: variable aleatoria que tiene distribución de Poisson con =4.6.
Hipótesis Alternativa: No la tiene.
2. Nivel de significancia: =0.05. 2 = 2 = 15.507 con =k-m-1=10-1-1=8
3. Criterio: Se rechaza la Hipótesis Nula si 2 > 15.507
4. Cálculos:
2 2
2 ( 18 22.4) ( 47 42.8)
6.749
22.4 42.8
5- Decisión: dado que 6.749 < 15.507 No se Rechaza la Hipótesis Nula. Luego, la
distribución de Poisson =4.6 proporciona un buen ajuste.
Problema II: La siguiente tabla indica la cifra promedio de accidentes por mil horas-
hombre de la muestra de 50 firmas , obtenidas de una industria específica. Probar la
hipótesis nula de que las frecuencias observadas en esta muestra siguen una distribución
normal, utilizando un nivel de significancia de 0.05.
Cátedra Estadística II 22
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Total 50
Cifra promedio de acciden- fronteras de clase (en Probabilidad de estar en Frecuencia esperada
tes por mil horas-hombre unidades normales cada categoría =50.p
(fronteras de clase) estándar)
1.45 – 1.75 -2.07 a –1.35 0.07 3.5
1.75 – 2.05 -1.36 a –0.64 0.17 8.5
2.05 – 2.35 -0.64 a 0.07 0.27 13.5
2.35 – 2.65 0.07 a 078 0.26 13.0
2.65 – 2.95 0.78 a 1.50 0.15 7.5
2.95 – 3.25 1.50 a 2.21 0.05 2.5
5- Decisión: dado que 2.40 < 3.841 No se Rechaza la Hipótesis Nula. Luego, la
distribución Normal proporciona un buen ajuste.
Cátedra Estadística II 23