Unidad 14 - Teoría de La Decision Estadística
Unidad 14 - Teoría de La Decision Estadística
Unidad 14 - Teoría de La Decision Estadística
Para tomar decisiones conviene hacer determinados supuestos acerca de las poblaciones
que se estudian. Tales supuestos que son los supuestos formulados respecto del valor de
algún parámetro, que pueden ser o no ciertos, se llaman Hipótesis Estadísticas y, en general,
lo son sobre las distribuciones de probabilidad de las poblaciones.
El procedimiento para probar una hipótesis comprende el uso de datos de una muestra
para probar los supuestos representado por H0 y H1
Cuando vimos las distribuciones de muestreo, dijimos que, en general, una media mues-
tral diferirá en valor de la media poblacional. Si el valor observado de un estadístico muestral,
como la media muestral, se acerca al valor paramétrico supuesto y sólo difiere en una cantidad
que cabría esperar del muestreo aleatorio, el valor hipotético no se rechaza. Si la diferencia entre
el estadístico muestral y el parámetro poblacional fuera tal que no puede atribuirse al azar, la
hipótesis se rechaza por inverosímil.
Pasos 1 y 2: Se debe tener cuidado al formular las hipótesis nula y alternativa para asegurar que
estén bien estructuradas, y que la conclusión de la prueba de hipótesis proporcione la informa-
ción que necesita el investigador o quien toma la decisión.
Sea 0 el valor numérico específico que se considera en las hipótesis nula y alternativa. En
general, una prueba de hipótesis referente a los valores de la media poblacional debe asumir
una de las tres formas siguientes:
H0 : x ≤ 0 H0 : x ≥ 0 H0 : x = 0
H1 : x 0 H1 : x 0 H1 : x 0
Prueba en caso de toma de decisiones: se debe elegir entre dos alternativas de ac-
ción, una asociada a H0 y la otra a H1
En el primer caso, supongamos que una empresa fabricante de cubiertas para la marca de
autos que vende la concesionaria, propone un nuevo material, que permitirá un aumento en la
duración de las cubiertas. Con el material actual las cubiertas duran en promedio 60.000 km.
Estadística I 233
Para evaluar el nuevo material se realizará un ensayo con 80 cubiertas. Observemos que la em-
presa fabricante busca pruebas para poder decir que el nuevo material aumenta la duración pro-
medio de las cubiertas. En éste caso, la hipótesis de investigación es que el nuevo material pro-
porcionará una media de duración de las cubiertas superiores a 60.000 km. Como regla general,
una hipótesis de investigación como ésta se debe formular y proponer como hipótesis alternativa.
Las hipótesis nula y alternativa en este caso son:
H0 : x ≤ 60.000 km.
H1 : x 60.000 km
Si los resultados de la muestra indican que no se puede rechazar H0, la empresa fabricante
no puede decir que el nuevo material es mejor. Quizás se deban llevar a cabo más investigacio-
nes y pruebas. Sin embargo, si los resultados de la muestra indican que se puede rechazar H0, la
empresa fabricante, puede hacer la inferencia de que la duración de las cubiertas es superior a
60.000 km. Esta conclusión cuenta con el respaldo estadístico necesario para decir que el nuevo
material aumenta la duración de las cubiertas. En estos casos se debe formular la hipótesis nula
de manera tal que su rechazo respalde la conclusión y la acción que se propone.
En el segundo caso, el gerente de ventas afirma que la nueva campaña publicitaria au-
mentó las ventas de autos más caros. Se seleccionará una muestra y se calculará el precio prome-
dio para investigar la afirmación del gerente de ventas. En este tipo de pruebas de hipótesis se
supone, por lo general, que la afirmación del gerente de ventas es verdadera, a menos que la evi-
dencia parezca demostrar lo contrario. Las hipótesis nulas y alternativas serían las siguientes:
H0 : x ≥ $ 90.000
H1 : x $ 90.000
En el tercer caso, el proveedor de aceite del taller, debe controlar que las botellas de
aceite que envasa tienen en promedio 1,5 lts. Periódicamente se selecciona una muestra de bote-
llas, que se controlan para determinar si el proceso de envasado funciona correctamente. En este
caso se formulan las siguientes hipótesis:
Si los resultados indican que no se puede rechazar H0 esto revelaría que el proceso de en-
vasado funciona correctamente. Sin embargo, si los resultados de la muestra indican que se debe
Estadística I 234
rechazar H0 la conclusión sería que falta o sobra aceite, se debe parar la línea de producción y
hacer los ajustes necesarios para que el llenado sea correcto.
Paso 3: Las hipótesis nula y alternativa son supuestos sobre la población que compiten entre sí.
O la hipótesis nula es verdadera, ó lo es la hipótesis alternativa, pero no ambas. En una situación
ideal, el procedimiento de prueba de hipótesis debe concluir no rechazando la hipótesis nula
cuando es verdadera y rechazándola cuando es falsa. Pero no siempre son posibles las conclusio-
nes correctas. Como las pruebas de hipótesis se basan en información de muestras, debemos con-
siderar la posibilidad de error.
Determinar que es “muy cercano” y que es “muy diferente” sería un proceso arbitrario sin
definiciones clara. La metodología de prueba debe permitir evaluar las diferencias, además de
cuantificar el proceso de toma de decisiones mediante el cálculo de la probabilidad de obtener un
resultado muestral dado si la hipótesis nula resulta verdadera. Se calcula esta probabilidad de-
terminando la distribución correspondiente al estadístico muestral y luego se calcula el estadísti-
co de prueba específico, en base al resultado muestral obtenido. La distribución muestral del
estadístico suele seguir una distribución estadística conocida, como la distribución normal estan-
darizada, la distribución t o la distribución , éstas se utilizan como ayuda para determinar si la
hipótesis nula es cierta.
otras palabras, si se encuentra que los resultados observados en una muestra al azar difieren mar-
cadamente de aquellos que cabría esperar con la hipótesis y la variación propia del muestreo, se
diría que las diferencias observadas son significativas y se estaría en condiciones de rechazar la
hipótesis. Habitualmente se trabaja con niveles de significación del 1% y del 5%.
La fórmula para determinar el tamaño de muestra mínimo requerido para una prueba de
hipótesis de la media, usando la distribución normal es:
n
z 0 z1 2 2
0 1
El valor z0 es el valor crítico de z que surge del nivel de significación especificado (),
mientras que z1 es el valor respecto de la probabilidad del error de tipo II asignada (). El valor
de debe conocerse o utilizar su estimador. Esta fórmula puede emplearse lo mismo para prue-
bas unilaterales que bilaterales. El único valor que difiere en estos dos tipos de pruebas es el va-
lor de z0 utilizado
Paso 5: Una vez definidas las hipótesis nula y alternativa, y el tamaño de la muestra se puede
establecer la distribución a utilizar: normal, t- student ó chi cuadrado.
Paso 6: Para poder establecer un método objetivo, que permita comparar los resultados muestra-
les con la hipótesis nula, el “nivel de significación”, se representa como un área (como toda
probabilidad en una función de densidad), que se ubica a la derecha, a la izquierda o a ambos
lados (en este caso, con la mitad de en cada lado) según como se haya definido la Hipótesis
alternativa. Esta probabilidad permite encontrar, en la tabla correspondiente (normal, t de Stu-
dent o chi cuadrado), un valor de la variable (z, t ó ) denominado “valor crítico” simbolizado
con zc (o eventualmente tc ó c), que divide al eje de las abscisas en dos zonas: la “zona de re-
chazo”, que se extiende por debajo de , y la “zona de no rechazo”, que se extiende a lo largo
del resto del eje.
Paso 7: Este paso está reservado a la efectiva realización de la investigación muestral. Es decir
que en este momento es cuando se realiza el estudio tendiente a obtener los valores muestrales y
calcular los estadísticos.
Paso 8: Se debe determinar la técnica a utilizar para determinar si el estadístico muestral ha caí-
do en la región de rechazo o en la de no rechazo, es decir, el modo en que el estadístico de la
muestra se va a comparar con el parámetro hipotético. El estadístico de prueba puede ser el es-
tadístico muestral (el estimador insesgado del parámetro que se prueba) o una versión transfor-
mada de ese estadístico muestral.
Estadística I 236
Estadístico – Parámetro
Error estándar del estimador
El procedimiento para efectuar esta comparación, consiste en construir una variable es-
tandarizada zi cuando n > 30, porque al estar trabajando con una muestra grande las estadísti-
cas tienen Distribución Normal, en cuyo numerador aparece, precisamente, la diferencia entre x
y 0, o entre S2x y 2 x es decir:
x 0 S
z1 z x x
Sx 1 S
x
n 2n
El valor del estadístico de prueba. se compara con el valor crítico en la distribución apro-
piada, para determinar si cae en la zona de rechazo o en la de no rechazo.
si z1 >zc z1 cae en la “zona de rechazo” y se considera que las diferencias en-
tre z1 y zc son significativas Rechazo la Hipótesis nula
si z1≤zc z1 cae en la “zona de no rechazo” y se considera que las diferencias
entre z1 y zc no son significativas No Rechazo la Hipótesis nula.
Paso 10: Una vez tomada la decisión, se deben expresar sus consecuencias en términos del pro-
blema particular.
Retomemos el primer caso, supongamos que una empresa fabricante de cubiertas para la
marca de autos que vende la concesionaria, propone un nuevo material, que permitirá un aumen-
to en la duración de las cubiertas. Con el material actual las cubiertas duran en promedio 60.000
km. Para evaluar el nuevo material se realizará un ensayo con 80 cubiertas. Observemos que la
empresa fabricante busca pruebas para poder decir que el nuevo material aumenta la duración
promedio de las cubiertas. En éste caso, la hipótesis de investigación es que el nuevo sistema
Estadística I 237
proporcionará una media de duración superior a 60.000 km. Como regla general, una hipótesis
de investigación como ésta se debe formular y proponer como hipótesis alternativa.
6. Establecer los valores críticos que dividen las zonas de rechazo y de no rechazo
zc= 2,33
Zona de
Zona de rechazo
no rechazo
zc
-3,00 -2,00 -1,00 0,00 1,00 2,00 3,00
x 62.000 km s x 5.000 km
x 62.000 60.000
0
z 3,2
1 S 5.000
x
n 64
10. Expresar la decisión estadística en términos del problema. El nuevo material aumenta la
duración de las cubiertas.
En el segundo caso, el gerente de ventas afirma que la nueva campaña publicitaria au-
mentó las ventas de autos más caros. Se seleccionará una muestra y se calculará el precio medio
para investigar la afirmación del gerente de ventas. En este tipo de pruebas de hipótesis se supo-
ne, por lo general, que la afirmación del gerente es verdadera, a menos que la evidencia parezca
demostrar lo contrario. Las hipótesis nulas y alternativas serían las siguientes:
6. Establecer los valores críticos que dividen las zonas de rechazo y de no rechazo
zc= - 1,645
Zona de
rechazo
Zona de
no rechazo
x $92.250 s x $17.500.
z1=-1,28≤zc=-1,645 no rechazar H0
En el tercer caso, el proveedor de aceite del taller, debe controlar que las botellas de
aceite que envasa tienen en promedio 1,5 lts. Periódicamente se selecciona una muestra de bote-
llas, que se controlan para determinar si les falta o sobra aceite. En este caso se formulan las si-
guientes hipótesis:
6. Establecer los valores críticos que dividen las zonas de rechazo y de no rechazo
tc= ± 2,80
Estadística I 240
Zona de Zona de
rechazo Zona de rechazo
no rechazo
-tc +tc
-3,00 -2,00 -1,00 0,00 1,00 2,00 3,00
hi P0
z
p
hi 1 hi
pˆ
n
2
z P 1 P z P 1 P
0 0 0 1 1 1
n
P1 P0
Al utilizar una muestra para hacer inferencias sobre la población, el que toma la decisión
corre el riesgo de que se llegue a una conclusión incorrecta. Existen dos tipos de errores que
pueden ocurrir en el procedimiento de prueba de hipótesis.
El primer error, llamado error de tipo I (), es la probabilidad de que se rechace la hipó-
tesis nula H0 cuando, en realidad, es verdadera. Si por el contrario, se acepta una hipótesis cuan-
do debería ser rechazada, se dice que se comete un error de Tipo II. En cualquiera de los dos
casos se comete un error al tomar una decisión equivocada.
Tradicionalmente, el error de tipo I se controla al decidir el nivel de riesgo que está dis-
puesto a correr al rechazar la hipótesis nula, siendo ésta cierta. Como el nivel de significación se
especifica antes de realizar la prueba de hipótesis el riesgo de cometer un error de tipo I está di-
rectamente bajo control. Por lo general, se seleccionan niveles de 0,01, 0,05 o 0,10. La selección
Estadística I 242
de un nivel de riesgo específico para cometer un error de tipo I depende del costo que implicaría
cometerlo. Después de especificar el valor de , se conoce el tamaño de la zona de rechazo,
porque es la probabilidad de rechazar la hipótesis nula cuando es verdadera. A partir de esto,
se determina el valor o los valores críticos que dividen la zona de rechazo y de no rechazo.
= P(eI)
RESUMEN
si ¿Es n grande no
(n≥30)?
si no si ¿Es aproximadamente no
¿Se conoce s?
normal la población?
si no
Usar sx para ¿Se conoce s?
estimar sx
Usar sx para
estimar sx Aumente el
tamaño de la
x x x x muestra a
z z
x sx n >30
x x x x
n n z t
x sx
n n 1
Estadística I 243
Formular la H 0) x = 0
hipótesis H0) x ≤ 0 H0) x ≥ 0
nula
Formular la
hipótesis H1) x > 0 H0) x < 0 H 0) x 0
alternativa
Especificar
el nivel de Fijar
significación
Determinar
el tamaño
Determinar n
de la mues-
tra
n >30 n ≤ 30
Elegir el descono- descono-
estadístico conocido cido conocido cido
de la prueba
Distribución
Distribución normal
t-student
Establecer
los valores Buscar zc
críticos
x x sx x x sx
Extraer la
muestra y
x x x x x x x x
calcular los z1 z1 z1 t1
x sx x sx
estadísticos
n n n n
Formular la H 0) x = 0
hipótesis H 0) x ≤ 0 H0) x ≥ 0
nula
Formular la
hipótesis H 1) x > 0 H0) x < 0 H 0) x 0
alternativa
Especificar
el nivel de Fijar
significación
Determinar
el tamaño
Determinar n
de la mues-
tra
n > 30 n ≤ 30
Elegir el
estadístico Distribución
de la prueba Distribución normal Chi- cuadra-
do
Establecer
los valores Buscar zc
críticos
sx sx sx
Extraer la
muestra y sx x sx x sx x sx x
z1 z1 z1 2
calcular los sx sx sx sx
estadísticos n2
2n 2n 2n
Formular la H 0) P x = P 0
H 0 ) P x ≤ P0 H0) P x ≥ P 0
hipótesis nula
Formular la
hipótesis alterna- H 1) P x > 0 H0) P x < P 0 H 0) Px P0
tiva
Especificar el ni-
vel de significa- Fijar
ción
Determinar el
tamaño de la Determinar n
muestra
n > 30 n ≤ 30
Elegir el estadís-
tico de la prueba
Distribución normal Aumentar
el tamaño
Establecer los de la
Buscar zc
valores críticos muestra
hi
Extraer la mues- hi P
z1
tra y calcular los hii 1 hi
estadísticos n
| z1 | > | zc |
Regla de decisión
rechazo H0
PREGUNTAS TEÓRICAS
2) En Teoría de Decisión, ¿qué relación existe entre el nivel de significación () y la probabili-
dad de error de tipo I (PeI)?
a) Directa
b) Inversa
c) No existe