Alvarez David 17088863-4 Pruaba de Estadística
Alvarez David 17088863-4 Pruaba de Estadística
Alvarez David 17088863-4 Pruaba de Estadística
863-4)
PROBLEMA 1
I.
La afirmación es falsa. El error tipo I y el error tipo II no son estrictamente complementarios.
El error tipo I es la probabilidad de rechazar la hipótesis nula cuando es verdadera, mientras
que el error tipo II es la probabilidad de no rechazar la hipótesis nula cuando es falsa. Si bien
ambos errores están relacionados, y reducir el error tipo I suele aumentar el error tipo II y
viceversa, el valor de uno no determina automáticamente el valor de otro, ya que dependen
de diferentes factores, como el tamaño de la muestra y el poder del test estadístico. En este
sentido, el error tipo I y tipo II no suman 1. Los valores son independientes y no se suman
para dar una probabilidad total. En una prueba de hipótesis, la suma de todas las
probabilidades puede ser igual a 1, pero esto incluye otros resultados posibles como rechazar
la hipótesis nula cuando es falsa o no rechazarla cuando es verdadera, es decir, hay más
opciones que error tipo 1 y error tipo 2. Si consideras todas las posibles combinaciones de
decisiones y estados de hipótesis, no es posible plantear que simplemente error tipo 1 sumado
a error tipo 2 es igual a 1.
Si bien existe una relación inversa entre ambos errores, es decir, al disminuir la probabilidad
de cometer un error tipo I aumenta la probabilidad de cometer un error tipo II y viceversa, la
afirmación es una simplificación que no considera todos los factores.
El valor del error tipo 1 no establece directamente el valor del error tipo II, por ejemplo,
puedes tener un alfa de 5% en una prueba, pero esto no implica que el beta sea de 95%, de
hecho, el valor de beta depende de factores como el tamaño de la muestra y la variabilidad
de los datos. En este contexto, la potencia de una prueba estadistica es la probabilidad de
rechazar correctamente la hipótesis nula cuando es falsa, es decir, 1 menos beta, la potencia
depende de la magnitud de efecto, el tamaño de una muestra y el nivel de significancia, al
aumentar el tamaño de la muestra o la magnitud del efecto, puedes aumentar la potencia y
reducir el beta, pero esto no afecta directamente al alfa. Por ejemplo, si se esta realizando una
prueba para determinar si un nuevo medicamento es más efectivo que un pplacebo, si el
medicamento realmente es efecto, puedes tener un alfa del 5%, error tipo I, pero si la
diferencia de eficacia es pequeña, es posible que no detectes ese efecto, error tipo II, lo que
puede resultar en un beta alto.
La relación entre errores tipo I y II no se puede simplificar a la suma o diferencia directa.
II.
La afirmación es falsa. El 98% de confianza no implica un valor P de 0,04. El valor de 98%
de confianza implica un nivel de significancia de 2% que es el valor P de 0,02. El analista
obtuvo en p de 0,04 que es mayor a 0,02 por lo que no se alcanza el nivel de significancia
requerido para tomar la decisión con certeza solicitada por el gerente. Si bien el resultado
puede ser significativo en un nivel del 5%, lo cual en muchos contextos es aceptable, no
cumple el criterio del 2% especificado para esta inversión.
No sería conveniente aplicar el software.
La afirmación del analista es incorrecta. EL valor de P 0,04 indica que si la hipótesis nula
fuera cierta tendríamos el 4% de probabilidad de obtener los resultados observados en la
muestra, lo cual no significa que haya un 98% de confianza en que el software aumente la
productividad en más del 10%. La confianza del 98% corresponde a un nivel de significancia
de 0,02.
Para cumplir con los requisitos, el valor de P debe ser menos de 0,02. Debido a que el valor
P es mayor que el nivel establecido, no se puede rechazar la hipótesis nula.
PROBLEMA 2
I.
Los resultados son (se desarrollan más adelante mediante Excel, el cual va adjunto y se
explica a continuación de los resultados por qué es un problema binomial y las fórmulas):
40 clientes: 0.0158 (1,58%) En Excel: =(=+COMBINAT(70;40))*(0,68^40)*((1-0,68)^30) =
0,015774505
50 clientes: 0.0866 (8,66%) En Excel: =(=+COMBINAT(70;50))*(0,68^50)*((1-0,68)^20) =
0,086626496
60 clientes: 0.0004 (0,04%) En Excel: =(=+COMBINAT(70;60))*(0,68^60)*((1-0,68)^10) =
0,000398567
70 clientes: 0.0000 (0% aprox) En Excel: =(=+COMBINAT(70;70))*(0,68^70)*((1-0,68)^0)
= 0.000000000001886357
Este es un problema de tipo binomial porque existe un éxito y un fracaso en las posibilidades.
Éxito es que un cliente vuelva al día siguiente y fracaso es que el cliente NO vuelva al día
siguiente.
La probabilidad de éxito o P es 0,68 o 68%.
Existió un número de 70 clientes en el día o 70 ensayos n.
Dado que tenemos un número fijo de ensayos o clientes idénticos n, y que cada ensayo tiene
dos posibles resultados, vuelve o no vuelve, es decir, éxito o fracaso, la probabilidad de éxito
es constante en cada ensayo y los ensayos son independientes, podemos modelar la situación
utilizando una distribución binomial que cumple con todos estos requisitos.
La probabilidad de que recompren 40, 50, 60 y 70 clientes son según la fórmula de la
distribución binomial es: P(X = k) = (nCk) * p^k * (1-p)^(n-k)
(nCk) = n! / (k! * (n-k)!) En excel la fórmula es =+COMBINAT(N;K)
P(X = k) = (n! / (k! * (n-k)!)) * p^k * (1-p)^(n-k)
Donde:
P(X = k): Probabilidad de que ocurran exactamente k éxitos (40, 50, 60 y 70).
nCk: Combinación de n elementos tomados de k en k. En excel la fórmula es
=+COMBINAT(N;K)
p: Probabilidad de éxito en un ensayo.
k: Número de éxitos.
n: Número total de ensayos.
Los resultados son (se desarrollan más adelante mediante Excel, el cual va adjunto):
40 clientes: 0.0158 (1,58%) En Excel: =(=+COMBINAT(70;40))*(0,68^40)*((1-0,68)^30) =
0,015774505
50 clientes: 0.0866 (8,66%) En Excel: =(=+COMBINAT(70;50))*(0,68^50)*((1-0,68)^20) =
0,086626496
60 clientes: 0.0004 (0,04%) En Excel: =(=+COMBINAT(70;60))*(0,68^60)*((1-0,68)^10) =
0,000398567
70 clientes: 0.0000 (0% aprox) En Excel: =(=+COMBINAT(70;70))*(0,68^70)*((1-0,68)^0)
= 0.000000000001886357
Desarrollo:
P(X = 40): ...
Para 40 clientes:
Número de ensayos (n): 70
Probabilidad de éxito (p): 0.68
Cálculo: P(X=40)=C(70,40)*0.68^40*(1−0.68) elevado^ 70−40
Resultado: P(X=40)=0.0158
II.
Para una distribución binomial, la media (μ) y la varianza (σ²) se calculan de la siguiente
manera:
μ = n * p . En Excel =70*0,68 = 47,6
σ² = n * p * (1-p). En Excel =70*0,68*(1-0,68) = 15,232
Desarrollo:
Media (μ): 70 * 0.68 = ...
Varianza (σ²): 70 * 0.68 * (1-0.68) = ...
III.
Gráfico de la Distribución de Probabilidad (es en barras porque es discreta
PROBLEMA 3
I.
Para plantear el problema de contraste de hipótesis, debemos establecer que la Hipótesis nula
es: el porcentaje promedio de navajas con defectos es menor o igual al 10% del total. Mientras
que la hipótesis alternativa es: el porcentaje promedio de navajas con defectos es mayor al
10%. Esto es lo que se busca verificar, porque si la fiscalización da cuenta de que en promedio
más de un 10% de las navajas tienen algún defecto, se determinará suspender el servicio
debido a que la falta de calidad genera una importante pérdida de confianza reputacional. En
el caso de la hipótesis nula debe ser H ≤ 0.1*1200 = 120. En el caso de la hipótesis alternativa
debe ser H > 120. Los datos que tenemos son el tamaño n de la muestra, 2.500, la media de
navajas defectuosas son 122, y que la varianza poblacional es de 2.500. Estamos asumiendo
un 95% de confianza estándar o riesgo. Si aplicamos el método de valor crítico, calculamos
el estadístico de prueba Z, compararemos el valor de Z calculando con el valor crítico, y si
el z calculado es mayor al valor crítico rechazaremos la hipótesis nula. Cálculo del estadístico
de prueba z = (x̄ - μ₀) / (σ / √n)
Donde:
x̄: Media muestral (122)
μ₀: Media poblacional bajo H₀ (120)
σ: Desviación estándar poblacional (√2500 = 50)
n: Tamaño de la muestra (2500)
z = (122 - 120) / (50 / √2500) = 2
Para un nivel de significancia de 0.05 y una prueba unilateral a la derecha, el valor crítico es
aproximadamente 1.645.
II.
Decisión: Como el valor calculado de z es 2 y es mayor que el valor crítico (1.645), sí
rechazamos la hipótesis nula.
Con un nivel de significancia del 5%, hay suficiente evidencia estadística para concluir que
el promedio de navajas defectuosas por lote es mayor al 10%. Esto significa que la calidad
del producto no cumple con los estándares establecidos y, por lo tanto, la fiscalización podría
recomendar la suspensión del servicio.
III.
Tipo de error preferible para la empresa:
Si la empresa no quiere interrumpir su operación, preferiría cometer un error tipo II.
Error tipo I: Rechazar H0 cuando es verdadera (concluir que hay más del 10% de defectos
cuando en realidad no es así). Esto llevaría a la suspensión injustificada del servicio.
Error tipo II: No rechazar H0 cuando es falsa (concluir que no hay más del 10% de defectos
cuando en realidad sí los hay). Esto permitiría continuar la operación, aunque con un riesgo
de baja calidad.
Al preferir un error tipo II, la empresa está priorizando la continuidad de su operación, aunque
a costa de un posible riesgo para su reputación si la calidad del producto es inferior a lo
establecido.
PROBLEMA 4
I.
Planteamos la hipótesis nula, la cual es que el promedio de ventas por vendedor es menor o
igual a 1.150 unidades, H0: ≤ 1150. La hipótesis alternativa es que el promedio de ventas por
vendedor es mayor a 1.150 unidades, H1: > 1150. Se establece un nivel significancia de 0,03.
Las variables son las siguientes:
X: Ventas individuales de un vendedor.
n: Tamaño muestral = 110.
x̄: Media muestral = 1.250.
s²: Varianza muestral = 78.935.
σ²: Varianza poblacional (asumida como desconocida).
Para la decisión bajo el método de valor p debemos calcular el estadístico de prueba t, dado
que la varianza poblacional es desconocida y utilizamos la varianza muestral. Se debe
calcular el valor p asociado a el estadístico t, utilizando la distribución t de Student con n-1
grados de libertad. Luego comparamos el valor p con el nivel de significancia de 0,03. Si el
valor p es menor que el definido, rechazamos la hipótesis nula.
II.
La decisión bajo el método de valor p es calculando el estadístico de prueba t, donde t = (x̄ -
μ₀) / (s / √n) donde s es desviación estándar muestral (√78935 ≈ 280.95 aprox.). Entonces t =
(1250 - 1150) / (280.95 / √110) ≈ 3.77. El cálculo del valor p es utilizando la tabla de
distribución t de student con 109 grados de libertad (n-1) y un valor de t de 3,77. Por esta
razón, encontramos que el valor p (en la tabla) es menor que 0,03. Es un valor muy cercano
a 0. La decisión se sustenta en que dado que el valor p es mucho menor que el nivel de
significancia 0,03 rechazamos la hipótesis nula. Con un 97% de confianza (1-α), podemos
concluir que el promedio de ventas por vendedor es significativamente mayor a 1150
unidades. Por lo tanto, la empresa debería otorgar el bono de 900 USD a sus vendedores, ya
que han cumplido con el objetivo establecido. Se asume que la distribución de las ventas
sigue una distribución normal aproximadamente. Si esta suposición no se cumple, los
resultados podrían no ser válidos. El tamaño de la muestra de 110 vendedores es considerado
suficientemente grande para aplicar el teorema del límite central y utilizar la distribución t
de Student.
Basados en el análisis estadístico realizado, la empresa multinacional cuenta con evidencia
suficiente para concluir que sus vendedores han superado el objetivo de ventas y, por lo tanto,
deben recibir el bono prometido.