Parcial 3 Estadistica 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 12

Tema 4: Inferencia repecto a la diferencia de media en

unidades Z
Página 2 de 8

PRUEBA DE HIPÓTESIS PARA UNA DIFERENCIA DE DOS MEDIAS

Una distribución muestral de diferencia de medias, es el conjunto de todas las diferencias de


medias, que se pueden estimar en todas las muestras de un tamaño específico provenientes de
dos poblaciones N1 y N2, con µ1 y µ2 y varianzas σ12 σ22 y .

En este caso el estadístico de prueba utilizado es:

Donde:

1= Media aritmética en la muestra 1

2 = Media aritmética en la muestra 2

σ12 = Varianza en la población 1


σ22 = Varianza en la población 2
n1 = Tamaño de la muestra 1
n2 = Tamaño de la muestra 2
PRUEBA DE HIPÓTESIS PARA PROPORCIONES

Así como probamos hipótesis relacionadas con medias, el concepto de prueba de hipótesis se
puede utilizar también para probar hipótesis relacionadas con datos cualitativos. Por ejemplo, nos
interesaría conocer la proporción de familias en las que hay por lo menos una persona
desempleada, la proporción de artículos defectuosos en un proceso productivo, la proporción de
estudiantes del centro educativo de enseñanza superior que trabajan y estudian. Estos son
ejemplos de una variable cualitativa, ya que lo que se espera es llegar a conclusiones en cuanto a
la proporción de los valores que tienen una característica particular. Las hipótesis nula y alternativa
se pueden plantear de la siguiente manera, según sea el caso:

H0 : P = 0.75
H1 : P > 0.75
H1 : P < 0.75
H1 : P ≠ 0.75

En la hipótesis nula, también se puede incluir el símbolo ≤ o ≥, según sea la dirección de la


hipótesis alternativa.

En este tipo de prueba el estadístico de prueba utilizado es:

Donde:

p = proporción muestral
P = proporción poblacional (valor supuesto del parámetro poblacional)
n = tamaño de la muestra

PRUEBA DE HIPÓTESIS PARA UNA DIFERENCIA DE PROPORCIONES

Una distribución muestral de diferencia de proporciones, se define como el conjunto de todas las
diferencias de proporciones, que se pueden estimar en todas las muestras de un tamaño
específico provenientes de dos poblaciones N1 y N2, con proporciones P1 y P2 y
varianzas σp1 y σp22
2
En este caso el estadístico de prueba utilizado es:

LA DISTRIBUCIÓN t DE STUDENT

El nombre de la distribución se debe a su autor W.S. Gosset, quien le dio el seudónimo de t de


Student ante la imposibilidad de presentar sus trabajos so pena de perder su empleo, esto sucedió
a principio del siglo XX.

Esta distribución es recomendada cuando se requiere estimar la media poblacional y no se conoce


la desviación estándar y, por lo tanto, hay que estimarla, eso si, siempre y cuando la distribución
original sea aproximadamente normal.

Otro término utilizado en ésta distribución continua, es el de grados de libertad (gl), el cual de
manera intuitiva se expone así:

Y= X1 ± X2 ± X3 ± X4, para satisfacer la ecuación, tres variables se pueden cambiar a libertad, pero
uno de ellos no, por eso, cuando se tiene una sola muestra, se hable de n-1 gl . A medida que se
aumenten los gl la distribución t, se aproxima a la distribución Z de la normal. Otra lectura que se
puede dar es que los gl es una medida del número de observaciones independientes en la
muestra, que se usan para estimar la desviación estándar.

En general, cuando el tamaño de muestra no sea muy pequeño y la simetría no sea alta, se puede
usar para estimar la media poblacional cuando no se conoce la desviación.

Cuando no se conoce s y el número de observaciones en la muestra es menor de 30, se puede


utilizar la desviación estándar de la muestra S como una estimación de σ, pero no es posible usar
la distribución Z como estadístico de prueba. El estadístico de prueba adecuado es la
distribución t de student.

En la inferencia estadística se aplica para estimar y probar una media y diferencias de medias
(independiente y pareada).
CÁLCULO DE INTERVALOS DE CONFIANZA PARA LA MEDIA
El procedimiento para calcular intervalos de confianza, es similar al utilizado cuando usamos la
distribución Z. En este caso la fórmula utilizada es como sigue:

Donde:

= Media aritmética muestral


t = t∞, gl
gl = Grados de libertad
gl = n - 1 ( tamaño de la muestra menos 1)
= Error estándar de la media

PRUEBA DE HIPÓTESIS CON MUESTRAS PEQUEÑAS

Una hipótesis acerca de una media poblacional se puede probar utilizando una muestra pequeña
sólo si se puede suponer que la muestra ha sido seleccionada de una población distribuida con
tendencia normal, con desviación típica desconocida. La prueba se realiza utilizando una
distribución t con n-1 grados de libertad.
En este caso el estadístico de prueba utilizado es el siguiente:

Donde:

= media aritmética muestral


µ = media aritmética poblacional
= error estándar de la media
EJERCICIOS PROPUESTOS

Realice los siguientes ejercicios:

1) El gerente de ventas de una empresa comercial considera que el kilometraje


promedio semanal que recorre su personal de venta es el siguiente:
88 82 81 87 80 78 79 89 80 81 87 88

¿Contradice esta afirmación a lo que dice que el gerente general, quien opina que el
kilometraje recorrido es de 86? Utilice un alfa del 0.01, interprete el resultado.

2) El administrador general de una entidad privada desea equipar sus oficinas con
nuevo equipo de informática. Según noticias que le han sido proporcionadas el
costo promedio por computadora es de $510. 00. Sin embargo, para estar seguro
selecciona una muestra de 15 distribuidores de computadores, obteniendo los
siguientes precios, en dólares:

321 423 335 450 500 480 496 390 510 575 450 500 490 520 475

¿Esta información refuerza los datos de que dispone el administrador? Use un ∞ de


10%

PRUEBA DE HIPÓTESIS PARA DIFERENCIAS DE DOS MEDIAS, EN MUESTREO PEQUEÑO

Al hacer inferencia acerca de dos medias poblacionales cuando las muestras son pequeñas
(menores de 30) y se desconocen las varianzas poblacionales, es adecuado emplear la
distribución t de Student. Para probar la hipótesis de que las dos medias poblacionales son iguales
(H0 :µ1 = µ2), se utiliza el estadístico de prueba siguiente:
1= Es la media de la muestra 1
2 = Es la media de la muestra 2

n1 = Número de observaciones en la muestra 1


n2 = Número de observaciones en la muestra 2
SP2 = Variianza combinada

S12 = Varianza en la muestra 1


S22 = Varianza en la muestra 2

Tema 1: Inferencia estadistica Chi -Cuadrada


Página 2 de 5

PRUEBA DE INDEPENDENCIA Y DE HOMOGENEIDAD

En la prueba de independencia (análisis de cuadros de contingencia) lo que se trata de determinar


es, si existe relación entre dos variables. Dicho de otra forma se busca establecer si dos variables
A y B, son independientes una de la otra. La hipótesis nula se plantea como que la variable A es
independiente de la variable B. También se puede plantear como que no existe relación entre
ambas variables A y B.

En la prueba de homogeneidad, se trata de determinar si dos o más muestras independientes se


extraen de la misma población o de poblaciones diferentes. Se considera que ésta prueba es una
extensión de la prueba de Chi- Cuadrado de independencia (tablas de contingencia).

LA DISTRIBUCIÓN CHI- CUADRADO (X2 )

Esta prueba es utilizada para probar hipótesis relacionadas con un conjunto de frecuencias
observadas acerca de la ocurrencia de un acontecimiento determinado y el correspondiente
conjunto de frecuencias esperadas o teóricas. Algunas características de ésta distribución son las
siguientes:

1. Los valores de Chi- Cuadrado siempre son positivos. Se debe a que la diferencia entre fo y fe
es cuadrada, es decir, (fo – fe)2
2. Existe una gran familia de distribuciones Chi- Cuadrado. Cada una depende de los grados de
libertad, por ejemplo, hay distribución para cinco grados de libertad, otra para tres grados de
libertad, etc. El número de grados de libertad se calcula mediante k-1, donde k representa el
número de categorías en que se ha dividido la variable.

3. La Chi- Cuadrado tiene sesgo positivo. No obstante, a medida se incrementan los grados de
libertad, la distribución tiende en su forma a la distribución normal.

El estadístico de prueba en esta distribución es el siguiente:

Donde:

fo= frecuencia observada de la ocurrencia de un acontecimiento


fe= frecuencia esperada o teórica de la ocurrencia del fenómeno

La aplicación de ésta ecuación supone los siguientes pasos:


1. Establecer las diferencias entre las fo y las fe.

2. Elevar al cuadrado las diferencias entre las fo y las fe.

3. Dividir las diferencias al cuadrado, entre las fe.

4. Sumar los resultados anteriores, obteniendo el valor de X 2

Se utiliza en los siguientes casos:

a. Análisis de tablas simples: comprende los siguientes casos:

 Frecuencias igualmente esperadas

 Frecuencias desigualmente esperadas

b. Análisis de cuadros de contingencia, y

c. Bondad de ajuste para la normalidad


d. ANÁLISIS DE TABLAS SIMPLES
e.
f. Es llamado también cuadro de clasificación unilateral, puesto que en cada caso las
frecuencias observadas ocupan una sola fila o una sola columna. En este tipo de análisis
sólo se toma en cuenta un rasgo característico o factor de clasificación.
g.
h. Frecuencias igualmente esperadas. Las frecuencias esperadas en cada celda son iguales.
i.
j.
k.
l.
m.
n.
o. Frecuencias desigualmente esperadas
p.
q. Las frecuencias esperadas de cada celda son diferentes, o no son iguales.
r.
s.
t.
u.
v. ANÁLISIS DE CUADROS DE CONTINGENCIA
w.
x. En este tipo de análisis se plantean dos variables de clasificación con el objeto de ver si las
variables son independientes o no. En los cuadros de contingencia las observaciones se
clasifican de acuerdo con dos o más características. Por ejemplo, se puede tener interés
en determinar si existe relación entre el tamaño de las empresas y el interés que éstas
presentan por la publicidad; o si existe relación entre el sexo y la selección de una carrera.
Esta prueba también recibe el nombre de prueba de independencia, ya que lo que se trata
de hacer es determinar si existe independencia entre las variables. Las tablas o cuadros de
contingencia pueden ser de cualquier magnitud, R x C, donde R = renglón y C = número de
columnas. Los grados de libertad se obtienen multiplicando (R-1) x (C-1). Al total de
frecuencias en cada renglón o fila y en cada columna se les llama frecuencias marginales.
y.
z.
aa.
bb.
cc.
dd.

EJERCICIOS PROPUESTOS

Realice los siguientes ejercicios:

1) Se entrevistó a 323 hombres de distintos niveles gerenciales acerca de la importancia


que le daban a la Planificación Estratégica de Marketing. Los resultados se presentan a
continuación:

a) A un nivel de significación del 5 % determine si existe relación entre el nivel gerencial y


la importancia que le dan a la Planificación Estratégica de Marketing .

2) Se tiene interés en conocer si existe relación entre el sexo de las personas y su


preferencia por las películas. Se seleccionó una muestra de personas de ambos sexos,
obteniendo los siguientes resultados:

¿Qué se puede concluir a un nivel de significación de 5 %?

PRUEBA DE BONDAD DE AJUSTE PARA LA NORMALIDAD

A través de ésta prueba se trata de determinar si una distribución de frecuencias observadas se


ajusta a la distribución normal teórica. Dicho de otra forma se trata de establecer si una distribución
posee tendencia normal. Se utiliza la fórmula de conversión:
Donde:

X = límite inferior de cada clase


µ = media aritmética de la distribución
σ =desviación típica de la distribución

Pasos:

1. Calcular los valores de la media y la desviación típica de la distribución

2. Determinar los valores de z para los límites inferiores y superiores de cada clase

3. Determinar las fe para cada clase

Los grados de libertad se encuentran así:

gl = k-m-1

Donde:

K = número de categorías
m = estadísticos utilizados en el cálculo de las frecuencias esperadas o teóricas.

EJERCICIOS PROPUESTOS

Realice los siguientes ejercicios:

1) Determine si la siguiente distribución correspondiente a la facturación mensual de 262


cuentas de una tienda comercial se ajusta a la curva normal. Utilice un alfa del 5 %. ( 40
%)

También podría gustarte