Estadistica II Materia 1X
Estadistica II Materia 1X
Estadistica II Materia 1X
ESTADÍSTICA II
DOCENTE
Dra. Margoth Bonilla
SEMESTRE:
CUARTO
PERIODO
Octubre 2020 – Febrero 2021
ÍNDICE DE CUADROS
ÍNDICE DE GRÁFICOS
ÍNDICE DE ILUSTRACIONES
Estadística paramétrica: Se caracteriza porque asume que los datos tienen una
determinada distribución o se especifican determinados parámetros que deberían
cumplirse. Así, por ejemplo, en un análisis paramétrico podemos trabajar bajo el
supuesto de que la población se distribuye como una Normal (hay que justificar nuestro
supuesto) y luego sacar conclusiones bajo el supuesto que esta condición se cumple.
Probabilidad
Deducir las leyes que rigen esos fenómenos.
Población:
Todo el universo de estudio que contiene características relacionadas a la variable de
estudio.
Ilustración 1Población
Muestra
Parte de una población en la cual se realiza la investigación.
Ilustración 2Muestra
Individuo estadístico
Cualquier elemento que por aparte información sobre el fenómeno
que se estudia.
individuo.
DATOS ESTADÍSTICOS
Son las agrupaciones de cualquier número de observaciones relacionadas.
VARIABLE
Se considera como variable cualquier característica o propiedades general de una
población que sea posible medir con distintos valores o describir con diferentes
modalidades.
Ejemplo
TIPO DE
VARIABLE
CUALITATIVAS CUANTITATIVAS
NO
IMPORTA NÚMEROS NÚMEROS
IMPORTA
EL ORDEN DECIMALES ENTEROS
EL ORDEN
- GÉNEROS -
SEMESTRE -PESO -NÚMEROS
-ESTADO DE HIJOS
-TALLA
CIVIL ESTUDIO
Por ejemplo
El estado civil, puede ser: Soltero, casado, separado, divorciado y viudo
Variable Cualitativa Ordinal O Cuasi cualitativa: Representa modalidades no numéricas en
las que si existe el orden.
El espacio muestral es: S = {(1,2,3), (1,2,4), (1,2,5), (1,3,4), (1,3,5), (1,4,5), (2,3,4), (2,3,5),
(2,4,5), (3,4,5)} y la variable aleatoria X asume los valores: 3, 4 y 5.
Esta es una variable aleatoria discreta, solo puede tomar los valores de 0,1,2,3,4….n
suponiendo que se han realizado n pruebas.
TRIANGULO DE PASCAL
(𝑝 + 𝑞 )0 1𝐶00
(𝑝 + 𝑞 )1 1𝐶01 1𝐶11
(𝑝 + 𝑞 )2 1𝐶02 2𝐶12 1𝐶22
3 3
(𝑝 + 𝑞 )3 1𝐶0 3𝐶1 3𝐶2 1𝐶33
3
𝑚!
𝐶𝑝𝑚 = (𝑚
𝑝) =
(𝑚 − 𝑝)! 𝑝!
•
(𝑝 + 𝑞)12 = 1𝑝12 + 12𝑝11 𝑞 + 66 𝑝10𝑞2 + 220 𝑝9 𝑞3 + 495 𝑝8 𝑞 4 + 792𝑝7 𝑞5
+ 924 𝑝6 𝑞6 + 729 𝑝5 𝑞7 + 495 𝑝4 𝑞8 + 220 𝑝3 𝑞9 + 66 𝑝2 𝑞10
+ 12 𝑝1 𝑞11 + 1𝑞12
Ejemplo:
Aplicación. - Usando el desarrollo del binomio indican el espacio muestral del
lanzamiento de la moneda 4 veces
p=cara = ½
q= sello = ½
• (𝑝 + 𝑞)4
(𝑝 + 𝑞)4 = 𝐶04 𝑝4 𝑞0 + 𝐶14 𝑝3 𝑞 + 𝐶24 𝑝2 𝑞2 + 𝐶34 𝑝0 𝑞3 + 𝐶44 𝑞4
4
1 4 1 0 1 3 1 1 1 2 1 2 1 1 1 3 1 0 1 4
(𝑝 + 𝑞) = 1 ( ) ( ) + 4 ( ) ( ) + 6 ( ) ( ) + 4 ( ) ( ) + ( ) ( )
2 2 2 2 2 2 2 2 2 2
4
1 1 1 1 1 1 1 1
(𝑝 + 𝑞) = 1 ( ) (1) + 4 ( ) ( ) + 6 ( ) ( ) + 4 ( ) ( ) + ( )
16 8 2 4 4 2 8 16
4
1 4 6 4 1
(𝑝 + 𝑞) = ( ) + ( ) + ( ) + ( ) + ( )
16 16 16 16 16
0 caras, 4 sellos
1 caras, 3 sellos
2 caras, 2 sellos
3 caras, 1 sellos
4 caras, 0 sellos
DISTRIBUCIÓN BINOMIAL
A esta distribución se le denominan como método exacto y se trabaja con una
distribución de variables aleatorias discretas
𝑛
𝑃(𝑥 ) = ( ) 𝑝 𝑥 𝑞𝑛−𝑥
𝑥
𝑛!
𝑃 (𝑥 ) = 𝑝 𝑥 𝑞𝑛−𝑥
(𝑛 − 𝑥 )! 𝑥!
Notación:
n = Número de ensayos, elementos de la muestra
x = Número de éxitos
p = probabilidad de éxito en cada ensayo
q = probabilidad de fracaso en cada ensayo
ESPACIO MUESTRAL
El espacio muestral nos da a conocer todos los casos posibles del experimento.
2 monedas c s 4 monedas c s
c cc cs ccc cccc cccs
s sc ss csc cscc cscs
scc sccc sccs
3 monedas c s ssc sscc sscs
cc ccc ccs ccs ccsc
cs csc css css cssc csss
sc scc scs scs scss
ss ssc sss sss ssss
1 4 6 4 1
(𝑝 + 𝑞)4 = ( )+( )+( )+( )+( )
16 16 16 16 16
TABLA DE FRECUENCIAS
x f h %= h*100 EVENTO
0 1 0.0625 6.25 0 caras ( 4 sellos)
1 4 0.25 25 1 caras (3 sellos)
2 6 0.375 37.5 2 caras (2 sellos)
3 4 0.25 25 3 caras ( 1 sellos)
4 1 0.0625 6.25 4 caras (0 sellos)
16 1 100
30 25 25
20
10 6,25 6,25
0
Categoría 1
EVENTOS
0 1 2 3 4
EJERCICIO (4A)
FORMULA
𝑛!
𝑃(𝑥 ) = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥 = (𝑛−𝑥)!𝑥! 𝑝 𝑥 𝑞𝑛−𝑥
9! 5!.6.7.8.9
PROCESO 𝑃(𝑥 = 4) = (49)(0.5)4 (05)5 = 5!4! (0.5)4 (0.5)5 = 5!1.2.3.4. (0.5)4 (0.5)5
DATOS:
FORMULA
𝑛!
c) 𝑃(𝑥 ) = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥 = (𝑛−𝑥)!𝑥! 𝑝 𝑥 𝑞𝑛−𝑥
P + q=1 p= 1 – q q= 1 – p
PROCESO:
P(x≥ 3)= 91,01% La probabilidad de obtener Por lo menos 3 caras (mínimo tres
caras) en el lanzamiento de 9 monedas
c) Máximo 2 caras
DATOS:
FORMULA
d) máximo 7 caras
DATOS:
FORMULA
𝑛!
a) 𝑃(𝑥 ) = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥 = ( 𝑝 𝑥 𝑞𝑛−𝑥
𝑛−𝑥)!𝑥!
P + q=1 p= 1 – q q= 1 – p
PROCESO
P(x≤ 7 )= 0.9804
TALLER
Usar el membrete
Escribir enunciado del problema, datos, formula, proceso, respuesta,
interpretación.
Subir al aula en pdf, en el tiempo establecido.
Hallar la probabilidad de obtener exactamente 8 caras o más de 11 caras si se
lanza una moneda 13 veces.
a) La probabilidad de obtener exactamente 8 caras
b) La probabilidad de obtener más de 11 caras
c) probabilidad de obtener exactamente 8 caras o más de 11 caras
EJERCICICIO (4B)
b) Exactamente 7 caras
FORMULA
𝑛!
𝑃(𝑥 ) = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥 = (𝑛−𝑥)!𝑥! 𝑝 𝑥 𝑞𝑛−𝑥
PROCESO
15!
𝑃(𝑥 = 7) = (15
7
)0.57 0.58 =
8!7!
0.57 0.58 =
DATOS:
FORMULA
𝑛!
𝑃(𝑥 ) = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥 = (𝑛−𝑥)!𝑥! 𝑝 𝑥 𝑞𝑛−𝑥
𝑝+𝑞 = 1 p= 1- q q= 1 – p
PROCESO
P(x≥2 ) = 1 – ( (15
0
)𝑝0 𝑞15 + (15
1
)𝑝1 𝑞14) = 1 – ( (15
0
)0.50 0.515 + (15
1
)0.51 0.514 )
d) Máximo 4 caras
e) p=1/2=0,5 q= ½= 0,5 n= 15 x≤4 (0,1,2,3,4) ÉXITO fracaso
x=5,6,7…..15
f) FORMULA
𝑛!
𝑃(𝑥 ) = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥 = (𝑛−𝑥)!𝑥! 𝑝 𝑥 𝑞𝑛−𝑥
P(x≤4 ) = (15
0
)𝑝0 𝑞15 + (15
1
)𝑝1 𝑞14) + (15
2
)𝑝2 𝑞13 + (15
3
)𝑝3 𝑞12) +(15
4
)𝑝4𝑞11
P(x≤4 ) = (15
0
)0.50 0.515 + (15
1
)0.51 0.514 ) + (15
2
)0.52 0.513 + (15
3
)0.53 0.512 ) +(15
4
)0.54 0.511
P(x≤4 ) = 0,0592
e) Mas de 13 caras
f) Menos de 3 caras
TALLER
Usar el membrete
Escribir enunciado, datos, formula, proceso, respuesta, interpretación.
Subir al aula en pdf, en el tiempo establecido.
Hallar la probabilidad de obtener exactamente 4 caras o más de 5 caras si se
lanza una moneda 7 veces.
d) La probabilidad de obtener exactamente 4 caras
e) La probabilidad de obtener más de 5 caras
f) probabilidad de obtener exactamente 4 caras o más de 5 caras
a) Exactamente 5 caras
Datos: p= ½ q=1/2 n=11 x=5 éxitos
FORMULA:
𝑛!
𝑃 (𝑥 ) = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥 = (𝑛−𝑥)!𝑥! 𝑝 𝑥 𝑞𝑛−𝑥
PROCESO:
11! 6!.7.8.9.10.11
P(X=5) = (11
5
)𝑝5𝑞6 = (11
5
)(1/2)5 (1/2)6 = ( ) (1/2)5 (1/2)6 = (6)!1.2.3.4.5
(1/2)5 (1/2)6
6 !5!
c) Máximo 8 caras
P (x ≤ 𝟖) =1- q
P (x ≤ 𝟖) =1- (P(x=9) +P(x=10) + P(x=11))
P (x ≤ 𝟖) =1- ((11
9
)𝑝9 𝑞2 +(11
10
)𝑝10 𝑞1 + (11
11
)𝑝11 𝑞0 ))
TALLER
Usar el membrete
Escribir enunciado, datos, formula, proceso, respuesta, interpretación.
Subir al aula en pdf, en el tiempo establecido.
Hallar la probabilidad de obtener 5 o 6 caras si se lanza una moneda 8 veces.
g) La probabilidad de obtener exactamente 5 caras
h) La probabilidad de obtener exactamente 6 caras
i) probabilidad de obtener 5 o 6 caras
g) Exactamente 4 caras
Datos: p= ½ q=1/2 n=12 x=4 éxitos
Formula:
𝑛
𝑃(𝑥 ) = ( ) 𝑝 𝑥 𝑞𝑛−𝑥
𝑥
12!
P(x=4)= (1/2)4 (1/2)8
8!4!
P(x=4)= 495(1/16)(1/256)
h) Exactamente 10 caras
i) Datos: p= ½ q=1/2 n=12 x=10 éxitos
k) Máximo 9 caras
l) Más de 10 caras
P(x>10) = P(11)+P(12)
P(x>10) = (12
11
)(0,5)11 (0,5)1 + (12
12
)(0,5)12 (0,5)0
P(x>10) = 0,0031738
P(x>10) =0,3174% de probabilidad de obtener más de 10 caras al lanzar la
moneda 12 veces
m) Menos de 3 caras
TRABAJO EN CLASE
LIBRO: Estadística y Probabilidades, Muchaypiña Jorge LAFONTE pag. 143
MEMBRETE
Enunciado, datos, formula, proceso, respuesta, interpretación.
Ejercicio: Hallar la probabilidad de obtener 4 o 5 caras si se lanza una moneda
6 veces.
A) probabilidad de obtener 4
B) probabilidad de obtener 5
C) probabilidad de obtener 4 o 5 caras
𝑛
𝑃(𝑥 ) = ( ) 𝑝 𝑥 𝑞𝑛−𝑥
𝑥
𝑃(𝑥 = 2) = 0.11%
𝑛
𝑃(𝑥 ) = ( ) 𝑝 𝑥 𝑞𝑛−𝑥
𝑥
𝑃 (𝑥 = 6) = 29.36%
𝑃(𝑥 ≥ 2) = 𝑝(2) + 𝑝(3) + 𝑝(4) + 𝑝(5) + 𝑝(6) + 𝑝(7) + 𝑝(8) = 1 − ⌊𝑝(0) + 𝑝(1)⌋
𝑃(𝑥 ≥ 2) = 49.67%
𝑃(𝑥 ≥ 6) = 49.67%
𝝀𝒙.ⅇ−𝝀
FÓRMULA: 𝑷(𝒙) = 𝒙!
𝟏𝟐𝟔 .ⅇ−𝟏𝟐
PROCESO: 𝑷(𝒙 = 𝟔) = =4147.2 * ⅇ−𝟏𝟐 = 0.02548
𝟔!
PROCESO
𝝀𝒙.ⅇ−𝝀
FÓRMULA: 𝑷(𝒙) = 𝒙!
Proceso
Tarea de clase
EJERCICIOS (4B)
El 6% de las bombillas fabricadas por una compañía son defectuosas, hallar la
probabilidad de que, en una muestra de 750 bombillas:
a) 7 sean defectuosas.
Datos: n= 750 x= 7 defectuosas ÉXITO p= 6%=0,06 defect.
𝝀 = 𝒏𝒑 = 750*0.06= 45
𝝀𝒙 .ⅇ−𝝀
FÓRMULA: 𝑷(𝒙) =
𝒙!
𝟒𝟓𝟕 .ⅇ−𝟒𝟓
PROCESO: 𝑷(𝒙 = 𝟕) = =2.12 E -12 = 2.12E-10 %
𝟕!
𝝀 = 𝒏𝒑 = 750*0.06= 45
𝝀𝒙 .ⅇ−𝝀
FÓRMULA: 𝑷(𝒙) = P=1-q
𝒙!
EJERCICIOS (4C)
El 3% de las bombillas fabricadas por una compañía son defectuosas, hallar la
probabilidad de que, en una muestra de 200 bombillas,
a) 7 sean defectuosas.
DATOS:
n=200 p=3%=0,03 defectuosas x=7 defect. (valor exacto)
𝝀 = 𝒏𝒑= 200(0,03) = 6
𝟔𝟕 .ⅇ−𝟔
PROCESO: 𝑷(𝒙 = 𝟕) = = 0.1377
𝟕!
EJERCICIO
TALLER
Resolver el ejercicio manualmente y subir al aula virtual en el tiempo establecido
EJERCICIOS (4D)
El 2% de las bombillas fabricadas por una compañía son defectuosas, hallar la
probabilidad de que, en una muestra de 150 bombillas, 4 sean defectuosas.
DATOS:
p = 2% = 0,02 defectuosas n= 150 bobillas x= 4 defect. 𝝀 = 𝒏𝒑 = 150 (0,02) = 3
𝝀𝒙 .ⅇ−𝝀
FÓRMULA: 𝑷(𝒙) = 𝒙!
𝟑𝟒 .ⅇ−𝟑 𝟑𝟒 .ⅇ−𝟑
Proceso: 𝑷(𝒙 = 𝟒) = = = 0,1680
𝟒! 𝟏.𝟐.𝟑.𝟒
P= 1- q
Ejercicio 60: suponga que una empresa aérea, en promedio uno de cada 150 vuelos se
retrasa más de una hora, si se programan 1500 vuelos en un mes:
a) Cuál es la probabilidad de que exactamente 3 vuelos se retrasen una hora.
b) Cuál es la probabilidad de que más de 3 vuelos se retrasen una hora.
c) Cuál es la probabilidad de que menos de 4 vuelos se retrasen una hora.
TALLER
Suponga que en promedio una casa de cada 2000 en cierta zona Buenas Aires, se
incendia durante el año. Si hay 6000 casas en dicha zona. Cual es la probabilidad de
que:
A) Mas de 3 casas se incendien durante el año
B) Exactamente 2 se incendien durante el año
𝝀𝒙 . ⅇ−𝝀
𝑷 (𝒙 ) =
𝒙!
𝟑𝟐 . ⅇ−𝟑
𝑷(𝒙) =
𝟐!
𝟗. 𝟎, 𝟎𝟒𝟗
𝑷(𝒙) =
𝟐. 𝟏
𝑷(𝒙) = 𝟎, 𝟐𝟐𝟒𝟎
𝑷(𝒙) = 𝟐𝟐, 𝟒𝟎%
𝑨 𝑪𝒙 ∗𝑵−𝑨 𝑪𝒏−𝒙
P(x,n) =
𝑵 𝑪𝒏
donde:
p(x, n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados
FORMULA
𝐴 𝑁−𝐴
( )( )
𝑃𝑋 = 𝑥 𝑛 − 𝑥
𝑁
( )
𝑛
Siendo:
N= Tamaño de la población.
A= Número de éxito de la población.
n= Tamaño de la muestra.
x= Numero de éxitos en la muestra.
𝐴 𝐴!
( )=
𝑋 (𝐴 − 𝑋)! 𝑋!
𝑁 𝑁!
( )=
𝑛 (𝑁 − 𝑛)! 𝑛!
TAREA 4A
EJERCICIOS (4C)
En la producción de cierto artículo se sabe que cada 48 producidos, en 41 su terminado
es excelente. Si se toman una muestra de 11 artículos. Cuál es la probabilidad:
a) De que exactamente 3 no sean clasificados como excelente. (x=3)
Datos: N= 48 A= 7 no excelente n= 11 x= 3 no excelente
FORMULA:
𝐴 𝑁−𝐴
( )( )
𝑃𝑋 = 𝑥 𝑛 − 𝑥
𝑁
( )
𝑛
PROCESO:
(7 48−7
3)(11−3) (7 41
3)( 8 )
𝑃𝑋=3 = = =
(48) (48)
11 11
7! 41!
∗
4!∗3! 33!∗8!
𝑃𝑋=3 = 48! = 0.1480
37!11!
(7 48−7
0)(11−0) (7 48−7
1)(11−1) (7 48−7
2)(11−2)
𝑃𝑋≥3 = 1 – ( + + )
(48) (48) (48)
11 11 11
(7 41
0)(11) (7 41
1)(10) (7 41
2)( 9 )
𝑃𝑋≥3 = 1 – ( + + 48 )
(48) (48) ( )
11 11 11
7! 41! 7! 41! 7! 41!
∗ ∗ ∗
𝑃𝑋≥3 = 1 – ( 7!∗0! 30!∗11!
48! + 6!∗1! 31!∗10!
48! + 5!∗2! 32!∗9!
48! )
37!11! 37!11! 37!11!
𝑃𝑋≥3 = 1 – 0.812755 = 0.1873
𝑃𝑋≥3 = 18.73% es la probabilidad de que por lo menos 3 artículos
sean clasificados como no excelente de una población de 48
producidos.
c) De que exactamente 3 sean clasificados como excelente. (x=3)
Datos: N= 48 A= 41 excelente n= 11 x= 3 excelente
FORMULA:
𝐴 𝑁−𝐴
( )( )
𝑃𝑋 = 𝑥 𝑛 − 𝑥
𝑁
( )
𝑛
PROCESO:
(41)(48−41) (41)(7)
3 11−3 3 8
𝑃𝑋=3 = 48 = =
( ) (48)
11 11
41! 7!
∗
38!∗3! 𝑋!∗8! 7
𝑃𝑋=3 = 48! = no existe por que ( ) no tiene solución
37!11!
8
d) De que exactamente 10 sean clasificados como excelente. (x=3)
EJERCICIO:
EJERICIO (4D)
FORMULA:
𝐴 𝑁−𝐴
( )( )
𝑃𝑋 = 𝑥 𝑛 − 𝑥
𝑁
( )
𝑛
PROCESO:
(7 55−7 (7 48 7! 48!
2)(12−2) 2)(10) ∗
5!∗2! 38!∗10!
𝑃𝑋=2 = = = 55! = 0.3131
(55) (55)
12 12 43!∗12!
f) Por lo menos dos no sean clasificados como excelente. (mínimo x=2,3,4….. 55)
FORMULA:
(𝐴 𝑁−𝐴
𝑥 )( 𝑛−𝑥 )
𝑃𝑋 = P = 1-q
(𝑁
𝑛)
(7 48 (7 48 7! 48! 7! 48!
0)(12) 1)(11) ∗
7!∗0! 36!∗12!
∗
6!∗1! 37!∗11!
𝑃𝑋≥2 = 1 – ( 55 + ) =1–( 55! + 55! )
( ) (55)
12 12 43!∗12! 43!∗12!
FORMULA:
𝐴 𝑁−𝐴
( )( )
𝑃𝑋 = 𝑥 𝑛 − 𝑥
𝑁
( )
𝑛
Proceso:…
Ejercicios
𝐴 𝑁−𝐴
( )( )
𝑃𝑋 = 𝑋 𝑛 − 𝑥
𝑁
( )
𝑛
6 15 − 6
( )( )
𝑃𝑋=2 = 2 5−2
15
( )
2
6 9
( )( )
𝑃𝑋=2 = 2 3
15
( )
2
𝑃𝑋=2 = 0.4195
𝑃 = 41.95%
𝐴 𝑁−𝐴
( )( )
𝑃𝑋 = 𝑋 𝑛 − 𝑥
𝑁
( )
𝑋
9 15 − 9
( )( )
𝑃𝑋=2 = 2 5−2
15
( )
5
9 6
( )( )
𝑃𝑋=2 = 2 3
15
( )
5
𝑃𝑋=2 = 0.2398
𝑃 = 23.98%
7
( ) (50 − 7)
𝑃𝑋=2 = 2 12 − 2
50
( )
12
7
( ) (50 − 7)
𝑃𝑋=2 = 2 12 − 2
50
( )
12
𝑃𝑋=2 = 0.3316
𝑃 = 33.96%
7 50 − 7 7
( )( ) ( ) (50 − 7)
𝑃𝑋≥2 =1− [ 0 12 − 0 + 1 12 − 1 ]
50 50
( ) ( )
12 12
7 43 7 43
( )( ) ( )( )
𝑃𝑋≥2 = 1−[ 0 12 + 1 12 ]
50 50
( ) ( )
12 12
𝑃𝑋≥2 = 0.5421
𝑃 = 54.21%
𝐴 𝑁−𝐴
( )( )
𝑃𝑋=2 = 𝑋 𝑛 − 𝑥
𝑁
( )
𝑋
43 50 − 43
()( )
𝑃𝑋=10 = 10 12 − 10
50
( )
12
43 7
()( )
𝑃𝑋=10 = 10 2
50
( )
12
𝑃𝑋=10 = 0.33167
𝑃𝑋=10 = 33.18%
𝐴 𝑁−𝐴
( )( )
𝑃𝑋 = 𝑋 𝑛 − 𝑥
𝑁
( )
𝑋
4 10 − 4
( )( )
𝑃𝑋=2 = 2 5 − 2
10
( )
5
4 6
( )( )
𝑃𝑋=2 = 2 3
15
( )
5
𝑃𝑋=2 = 0.4762
𝑃 = 47.62%
De hecho, la estadística descriptiva sólo permite describir un fenómeno, sin explicación alguna.
Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística
en psicología y sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más simples y antiguos.
𝑁 −𝑧2
𝑦= ∗𝑒 2𝜎−2
𝜎√2𝜋
−𝒁𝟐
𝟏
Si 𝜎 =1 𝑦𝑁 =1 𝒚= ∗ⅇ𝟐
√𝟐𝝅
Siendo:
−𝒁𝟐
𝟏
Funcion: 𝒚= ∗ⅇ 𝟐
√𝟐𝝅
(z)
GRAFICO EN GEOGEBRA
https://youtu.be/IfU61YcpISQ
GRAFICO EN EXCEL
https://youtu.be/jmed6Ad1nF4
Si Z = 0.87 A = … %A =….
A=0,2088 z=0,55
A=0,1950 z=0,51
https://matemovil.com/wp-content/uploads/2018/06/Tabla-z-distribuci%C3%B3n-
normal-estandarizada-MateMovil.pdf
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
4.0 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
Facebook Twitter Imprimir
EJERCICIOS (4D)
1 - 350
0.4292 x=
,n = N*A n= 350*(0.4292) = 150.22 = 150 individuos se encuentran en la
área pintada
1 - 570
0.4693 - x
A= 0.2854 z= 0.79
A= 0.3572 z=1.07
Taller (2B)
DEBER
Realizar 5 EJERCICIOS COMO EL MODELO DE LA CLASE
Resolver la pae
Prueba sábado 7h30
Ejercicio GRAFICAR Y COMPLETAR LA INFORMACION
N= 320 Z= 2.36 A = %A= n=
A= 0.2586 %A= Z= N= 320 n=
4) A= 0.3721 z= 1.14
Si la población es 450 individuos el área pintada corresponde a:
n= N*A n= 450* 0.3721 = 167.45 = 167 individuos en el área pintada
5) A= 0.4159 z= 1.38
Si la población es 450 individuos el área pintada corresponde a:
n= N*A n= 450* 0.4159 = 187.16= 187 individuos en el área pintada
DEBER
Z= 3.49 A= N= 180 n=
A= 0.3268 z= N= 330 n=
EJERCICIOS
A= 0,4625
%A= 46,25
Z= 1,04
3. Determinar el área y gráfica.
Z= 1,99 A= 0,4767 %A= 47,67%
A= 0,4767
%A= 47,67%
Z= 1,99
4. Determinar el área y gráfica.
Z= - 2,38 A= 0,4913 %A= 49,13%
A= 0,4913
Z= -2,38
Z= 2,16
Z= 1,05
𝐴2 = 0,3536 𝐴1 = 0,3536
Z= -2,12 Z= 1,05
100% - 520
83,66% - x = (0,8366*520)/100 =435,032 =435 elementos pertenecen región solución.
Otra forma
Nota: si los valores de z están al mismo lado del origen, las áreas se restan
𝐴 𝑇 = 𝐴1 -𝐴2
𝐴 𝑇 = 0,4925-0,4306
𝐴 𝑇 = 0,0619
%𝐴 𝑇 = 6,19%
𝐴1 = 0,4925
𝐴2 = 0,4306
Z= 1,48 Z= 2,43
Nota: si los valores de z están al mismo lado del origen las áreas se restan
𝐴 𝑇 = 𝐴1 -𝐴2
𝐴 𝑇 = 0,4925-0,4306
𝐴 𝑇 = 0,0619
%𝐴 𝑇 = 6,19%
𝒙−𝝁
𝒛=
𝝈
Ejercicios:
9. Dada una curva normal con 𝝁 = 𝟐𝟓, 𝟑 y 𝝈 = 𝟖, 𝟏. Hallar el área bajo la curva
entre 20,6 y 29,1. Para una población de 250 elementos, cual sería el tamaño de
la muestra.
Datos:
𝜇 = 25,3
𝜎 = 8,1
𝑥1 = 20,6 27
𝑥2 = 29,1 33
𝑁 = 250
𝑥1 − 𝜇 𝑥2 − 𝜇
𝑧= 𝑧=
𝜎 𝜎
20,6 − 25,3 29,1 − 25,3
𝑧1 = 𝑧2 =
8,1 8,1
Dra. Margoth Bonilla 55
𝑧1 = −0,58 𝑧2 = 0,469 = 0,47 ver en la tabla
𝐴1 = 0,2190 𝐴2 = 0,1808
%𝐴1 = 21,90% %𝐴2 = 18,08%
Nota: como los valores son z+ y z-, las áreas se suman
𝐴 𝑇 = 𝐴1 +𝐴2
𝐴 𝑇 = 0,2190+0,1808
𝐴 𝑇 = 0,3998
%𝐴 𝑇 = 39,98%
𝐴1=0,2190 𝐴2 = 0,1808
Z= -0,58 Z= 0,47
10. Con los datos del problema anterior calcular el área entre 29,1 y 35.
Datos:
𝜇 = 25,3
𝜎 = 8,1
𝑛 = 250
𝑥1 = 29,1
𝑥2 = 35
𝑥−𝜇
𝑧=
𝜎
35 − 25,3
𝑧=
8,1
𝑧 = 1,20 ver en la tabla
𝐴2 = 0,3849
%𝐴2 = 38,49%
Z= 0,47 Z= 1,20
Cuando los valores de z se encuentran al mino lado de la campana las áreas se restan.
𝐴 𝑇 = 𝐴2 − 𝐴1 𝐴 𝑇 = 0,3849-0,1808 𝐴 𝑇 = 0,2041 %𝐴 𝑇 = 20,41%
𝑥−𝜇
𝑧=
𝜎
12,4 − 25,3
𝑧=
8,1
𝑧 = −1,59
𝐴2 = 0,4441
%𝐴2 = 44,41%
𝐴2 = 0,4441
𝐴1=0,2190
𝐴 𝑇 = 𝐴2 -𝐴1
𝐴 𝑇 = 0,441-0,2190
𝐴 𝑇 = 0,2251
%𝐴 𝑇 = 22,51%
𝑛 = 𝐴𝑇 ∗ 𝑁
𝑛 = 0,2251 ∗ 250
𝑛 = 56,276
𝑛 = 56,28
12. Determine el área menor a 20,6.
Datos:
𝑧 = −0,58
𝐴1 = 0,2190
%𝐴1 = 21,90%
𝐴 𝑇 = 𝐴2 -𝐴1
𝐴 𝑇 = 0,50-0,2190
𝐴 𝑇 = 0,281
%𝐴 𝑇 = 28,1%
0,50
𝐴1=0,2190
Z=- 0,58
𝑛 = 𝐴𝑇 ∗ 𝑁
𝑛 = 0,281 ∗ 250
𝑛 = 70,25
𝑛 = 70
13. Determine el área bajo la curva que encuentre a la derecha de x=12,4.
𝑧 = −1,59
A= 0,4441
%A= 44,41%
0,50
𝐴1=0,4441
Z=- -1,59
𝑛 = 𝐴𝑇 ∗ 𝑁
𝑛 = 0,4441 ∗ 250
𝑛 = 236,025
𝑛 = 236
14. Se sabe que la duración media de los tubos de los receptores de televisión es de
3,0 años con una desviación de 1,5. Determinar el área y la muestra en una
población de 100.
Datos:
𝜇 = 25,3
𝜎 = 8,1
𝑛 = 250
𝑥−𝜇
𝑧=
𝜎
1 − 3,5
𝑧=
1,5
𝑧 = −1,33
A= 0,4082
%A= 40,82%
Z=- -1,33
𝐴 𝑇 = 𝐴2 -𝐴1
𝐴 𝑇 = 0,50-0,4082
𝐴 𝑇 = 0,0918
%𝐴 𝑇 = 9,18%
𝑛 = 𝐴𝑇 ∗ 𝑁
𝑛 = 0,0918 ∗ 100
𝑛 = 9,18
𝑛=9
Ejercicio 113.
En una distribución normal que tiene una desviación estándar de 2; la probabilidad de
que el valor de la variable elegida al azar sea menor a 28 es de 0.03.
a. ¿Calcule la media de la población?
b. Obtenga el valor de la variable que supera el 95% de los datos.
a.
Datos:
𝑥−𝜇
X>28 𝑧=
P=0.03 𝜎 𝑧 = 0.5 − 0.03
%A=3 z σ= x-µ Z= 1.88
σ=2
σ= x-z σ
σ = 28-(1.88) *(2)
µ = 24.24
x= σ z+µ
x =2* (1.64) +24.24
x = 27.52
127.El 10% de ciertas unidades compradas por un almacén son inadecuadas para la
venta. ¿Cuál es la probabilidad de que 42 o menos resulten inadecuadas en un lote de
500?
Datos:
P = 10% = 0,10 σ= µ= z= A=? n= 500 x= 42
σ = √50 ∗ 0.9
σ = √45 = 6,7
σ = 6,7
CALCULO DE LA MUESTRA EN EL AREA SONBREADA
n=A.N
n= 0,117 (500) = 58,5 = 59 ELEMENTOS QUE SE ENCUENTRA BAJO EL VALOR DE X= 42
UNIDAD 2
POBLACIÓN O UNIVERSO ESTADÍSTICO
En toda investigación estadística existe un conjunto de elementos sobre los que se toma
información
Muestreo: proceso mediante el cual se selecciona la muestra de uña población.
Muestra parte de la población determinada con un nivel de confianza tamaño de la
muestra =n es el número de elementos que se compone la muestra.
Estimadores: los estimadores se realizan atreves de funciones matemáticas de la
muestra denominadas estimadores que se convierten en variables aleatorias al
considerar la variabilidad de las muestras. Los errores se cuantifican mediante
varianzas, desviaciones típicas o errores, cuadráticos medios de los estibadores que
miden la presión de estos.
Tipos de muestreo: Existen2 tipos de muestreo denominados probabilísticos y no
probabilísticos
Tipos de población: existen probabilísticos finitas e infinitas.
Muestreo probabilístico: cuando se realiza este proceso todos los integrantes de la
población tienen la misma probabilidad de ser seleccionados como parte de la muestra
Muestreo no probabilístico: Este procedimiento no usa el azar en la selección de la
muestra los elementos de muestra se determinan por conveniencia del investigador por
este motivo los resultados de la investigación pueden estar sesgados, no permitiendo
emitir un juicio verdadero de la investigación pueden estar sesgados no permitiendo
emitir un juicio verdadero de la investigación.
MUESTREO
Proceso mediante el cual se determina la muestra de la población
Muestra
Parte de una población determinada con un nivel de confianza
Muestreo Probabilístico
Cuando se realiza este proceso todos los integrantes de la población tienen la misma
posibilidad de ser seleccionados como parte de la muestra. (prevalece el sorteo, el azar)
Muestreo No Probabilístico
Este procedimiento no usa el azar en la selección de la muestra, los elementos de la
muestra se determinan por conveniencia del investigador, por este motivo los resultados
de la investigación pueden estar sesgados, no permiten emitir un juicio valedero de la
investigación.
CALCULO DE LA MUESTRA
Población Finita:
Cuando se conoce el tamaño de la población, la muestra se determina con la siguiente
formula:
𝒁𝟐 𝝈 𝟐 𝑵 𝒁𝟐 𝒑𝒒 𝑵
𝒏 = ⅇ𝟐 (𝑵−𝟏)+𝒁𝟐𝝈𝟐 = ⅇ𝟐(𝑵−𝟏)+𝒁𝟐 𝒑𝒒 𝝈𝟐 = 𝒑𝒒
Población Infinita:
Cuando no se conoce el tamaño de la población, muestra se determina con la siguiente
formula:
𝒁𝟐 𝝈𝟐 𝒁𝟐 𝒑𝒒
𝒏= =
ⅇ𝟐 ⅇ𝟐
Notación:
N=Tamaño de la Población
n= Tamaño de la Muestra
σ= Desviación Estándar de la población
𝜎 2 = Varianza de la población
Z=Puntuación tipificada o estandarizada Z de acuerdo con el nivel de Confianza
e= Error muestral o tolerancia permitida 2% = 0,02
Tipos de Ensayos
Existen ensayos unilaterales y bilaterales.
1) Unilaterales
A= 0,5-0,05
A=0,45
Z= 1,64
2) Bilateral
A= 0,5-0,025
A=0,475
Z= 1,86
𝑵 𝒁𝟐 𝒑𝒒
𝒏=
ⅇ𝟐 (𝑵 − 𝟏) + 𝒁𝟐 𝒑𝒒
𝟏𝟔𝟓𝟎 (𝟏, 𝟔𝟒)𝟐 (𝟎, 𝟓)(𝟎, 𝟓)
𝒏=
(𝟎, 𝟎𝟐)𝟐 (𝟏𝟔𝟒𝟗) + (𝟏, 𝟔𝟒)𝟐 (𝟎, 𝟓)(𝟎, 𝟓)
𝒏 = 𝟖𝟑𝟐, 𝟗𝟑 ⇒ 𝟖𝟑𝟑
Ejemplo 2:
Con los datos del problema anterior trabajar con un ensayo bilateral.
n= 1650 NC= 95% Z= 1,96 e= 2% = 0,02 p= 0,5 q= 0,5
Ejemplo 3:
Repetir el ejercicio anterior con un NC= 98%
n= 1650 NC= 98% Z= 2,05 e= 2% = 0,02 p= 0,5 q= 0,5
𝑵 𝒁𝟐 𝒑𝒒
𝒏= 𝟐
ⅇ (𝑵 − 𝟏) + 𝒁𝟐 𝒑𝒒
𝟏𝟔𝟓𝟎 (𝟐, 𝟎𝟓)𝟐 (𝟎, 𝟓)(𝟎, 𝟓)
𝒏=
(𝟎, 𝟎𝟐)𝟐 (𝟏𝟔𝟒𝟗) + (𝟐, 𝟎𝟓)𝟐 (𝟎, 𝟓)(𝟎, 𝟓)
𝒏 = 𝟏𝟎𝟏𝟒
α = 5%
95%
Z= -1.64
Ensayo Bilateral
Z= -1.96 Z=1.96
A= 0.5-0.025=0.475
A=1.96
Ejercicio 2
Ensayo Unilateral derecho
NC=94%
A=0.5-0.06=0.44 Z=1.55 unilateral
Z=1.55
Ejercicio 3
NC=92%
A=0.5-0.08=0.42 Z=1.40 Unilateral
92% α =8%
Z=1.40
Ejercico 4
NC=98%
A=0.5- 0.02=0.48 Z=2.33 Unilateral
Z=2.33
Nz2 p. q
n= 2
e (N− 1) + z2 p. q
(1650)(1.64)2 (0.52 )
n=
(0.02)2 (1650 − 1) + (1.64)2 (0.5)2
n = 832.93 ~ 8.33
Nz2 p. q
n=
e2 (N− 1) + z2 p. q
n = 12.6
Con los datos anteriores trabajar la tolerancia permitida el tamaño de la muestra disminuye
N=1650 ∝= 𝑎𝑙𝑓𝑎 𝑒𝑠 𝑢n 𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝑢no
NC=95%
Z=1.96 (bilateral )
e = 2% 0.02
p=0.50
q=0.50
Nz2 p. q
n=
e2 (N− 1) + z2 p. q
(1650)(1.96)2 (0.5)
n=
(0.02)2 (1650 − 1) + (196)2 (0.5)2
n = 978.18 ~ 978
cambiar la tolerancia e=7% = 0.07
Nz2 p. q
n=
e2 (N− 1) + z2 p. q
(1650)(1.96)2 (0.5)2
n=
(0.02)2 (1650 − 1) + (196)2 (0.5)2
Nz2 p. q
n= 2
e (N− 1) + z2 p. q
(1650)(2.06)2 (0.5)2
n=
(0.02)2 (1650 − 1) + (2.06)2 (0.5)2
n = 1013.62 ~ 102
Z=1,64
∝
∝ = 2,5%
= −2,5% 2
2
NC=95%
Z=-1,96 Z=1,96
MUESTREO PROBABILISTICO.
Son aquellos que se basan en el principio de equiprobabilidad. Todos los individuos de la población
tienen la misma probabilidad de ser elegidos parte de la muestra.
Este procedimiento permite asegurar que la muestra es representativa.
MUESTREO SISTEMÁTICO. -
Este es un procedimiento ordenado en el cual es necesario enlistar a los individuos.
𝑵
Calcular el coeficiente de sistematización con la fórmula: CS=
𝒏
AFIJACION SIMPLE:
En cada estrato le corresponde igual número de elementos muéstrales.
AFIJACIÓN PROPORCIONAL:
La distribución de la muestra se hace de acuerdo con el peso de la población o proporcional a los
elementos de la población.
AFIJACIÓN ÓPTIMA:
Se toma en cuenta la dispersión de los resultados de modo que se considera la proporción y la
desviación típica.
419(1,64)2 (0,5)(0,5)
𝑛= n= 335,56 n= 336 INDIVUDUOS
(0,05)2 (419−1)+(1,64)2 (0,5)(0,5)
Ejemplo:
NC: 95%
∝ 5
= = 2.5%
2 2
𝐴 = 0.50 − 0.025
A= 0.475
Z= ±1.96
∝ 𝜎
𝐸=𝑍 ∗
2 √𝑛
INTERVALOS
Datos: 𝑥̅ = 26.2
s=5.15
n=32
NC= 95%
1: Calcular Z
∝
𝑍= = 1.96
2
2: Calcular E
∝ 𝜎
𝐸 =𝑍2∗
√𝑛
5.15
𝐸 = 1.96 ∗
√32
E= 1.78
3: Intervalo de confianza
Primera forma
𝐼𝐶: 𝑋̅ − 𝐸 < 𝑥̅ < 𝑥̅ + 𝐸
𝐼𝐶: 26.2 − 1.78 < 𝑥̅ < 26.2 + 1.78
𝐼𝐶: 24.48 < 𝑥̅ < 27.98
Segunda forma
Datos:
gl=n-1 gl=28-1 gl=27 (ver tabla) 𝑡∝ = 2.05
2
✓ Para probar la durabilidad de una pintura que se utiliza en las líneas de división de carriles.
El departamento de autopistas pintó franjas de prueba en camino muy transitados por 8
cifras, las que determinan una media de nivel de 140800 automóviles y una desviación
estándar de 19200.
∝
Datos: 1) Calcular T
2
2) Calcular error
𝜎
𝐸 = 𝑡∝ ∗
2 √𝑛
19200
𝐸 = 2.36 ∗
√8
E=16020.21
3) Intervalo de confianza
PRIMERA FORMA
𝐼𝐶: 𝑋̅ − 𝐸 < 𝑥̅ < 𝑥̅ + 𝐸
INTERVALOS:
Li= 𝑃 − 𝐸 =0.4368 – 0.0292 = 0.4076
Ls= 𝑃 + 𝐸 = 0.4368 + 0.0292 = 0.466
Primer modelo
𝐼𝐶: 𝑃 − 𝐸 < 𝑃 < 𝑃 + 𝐸 𝐼𝐶: 0.4368 – 0.0292 < 𝑃 < 0.4368 + 0.0292
𝐼𝐶: 𝐿𝑖 < 𝑃 < 𝐿𝑠 𝐼𝐶: 0.4076 < 𝑃 < 0.466
Segundo modelo
IC:P±E IC: P±0.0292 IC: 0.4368±0.0292
Tercer modelo
IC: (P-E;P+E) IC: (0.4368 – 0.0292; 0.4368 + 0.0292 ) (0.4076; 0.466)
FORMULA
𝑝𝑞
𝐸 = 𝑡𝛼 √
2 𝑛
PROCESO
0.3667(0.6333)
𝐸 = 2.756√ =0.2425
30
INTERVALOS:
Li= 𝑃 − 𝐸 =0.3667 – 0.2425 = 0.1242
Ls= 𝑃 + 𝐸 = 0.3667 + 0.2425 = 0.6092
Primer modelo
𝐼𝐶: 𝑃 − 𝐸 < 𝑃 < 𝑃 + 𝐸 𝐼𝐶: 0.3667 – 0.2425 < 𝑃 < 0.3667 + 0.2425
𝐼𝐶: 𝐿𝑖 < 𝑃 < 𝐿𝑠 𝐼𝐶: 0.1242 < 𝑃 < 0.6092
Segundo modelo
IC:P±E IC: P±0.2425 IC: 0.3667±0.2425
Tercer modelo
IC: (P-E;P+E) IC: (0.3667 – 0.2425; 0.3667 + 0.2425 ) (0.1242; 0.6092)
DEBER
2 EJERCICOS DE MUESTRA GRANDE
2 EJERCICIO DE MUESTRA PEQUEÑA
PAE : REACTIVOS DE ESTIMACIONES
CONSULTA PARA EL CUADERNO (DEBE SOCIALIZAR)
Modelos para verificar hipótesis de la distribución normal
Nombre y formula
Modelos para verificar hipótesis de la distribución t student
Nombre y formula
Puede consultar en estadística y muestreo de Ciro Martínez (Elibro biblioteca uta)
Ejercicios (4B)
Para muestra grande
Para una muestra de 580 individuos y el nivel de confianza 94% construir el intervalo
estimado de la proporción poblacional P, dado para un valor igual a 215 individuos.
Dra. Margoth Bonilla 82
α 6
DATOS: n = 580 x= 215 NC = 94% α= 6% (unil) = = 3% = 0.03 (bilat)
2 2
x 215
A= 0.5 – 0.03 = 0.47 ver tabla 𝑍𝛼 = 1.88 p= 𝑛 = = 0.3707 q= 1 – p = 1-03707 = 0.6293
2 580
Formula:
𝑝𝑞
𝐸 = 𝑍𝛼 √
2 𝑛
Proceso:
0.3707(0.6293)
𝐸 = 1.88√ = 0.037
580
Intervalos
Li= 𝑃 − 𝐸 =0.3707 – 0.037 = 0.3337
Ls= 𝑃 + 𝐸 = 0.3707 + 0.037 = 0.4077
Primer modelo
𝐼𝐶: 𝑃 − 𝐸 < 𝑃 < 𝑃 + 𝐸 𝐼𝐶: 0.3707 – 0.037 < 𝑃 < 0.3707 + 0.037
𝐼𝐶: 𝐿𝑖 < 𝑃 < 𝐿𝑠 𝐼𝐶: 0.3337 < 𝑃 < 0.4077
Segundo modelo
IC:P±E IC: P±0.037 IC: 0.47±0.037
Tercer modelo
IC: (P-E;P+E) IC: (0.3707 – 0.037; 0.3707 + 0.037 ) (0.3337; 0.4077)
Para muestra pequeña
Para una muestra de 26 individuos y el nivel de confianza 90% construir el intervalo
estimado de la proporción poblacional P, dado para un valor igual a 8 individuos.
α 10
DATOS: n = 26 x= 8 NC = 90% α= 10% (unil) 2 = 2 = 5% = 0.05 (bilat)
x 8
gl = n-1= 26 – 1 = 25 ver tabla 𝑡𝛼 = 1.708 p= = = 0.308 q= 1 – p = 1-0308 = 0.692
2 𝑛 26
Formula
𝑝𝑞
𝐸 = 𝑡𝛼 √
2 𝑛
Proceso
0.308(0.692)
𝐸 = 1.708√ = 0.1546
26
INTERVALOS
Li= 𝑃 − 𝐸 =0.308 – 0.1546 = 0.1534
Ls= 𝑃 + 𝐸 = 0.308 + 0.1546 = 0.4626
Primer modelo
1. 𝐼𝐶: 𝑃 − 𝐸 < 𝑃 < 𝑃 + 𝐸 𝐼𝐶: 0.308 – 0.1546 < 𝑃 < 0.308 + 0.1546
𝐼𝐶: 𝐿𝑖 < 𝑃 < 𝐿𝑠 𝐼𝐶: 0.1534 < 𝑃 < 0.4626
Segundo modelo
2. IC:P±E IC: P±0.1546 IC: 0.308±0.1546
Tercer modelo
3. IC: (P-E;P+E) IC: (0.308 – 0.1546; 0.308 + 0.1546 ) (0.44; 0.4626)
Ejercicio (4C)
EJEMPLO MUESTRA GRANDE
Para una muestra de 730 individuos y el nivel de confianza 90% construir el intervalo
estimado de la proporción poblacional P, dado un valor de 345 individuos.
𝑥 345
Datos: n=730 x= 345 p=𝑛 = 730 = 0.47 q= 1 – p = 1 – 0.47 = 0.53
α 10
NC= 90% α = 10% = = 5% = 0.05 A= 0.5 – 0.05 = 0.45 tabla 𝑍𝛼 =1.64 grafico
2 2 2
Formula
𝑝𝑞
𝐸 = 𝑍𝛼 √
2 𝑛
Proceso
0.47(0.53)
𝐸 = 1.64√ = 0.03
730
INTERVALOS
Li= 𝑃 − 𝐸 =0.47 – 0.03 = 0.44
Ls= 𝑃 + 𝐸 = 0.47 + 0.03 = 0.5
Primer modelo
4. 𝐼𝐶: 𝑃 − 𝐸 < 𝑃 < 𝑃 + 𝐸 𝐼𝐶: 0.47 – 0.03 < 𝑃 < 0.47 + 0.03
𝐼𝐶: 𝐿𝑖 < 𝑃 < 𝐿𝑠 𝐼𝐶: 0.44 < 𝑃 < 0.5
Segundo modelo
5. IC:P±E IC: P±0.03 IC: 0.47±0.03
Tercer modelo
6. IC: (P-E;P+E) IC: (0.47 – 0.03; 0.47 + 0.03 ) (0.44; 0.5)
DEBER
2 EJERCICOS DE MUESTRA GRANDE
2 EJERCICIO DE MUESTRA PEQUEÑA
PAE : REACTIVOS DE ESTIMACIONES
CONSULTA PARA EL CUADERNO (DEBE SOCIALIZAR)
Modelos para verificar hipótesis de la distribución normal
Nombre y formula
Modelos para verificar hipótesis de la distribución t student
Nombre y formula
Puede consultar en estadística y muestreo de Ciro Martínez (Elibro biblioteca uta)
tall
Ejercicios (4D)
Para una muestra de 958 individuos y el nivel de confianza 97% construir el intervalo
estimado de la proporción poblacional P, dado un valor de 185 individuos.
𝛼 3
Datos: n= 958 x= 185 NC= 97% 𝛼 = 3% 2 = 2 = 1,5% = 0.015
A= 0.5 – 0.015 =0.485 ver tabla 𝑍𝛼 = 2.17 GRAFICAR CAMPANA
2
𝑥 185
P= 𝑛 = 958 = 0.193 q= 1 – p = 1 – 0.193 = 0.807
FORMULA
𝑝𝑞
𝐸 = 𝑍𝛼 √
2 𝑛
PROCESO
0.193∗0.807
𝐸 = 2.17√ = 0.028
958
INTERVALOS
Ejemplo:
Para una muestra de 1068 individuos y el nivel de confianza dado construir el intervalo
estimado de la proporción poblacional P, para 267.98
Datos: n=1068 x=267.98
𝑥 267
𝑝= = = 0.25
𝑛 1068
𝑞 = 1 − 𝑝 = 1 − 0.25 = 0.75
∝ 2
𝑁𝐶 = 98% = 2 = 1% 𝐴 = 0.5 − 0.01 = 0.49 Z=2.33
2
𝑝(1 − 𝑝)
0.02 = 2.33√
543
𝑝 − 𝑝2
0.02 = 2.33√
543
0.02 𝑝 − 𝑝2
( ) = (√ )
2.33 543
𝑝 − 𝑝2
0.0000736 =
543
0.040 = 𝑝 − 𝑝2
−𝑏 ± √𝑏2 − 4𝑎𝑐
𝑝=
2𝑎
1 ± √(−1)2 − 4(1)(0.040)
𝑝=
2(1)
P1:0.96
P2:0.04
Repetir el procedimiento con el error de tolerancia de 0.02
𝑝(1 − 𝑝)
0.02 = 2.33√
3393
𝑝 − 𝑝2
0.02 = 2.33√
3393
0.02 𝑝 − 𝑝2
( ) = (√ )
2.33 3393
𝑝 − 𝑝2
0.0000736 =
3393
0.025 = 𝑝 − 𝑝2
𝑝2 − 𝑝 + 0.25 = 0
a=1 b=-1 c=0.25
−𝑏 ± √𝑏2 − 4𝑎𝑐
𝑝=
2𝑎
1 ± √(−1)2 − 4(1)(0.040)
𝑝=
2(1)
P1:0.5
P2:0.5
VERIFICACION DE HIPOTESIS
GRAFICO DE LA CURVA NORMAL EN GEOGEBRA
https://youtu.be/IfU61YcpISQ
GRAFICO EN EXCEL
https://youtu.be/jmed6Ad1nF4
VERIFICACION DE HIPOTESIS
HIPOTESIS: es una proposición, supuesto, una conjetura que requiere ser verificada.
La proposición consta de dos variables: variable dependiente y variable independiente o
causa y efecto
PROPOSICION: es un enunciado que tiene carácter de verdad
ENSAYO BILATERAL.
α 5
NC= 95% α = 5% = 0.05 = = 2.5% = 0.025 A= 0.5 - 0.025 = 0.475 VER TABLA Zt = ±1.96
2 2
Ejercicio (4c)
Escribir la regla de decisión para 97%
PROCEDIMIENTO PARA VERIFICACIÓN DE LA HIPÓTESIS
Objetivo: de la verificación de hipótesis determina la valides de los enunciados o supuestos
poblacionales, aplicando un método estadístico de una, dos o más poblaciones.
Existen varios procedimientos uno de los más recomendados tiene cinco pasos:
PASO 1°: Planteamiento de la hipótesis.
Modelo lógico (escribir hipótesis en enunciado)
𝐻𝑂 : hipótesis nula. - niega a la hipótesis de investigaciones.
𝐻1 ;𝐻𝑖 : hipótesis altera o de investigación. – es el enunciado propuesto por la investigación
por lo tanto afirmativa o verdadera.
Modelo matemático (escribir la hipótesis en formula)
𝐻𝑂 ; 𝑋1 + 𝑋2 𝐻𝑂 ; 𝑋1 = 𝑋2 𝐻𝑂 ; 𝑋̅1 + 𝑋̅2
𝐻1 ; 𝑋1 ≠ 𝑋2 𝐻𝑂 ; 𝑋1 > 𝑋2 𝐻𝑂 ; 𝑋̅1 < 𝑋̅2
(BILATERAL) (UNILATERAL DERECHO) (UNILATERAL IZQUIERDO)
Rechazo𝐻0
NC=95%
Acepto 𝐻0 ∝= 5%
Z=1,64
Rechazo𝐻0
NC=95%
∝= 5% Acepto 𝐻0
Z=-1,64
Rechazo𝐻0 Rechazo𝐻0
∝ ∝
= −2,5% = 2,5%
2 NC=95% 2
Acepto 𝐻0
https://www.geogebra.org/m/k6xFEq7W
Tipos de error
Al aceptar o rechazar la hipótesis se puede cometer dos tipos de errores de acuerdo al
siguiente gráfico:
ACEPTAR RECHAZAR
𝑯𝑶 v // 𝑇𝑖𝑝𝑜𝐼∝
𝑯𝑶 F 𝑇𝑖𝑝𝑜𝐼𝐼𝛽 //
4.1−4.6
Cálculo del modelo: Z = 1.8 = ± 1.62
√34
VERIFICACIÓN DE LA HIPÓTESIS
1) Planteamiento de la hipótesis
Modelo lógico
Ho: no es verdad que un gimnasio invita a sus clientes argumentando una reducción
de peso, al menos de 4,6 kilos
Hi: es verdad que un gimnasio invita a sus clientes argumentando una reducción de
peso, al menos de 4,6 kilos
Modelo matemático
Ho: µ = 4.6
Hi: µ ≥ 4.6 ( unilateral derecho)
2) Nivel de confianza (o nivel de significancia)
La hipótesis se verifica con el 99% de nivel de confianza con un
error α = 1%
3) Modelo estadístico
Para una muestra grande como indica el problema se aplica la
distribución de medias muestrales.
𝑥̅ −𝜇
Z= 𝜎
√𝑛
4) Regla de decisión
Con el 99% de nivel de confianza y ensayo unilateral α = 1%= 0.01
𝐴 = 0,50 − 0.01 = 0.49 ver tabla 𝑍 = 2.33
Rechazo𝐻0
NC=99%
Acepto 𝐻0 ∝= 1%
Z=2.33
Dra. Margoth Bonilla 94
La regla de decisión es 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 𝑠𝑖 𝑍𝑐 < 𝑍𝑡 o 𝑍𝑐 < 2.33
5) Cálculo del modelo estadístico y toma de decisión
5.a) Cálculo del modelo estadístico
Con los datos del problema se reemplaza em el modelo estadístico
𝑥̅ −𝜇
Fórmula del modelo: Z = 𝜎
√𝑛
4.1−4.6
Cálculo del modelo: Z = 1.8 = ± 1.62
√34
3.62−3.6
CALCULO DEL MODELO: Z = 0.21 = ∓1.35
√200
Rechazo𝐻0 Rechazo𝐻0
∝ ∝
= −2,5% = 2,5%
2 NC=95% 2
Acepto 𝐻0
Z=-1,96 Z=1,96
3.62−3.6
CALCULO DEL MODELO: Z = 0.21 = ∓1.35
√200
𝒙 𝟗
Datos: P= 20%= 0.2 p= = 𝟓𝟎 = 0.18 n= 50
𝒏
Hipótesis: Un cirujano desarrollo una nueva técnica quirúrgica que disminuya la tasa
de mortalidad post - operatoria.
Modelo
𝒑−𝑷
𝒛=
𝒑𝒒
√𝒏
94.3−89.7
𝑧= 196 289
= ± 1.71
√ +
80 60
𝒙 𝟖 𝒙 𝟔
Datos: P1= 𝒏 = 𝟏𝟎𝟎 =0.08 P2= 𝒏 = 𝟏𝟎𝟎 =0.06
EJERCICIO:
Ciro Martínez pág. 337
9. una muestra aleatoria de zapatos (n=40) usados por los soldados en campaña en un
desierto, revela una vida media de 1.08 años con una desviación estándar de 0.5 años. se
sabe que en condiciones normales dichos zapatos tiene una vida media de 1.28 años. Al
nivel de significancia del 5% ¿hay razón para sostener que la distribución de la vida media
de los zapatos se debe a su uso en el desierto?
Existen dos procedimientos para determinar el valor del modelo estadístico: Con una
muestra simple o con tablas de contingencia.
Las frecuencias esperadas fe son las que se calculan en función de las frecuencias
conocidas.
Para aplicar este método se recomienda que en las frecuencias esperadas el valor mínimo
sea 5.
Grados de libertad
En la tabla simple los grados de libertad se denominan por la fórmula de Fisher gl = n-1
Tabla de contingencia: Las tablas de contingencia son tablas de doble entrada en la cual se
cruzan la información de dos variables de la hipótesis. Por ejemplo
Ítem 4
Ítem 1
Muy
Excelente bueno Bueno Regular TOTAL
Excelente
Muy bueno
Bueno
TOTAL ……….
Frecuencias fo o fe
Datos MARGINALES O
TOTALES
La tabla de chi cuadrado es una tabla de doble entrada que tiene en la primera fila los
niveles de confianza y en la primera columna los grados grado de libertad.
Nc= 95%
Gl= 7 NC=95% Rechazo Ho ∞
5%
χ2= 14.07 Acepto Ho
χ2=14.07
Nc= 97.5%
Gl= 7 NC=97.5% Rechazo Ho
∞2.5%
χ2=16.1 Acepto Ho
χ2=16.1
Nc=99%
Gl=7 NC=99% Rechazo Ho ∞
1%
χ2= 18.48 Acepto Ho
χ2= 18.48%
Nc= 5%
Gl=7% NC= 5% Rechazo Ho ∞
χ2= 2.17 Acepto Ho
χ2= 2.17
Regla de decisión:
Decisión: con los datos del problema se tiene X2=52.9097 que se encuentra en la zona de
rechazo Ho, por lo tanto con el 95% de nivel de confianza se rechaza Ho y se acepta la
hipótesis alterna Hi: En la presentación de un grupo de musico profesionales se observa que
la música country si tiene buena acogida.
El número de incendios en cierta ciudad durante una semana es: Lunes 8, Martes 7,
Miércoles 9, Jueves 6, Viernes 13, Sábado 12, Domingo 10
Regla de decisión:
NC= 95% α = 5% = 0.05 Valor de chi cuadrado de la tabla Xt2= 12.592 gl= n-1= 7-1 = 6
xxxxx
Promedio X= ∑x/n
∞= 5%
GL=N-1 =7-1 =6
El valor tabular es
X2= 12.95
TOMA DE DECISION:
Les decimos pruebas aplicadas a cuadros de contingencia, algunos los denominan también
como decimas de independencia. Sin embargo, permiten la realización de pruebas de
homogeneidad.
Un cuadro de contingencia es un arreglo por el cual un conjunto de observaciones se
dispone conforme a dos criterios de clasificación, una de los cuales se expresa en columnas
y el otro en reglones. (Martínez Bencardio, 2012, pág. 431)
Modelo de tabla de contingencia:
Ítem 4
Ítem 1
Muy
Excelente bueno Bueno TOTAL
Excelente
Muy bueno
Bueno
TOTAL
Procedimiento
1. Calcular los valores extremos de la tabla de contingencia.
2. Calcular las frecuencias esperadas (en otra tabla), multiplicando los valores
extremos en cada caso y dividiendo este resultado para el total.
Ítem 4
Ítem 1
Muy
Excelente bueno Bueno TOTAL
Excelente fe Tf
Muy bueno
Bueno
TOTAL Tc T
𝑇𝑐 ∗ 𝑇𝑓
𝑓𝑒 =
𝑇
X2= ………
EJERCICIO 4C
Analizar la información de la tabla que representa el número de niños ingresados por tipo
de obesidad y sexo en el mes de enero. Con el 95% determinar el buen estado de salud.
Hipótesis: los niños ingresados por tipo de obesidad y sexo en el mes de enero se observa
que los niños …. tienen un buen estado de salud.
Regla de decisión:
NC= 95% α = 5%= 0,05 gl=(f-1)(c-1)=(4-1)(2-1)= 3*1=3 X2= 7.815
EJERCICIO 4D
Ejercicio 58
En una operación de control se clasifican las piezas producidas por 4 máquinas en tres
grupos, según su calidad (buena, regular y mala). El nivel del 5% según los resultados
obtenidos. Puede admitirse que la distribución de las piezas, buenas, malas y regulares es
lo mismo, independientemente de la máquina que las fabrico?
Hipótesis: la distribución de las piezas, buenas, malas y regulares … es independientemente
de la máquina que las fabrico.
FRECUENCIAS OBSERVADAS
CLASIFICACION
MAQUINA TOTAL
BUENAS REGULARES MALAS
1 229 216 105 550
FRECUENCIAS ESPERADAS
MAQUINA BUENAS REGULARES MALAS TOTAL
1 245.37 201.39 103.24 550
2 164.18 134.75 69.08 368
3 111.98 91.91 47.11 251
4 153.47 125.96 64.57 344
TOTAL 675 554 284 1513
REGLA DE DECISIÓN
N.C= 98% 𝛼=2%=0,02
𝑥 2 c < 15.033
𝑥 2 t =15,033
TOMA DE DECISIÓN
Con los datos del valor calculado de chi cuadrado es 𝑥 2 =7,7472, que se encuentra en la zona
de aceptación Ho, por lo tanto, con el 98% de Nivel de Confianza se acepta Ho: la distribución de
N fo
SOLICITUDES
0 55
1 72
2 84
3 58
3 37
5 24
330
Hipótesis, Regla de decisión, Calculo x2, decisión
Taller
ESTADISTICA PARA LA ADMINISTRACION Y ECONOMIA MASON ED 11 ejercicio 24 PG 573
N fo
SOLICITUDES
0 50
1 77
2 81
3 48
3 31
5 13
300
Para que exista un análisis de correlación las variables deben tener aspectos que se
relacionen entre ellos. Los datos para un análisis de correlación se determinan por parejas
por lo tanto pueden representarse gráficamente con gráficos denominados de dispersión.
GRÁFICOS DE DISPERSIÓN
El coeficiente de correlación lineal r° mide la fuerza de la relación lineal entre los variables
cuantitativas expresadas como x, y de una muestra. El coeficiente de correlación lineal es
propuesto por Karl Pearson.
GRADO DE CORRELACIN ENTRE LAS VARIABLES
0 a 0.2 correlación muy baja y no permite análisis
0.2 a 0.5 correlación baja
0.5 a 0.6 correlación aceptable
0.7 a 0.8 correlación buena
0.8 a 0.9 correlación alta
0.9 a 1 correlación muy alta
Fórmula para calcular el coeficiente r°
∑𝑦 ∑𝑥
Punto de corte de la recta con el eje y: a= –b
𝑛 𝑛
𝑟
𝑡 =
1−𝑟°
√
𝑛−2
EJERCICIO 4C
ESTADISTICA APLICADA DE MASON PG 475, N 14
El señor presidente de una empresa considera que existe una relación entre el numero de
entrevistas con clientes y el importe en dólares de las ventas. Para documentar esta afirmación,
recopilo la siguiente información muestral (ver tabla).
X Y
14 24
12 14
GRAFICO
80
60
40
20
0
0 10 20 30 40 50 60
CLIENTES
TABLA DE FRECUENCIAS
n X Y xy x^2 y^2 Y’ = a + bx
1 14 24 336 196 576 18,517
2 12 14 168 144 196 14,127
3 20 28 560 400 784 31,687
4 16 30 480 256 900 22,907
5 46 80 3680 2116 6400 88,757
6 23 30 690 529 900 38,272
7 48 90 4320 2304 8100 93,147
8 50 85 4250 2500 7225 97,537
9 55 120 6600 3025 14400 108,512
10 50 110 5500 2500 12100 97,537
334 611 26584 13970 51581
ESTADISTICA APLICADA DE MASON PG 475, N 14
coeficiente de correlación
10∗26584−334∗611 61766
b=(10∗13970)−(334)2] = = 2,195
28144
∑𝑦 ∑𝑥
Punto de corte de la recta con el eje y: a= –b
𝑛 𝑛
611 334
a= – 2,195 * = - 12,213
10 10
Y’ = - 12,213 + 2,195x
𝑟 0.975 0.975
𝑡 = = = = 17.12
1−𝑟° 1−0.975 1−0.975
√ √ √
𝑛−2 10−2 10−2
REGLA DE DECISIÓN
GRAFICO: …..
DECISION: con los datos del problema se tiene el modelo t student t= 17.12 que se encuentra en
la zona de rechazo Ho; por lo tanto con el 95% de nivel confianza se rechaza la hipótesis nula y de
acepta la hipótesis alterna Hi: El señor presidente de una empresa considera que si existe una
relación entre el número de entrevistas con clientes y el importe en dólares de las ventas.
El gerente de ventas de una compañía expresa que tiene una gran fuerza de ventas en toda la ciudad, desea
determinar si existe relación entre el número de llamadas telefónicas de ventas hechas en un mes, y la
cantidad de copiadoras vendidas durante ese lapso. El gerente selecciona al azar una muestra de 10
representantes y determina que el número de tales llamadas que hizo cada uno el mes anterior y la cantidad de
productos vendidos. De acuerdo con el siguiente cuadro:
n X Y
1 20 30
2 40 60
3 20 40
4 30 60
5 10 30
6 10 40
7 20 40
8 20 50
9 20 30
10 30 70
220 450
GRAFICO DE DISPERSION
70 R² = 0,5761
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35 40 45
# DE LLAMADAS
n X Y xy x^2 y^2 Y’ = a + bx
1 20 30 600 400 900 42,63
2 40 60 2400 1600 3600 66,31
3 20 40 800 400 1600 42,63
4 30 60 1800 900 3600 54,47
5 10 30 300 100 900 30,79
6 10 40 400 100 1600 30,79
7 20 40 800 400 1600 42,63
8 20 50 1000 400 2500 42,63
9 20 30 600 400 900 42,63
10 30 70 2100 900 4900 54,47
220 450 10800 5600 22100
Cálculo de la Correlación
𝑛(∑ 𝑥𝑦) − (∑ 𝑥)(∑ 𝑦)
𝑟𝑜 =
√[𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 ][𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2 ]
10∗10800−220∗450 9000 45
b=[10(5600) − (220)2] =7600 = 38 = 1,184
HIPOTESIS: El gerente de ventas de una compañía expresa que … tiene una gran fuerza de ventas en toda la
ciudad, desea determinar si existe relación entre el número de llamadas telefónicas de ventas hechas en un
mes, y la cantidad de copiadoras vendidas durante ese lapso
REGLA DE DECISION:
GRAFICO …….
DECISION:
Con los datos del problemas el valor del modelo estadístico t student t= 4,37 se encuentra en la zona de
rechazo Ho; por lo tanto con el 95% de nivel de confianza se rechaza la hipótesis nula y se acepta la hipótesis
alterna Hi: El gerente de ventas de una compañía expresa que si tiene una gran fuerza de ventas en toda la
ciudad, desea determinar si existe relación entre el número de llamadas telefónicas de ventas hechas en un
mes, y la cantidad de copiadoras vendidas durante ese lapso.
EJERCICIO:
Un profesor intenta mostrar a sus estudiantes la importancia de los exámenes cortas aun
cuando el 90% de la calificación final este determinada por los parciales. El cree que
cuando más altos sean las calificaciones de los exámenes cortos más alta será la calificación
final.
(x) (y) X.Y X2 Y2
1 52 65 3380 2704 4225
2 92 84 7728 8464 7056
3 72 77 5544 5184 5929
4 90 80 7200 8100 6400
11(70873) − (1899)(860)
𝑟𝑜 =
√11(75083) − (899)2 √11(67606) − (860)2
r° =0.76 r= 76%
𝑟
𝑡 =
1−𝑟°
√
𝑛−2
VERIFICACION DE HIPOTESIS
0.46√11 − 2
𝑡 =
√1 − (0.76)2
𝑡 = 3.5
gl = n-2
gl = 9 =
tt = 1.83
Tc= 3.5
Toma de decisión
Se realizó la prueba de hipótesis con el 90% de nivel de confianza y un ensayo bilateral, por
lo tanto, rechazamos Ho y aceptamos la h1: Es cierto que las calificaciones sean más altas
que los exámenes cortos.
La ecuación de regresión lineal es la mejor aproximación que se tiene para formar una recta
con un grupo que analiza dos muestras de variables cuantitativas.
Uno de los métodos para determinar la recta conocida con el nombre de la recta del mejor
ajuste es el MÉTODO DE MÍNIMOS CUADRADOS.
El modelo de la línea de estimación o regresión está dado por:
𝑦 = 𝑎 + 𝑏𝑥
PENDIENTE DE LA RECTA DE MEJOR AJUSTE
∑ 𝑥𝑦 − 𝑛𝑥̅ 𝑦̅
𝑏=
∑ 𝑥 2 − 𝑛𝑥̅ 2
b= pendiente de la recta de estimación de mejor ajuste
x= valores de la variable independiente
y= valores de la variable dependiente
̅= promedio de la variable independiente
𝒙
̅= promedio de la variable dependiente
𝒚
n= número de pares
𝑎 = 𝑦̅ − 𝑏𝑥̅
EJERCICIO:
X Y XY X2 Y=a+bx
67 92 6164 4489 79,09
81 65 5265 6561 77,27
65 81 5265 4225 79,35
42 75 3150 1764 82,34
53 85 4505 2809 80,91
40 78 3120 1600 82,60
71 77 5467 5041 78,57
a= 87,8
b= -0,13
𝟔𝟎𝟎
̅=
𝒙 = 𝟔𝟎
𝟏𝟏
𝟖𝟖𝟎
̅=
𝒚 = 𝟖𝟎
𝟏𝟏
CALCULAR LA PENDIENTE:
∑ 𝒙𝒚 − 𝒏𝒙
̅𝒚̅ 52593 − 11(60)(80)
𝒃= 𝟐 𝟐
= = −0,13
∑ 𝒙 − 𝒏𝒙̅ 41210 − 11(60)2
CALCULAR EL CORTE CON EL EJE Y O LA ORDENADA
̅ = 80 + 0,13(60) = 87,8
̅ − 𝒃𝒙
𝒂= 𝒚
REGRESIÓN MÚLTIPLE
Utilizamos regresión múltiple cuando estudiamos la posible relación entre varias variables
independientes (predictoras o explicativas) y otras variables independientes (criterio,
explicada, respuesta).
La técnica de regresión múltiple se usa frecuentemente en investigación se aplica al caso en
que la variable respuesta es de tipo numérica.
Cuando la respuesta de este tipo dicotómico (muere/vivo, enferma/no enferma), usamos
otras técnicas denominadas regresión logística y que tratamos en un capitulo anterior.
➢ Aplicaciones de la regresión múltiple
Es cierto que la regresión múltiple se utiliza para la predicción de respuestas a partir de
varias explicaciones.
➢ Identificación de variables explicativas
REQUISITOS Y LIMITACIONES
Hay ciertos requisitos necesarios para poder utilizar la técnica de regresión múltiple.
➢ Linealidad.- Se supone que la variable respuesta depende limitaciones de las variables
explicativas si la respuesta no aparenta ser lineal, debemos introducir en el modelo
componente no lineal.
➢ Normalidad y la distribución de los recursos.- Se llama residuos las diferencias entre
las variables calculadas por el modelo y los realmente obtenidos en la variable
dependiente.
➢ Numero de variables independientes.- Podemos estar tentados en incluir en el modelo
cualquier cosa que tengamos en una base de datos, con la esperanza de que cuantas
variables incluyamos.
➢ Colinealidad.- Si dos variables independientes están estrechamente relacionadas y
amadas son incluidas en su modelo, muy posiblemente ninguna de las dos sean
consideradas significativas.
EJERCICIO
10 441 147
441 19,461 6,485
420532,75 147 6,485 2,173 422,89
420,55 10 441 147 420403,10
422607,21 441 19,461 6,485 420403,10
∑Ds= 843560,51 ∑Dp= 841229,08
∑Dp - ∑Ds
-2331,44
∑Dp - ∑Ds
-42,08
10 4272 147
441 12,005 6,485
=259416,05 147 4,013 2,173 =260,87
=260,24 10 273 147 =260150,75
=261613,99 441 12,003 6,485 =260249,54
∑Ds= 521290,28 ∑Dp= 520661,15
∑Dp - ∑Ds
=-629,12
10 441 4272
441 19,461 12,005
=12221196,62 147 6,485 4,013 =780,97
=778,52 10 441 273 =780748,61
=780452,25 441 19,461 12,003 =778118,48
∑Ds= 13002427,40 ∑Dp= 1559648,06
∑Dp - ∑Ds
-11442779