MA145_Manual de Excel y Minitab
MA145_Manual de Excel y Minitab
MA145_Manual de Excel y Minitab
Ciencias Aplicadas
1
Contenido
Unidad I: Estimación y pruebas de hipótesis ........................................................................................... 3
1.1. Prueba de hipótesis para la diferencia de medias con muestras independientes ............................ 3
1.2. Prueba de hipótesis para la diferencia de medias con muestras relacionadas .............................. 23
Unidad II: Análisis y Diseño de experimentos ........................................................................................ 27
2.1. ANOVA de un factor ........................................................................................................................ 27
2.2. ANOVA de dos factores ................................................................................................................... 34
Unidad III: Análisis de regresión............................................................................................................ 49
3.1. Regresión lineal simple .................................................................................................................... 49
3.2. Regresión no lineal simple ............................................................................................................... 56
3.3. Regresión lineal múltiple ................................................................................................................. 62
Unidad IV: Series de tiempo ................................................................................................................. 71
4.1. Suavización exponencial simple ...................................................................................................... 71
4.2. Método de descomposición ............................................................................................................ 76
2
Unidad I: Estimación y pruebas de hipótesis
1.1. Prueba de hipótesis para la diferencia de medias con muestras independientes
GLP 44 27 35 25 44 47 44 35 40
GNV 31 41 40 42 28 24 39 41 27 36 26 38
Considere que las muestras son aleatorias e independientes y que provienen de poblaciones normales. En
base a lo presentado, ¿qué decisión tomará el Ingeniero de Producción? Use un nivel de significación del 5%.
3
3°. Click en: Complemento, luego el botón: Ir…
Hipótesis:
𝐇𝟎 : 𝛔𝟐𝟏 = 𝛔𝟐𝟐
𝐇𝟏 : 𝛔𝟐𝟏 ≠ 𝛔𝟐𝟐
4
2°. Click en: Prueba F para varianzas de dos
muestras, luego click en el botón: Aceptar
5
7°. Resultados
Hipótesis:
𝐇𝟎 : 𝝁𝟏 − 𝝁𝟐 ≥ 𝟎 → K = 0
𝐇𝟏 : 𝝁𝟏 − 𝝁𝟐 < 𝟎 → K = 0
Paso 3: Realizar la prueba de hipótesis para la diferencia de medias para muestras independientes y varianzas
homogéneas
1°. Click en el menú: Datos, luego click en: Análisis de datos
2°. Seleccionar: Prueba t para dos muestras suponiendo varianzas iguales, luego click en el botón: Aceptar
6
3°. Seleccionar los datos para la
variable 1 y variable 2 en Rango para
la variable 1 y Rango para la variable
2, respectivamente. Click en:
Rótulos, ingresar el valor de K en:
Diferencia hipotética entre las
medias, ingresar el nivel de
significación en: Alfa, click en el
botón: Aceptar
4°. Resultados
7
Caso: VINOS PERÚ S.A.C.
Vinos Perú S.A.C. es una empresa que se dedica a la fabricación y embotellamiento de vinos en la provincia
de Cañete, el Ingeniero de Producción de la empresa ha recibido un informe donde se indica que, la
producción promedio por día de vinos (caja de 12 botellas) es mayor en la planta de Lunahuaná (1) que en la
de Imperial Cañete (2). Encarga a un grupo de ingenieros industriales de dicha empresa la verificación de la
conclusión del informe. Si se corrobora lo indicado en el informe, el Ingeniero tomará la decisión de modificar
el programa de producción de vino de las máquinas destiladoras de la planta de Imperial Cañete, caso
contrario, se mantendrá el programa de producción en ambas plantas. Por tal razón, registró la producción
de la planta Lunahuaná durante 8 días y de la planta Imperial Cañete durante 9 días, los datos se muestran a
continuación:
Considere que las muestras son aleatorias e independientes y que provienen de poblaciones normales. En
base a lo presentado, ¿qué decisión tomará el Ingeniero de Producción? Use un nivel de significación del 5%.
Hipótesis:
𝐇𝟎 : 𝛔𝟐𝟏 = 𝛔𝟐𝟐
𝐇𝟏 : 𝛔𝟐𝟏 ≠ 𝛔𝟐𝟐
8
3°. Click en la imagen de: Rango para la
variable 1 → En este paso se realiza la selección
de los datos para la variable 1
7°. Resultados
9
El p-valor se puede obtener fácilmente de la siguiente forma:
p – valor = 2 * P(F<=f) una cola = 2*0.024407331 = 0.048814662
Hipótesis:
𝐇𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝟎 → K = 0
𝐇𝟏 : 𝝁𝟏 − 𝝁𝟐 > 𝟎 → K = 0
Paso 2: Realizar la prueba de hipótesis para la diferencia de medias para muestras independientes y varianzas
homogéneas
1°. Click en el menú: Datos, luego click en: Análisis de datos
2°. Seleccionar: Prueba t para dos muestras suponiendo varianzas iguales, luego click en el botón: Aceptar
10
4°. Resultados
11
Toma de decisión estadística con los valores críticos
GNV 31 41 40 42 28 24 39 41 27 36 26 38
Considere que las muestras son aleatorias e independientes y que provienen de poblaciones normales. En
base a lo presentado, ¿qué decisión tomará el Ingeniero de Producción? Use un nivel de significación del 5%.
▪ Estadístico de prueba: Fcal = 1.38044 (Valor obtenido del reporte de Análisis de datos, revisar manual para
calcular el p – valor en Excel)
El valor “F=1.380435” que se muestra en la tabla corresponde al valor del Estadístico de prueba
Para decidir, si se rechaza o no la hipótesis nula, es necesario identificar los puntos críticos de la distribución
F y, con ellos, establecer las regiones críticas.
12
▪ Establecer las regiones críticas y calcular los valores críticos
α
1-
2
n1 – 1
n2 – 1
Cálculo del Fcritico 1 = Fcrítico 1 = F(1 - α, n1 - 1, n2 - 1)
2
α
4°. Ingresar en: Probabilidad = 1 - 2, luego ingresar
en Grados_de_libertad1 = n1 – 1, luego ingresar en
Fcrítico 1 Grados_de_libertad2 = n2 – 1
13
α
Cálculo del Fcrítico 1 = F(α,
n1 - 1, n2 - 1) n1 – 1 2
2
α n2 – 1
5°. Ingresar en: Probabilidad = 2, luego
ingresar en
Grados_de_libertad1 = n1 – 1, luego ingresar en
Grados_de_libertad2 = n2 – 1
Fcrítico 2
α/2 = 0.025
α/2 = 0.025
0.23566 = Fcrítico 1 1.38044 = Fcal 3.66382 = Fcrítico 2
▪ Estadístico de prueba: tcal = 1.08550 (Valor obtenido del reporte de Análisis de datos, revisar el manual
para calcular el p – valor en Excel)
14
Utilizando el complemento “Análisis de datos” se obtiene el reporte siguiente
El valor “t = 1.08550” que se muestra en la tabla corresponde al valor del Estadístico de prueba.
Para decidir, si se rechaza o no la hipótesis nula, es necesario identificar los puntos críticos de la distribución
T y, con ellos, establecer las regiones críticas
15
3°. Seleccionar la función: INV.T, luego click en: Aceptar
tcrítico
tcrítico 1 =t α
( , n1 + n2 - 2)
2 } Prueba de hipótesis bilateral
tcrítico 2 =t α
(1 - , n1 + n2 - 2)
2
α = 0.05
16
Los criterios de rechazo y no rechazo se determina con la siguiente regla:
Si tcal ≥ tcrítico → No se rechaza Ho
Si tcal < tcrítico → Sí se rechaza Ho
17
Caso: VINOS PERÚ S.A.C.
Vinos Perú S.A.C. es una empresa que se dedica a la fabricación y embotellamiento de vinos en la provincia
de Cañete, el Ingeniero de Producción de la empresa ha recibido un informe donde se indica que, la
producción promedio por día de vinos (caja de 12 botellas) es mayor en la planta de Lunahuaná (1) que en la
de Imperial Cañete (2). Encarga a un grupo de ingenieros industriales de dicha empresa la verificación de la
conclusión del informe. Si se corrobora lo indicado en el informe, el Ingeniero tomará la decisión de modificar
el programa de producción de vino de las máquinas destiladoras de la planta de Imperial Cañete, caso
contrario, se mantendrá el programa de producción en ambas plantas. Por tal razón, registró la producción
de la planta Lunahuaná durante 8 días y de la planta Imperial Cañete durante 9 días, los datos se muestran a
continuación:
Considere que las muestras son aleatorias e independientes y que provienen de poblaciones normales. En
base a lo presentado, ¿qué decisión tomará el Ingeniero de Producción? Use un nivel de significación del 5%.
▪ Estadístico de prueba: Fcal = 4.56726 (Valor obtenido del reporte de Análisis de datos, revisar manual para
calcular el p – valor en Excel)
El valor “F = 4.56726” que se muestra en la tabla corresponde al valor del Estadístico de prueba
Para decidir, si se rechaza o no la hipótesis nula, es necesario identificar los puntos críticos de la distribución
F y, con ellos, establecer las regiones críticas.
18
▪ Establecer las regiones críticas y calcular los valores críticos
𝛂
𝟏 −
𝟐
n1 – 1
Cálculo del Fcrítico 1 = F(1 - α,
n1 - 1, n2 - 1)
n2 – 1 2
α
4°. Ingresar en: Probabilidad = 1 – 2, luego
ingresar
en Grados_de_libertad1 = n1 – 1, luego ingresar en
Grados_de_libertad2 = n2 – 1
Fcrítico 1
19
𝛂
Cálculo del Fcrítico 2 = F( α, n1 - 1, n2 - 1) 𝟐
2 n1 – 1
n2 – 1
α
5°. Ingresar en: Probabilidad = 2, luego ingresar en
Grados_de_libertad1 = n1 – 1, luego ingresar en
Grados_de_libertad2 = n2 – 1
Fcrítico 2
α/2 = 0.025
0.20411 = Fcrítico 1 Fcrítico 2 = 4.52856 4.56726 = Fcal
▪ Estadístico de prueba: tcal = 1.08550 (Valor obtenido del reporte de Análisis de datos, revisar el manual
para calcular el p – valor en Excel)
20
Utilizando el complemento “Análisis de datos” se obtiene el reporte siguiente
El valor “t = 1.74462” que se muestra en la tabla corresponde al valor del Estadístico de prueba.
Para decidir, si se rechaza o no la hipótesis nula, es necesario identificar los puntos críticos de la distribución
T y, con ellos, establecer las regiones críticas
21
1–α Cálculo del tcritico = t (1 – α, v)
v
4°. Ingresar en: Probabilidad = 1 – α, luego
ingresar en Grados_de_libertad = v
tcrítico
tcrítico 1 =t α
( , v)
2 } Prueba de hipótesis bilateral
tcrítico 2 =t α
(1 - , v)
2
α = 0.05
22
1.2. Prueba de hipótesis para la diferencia de medias con muestras relacionadas
Un ingeniero Agrónomo desea comparar la producción de papa, en quintales por hectárea, luego de aplicar
dos tipos de fertilizantes. Para iniciar el estudio se seleccionó una muestra de 10 hectáreas de papas a las
que se aplicó primero el fertilizante A y luego de 6 meses se aplicó el fertilizante B a un nuevo sembrío de
papa, finalmente se registró la producción de papa, en quintales por hectárea luego de la aplicación de cada
fertilizante. Los resultados se muestran en la tabla siguiente:
Fertilizante A (1) 48.5 48.6 50.2 54.3 56.5 59.8 59.4 60.2 65.4 67.5
Fertilizante B (2) 48 49.5 51.2 53.6 55.9 58.7 60.2 61.3 64.5 66.8
Si la producción de papa obtenida con la aplicación del fertilizante A es diferente a la obtenida con el
fertilizante B entonces, el Ingeniero Agrónomo tendrá que realizar una prueba más para decidir qué
fertilizante usará. ¿Cuál será la decisión del Ingeniero Agrónomo? Asuma que las variables en estudio siguen
una distribución normal y use un nivel de significación de 5%.
2°. Seleccionar “Prueba t para dos muestras emparejadas” y luego clic en el botón “Aceptar”
23
3°. Seleccionar los datos para la variable 1 y
variable 2 en Rango para la variable 1 y Rango
para la variable 2, respectivamente. Luego “Clic
en “Rótulos”, ingresar el valor de K en
“Diferencia hipotética entre las medias”,
ingresar el nivel de significación en “Alfa” y clic
en el botón “Aceptar”
Para decidir, si se rechaza o no la hipótesis nula, se puede utilizar el criterio de los valores críticos o el criterio
del p – valor.
24
2°. Clic en “Estadísticas”
tcrítico 1
1 - α/2
Cálculo del tcrítico 2 = t(1− α, v)
v 2
tcrítico 2
tcrítico 1 =t α
( , v)
2 } Prueba de hipótesis bilateral
tcrítico 2 =t α
(1 - , v)
2
25
6°. Al dar clic en el botón: Aceptar, en el paso 4° y 5°
26
Unidad II: Análisis y Diseño de experimentos
2.1. ANOVA de un factor
Caso: Longitud de ruptura del papel
La calidad de la producción del papel está determinada por una serie de parámetros que están en
correspondencia con la utilización del producto final. En la producción de papel periódico se tienen en cuenta
las siguientes propiedades: longitud de ruptura, opacidad, brillantez, resistencia en seco, espesor, lisura, etc.
La longitud de ruptura es la longitud límite, de una tira de papel, por encima de la cual, si el papel se
suspendiera por un extremo, se rompería por su propio peso (m). Dentro de todas estas características la
más significativa es la longitud de ruptura debido a que las partiduras de papel limitan la productividad de
las máquinas de impresión continuo, además es muy trabajoso el montaje de la hoja y la puesta en marcha
del equipo de impresión con la consiguiente pérdida de tiempo, el bajo rendimiento y grandes pérdidas de
papel.
Para analizar el tipo de papel que brinda mejores resultados garantizando todos los requisitos anteriores se
decidió realizar un diseño completamente al azar, donde se evaluó cuatro tecnologías para producir papel.
Cada tecnología fue asignada aleatoriamente a las unidades experimentales (unidades de masa de corteza
de árbol) y se registró la longitud de ruptura, como se detalla en la tabla a continuación:
A un nivel de significación de 1%, ¿el tipo de tecnología de producción influye en la longitud de ruptura del
papel? Determine la tecnología que mejora la longitud promedio de ruptura del papel.
La variable se considera en
una sola columna
27
Procedimiento para generar los residuos, la gráfica de los residuos vs orden, la tabla de Anova. Los residuos
aparecerán en la vista de datos
28
Supuesto 1: Prueba de normalidad para los residuos
ESTADISTICA/ESTADISTICAS BASICAS/PRUEBA DE NORMALIDAD
29
Normalidad de los errores
Hipótesis
Ho: Los errores siguen una distribución normal
H1: Los errores no siguen una distribución normal
Nivel de significación
= 0,01
Estadístico de prueba
AD =0,242
Valor p = 0,737 > = 0,01, No se Rechaza H0
Conclusión: Con un nivel de significación del 1%, los errores siguen una distribución normal. Se cumple el
supuesto.
30
Pruebas
Estadística
Método de prueba Valor p
Bartlett 8.07 0.045
Homogeneidad de varianzas
Hipótesis
Ho: 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42
H1: Al menos una varianza es diferente
Nivel de significación
= 0.01
Estadístico de prueba
Bartlett = 8,07
ANOVA
Hipótesis
H0: El tipo de tecnología no afecta a la longitud de ruptura de una unidad de masa de corteza de papel.
H1: El tipo de tecnología afecta a la longitud de ruptura de una unidad de masa de corteza de papel.
31
Nivel de significación
= 0.01
Estadístico de prueba
Fcal = 275.26
Región crítica
F (0.01; 3,16) como no hay en la tabla, se usa F (0.01; 3,15) = 5.42 < Fcal= 275.26
Valor p = 0.000 < = 0.01 Se Rechaza H0
Conclusión: Con un nivel de significación del 1%, el tipo de producto químico influye en la resistencia de la
fibra de algodón.
32
Comparaciones por parejas de Tukey: Respuesta = Longitud de ruptura, Término = Tecnología
Agrupar información utilizando el método de Tukey y una confianza de 95%
Diferencia
de las EE de Valor p
Diferencia de niveles medias diferencia IC de 99% Valor T ajustado
Tecnología II - Tecnología I 57.8 27.5 ( -43.2, 158.8) 2.10 0.195
Tecnología III - Tecnología I -483.0 27.5 (-584.0, -382.0) -17.54 0.000
Tecnología IV - Tecnología I 285.0 27.5 ( 184.0, 386.0) 10.35 0.000
Tecnología III - Tecnología II -540.8 27.5 (-641.8, -439.8) -19.64 0.000
Tecnología IV - Tecnología II 227.2 27.5 ( 126.2, 328.2) 8.25 0.000
Tecnología IV - Tecnología III 768.0 27.5 ( 667.0, 869.0) 27.90 0.000
Prueba de comparaciones:
H0: µi = µj
H1: µi ≠ µj, Para todo i ≠ j
Con un nivel de significación del 1%, la Tecnología IV es la que presenta la mayor longitud promedio de
ruptura de papel.
33
2.2. ANOVA de dos factores
El ingeniero decide probar los tres materiales de la placa (M1, M2 y M3) con tres niveles de temperatura
(15°F, 70°F y 125°F), ya que estos niveles de temperatura son consistentes con el medio ambiente donde se
usará finalmente el producto.
Se prueban cuatro baterías con cada combinación del material de la placa y la temperatura, y las 36 pruebas
se corren de manera aleatoria. La tabla siguiente muestra los resultados obtenidos de la vida de las baterías
en horas.
Tipo de Temperatura
material 15 °F 70 °F 125 °F
130 155 34 40 20 70
M1
74 180 80 75 82 58
150 188 136 122 25 70
M2
159 126 106 115 58 45
138 110 174 120 96 104
M3
168 160 150 139 82 60
Utilice nivel de significación 5%. ¿El tipo de material y/o la temperatura influyen en el tiempo de duración de
las baterías? ¿Qué tipo de material y/o temperatura recomendaría utilizar?
Los factores se
consideran en una
sola columna
La variable se
considera en una
sola columna
34
Esta opción nos va otorgar
almacenar los errores o
residuales para realizar dos
supuestos: Normalidad de
errores y homogeneidad de
varianzas
35
Se selecciona los
dos factores para
agregar a “términos
del modelo” la
interacción
36
37
38
Prueba de varianzas iguales: Tiempo vs. Tipo de material, Temperatura
Tipo de material Temperatura
M1 1 25 °F Prueba de Bartlett
1 5 °F
Valor p 0.732
70 °F
M2 1 25 °F
1 5 °F
70 °F
M3 1 25 °F
1 5 °F
70 °F
39
Modelo lineal general: Duración vs. Tipo de material, Temperatura
Método
Análisis de Varianza
Total 35 77647
Pruebas
Estadística
Método de prueba Valor p
Pruebas
Estadística
Método de prueba Valor p
Tipo de
material*Temperatura N Media Agrupación
M2 15°F 4 155.75 A
M3 70°F 4 145.75 A B
M3 15°F 4 144.00 A B
M1 15°F 4 134.75 A B
M2 70°F 4 119.75 A B
M3 125°F 4 85.50 B C
M1 125°F 4 57.50 C
M1 70°F 4 57.25 C
M2 125°F 4 49.50 C
Las medias que no comparten una letra son significativamente diferentes.
40
Supuesto: Normalidad de errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Anderson Darling: AD = 0.340
Valor p= 0.478 > α = 0.05
Decisión: No se Rechaza H0
Conclusión: Con un nivel de significación del 5%, se asume que los errores se distribuyen normalmente. Se
cumple supuesto.
Prueba de comparaciones:
H0: µi = µj
H1: μi ≠ μj Para todo i ≠ j
41
Caso: Teñido de fibra sintetica
En el departamento de control de calidad de la planta de acabado de telas se está estudiando el efecto de
dos factores el tiempo de ciclo (en minutos) y la temperatura (°C) sobre el teñido de algodón y fibra sintética,
la cual se utiliza en la manufactura de camisas para caballeros. Se seleccionaron tres niveles de tiempo, tres
niveles de temperatura, y se tiñeron tres pequeñas muestras de tela dentro de cada conjunto de condiciones.
La tela teñida fue comparada con un estándar y se le asignó una calificación numérica. Los resultados
aparecen a continuación.
Temperatura
Tiempo de ciclo
80° 100° 150°
23 29 28
40 28 30 27
25 28 30
26 37 35
50 29 39 40
27 35 37
22 26 26
60 28 29 30
23 25 31
A un nivel de significación 1%. ¿El tiempo de ciclo y/o la temperatura influye en la calificación obtenida en
las telas? ¿Qué tiempo de ciclo y/o temperatura presenta mayores calificaciones en promedio?
42
Se selecciona los dos
factores para agregar a
“términos del modelo” la
interacción
43
44
45
Prueba de varianzas iguales: RESID1 vs. Temperatura, Tiempo
Temperatura Tiempo
50
Valor p 0.936
60
1 50° 40
50
60
80° 40
50
60
0 20 40 60 80 1 00 1 20 1 40
Intervalos de confianza de Bonferroni de 99% para Desv.Est.
Pruebas
Estadística
Método de prueba Valor p
Bartlett 2.97 0.936
46
Comparaciones para Calificación
Comparaciones por parejas de Tukey: Tiempo
Agrupar información utilizando el método de Tukey y una confianza de 99%
47
Prueba de hipótesis del tiempo de ciclo
H0: El tiempo de ciclo no afecta la calificación promedio obtenida sobre las telas teñidas.
H1: El tiempo de ciclo afecta la calificación promedio obtenida sobre las telas teñidas.
F cal = 19.14
Valor p = 0.000 < = 0.01
Decisión: Se rechaza H0
Conclusión: Con un nivel de significación del 1%, la evidencia muestral es suficiente para afirmar que el
tiempo de ciclo afecta la calificación promedio obtenida sobre las telas teñidas.
F cal = 28.55
Valor p = 0.000 < = 0.01
Decisión: Se rechaza H0
Conclusión: Con un nivel de significación del 1%, la evidencia muestral es suficiente para afirmar que la
temperatura afecta la calificación promedio obtenida sobre las telas teñidas.
Prueba de comparaciones:
H0: µi = µj
H1: μi ≠ μj Para todo i ≠ j
48
Unidad III: Análisis de regresión
3.1. Regresión lineal simple
A continuación, realice los procedimientos con ayuda del software MINITAB para responder las preguntas
que se muestran a continuación.
Solución
a. Según el contexto presentado, las variables del modelo y la relación entre ellas es:
Para a validación de los supuestos del modelo, primero se tiene que estimar el modelo y los residuales
utilizando Minitab:
49
Paso 1: Estadísticas / Regresión / Regresión / Ajustar modelo de regresión
i ii
50
ii) Almacenamiento: seleccionar Residuos
51
H0: Los errores se distribuyen normalmente.
Hipótesis
H1: Los errores no se distribuyen normalmente.
Nivel de significación α = 0.01
p - valor 0.365
Decisión estadística Como el p – valor > α, No rechazo H0
Con un nivel de significación de 0.01, no se puede descartar que los
Conclusión
errores se distribuyen normalmente.
Como DW = 2.24515 pertenece al intervalo [1.5;2.5], se asume que los errores no están auto
correlacionados y la varianza de los errores es constante (homocedasticidad). Por lo tanto, se cumplen
ambos supuestos.
Ecuación de regresión
Y: Conductividad térmica = 0.01684 + 0.000168 X: Densidad del concreto
52
Ecuación de regresión lineal simple estimada ŷ = 0.01684+0.000168X
Coeficientes
Término Coef EE del coef. Valor T Valor p FIV
Constante 0.01684 0.00925 1.82 0.099
X: Densidad del concreto 0.000168 0.000011 15.20 0.000 1.00
Prueba individual
Hipótesis H0 : 𝛽1 =0 (El modelo de regresión lineal simple no es válido)
H1 : 𝛽1 ≠0 (El modelo de regresión lineal simple es válido)
H0: β1 = 0
H1: β 1 ≠ 0
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 1 0.042030 0.042030 231.08 0.000
X 1 0.042030 0.042030 231.08 0.000
Error 10 0.001819 0.000182
Total 11 0.043849
Fcal= 231.08 p – valor = 0.000
53
f. ¿Qué porcentaje de la variabilidad de la Conductividad Térmica es explicada por el modelo de
regresión estimado? Interprete.
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
0.0134863 95.85% 95.44% 94.49%
Interpretación:
▪ El 95.85% de la variabilidad de la conductividad térmica (y) es explicada por el modelo de
regresión estimado.
▪ La variabilidad de los datos muestrales (yi) alrededor de la recta de regresión (ŷ) es 0.0134863
g. Pronostique, con un nivel de confianza del 99%, la conductividad térmica promedio cuando la
densidad del concreto es de 650 kg/m2. Interprete.
i ii
54
i) Opciones: Digitamos el nivel de confianza
Nota.
IC → Intervalo de confianza del promedio de Y
IP → Intervalo de confianza del valor individual de Y
Predicción
Ajuste EE de ajuste IC de 99% IP de 99%
0.126000 0.0040757 (0.113083; 0.138917) (0.0813493; 0.170651)
h. Pronostique, con un nivel de confianza del 99%, la conductividad térmica cuando la densidad del
concreto es de 650 kg/m2. Interprete.
Predicción
Ajuste EE de ajuste IC de 99% IP de 99%
0.126000 0.0040757 (0.113083; 0.138917) (0.0813493; 0.170651)
55
3.2. Regresión no lineal simple
Concentración de CO 12 21 31 34 37 49 34 34 42 51 56
Concentración espectro 16 25 26 28 42 48 33 29 37 42 45
Solución
Transformación de X a X2
independientes.
56
Transformación de X a Ln(X)
Transformación de Y a Ln(Y)
Luego de dar clic en el botón: Aceptar, en cada transformación se obtienen cada uno de las nuevas
columnas.
57
Generar las salidas para los modelos de regresión
Paso 2: Regresión/ Regresión/ Ajustar modelo de regresión
Modelo potencia
58
Paso 1: Ranking de los modelos
Modelo R2 Ranking
Cuadrático 84.99% 2
Exponencial 84.63% 3
Potencia 88.24% 1
Paso 2: Validez del mejor modelo del Ranking y verificación del cumplimiento de los supuestos
Modelo potencia
Prueba individual
H0: β1 = 0
H1: β1 ≠ 0
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante 1.016 0.301 3.37 0.008
Ln(X) 0.6979 0.0849 8.22 0.000 1.00
59
Verificación del cumplimiento de los supuestos
Como el valor de DW = 1.77410 pertenece al intervalo [1.5, 2.5], entonces se asume que los errores son
independientes o no existe autocorrelación de los errores. Además, se asume que los errores tienen varianzas
constantes (homocedasticidad).
Al verificar la validez del modelo y el cumplimiento de los supuestos, el modelo potencia será utilizado
para realizar el pronóstico.
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante 1.016 0.301 3.37 0.008
Ln(X) 0.6979 0.0849 8.22 0.000 1.00
̂ = 1.016 + 0.6979Ln(X)
Modelo potencia linealizado: Ln(Y)
▪ Estimar mediante un intervalo de confianza del 90%, la concentración promedio de CO medida por el
espectrómetro, cuando la concentración verdadera de CO del medio ambiente partir de 80 ppm.
60
Ingresar Ln(X) = Ln (80) = 4.382026….
Predicción
Ajuste EE de ajuste IC de 90% IP de 90%
4.07393 0.0812340 (3.92502; 4.22284) (3.81162; 4.33624)
Interpretación del intervalo: Con un nivel de confianza del 90%, el intervalo de 50.65409 a 68.22697 ppmm.
contiene la concentración de CO media por el espectrómetro, cuando a concentración de CO del medio
ambiente es 80 ppmm.
61
3.3. Regresión lineal múltiple
Longitud del alambre Altura de la matriz Altura del poste Altura del amarre Resistencia al desprendimiento
(X1) (X2) (X3) (X4) (Y)
8 350 2 2 25.02
2 360 1 2 29.88
11 400 3 2 37.00
22 600 3 4 59.00
4 200 1 1 16.86
2 200 1 1 9.95
1 340 1 2 23.56
20 600 4 4 56.00
25 603 3 4 57.00
4 198 2 1 17.08
8 260 1 2 24.45
17 590 2 4 56.63
8 250 2 2 23.60
8 300 2 2 27.50
2 375 1 2 26.47
13 490 3 2 40.00
15 432 3 3 44.88
15 480 3 4 46.59
18 598 3 4 58.00
12 500 3 3 41.95
9 345 2 2 26.34
6 223 2 2 22.13
14 550 3 4 54.22
4 220 2 1 17.89
5 235 1 1 21.15
10 550 2 4 51.48
5 215 2 2 21.65
9 245 1 1 24.35
16 520 3 3 54.12
2 199 1 1 9.60
62
Paso 1: Gráfica / Gráfica de dispersión/ Simple
63
Gráfica de dispersión de Y vs. X1; X2; X3; X4
X1: Longitud del alambre X2: Altura de la matriz
60
40
Y: Resistencia 20
40
20
1 2 3 4 1 2 3 4
La resistencia al desprendimiento está relacionada linealmente con cada una de las variables independientes.
64
Estimación del Modelo Completo:
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante -2.13 1.91 -1.12 0.275
X1: Longitud del alambre 0.567 0.194 2.92 0.007 5.25
X2: Altura de la matriz 0.0588 0.0106 5.57 0.000 8.20
X3: Altura del poste 0.25 1.09 0.23 0.820 3.08
X4: Altura del amarre 3.23 1.30 2.48 0.020 7.19
Modelo de regresión lineal múltiple estimada: Ŷ = -2.13 + 0.567X1 +0.0588X2 +0.25X3 +3.23X3
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 4 7138.92 1784.73 203.29 0.000
X1: Longitud del alambre 1 75.05 75.05 8.55 0.007
X2: Altura de la matriz 1 272.06 272.06 30.99 0.000
X3: Altura del poste 1 0.46 0.46 0.05 0.820
X4: Altura del amarre 1 54.04 54.04 6.16 0.020
Error 25 219.48 8.78
Total 29 7358.41
65
Validación de los coeficientes de regresión:
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante -2.13 1.91 -1.12 0.275
X1: Longitud del alambre 0.567 0.194 2.92 0.007 5.25
X2: Altura de la matriz 0.0588 0.0106 5.57 0.000 8.20
X3: Altura del poste 0.25 1.09 0.23 0.820 3.08
X4: Altura del amarre 3.23 1.30 2.48 0.020 7.19
Conclusión: Al 5% de nivel de significación, la evidencia muestral es suficiente para afirmar que solo la
longitud del alambre, la altura de la matriz y la altura del amarre influye en la explicación de la resistencia al
desprendimiento. Por lo tanto, el modelo no es válido
Botón: Paso a paso/ Método: Paso a paso/ Alfa a entrar: 0.05 y Alfa a retirar: 0.05/ Incluir detalles para
cada paso
66
Botón: Almacenamiento/ Residuos y Distancia de cook
67
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante -1.92 1.64 -1.17 0.253
X1: Longitud del alambre 0.590 0.162 3.65 0.001 3.79
X2: Altura de la matriz 0.0590 0.0104 5.70 0.000 8.16
X4: Altura del amarre 3.24 1.28 2.53 0.018 7.19
68
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Como DW = 1.73103 pertenece al intervalo [1.5; 2.5], existe independencia de los errores y
homocedasticidad. Por lo tanto, se cumplen ambos supuestos.
Ausencia de colinealidad:
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Como el FIV es menor que 10 en todas las variables independientes, se puede concluir que no hay problemas
de multicolinealidad entre las variables X1, X2 y X4.
Estadísticas
Variable N N* Mínimo Máximo
COOK 30 0 0.00012 0.26287
69
Se puede observar que no existe observaciones influyentes, todas las distancias de cook son menores que 1.
Por lo tanto, se cumplen todos los supuestos del modelo.
Ingresar los valores correspondientes de las variables independientes para realizar el pronóstico: X1 = 16,
X2 = 550, X4 = 4.
Botón: Opciones/ Nivel de confianza: 95
Predicción
Ajuste EE de ajuste IC de 95% IP de 95%
52.9494 0.969401 (50.9568; 54.9420) (46.6475; 59.2512)
Con un 95% de confianza, el intervalo de 46.6475 a 59.2512 contiene la resistencia al desprendimiento del
alambre adherido en un semiconductor, cuando la longitud del alambre es 16 mm, la altura de la matriz 550
mm y la altura del amarre 4 mm.
70
Unidad IV: Series de tiempo
4.1. Suavización exponencial simple
Analice la serie y de ser necesario utilice un alfa igual a 0.3, 0.5 y 0.7 para obtener el mejor pronóstico. El
gerente tomará dicha decisión si el número de clientes que asistirían el lunes de la cuarta semana sería menor
a 20. Considere el PEMA como medida del error. Use el nivel de significación de 0.05.
Interpretación: ¿El gerente de operaciones decidirá no abrir el local los días lunes?
Representación:
Y: Número de clientes que asistieron al restaurante
X: Tiempo (días)
Datos en minitab
71
En minitab:
Para obtener la gráfica de la serie
Estadísticas/serie de tiempo/gráfica de serie de tiempo
72
En el gráfico de la serie no se observa tendencia ni estacionalidad, por lo tanto, no existe tendencia. La serie
es estacionaria por lo que se usará el modelo de suavización exponencial simple.
Cálculo y Análisis:
Calcular los pronósticos para las constantes de suavización de 0.3, 0.5 y 0.7
Este mismo procedimiento se replica para alfa: 0.5 y 0.7. Las salidas son:
Tabla resumen
Constante de suavización Pronósticos PEMA (MAPE)
α = 0.3 26.3376 24.4814
α = 0.5 26.7932 25.5277
α = 0.7 27.6952 26.5493
73
Calcular el CEF y la señal de rastreo (SR) para cada constante de suavización.
74
Dando como resultado lo siguiente:
Comentario: Analizando la señal de rastreo para α = 0.3, 0.5 y 0.7 se observa que éstos se encuentran dentro
de los límites admisibles; [-2;2] por lo que no se descarta ningún pronóstico.
▪ El mejor modelo de pronóstico del número de clientes que asisten a restaurante es la suavización
exponencial simple con un alfa de 0.3, dado que el PEMA en este caso es el menor entre los tres.
▪ El número de clientes que asistirían al restaurante el próximo lunes sería de 26.33 clientes.
Argumentación: El gerente decidirá seguir atendiendo los días lunes en vista que se espera más de 20 clientes
para ese día.
75
4.2. Método de descomposición
El ingeniero Arredondo revisa la información histórica de la producción por trimestre de gas natural húmedo
(en millones de pies cúbicos por día), desde el primer trimestre del año 2016 al primer trimestre del 2020.
Los datos del histórico de la producción de gas húmedo (en millones de pies cúbicos por día) se presentan a
continuación:
Datos en Minitab:
76
Para obtener la gráfica de la serie
77
Interpretación: Determinar si el Ingeniero Arredondo, jefe de planta, procederá a la exportación de gas
natural.
Representación.
Variable dependiente: Producción de gas (en millones de pies cúbicos al día)
Variable independiente: Tiempo (trimestre)
Estacional: En el gráfico de la serie hay un patrón que se repite al inicio del I trimestre en cada año.
Cálculo y Análisis:
Cálculo de los índices estacionales ajustados
Estadísticas/serie de tiempo/Descomposición
1 0.97633
2 0.99168
3 0.99687
4 1.03512
78
Interpretaciones de los índices estacionales ajustados:
Índice estacional para el trimestre I: (1 - 0.97633) x 100 % = 2.37%
En el I trimestre, la producción de gas natural húmedo está por debajo en un 2.37% con respecto al promedio
de la producción del año.
Estime el mejor modelo de tendencia a partir de Y sin estacionalidad (DAjE1) usando regresión simple.
79
Se obtienen los modelos: Lineal, cuadrático, potencia y exponencial:
Modelo R2 Ranking
Lineal 93.42% 2°
Cuadrático 93.80% 1°
Exponencial 93.03% 3°
Potencia 83.61% 4°
80
El primer modelo a validar es el modelo cuadrático.
Prueba individual
Ho: β2 = 0
H1: β2 ≠ 0
81