Taller 3 Correlación y Regresión
Taller 3 Correlación y Regresión
Taller 3 Correlación y Regresión
Correlación y Regresión
Universidad Nacional de Colombia, Sede Palmira
Escuela de Posgrados de la Facultad de Ciencias Agropecuarias
Métodos Estadísticos en la Investigación Agrícola.
Profesor. PhD. Mario Augusto García Dávila
1
Cantor, J.
1
Maestría en Ciencias Agrarias con profundización en Fitomejoramiento
La regresión lineal es un modelo que permite explicar la relación lineal que existe entre dos
variables, el modelo de regresión lineal posee dos variables bien definidas.
La variable dependiente se conoce como Y
La variable de predicción se conoce como X.
Ho: No hay Relación lineal entre ambas variables por lo que la pendiente del modelo
lineal es β1= 0
Ha: Si hay Relación lineal entre ambas variables por lo que la pendiente del modelo
lineal es β1 ≠ 0
∑(𝑥 − ẋ)(𝑦 − ẏ) 𝑆𝑦
𝛽= Ó 𝑅
∑((𝑥 − ẋ))2 𝑆𝑥
Entonces:
26.4
𝛽= = 0.0825
320
ANOVA
FUENTES DE VARIACIÓN SC GL CM F
Regresión 2.178 1 2.178 47.35
Error 0.092 2 0.046
Total (REP) 2.27 3
Linea de la Regresión
7
6 y = 0.0825x + 3.3
R² = 1
Valores de Ŷ
5
4
3
2
1
0
0 5 10 15 20 25 30 35
X
2.178
𝑅2 = 0.95947 × 100 = 𝟗𝟓. 𝟗𝟒%
2.27
√0.9547 = 0.979
b) Utilizando regresión lineal, obtener el rendimiento que cabe esperar si la cantidad
de agua aplicada es de 12 m3.
y = α + βx
Donde:
α: intersección o valor estimado de Y cuando X=0
β: Pendiente de la línea, o cambio promedio de Ŷ para cada cambio de X
X: valores aleatorios proporcionados
y = 4.29 Ton/ha
Horas de empaque X 20 16 34 10 23
Cajas Y 6.5 6 8 4 7
La correlación cuantifica cuán relacionadas están dos variables, Para estudiar la relación lineal
existente entre dos variables continuas es necesario disponer de parámetros que permitan
cuantificar dicha relación. Uno de estos parámetros es la covarianza, que indica el grado de
variación conjunta de dos variables aleatorias (Rodrigo, 2016).
6
Valores de Ŷ
0
0 5 10 15 20 25 30 35 40
X
∑(𝑥 − ẋ)(𝑦 − ẏ) 𝑆𝑦
𝛽= Ó 𝑅
∑((𝑥 − ẋ))2 𝑆𝑥
Entonces:
50.1
𝛽= = 0.157
319.2
α = ẏ − bẋ
Entonces:
α = 6.3 − (0.157 × 20.6) = 3.067
ANOVA
FUENTES DE VARIACIÓN SC GL CM F
Regresión 7.863 1 7.863 25.19
Error 0.937 3 0.312
Total (REP) 8.8 4
7.863
𝑅2 = 0.89357 × 100 = 𝟖𝟗. 𝟑𝟓𝟕%
0.937
√0.89357 = 0.94528
Lo que significa que las variables X y Y son dependientes una de la otra en un 94.52%, es
decir están fuertemente correlacionadas.
b. Calcular las cajas estimadas para una persona que empaco o durante 28 horas.
y = α + βx
Donde:
α: intersección o valor estimado de Y cuando X=0
β: Pendiente de la línea, o cambio promedio de Ŷ para cada cambio de X
X: valores aleatorios proporcionados
y = 7.46 Cajas
Referencias Bibliográficas