Taller 3 Correlación y Regresión

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

TALLER 3

Correlación y Regresión
Universidad Nacional de Colombia, Sede Palmira
Escuela de Posgrados de la Facultad de Ciencias Agropecuarias
Métodos Estadísticos en la Investigación Agrícola.
Profesor. PhD. Mario Augusto García Dávila
1
Cantor, J.
1
Maestría en Ciencias Agrarias con profundización en Fitomejoramiento

La regresión lineal es un modelo que permite explicar la relación lineal que existe entre dos
variables, el modelo de regresión lineal posee dos variables bien definidas.
La variable dependiente se conoce como Y
La variable de predicción se conoce como X.

Estas dos variables se aplican en la siguiente Ecuación:


𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝜖
Donde:
β0: La ordenada en el Origen
β1: La pendiente
ϵ: Error aleatorio.
Por lo tanto, se plantea una prueba de significancia para la pendiente β1 del modelo cuyas
hipótesis son:

Ho: No hay Relación lineal entre ambas variables por lo que la pendiente del modelo
lineal es β1= 0
Ha: Si hay Relación lineal entre ambas variables por lo que la pendiente del modelo
lineal es β1 ≠ 0

1. Un agrónomo ha analizado la relación entre la cantidad de agua aplicada (en m3) y


el correspondiente rendimiento de cierta cosecha (en toneladas por hectárea)
obteniendo los siguientes datos
Agua X 8 16 24 32

Rendimiento Y 4.1 4.5 5.1 6.1

a) Halle la correlación y regresión y realice el ANOVA para la regresión.


X Y (𝐗 − Ẋ)2 (𝐗 − Ẋ)(𝐘 − Ẏ) Ŷ (𝐘 − Ẏ)𝟐 (Ŷ − Ẏ)𝟐 (𝐘 − Ŷ)𝟐
8 4.1 144 10.2 3.96 0.7225 0.9801 0.0196
16 4.5 16 1.8 4.62 0.2025 0.1089 0.0144
24 5.1 16 0.6 5.28 0.0225 0.1089 0.0324
32 6.1 144 13.8 5.94 1.3225 0.9801 0.0256
Total 80 19.8 320 26.4 19.8 2.27 2.178 0.092
Ẋ 20 4.95 SCtotales SCRegresión SCError
Para construir la ANOVA se debe calcular el valor de Alpha y Beta:

∑(𝑥 − ẋ)(𝑦 − ẏ) 𝑆𝑦
𝛽= Ó 𝑅
∑((𝑥 − ẋ))2 𝑆𝑥
Entonces:
26.4
𝛽= = 0.0825
320

Se debe calcular Alpha que se representa en la siguiente ecuación:


α = ẏ − bẋ
Entonces:
α = 4.95 − (20 × 0.0825) = 3.3

ANOVA
FUENTES DE VARIACIÓN SC GL CM F
Regresión 2.178 1 2.178 47.35
Error 0.092 2 0.046
Total (REP) 2.27 3

F Calculado: 47.35 F Tabulado: 18.51


Por lo cual se acepta la hipótesis alterna (Ha), que plantea que existe relación entre la
cantidad de agua aplicada y el rendimiento de cierta cosecha en cierto cultivo.

Linea de la Regresión
7
6 y = 0.0825x + 3.3
R² = 1
Valores de Ŷ

5
4
3
2
1
0
0 5 10 15 20 25 30 35
X

El coeficiente de determinación R2 se utiliza como descriptor de la proporción de la


variabilidad observada en la variable Y explicada por el modelo y relativa a la variabilidad
Total, esta puede tomar valores entre 0 y 1, se representa de la siguiente manera:
∑(Ŷ𝑖 − 𝑌𝑖)2
1−
∑(𝑌𝑖 − Ẏ𝑖)2

2.178
𝑅2 = 0.95947 × 100 = 𝟗𝟓. 𝟗𝟒%
2.27

La correlación lineal es igual a la Raíz cuadrada del coeficiente de Determinación:

√0.9547 = 0.979
b) Utilizando regresión lineal, obtener el rendimiento que cabe esperar si la cantidad
de agua aplicada es de 12 m3.

y = α + βx
Donde:
α: intersección o valor estimado de Y cuando X=0
β: Pendiente de la línea, o cambio promedio de Ŷ para cada cambio de X
X: valores aleatorios proporcionados

y = 3.3 + (0.0825 × 12)

y = 4.29 Ton/ha

2. El número de horas dedicadas al empaque de un producto y la cantidad de cajas


obtenidas es:
a. Calcular la recta de regresión de Y sobre X, y su respectivo ANOVA, b. Calcular
el coeficiente de correlación lineal e interpretar su valor

Horas de empaque X 20 16 34 10 23
Cajas Y 6.5 6 8 4 7

La correlación cuantifica cuán relacionadas están dos variables, Para estudiar la relación lineal
existente entre dos variables continuas es necesario disponer de parámetros que permitan
cuantificar dicha relación. Uno de estos parámetros es la covarianza, que indica el grado de
variación conjunta de dos variables aleatorias (Rodrigo, 2016).

X Y (𝐗 − Ẋ)2 (𝐗 − Ẋ)(𝐘 − Ẏ) Ŷ (𝐘 − Ẏ)𝟐 (Ŷ − Ẏ)𝟐 (𝐘 − Ŷ)𝟐


20 6.5 0.36 -0.12 6.21 0.04 0.009 0.087
16 6 21.16 1.38 5.58 0.09 0.521 0.178
34 8 179.56 22.78 8.40 2.89 4.423 0.163
10 4 112.36 24.38 4.64 5.29 2.768 0.405
23 7 5.76 1.68 6.68 0.49 0.142 0.105
Total 103 31.5 319.2 50.1 31.5 8.8 7.863 0.937
Ẋ 20.6 6.3 SCtotales SCRegresión SCError
Línea de la regresión Caso 2
9
y = 0.157x + 3.0667
8
R² = 1
7

6
Valores de Ŷ

0
0 5 10 15 20 25 30 35 40
X

Para construir la ANOVA se debe calcular el valor de Alpha y Beta:

∑(𝑥 − ẋ)(𝑦 − ẏ) 𝑆𝑦
𝛽= Ó 𝑅
∑((𝑥 − ẋ))2 𝑆𝑥
Entonces:
50.1
𝛽= = 0.157
319.2

Se debe calcular Alpha que se representa en la siguiente ecuación:

α = ẏ − bẋ
Entonces:
α = 6.3 − (0.157 × 20.6) = 3.067

ANOVA
FUENTES DE VARIACIÓN SC GL CM F
Regresión 7.863 1 7.863 25.19
Error 0.937 3 0.312
Total (REP) 8.8 4

F Calculado: 25.19 F Tabulado: 10.53


Por lo cual se acepta la hipótesis alterna (Ha), que plantea que existe relación entre el
número de horas dedicadas al empaque de un producto y la cantidad de cajas.
∑(Ŷ𝑖 − 𝑌𝑖)2
1−
∑(𝑌𝑖 − Ẏ𝑖)2

7.863
𝑅2 = 0.89357 × 100 = 𝟖𝟗. 𝟑𝟓𝟕%
0.937

El grado de correlación es igual a la Raíz cuadrada del coeficiente de Determinación.

√0.89357 = 0.94528
Lo que significa que las variables X y Y son dependientes una de la otra en un 94.52%, es
decir están fuertemente correlacionadas.

b. Calcular las cajas estimadas para una persona que empaco o durante 28 horas.

y = α + βx
Donde:
α: intersección o valor estimado de Y cuando X=0
β: Pendiente de la línea, o cambio promedio de Ŷ para cada cambio de X
X: valores aleatorios proporcionados

y = 3.067 + (0.157 × 28)

y = 7.46 Cajas

Referencias Bibliográficas

Rodrigo, J. A. (2016). Correlación lineal y Regresión lineal simple. cienciadedatos.net.


Tomado de: https://www.cienciadedatos.net/documentos/24_correlacion_y_regresion_lineal

Garcia, M. (2020). Correlación y Regresión. Universidad Nacional de Colombia.

También podría gustarte