Resueltos Regresion
Resueltos Regresion
Resueltos Regresion
DISTRIBUCIONES BIDIMENSIONALES
PROBLEMAS RESUELTOS
1. a) Asocia las rectas de regresión: y = –x +16, y = 2x – 12 e y = 0,5x + 5 a las nubes de
puntos siguientes:
b) Asigna los coeficientes de correlación lineal r = 0,4, r = –0,85 y r = 0,7, a las mismas
nubes de puntos.
Solución:
a) Respectivamente: (c), (b), (a).
b) Respectivamente: (a), (b), (c).
Con esto:
85 45
x= = 12,14 y = = 6,43
7 7
1171 317 601
sx = − 12,14 2 = 4,46 ; s y = − 6,43 2 = 1,99 ; s xy = − 12,14·6,43 = 7,80
7 7 7
7,80
Por último, r = = 0,88 .
4,46·1,99
Al ser r próximo a +1, la correlación entre las horas de estudio y las notas de examen es
directa y fuerte: a más horas de estudio, mejor nota de examen.
La recta de regresión es
7,80
y − 6,43 = ( x − 12,14) ⇔ y = 0,39 x + 1,67
19,90
(Es la recta continua de la figura anterior).
Nota: Los resultados anteriores están redondeados a las centésimas.
Con más precisión (con la calculadora): r = 0,879689; y = 0,393004x + 1,656379.
X Y X2 Y2 X·Y
10 2 100 4 20
7 4 49 16 28
5 6 25 36 30
3 8 9 64 24
0 10 0 100 0
ΣXi = 25 ΣYi = 30 ΣXi = 183
2
ΣYi2 = 220 ΣXiYi = 102
Se obtiene.
183 102
x = 5 ; sx = − 5 2 = 11,6 ; y = 6 ; s xy = − 5·6 = −9,6
2
5 5
La ecuación de la recta de regresión es
s xy
y − y = 2 ( x − x ) ⇒ y = –0,8276x +10,138
sx
b) Si X = 7 ⇒ Y = 4,3448.
7. Para los datos del problema anterior, halla con ayuda de la calculadora:
a) Las medias y desviaciones típicas marginales.
b) La covarianza.
c) El coeficiente de correlación lineal.
d) La recta de regresión de Y sobre X.
e) El número de rechazos que hay que esperar para una persona con 20 semanas de
experiencia.
Solución:
Sumas:
∑ xi = 80; ∑y ∑x ∑y ∑x y
2 2
i = 260; i = 884; i = 7420; i i = 1788
a) x = 8; sx = 4,93963; y = 26; sy = 8,12403
b) sxy = 178,8 − 8 · 26 = −29,2
c) r = −29,2 /(4,93963 · 8,12403) = −0,72763
d) y = −1,19672x + 35,5737
e) 11,6, que se aproxima a 12, el entero más próximo.
8. Se midieron los valores de concentración de una sustancia A en suero fetal y los valores de
su concentración en suero materno. Se obtuvieron los siguientes datos en una muestra de seis
embarazadas a término:
Madre (X) 8 4 12 2 7 9
Feto (Y) 6 4 8 1 4 5
a) Calcula el coeficiente de correlación lineal.
b) Halla la expresión de la recta que permita estimar los valores fetales a partir de los
maternos.
Solución:
a) Con la calculadora se obtiene: r = 0,93
Otros parámetros de interés:
x = 7; sx = 3,2659; y = 4,667; sy = 2,1344
También se obtiene: A = 0,40; B = 0,609
b) Si un alumno obtuvo en el test 130, se puede estimar que su nota en matemáticas sería
y = 2,28 + 0,08 · 130 = 8,12
Como r es muy alto y 130 está dentro del rango de los datos considerados, la estimación es
fiable.
10. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son:
Padre (X) 170 173 178 167 171 169 184 175
Hijo (Y) 172 177 175 170 178 169 180 187
a) Calcula la recta de regresión que permita estimar la altura de los hijos dependiendo de la
del padre; y la del padre conociendo la del hijo.
b) ¿Qué altura cabría esperar para un hijo si su padre mide 174? ¿Y para un padre, si su hijo
mide 190 cm?
Solución:
a) Se utilizará la calculadora en el modo estadístico.
Si X indica la atura del padre e Y la del hijo, se tendrá:
Y = 68,1853 + 0,621859 · X; X = 77,4406 + 0,545082 · Y.
b) Si el padre (X) mide 174 cm (en la primera ecuación) ⇒ para el hijo caber esperar una
estatura de Y = 176,4 cm.
Si el hijo (Y) mide 190 cm (en la segunda ecuación) ⇒ para el padre puede suponerse una
estatura de X = 181 cm.
11. Los años de siete árboles y el diámetro de su tronco, en cm, se dan en la siguiente tabla:
Años 2 4 5 8 10 14 20
Diámetro 10 15 17 20 23 25 27
a) Calcula, utilizando la recta de regresión, el diámetro que se puede predecir para árboles de
10 y 20 años.
b) Compara el resultado anterior con los valores observados en la tabla. Razona el porqué de
las diferencias.
Solución:
a) X = años; Y = diámetro.
x = 9 ; sx = 5,83; y = 19,57 ; sy = 5,55; r = 0,93563.
= y 11,55 + 0,89 x .
OTROS PROBLEMAS
14. Halla el centro medio de una distribución sabiendo que sus rectas de regresión valen:
De Y sobre X: y = 2x + 2.
De X sobre Y: x = 0,45y – 0,2.
Solución:
Como las dos rectas pasan por el centro medio, este punto será la solución del sistema
y = 2x + 2
x = 0,45 y − 02
Cuya solución es: x = 7, y =16.
El centro medio será ( x , y ) = (7, 16).
15. Una compañía de seguros sospecha que el número de accidentes está en función de la
edad del conductor. Para ello elige 100 personas de cada grupo de edad y contabiliza los
accidentes totales del último año. Los datos fueron:
Edad 20 25 30 35 40 45
N.º accidentes 10 11 9 7 4 5
a) Representa gráficamente la nube de puntos asociada a estos datos. ¿Qué correlación se
observa?
b) Halla, sin calculadora, el coeficiente de correlación lineal entre las variables medidas.
Comenta su valor.
Solución:
a)
Correlación inversa.
b) Observa que debemos hacer sumas, sumas de cuadrados y sumas de productos; para ello
resulta eficaz la siguiente tabla:
xi yi xi 2 yi 2 xi y i
20 10 400 100 200
25 11 625 121 275
30 9 900 81 270
35 7 1225 49 245
40 4 1600 16 160
45 5 2025 25 225
∑ xi = 195 ∑ yi = 46 ∑ xi = 6675
2
∑ yi = 392
2
∑ xi y i = 1375
Con esto:
x = 32,5 ; y = 7,667 ; s x = 8,539 ; s y = 2,56 ; s xy = −20 ; r = −0,915 .
La correlación entre el número de accidentes y la edad es negativa y muy fuerte: los
conductores más novatos tiene más accidentes.
16. Se está experimentado la resistencia a la rotura de una determinad fibra textil. Para ello se
ha medido el diámetro de la fibra y el peso que soporta hasta la rotura, obteniéndose los
siguientes datos:
Diámetro en mm (X) 1 1,2 1,4 1,6 1,8 2
Peso a la rotura en kg (Y) 12,5 18 25 32 41 52
a) Representa el diagrama de dispersión asociado a esos datos. ¿Sugiere la gráfica alguna
asociación lineal?
b) ¿Cómo calificarías la correlación?
Solución:
a)
=
b) x 0, 02522 y + 0, 74112 .
Para y = 60 kg, x = 2,25 mm