Ejercicios Tema 2 - Estructuras Bidimensionales
Ejercicios Tema 2 - Estructuras Bidimensionales
Ejercicios Tema 2 - Estructuras Bidimensionales
Problema 1
A un concurso de vinos se presentaron cincuenta variedades diferentes. De cada uno, anotamos:
X: Número de años de crianza Y : Grados de alcohol
Para cada vino, los datos expresados en forma de par (X, Y ) fueron los siguientes:
(3, 11) (4, 13) (3, 11) (3, 12) (3, 12) (3, 12) (3, 13) (3, 12) (3, 13) (2, 11)
(2, 13) (3, 11) (2, 13) (2, 13) (2, 12) (4, 12) (2, 12) (3, 12) (3, 11) (2, 12)
(4, 12) (4, 12) (4, 13) (4, 13) (4, 12) (3, 13) (3, 12) (4, 12) (4, 12) (2, 13)
(2, 12) (3, 13) (3, 11) (3, 13) (2, 11) (3, 11) (3, 13) (2, 12) (2, 12) (4, 12)
(3, 12) (2, 11) (3, 11) (3, 13) (3, 11) (3, 12) (3, 12) (3, 12) (3, 12) (2, 12)
Obtener las siguientes distribuciones:
a) Conjunta de X e Y , marginal de X y marginal de Y .
b) Del número de años de crianza para los vinos con 12 grados de alcohol.
c) De los grados de alcohol para los vinos de 3 o más años de crianza.
Problema 2
Sean las variables X e Y , con las frecuencias absolutas con-
Y 2 13 15 20 23 25
juntas mostradas en la tabla de correlación. Calcular: X
a) Las distribuciones marginales de las variables X e Y , sus 4 5 13 28 1 4 18
medias y varianzas. 7 4 20 33 3 2 6
b) Las distribuciones condicionadas X|Y = 13 e Y |X = 15, 14 3 16 11 4 3 7
sus medias y varianzas. 15 14 8 13 16 5 2
c) La distribución de X + Y . 17 8 14 24 21 3 3
Problema 3
Problema 4
La siguiente tabla muestra la distribución conjunta de la superficie de labor en hectáreas (X)
en cierta provincia, y la producción de trigo en toneladas (Y ) en el año 2000.
Y [1.5; 2.5) [2.5; 3.5) [3.5; 4.5) [4.5; 5.5) a) Obténgase las medias y las varianzas
X de las variables marginales.
(1, 2] 3 4 6 9
b) Obténgase las medias y las varianzas
(2, 3] 4 5 8 11 de la variable X condicionada a que
(3, 4] 5 8 11 13 3.5 ≤ Y < 4.5.
(4, 5] 4 7 9 10
c) Hállese la covarianza.
1
Probabilidad y Estadística 2021/22
T2 – Distribuciones Bidimensionales
Problema 5
Problema 6
El gasto de los consumidores españoles en bienes y servicios y la
Año Gastos Renta
renta disponible (en miles de millones de euros) correspondientes
a los últimos diez años vienen expresados en la tabla adjunta. 2012 0.60 0.90
a) Suponiendo que para 2022 se mantenga la estructura de la 2013 0.60 1.00
relación entre ambas variables, determine el gasto en bie- 2014 0.70 1.20
nes y servicios para ese año si la renta es de 1080 millones 2015 0.80 1.40
de euros. 2016 0.90 1.50
b) Dé una medida de la bondad de la predicción. 2017 1.00 1.70
2018 1.10 1.90
c) ¿Cuál es el porcentaje de variabilidad total del gasto en
2019 1.20 2.10
bienes y servicios que puede explicar el modelo lineal?
2020 1.50 2.50
d) ¿Qué parte del gasto no queda explicada por la relación
2021 1.60 2.70
establecida entre gasto y renta?
Problema 7
Se desea estudiar la repercusión que tienen los días de lluvia en el número de visitas a un
parque zoológico. Para ello, se observaron las siguientes variables durante los últimos diez
años: X = “Número de días de lluvia al año” e Y = “Número de visitas anuales” en miles.
Y 107 105.5 105 104.4 104.3 104 103.7 103.4 103.1 103
X 18 26 30 33 38 39 42 44 46 49
a) Obtenga la recta de regresión que explique el número de visitas anuales en función del
número de días de lluvia.
b) ¿Puede calcularse la recta de regresión del número de días de lluvia sobre las visitas al
zoo? ¿Tiene sentido calcularla? Justifique su respuesta.
c) La entrada el siguiente año constará 8e. Estime los ingresos del zoo si se prevén 43 días
de lluvia.
d) Calcule el coeficiente de correlación lineal e interprete el resultado.
e) Estudie la bondad del ajuste.
2
Probabilidad y Estadística 2021/22
T2 – Distribuciones Bidimensionales
Problema 8
La siguiente tabla muestra los vehículos matriculados Año Matriculación Accidentes
(en miles de vehículos) y los accidentes de tráfico (en
2007 205 32
miles de accidentes) en los últimos años.
2008 215 42
a) Calcule la recta de regresión que explica el nú- 2009 245 55
mero de accidentes de tráfico en función de las 2010 265 65
matriculaciones. 2011 300 75
b) ¿Tiene sentido calcular la otra recta de regresión? 2012 314 85
2013 325 87
c) Si se esperan 500 mil matriculaciones en 2022,
¿cuántos accidentes de tráfico se producirán en 2014 350 105
ese mismo años? 2015 370 110
2016 372 115
d) Dé una medida de la bondad de la predicción.
2017 387 120
2018 392 125
2019 410 134
2020 415 150
2021 435 200
Problema 9
Dada la siguiente distribución de frecuencias bidimensionales:
xi yj nij xi nij yj nij x2i nij yj2 nij xi yj nij a) Determine la recta de regresión Y /X.
1 4 3 3 12 3 48 12
b) Determine la recta de regresión X/Y .
1 5 8 8 40 8 200 40
2 4 2 4 8 8 32 16 c) Calcule el coeficiente de determinación
2 5 10 20 50 40 250 100 lineal entre X e Y .
2 6 18 36 108 72 648 216 d) Calcule la varianza residual de la re-
3 5 6 18 30 54 150 90 gresión de Y /X.
3 6 12 36 72 108 432 216
3 7 19 57 133 171 931 399 e) Calcule la varianza residual en la re-
4 6 6 24 36 96 216 144 gresión de X/Y .
4 7 16 64 112 256 786 448 f ) Represente gráficamente ambas rectas
SUMA 100 270 601 816 3691 1681 de regresión.
Problema 10
Dada la distribución bidimensional (X, Y ) se conocen los siguientes datos:
2 1
x̄ = Sx2 = 18 ȳ = Sy2 = 72
3 6
Si la recta de regresión de Y sobre X es: Y “ = X , calcule el coeficiente de correlación lineal
4
entre X e Y . Si X = 0.4 ¿es fiable la predicción que proporciona dicha recta?
3
Probabilidad y Estadística 2021/22
T2 – Distribuciones Bidimensionales
Problema 11
Los siguientes gráficos corresponden a las dos rectas de regresión que se pueden construir con
una muestra de datos bidimensionales.
a) b) c) d)
Y Y Y Y
X X X X
Indique qué casos son realmente posibles y explique su significado.
Problema 12
A partir de una distribución bidimensional de las variables X e Y se ha calculado la recta de
regresión de Y sobre X, con el siguiente resultado: Y = 5 + 3X
a) Determine los parámetros de la recta de regresión de X sobre Y , teniendo en cuenta que
el coeficiente de correlación lineal es r = 1.
b) ¿Es posible que el coeficiente de correlación anterior sea −1 en lugar de +1? Justifique
su respuesta.
Problema 13
A partir de un conjunto de datos sobre las variables X e Y , se ha calculado la regresión de Y
sobre X, obteniéndose los siguientes resultados:
Y = 10 + 0.45X r2 = 0.9 x̄ = 20
Problema 14
Asocie la curva de mejor ajuste a las nubes de puntos correspondientes. Una vez hecho esto,
asocie el correspondiente coeficiente de correlación de Pearson a la nube de puntos.
a) b) c)
y = f (x) rxy
y = −2x + 8 0.4
y = 1 + 3x −0.6
y = 0.4x − 3 −0.8
d) e) f)
y =x 1
y = e−x 0.1
y =k 0.6