Prueba # 2 Econometria 2016 Sección 6 - PAUTA
Prueba # 2 Econometria 2016 Sección 6 - PAUTA
Prueba # 2 Econometria 2016 Sección 6 - PAUTA
Eduardo Fajnzylber
Instrucciones Generales:
1. Tiene 120 minutos para responder esta prueba, dividida en 100 puntos.
3. Sólo el profesor puede responder dudas de enunciado, y sólo en voz alta desde el
puesto.
4. Se permite el uso de calculadoras, siempre y cuando no cuenten con dispositivos de
comunicación.
5. En caso de copia, se sancionará de acuerdo a lo estipulado en el programa del curso.
Buena Suerte!
Fórmulas:
Los valores predichos y los residuos del modelo se pueden obtener a partir de las matrices
𝑃𝑋 y 𝑀𝑋 de acuerdo a 𝑌̂ = 𝑃𝑋 𝑌 𝑦 𝜀̂ = 𝑀𝑋 𝑌
1/14
Econometría UAI, Prof. Eduardo Fajnzylber
𝐷𝑂𝐿𝑂𝑅𝑖 = 𝛼0 + 𝛼1 𝐷𝑅𝑂𝐺𝐴𝑖 + 𝜀𝑖
Donde 𝐷𝑂𝐿𝑂𝑅𝑖 representa el nivel de dolor del individuo i, 30 minutos después de haber
tomado la pastilla y 𝐷𝑅𝑂𝐺𝐴𝑖 corresponde a una variable dummy igual a 1 si la persona en
cuestión recibió la droga y 0 si recibió el placebo.
b) Usted estima, a partir de una muestra de gran tamaño, un modelo de regresión lineal
para el logaritmo de los salarios de los trabajadores chilenos en función del género, nivel
educacional y experiencia potencial. Un colega le sugiere incluir además una variable que
corresponde al último dígito del RUT del trabajador (antes del dígito verificador).
Suponiendo que dicho número es prácticamente aleatorio, explique cuál puede ser la
consecuencia de incluir esta variable en la regresión en términos del sesgo y la varianza
del coeficiente que representa el retorno a la educación. Justifique. (10 puntos)
a)
Nota: se pueden mencionar también las otras propiedades necesarias (modelo lineal y ausencia de
multicolinealidad perfecta)
ii) Incluir variables adicionales al modelo podría eventualmente disminuir la varianza del estimador
de MCO de 𝛼1 , en la medida en que las variables agregadas aportan poder predictivo al modelo y
no están muy correlacionadas con la variable independiente de interés. Esta última condición está
garantizada por la aleatoriedad con que fue definida la variable DROGA.
2/14
Econometría UAI, Prof. Eduardo Fajnzylber
𝜎̂2
̂ (𝛼
𝑉𝑎𝑟 ̂|𝑋)
1 =
̂ (𝐷𝑅𝑂𝐺𝐴𝑖 ) ∙ (1 − 𝑅 2 DROGA,Otras variables )
𝑁 ∙ 𝑉𝑎𝑟
𝑆𝑅𝐶⁄
= 𝑁−𝐾
̂
𝑁 ∙ 𝑉𝑎𝑟(𝐷𝑅𝑂𝐺𝐴𝑖 ) ∙ (1 − 𝑅 2 DROGA,Otras variables )
b) Agregar una variable al modelo, incluso si ésta es totalmente irrelevante (como en este
caso) no puede introducir un sesgo en los coeficientes estimados de las otras variables (y
en particular, no puede sesgar el coeficiente correspondiente al retorno a la educación).
(5 puntos)
Sin embargo, si la variable es irrelevante (o intrusa), podría implicar que la varianza del
coeficiente estimado sea superior. Nuevamente esto se puede ver en la fórmula siguiente:
𝜎̂2
̂ (𝛽̂
𝑉𝑎𝑟 𝐸𝐷𝑈𝐶 |𝑋) =
̂ (𝐸𝐷𝑈𝐶𝑖 ) ∙ (1 − 𝑅 2 EDUC,Otras variables )
𝑁 ∙ 𝑉𝑎𝑟
𝑆𝑅𝐶⁄
= 𝑁−𝐾
̂
𝑁 ∙ 𝑉𝑎𝑟(𝐸𝐷𝑈𝐶𝑖 ) ∙ (1 − 𝑅 2 EDUC,Otras variables )
Una variable intrusa (virtualmente aleatoria) no afectará la varianza por el lado del
denominador (pues no estaría correlacionada con la variable educación) pero sí
aumentaría la varianza por el lado del numerador de la expresión anterior, en la medida
en que su incorporación tendería a aumentar 𝜎̂2 , pues no disminuiría SRC en forma
significativa pero sí implicaría perder un grado de libertad (N-K sería una unidad menor).
(5 puntos)
3/14
Econometría UAI, Prof. Eduardo Fajnzylber
4/14
Econometría UAI, Prof. Eduardo Fajnzylber
5/14
Econometría UAI, Prof. Eduardo Fajnzylber
Usamos el estadístico
̂
𝛽𝐻𝑒𝑖𝑔ℎ𝑡 −0.110
𝑇= = = −0.917
̂ )
𝑠𝑒(𝛽𝐻𝑒𝑖𝑔ℎ𝑡 0.120
La distribución del estadístico bajo la hipótesis nula es una T con 210 grados de libertad.
(2 puntos)
El valor crítico al 95% de confianza es en este caso VC=1.971. Como el valor absoluto del
estadístico es menor que el valor crítico, no podemos rechazar H0, es decir no podemos
afirmar que la variable height es significativa al 95% de confianza. (2 puntos)
Mirando la fila correspondiente en la tabla, podemos ver que el valor P se encuentra entre
30% y 40% (pues el estadístico se encuentra entre las columnas correspondientes a 15%
y 20%. (2 puntos)
c) Siguiendo con la respuesta a la parte (b) al comparar los modelos (1) y (2), se puede
apreciar que el coeficiente asociado a la variable height aumenta al incluir la variable
weight. Dado este aumento en el coeficiente y que el modelo (2) sugiere que el peso
afecta negativamente las marcas, podemos inferir que la variable weight (que está
omitida del modelo (1)) está positivamente correlacionada con la variable height. (4
puntos)
6/14
Econometría UAI, Prof. Eduardo Fajnzylber
d) La inclusión de la variable weight2 permite que el efecto del peso sobre el dese
mpeño en competencia sea no lineal. Matemáticamente, el efecto marginal del peso
sobre la marca (ceteris paribus) estaría dado por: (3 puntos)
𝜕𝑀𝑎𝑟𝑘
= 𝛽𝑤𝑒𝑖𝑔ℎ𝑡 + 2 ∙ 𝛽𝑤𝑒𝑖𝑔ℎ𝑡 2 ∙ 𝑤𝑒𝑖𝑔ℎ𝑡
𝜕𝑊𝑒𝑖𝑔ℎ𝑡
Por lo tanto, este modelo permite que el efecto sea constante (lo que ocurriría si 𝛽𝑤𝑒𝑖𝑔ℎ𝑡 2 =
0), decreciente (𝛽𝑤𝑒𝑖𝑔ℎ𝑡 2 < 0) o creciente (𝛽𝑤𝑒𝑖𝑔ℎ𝑡 2 > 0) en el peso.
A partir de la expresión anterior, podemos ver que la mejor marca (la menor marca)
ocurrirá cuando el peso corresponda a lo siguiente:
e) Para ver si weight tiene alguna influencia sobre la marca, a partir del modelo (3), no
basta con analizar solamente la significancia de la variable weight. Es necesario testear
en forma conjunta de que los 2 coeficientes (el de weight y el de weight2) son iguales a
cero. (2 puntos)
La distribución del estadístico bajo la hipótesis nula es una F con 2 grados de libertad en
el numerador y 207 grados de libertad en el denominador. (2 puntos)
7/14
Econometría UAI, Prof. Eduardo Fajnzylber
promedio, 0.0461 segundos inferiores a las de los otros países, controlando por la altura,
el peso y el peso al cuadrado. (4 puntos)
Los modelos predichos, para los 2 tipos de corredores, entre la marca y el peso (cuando la
altura es de 1.8 metros) son los siguientes:
Podemos ver que los modelos son paralelos, pero con distintos interceptos. Además, la
pendiente de la curva está dada por
𝜕𝑀𝑎𝑟𝑘
= −0.872 + 2 ∙ 0.427 ∙ 𝑤𝑒𝑖𝑔ℎ𝑡 = −0.872 + 0.854 ∙ 𝑤𝑒𝑖𝑔ℎ𝑡
𝜕𝑊𝑒𝑖𝑔ℎ𝑡
10.7
10.6
10.58472
10.5
10.53862
10.4
Marca en segundos
10.3
10.2
10.1
10
9.9
Pendiente
9.8
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5
Peso en cientos de kilogramos
marca_lideres marca_NO_lideres
8/14
Econometría UAI, Prof. Eduardo Fajnzylber
En este caso el coeficiente estimado, -0.518, sugiere que el efecto marginal de la altura
sobre el desempeño es inferior en el primer grupo respecto al segundo. (3 puntos)
𝑅 2 /5 0.057/5
𝐹= = = 2.4783
(1 − 𝑅 2 )/(𝑁 − 6) (1 − 0.057)/(211 − 6)
La distribución del estadístico bajo la hipótesis nula es una F con 5 grados de libertad en
el numerador y 205 grados de libertad en el denominador. (2 puntos)
Lo anterior implica que el modelo (5) tiene un problema de heterocedasticidad, por lo que
es necesario ya sea utilizar errores robustos a este problema o plantear un modelo para la
heterocedasticidad y obtener el estimador de Mínimos Cuadrados Generalizados (MCG). (2
puntos)
9/14
Econometría UAI, Prof. Eduardo Fajnzylber
a) La constante de este modelo se interpreta como el valor predicho para el logaritmo del
precio, cuando las variables independientes son todas iguales a cero. En esto caso ello
implica que el logaritmo del precio es igual a 9.1134 cuando mpg=10, trunk=10 y
headroom=1. En otras palabras, corresponde al valor predicho para el logaritmo del precio
de un automóvil con 10 millas por galón, 10 metros cúbicos de portamaletas y 1 pulgada
de espacio interior. (2.5 puntos)
10/14
Econometría UAI, Prof. Eduardo Fajnzylber
𝐼𝑃 = 9.1135 ± VC ∙ √𝑉𝑎𝑟(𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒
̂ ̂2
)+𝜎
Por último, la varianza estimada del modelo corresponde a: 𝜎̂2 = 0.338782 = 0.11477 (1
punto)
c) Para predecir el precio del vehículo, no basta con aplicar la función exponencial a la
constante del modelo, pues es necesario aplicar un factor de ajuste, originado en el hecho
de que la esperanza de la exponencial del error del modelo en logaritmo es, en general,
superior a 1. En este caso, la fórmula de ajuste que es posible aplicar directamente a
partir del modelo de regresión estimado es aquella que involucra la exponencial de la
mitad de la varianza del error del modelo. (7.5 puntos)
̂0=
Nota: Restar 4 puntos si el alumno responde sin aplicar el factor de ajuste (𝑃𝑟𝑒𝑐𝑖𝑜
𝑒𝑥𝑝(9.113486) = 9076.8818)
11/14
Econometría UAI, Prof. Eduardo Fajnzylber
Valores críticos,
Distribución T-student
12/14
Econometría UAI, Prof. Eduardo Fajnzylber
Valores críticos al 5% de
significancia,
p=5%
Distribución F
VC
13/14