Stata Int Sesion 1 Presentacion
Stata Int Sesion 1 Presentacion
Stata Int Sesion 1 Presentacion
Objetivos de la Sesión
Modelo
econométrico (variable dependiente) son las variables
Variables objetos de estudio, se desea encontrar su
endógenas comportamiento.
Elementos
(variable
V. Exógenas corrientes independiente)
Variables ayudan a explicar el
V. Exógenas no corrientes comportamiento de la
exógenas
V. Exógenas con rezago variable modelo.
Valores fijos durante el
muestreo.
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
DE REGRESIÓN GENERAL
𝑖 = 1, 2, … , 𝑛
• El término 𝜀𝑖 se le denomina perturbación aleatoria, porque “perturba” la que, de otra manera, sería una
relación determinística estable.
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
𝑦 = 𝛽0 + 𝛽1 ∗ 𝑥 + 𝜇
• El modelo es lineal
• Si los otros factores de 𝜇 se mantiene fijos de modo que ∆𝜇 = 0, entonces 𝑥 tiene efecto lineal en 𝑦:
∆𝑦 = 𝛽1 ∆𝑥 𝑠𝑖 ∆𝜇 = 0
• La linealidad implica que un cambio de 1 unidad en 𝑥 tiene el mismo efecto en 𝑦, cualquiera que
sea el valor inicial de 𝑥.
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
• Como las variables 𝜇, 𝑥 son variables aleatorias, se puede definir la distribución condicional de 𝜇 dado
cualquier valor de 𝑥.
𝐸 (𝜇/𝑥) = 𝐸 𝜇 = 0
• Este supuesto implica que la media condicional de 𝜇 dado x es igual a cero, por lo que el promedio de los
factores inobservables es el mismo y por lo tanto debe ser al promedio de 𝜇 para todo la población. Según
esto, se obtiene:
𝐸(𝑦/𝑥) = 𝛽0 + 𝛽1 𝑥
• Lo cual muestra que la función de regresión poblacional (FPR), 𝐸(𝑦/𝑥) es una función lineal de x.
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
e) No existe autocorrelación.
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
• Este es el método más común para la estimación del modelo de regresión lineal.
• Los parámetros desconocidos de la relación (𝛽𝑖 , 𝜇 ) son el objetivo de la estimación.
PASOS
1) Minimizar la parte indeterminada de la regresión 𝜇
𝜇 = 𝑦 − 𝛽0 − 𝛽1 𝑥 …(1)
Obtenemos SCR
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
𝜕 σ 𝜇𝑖2
= σ 2(𝑦𝑖 − 𝛽0 − 𝛽1 𝑥) −1 = 0 … (3)
𝜕 𝛽0
𝜕 σ 𝜇𝑖2
𝜕 𝛽1
= σ 2(𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖 ) −𝑥𝑖 = 0 …(4)
𝑦ത = 𝛽0 − 𝛽1 𝑥ҧ …(5)
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
PROPIEDADES DE LOS
(Teorema de Gauss – Markov)
ESTIMADORES DE MCO
ANÁLISIS DE REGRESIÓN
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜇
Donde:
STC: Suma total de cuadrados
STC = SEC + SRC
SEC: Suma explicada de cuadrados
SRC: Suma residual de cuadrados
ത 2 = (ෞ
(𝑦𝑖 − 𝑦) 2 )2 + (𝑦𝑖 − 𝑦ෝ𝑖 )2
𝑦𝑖 − 𝑦
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
𝑆𝐸𝐶 σ 𝑦𝑖2
𝑅2 = =
𝑆𝑇𝐶 σ 𝑦𝑖2 Puede tener signo positivo o negativo,
dependiendo de la asociación entre las
parejas de variables analizadas.
Puede tomar valores entre -1 < r < 1
Donde 0 < 𝑅 2 < 1
Tan solo para el modelo bivariable
Indica que parte de la variación del modelo es
debida a la variación explicada.
+
𝑟= 𝑅2
−
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
Hipótesis:
𝐻0 : 𝛽1 = 0 → ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎
𝐻1 : 𝛽1 ≠ 0 → ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎
−𝑡𝑐𝑟𝑖𝑡 0 𝑡𝑐𝑟𝑖𝑡
𝐹𝑐𝑟𝑖𝑡
Regla de decisión:
Si 𝑡𝑐𝑎𝑙 > 𝑡𝑐𝑟𝑖𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
Si 𝑡𝑐𝑎𝑙 < 𝑡𝑐𝑟𝑖𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑎 𝐻0
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
POST ESTIMACIÓN
EFECTOS MARGINALES
• Es justamente del incumplimiento de los últimos supuestos básicos, de donde provienen los
principales problemas de un modelo de regresión.
Homoscedasticidad Heterocedasticidad
Linealidad Multicolinealidad
Independencia Autocorrelación
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
MULTICOLINEALIDAD
CONSECUENCIAS PRÁCTICAS
Se refiere a la alta asociación lineal entre 1. Estimadores MCO aún son MELI
las variables explicativas de un modelo de presentan varianza y covarianzas
regresión grandes.
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MULTICOLINEALIDAD
¿CÓMO SE SOLUCIONA?
1. Ignorar el problema
2. Eliminación de variables colineales
3. Transformación de variables del modelo
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
HETEROCEDASTICIDAD
CONSECUENCIAS
No eficientes
Las pruebas t y F pierden validez
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
HETEROCEDASTICIDAD
¿CÓMO SE DETECTA?
Prueba de Park
Si 𝑙𝑛𝑥𝑖 influye mucho en el modelo,
𝜎 sigue la siguiente forma funcional:
entonces existe heterocedasticidad, por lo
𝛽
𝜎𝑖2 = 𝜎 2 𝑥𝑖 𝑒 𝑣𝑖 cual hay que analizar la significancia de 𝛽.
HETEROCEDASTICIDAD
¿CÓMO SE DETECTA?
Prueba de Glejsen PASOS:
Permite analizar cual de las variables explicativas 1. MCO
(una por una ) y bajo forma funcional 2. Calcular sus errores (valor absoluto)
3. Regresionar el valor absoluto de los
errores con cada una de las formas
𝑦𝑖 = 𝛽1 + 𝛽2 𝑥2𝑖 + 𝜇𝑖 funcionales de la prueba
𝜇ෝ𝑖 = 𝛽1 + 𝛽2 𝑥𝑖 + 𝑣𝑖 4. Analizar la significancia de 𝛽2
= 𝛽1 + 𝛽2 𝑥𝑖 + 𝑣𝑖 𝐻0 : homoscedasticidad
1
= 𝛽1 + 𝛽2 𝑥 + 𝑣𝑖 Se aplica la prueba t.
𝑖
1
= 𝛽1 + 𝛽2 + 𝑣𝑖
𝑥𝑖
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
HETEROCEDASTICIDAD
¿CÓMO SE DETECTA?
Prueba de Goldfeld – Quandt
Y X
PASOS:
1. Ordenar las observaciones, según los valores de x, de
manera ascendente. 𝑛1 𝑆𝐶𝑅1
2. Omitir las c observaciones centrales. Las observaciones
restantes (n-c) son divididas en dos grupos. Elimina “c”
observaciones centrales
3. Al interior de cada grupo se estima con MCO y se captura
𝑆𝐶𝑅1 y 𝑆𝐶𝑅2.
4. Capturar el estadístico 𝜆 definido como: 𝑛2 𝑆𝐶𝑅2
𝜆 = (𝑆𝐶𝑅2 /gl)/(𝑆𝐶𝑅1 /𝑔𝑙)
𝐻0 : homoscedasticidad
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
HETEROCEDASTICIDAD
1
𝜃= 𝑆𝐶𝐸
2
𝐻0 : homoscedasticidad
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
HETEROCEDASTICIDAD
MEDIDAS CORRECTIVAS
Cuando se conoce 𝜎𝑖2
MÍNIMOS CUADRADOS PONDERADOS (MCP)
𝑦𝑖 = 𝛽1 + 𝛽2 𝑥2𝑖 + 𝜇𝑖
Como se conoce la varianza, entonces se divide a toda la ecuación entre esta:
𝑦𝑖 1 𝑥2𝑖 𝜇𝑖
= 𝛽1 + 𝛽2 +
𝜎𝑖2 𝜎𝑖2 𝜎𝑖2 𝜎𝑖2
𝜇𝑖
Y entonces la varianza es homocedástica.
𝜎𝑖2
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
HETEROCEDASTICIDAD
MEDIDAS CORRECTIVAS
Cuando no se conoce 𝜎𝑖2
Supuestos razonables sobre el patrón de
heterocedasticidad
1) La varianza del error es proporcional a 𝑥𝑖2 : 2) La varianza heterocedástica es proporcional
a 𝑥𝑖
𝐸 𝜇𝑖2 = 𝜎 2 𝑥𝑖2 = 𝜎𝑖2
𝜎𝑖2 = 𝜎 2 𝑥𝑖2
𝑦𝑖 1 𝑥𝑖 𝜇𝑖
= 𝛽1 + 𝛽2 + 𝑦𝑖 1 𝑥𝑖 𝜇𝑖
𝑥𝑖 𝑥𝑖 𝑥𝑖 𝑥𝑖 = 𝛽1 + 𝛽2 +
𝑥𝑖 𝑥𝑖 𝑥𝑖 𝑥𝑖
𝑦𝑖 1 𝜇𝑖
= 𝛽1 + 𝛽2 + 𝑦𝑖 1 𝜇𝑖
𝑥𝑖 𝑥𝑖 𝑥𝑖 = 𝛽1 + 𝛽2 𝑥𝑖 +
𝑥𝑖 𝑥𝑖 𝑥𝑖
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
CAUSAS
1) Inercia Si economía esta pasando por etapa de crecimiento
2) Sesgo de especificación Caso de variables excluidas
Caso de forma funcional incorrecto
3) Rezagos En modelos donde variable endógena aparece como variable explicativa sesgada
en el tiempo.
AUTOCORRELACIÓN
¿CÓMO SE DETECTA?
Prueba de Durbin Watosn (d)
Zona Zona
∃ indecisión indecisión ∃
(+) (-)
autoc. autoc.
𝑑 =ሶ 2 1 − 𝜌ො , 𝜌ො: coeficiente de autocorrelación (+) ∄ (-)
−1 ≤ 𝜌ො ≤ 1
autoc.
(+)ni(-)
Si:
𝜌ො = 1 𝑑 =ሶ 0 (∃ autocorrelación (+) de 1er orden)
𝜌ො = −1 𝑑 =ሶ 4 (∃ autocorrelación (-) de 1er orden) 0 𝑑𝐿 𝑑𝑢 2 4-𝑑𝑢 4-𝑑𝐿 4
𝜌ො = 0 𝑑 =ሶ 0 (∄ autocorrelación ni (+) ni (-))
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
AUTOCORRELACIÓN
Pasos
1) MCO y obtener los residuos
2) Variables explicativas fijas en el modelo
3) 𝑢𝑖 se genera mediante el esquema AR(1), distribución normal
4) No hay información faltante en los datos.
PRUEBA MODIFICADA
Cuando dcal cae en la zona de indecisión de usará esta prueba.
a) 𝐻0 ∶ 𝜌 = 0
Si el valor de dcal es menor de du, se rechaza la
𝐻1 ∶ 𝜌 > 0 Ho, por lo tanto existe autocorrelación positiva
AUTOCORRELACIÓN
¿CÓMO SE DETECTA?
Prueba general de autocorrelación de Bruesh Godfrey
Permite:
- Regresores no estocásticos
- Esquemas autorregresivos de orden mayor
Pasos:
1) MCO, calcular los residuos
2) Realiza la regresión 𝜇ෝ𝑡 sobre 𝑥𝑡
3) Se calcula el 𝑅 2 . Si (n- 𝜌) es mayor que 𝑋𝜌2 se rechaza la Ho.
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
AUTOCORRELACIÓN
CORRECCIÓN A AUTOCORRELACIÓN
Cuando se conoce 𝜌 Cunando no se conoce 𝜌
Regresionando un modelo de
regresión lineal en STATA
Regresionando un modelo de
regresión lineal en STATA
ANÁLISIS DE MULTICOLINEALIDAD
Para realizar un análisis de colinealidad entre las variables explicativas tras un modelo de regresión se usa el
comando “estat vif”.
Por ejemplo, si regresionamos la variable precio según el kilometraje y el desplazamiento obtenemos:
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
ANÁLISIS DE HETEROCEDASTICIDAD
ANÁLISIS DE HETEROCEDASTICIDAD
ANÁLISIS DE AUTOCORRELACIÓN
En primer término es necesario generar una variable de paso del tiempo (t) y referir todas las otras variables a
ella (tsset t)
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
ANÁLISIS DE AUTOCORRELACIÓN
se emplea en
modelos
autorregresivos
Test de Breusch-
Godfrey para
autocorrelación
SESIÓN 1: ANÁLISIS DE REGRESIÓN LINEAL
A tener en Cuenta:
Tarea (Obligatorio)
• Se debe obtener una nota satisfactoria en los trabajos prácticos de cada
sesión, a fin de pasar a la siguiente.
Foro (Obligatorio):
• En el foro del curso se comparten tips y experiencias acerca del curso. Realizar
como mínimo 5 preguntas o comentarios.