Applied Regresion Lineal

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 36

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/274071340

Modelo de regresión lineal aplicado al análisis regional

Chapter · December 2014


DOI: 10.13140/RG.2.1.1228.4965

CITATIONS READS

0 1,902

1 author:

Isaac Sánchez-Juárez
Universidad Autónoma de Ciudad Juárez
51 PUBLICATIONS   255 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Crecimiento económico en México, explicaciones y soluciones. ECONOMIC GROWTH IN MEXICO, EXPLANATIONS AND PROPOSALS. View project

All content following this page was uploaded by Isaac Sánchez-Juárez on 26 March 2015.

The user has requested enhancement of the downloaded file.


Primera edición: diciembre de 2014

D.R. © José Francisco Beltrán Abellán


D.R. © Isabel Castillo Ramos
D.R. © Rosa María García Almada
D.R. © Celia Hernández Cortés
D.R. © Antonio Losa Carmona
D.R. © Juan Carlos Magarzo García
D.R. © Jaime Ornelas Delgado
D.R. © Alfonso Pérez Sánchez
D.R. © Prudencio José Riquelme Perea
D.R. © Isaac Leobardo Sánchez Juárez

D.R. © Universidad Autónoma de Tlaxcala


Av. Universidad 1
Col. La Loma Xicotencatl
90062, Tlaxcala, Tlax. Tel. (246) 462 1167

D.R. © Educación y Cultura, Asesoría y Promoción, s.c.


Moras 755-202, Col. Acacias, Del. Benito Juárez
03240, México, D.F., Tel. (55) 1518 1116
www.edicioneseyc.com / [email protected]
Miembro de la Alianza de
Editoriales Mexicanas Independientes (aemi)

ISBN: 978-607-8432-14-1 (uat)


ISBN: 978-607-8344-11-6 (eeyc)

Diseño editorial: Abraham Zajid Che

Impreso y hecho en México


Printed and bounded in Mexico

Se prohíbe la reproducción, el registro o la transmisión


parcial o total de esta obra por cualquier medio impreso,
mécanico, fotoquímico, electrónico o cualquier
otro existente o por existir, sin el permiso previo del
titular de los derechos correspondientes.
Modelo de regresión lineal
aplicado al análisis regional

Isaac Leobardo Sánchez Juárez

Introducción

E xisten muchos manuales de técnicas de análisis regional en


el mercado, pero muy pocos son realmente valiosos al mo-
mento de utilizarlos en los trabajos que cotidianamente se reali-
zan por parte de los investigadores, profesores, estudiantes e in-
teresados en los estudios económicos regionales. La mayor parte
de libros omite pasos y no logra contribuir al esclarecimiento
de dudas que se tienen al momento de aplicar una técnica. Pen-
sando en esto, el presente capítulo expone una de las técnicas
más sencillas disponibles, pero que tiene en la actualidad un
gran poder explicativo, particularmente si es bien aplicada. El
trabajo se concentra en la especificación, estimación, inferencia,
predicción y diagnóstico del modelo de regresión lineal clásico.
Usando datos regionales de la economía mexicana como
ejemplo, específicamente producción total, inversión privada,
inversión extranjera directa, inversión pública y niveles de esco-
laridad para 2003 y 2012, el lector se familiariza con la técnica,
pensando en que realice una aplicación eficaz de la misma en los
trabajos que tenga en su agenda. La meta no es establecer una
hipótesis a partir de un marco teórico y contrastarla con infor-
mación empírica, lo que se pretende es presentar la herramienta
138 Teorias y técnicas para el Análisis Regional

y establecer la mejor forma de uso de la misma. También debe


advertirse que la presentación que se realiza ha tratado de incluir
la mayor parte de elementos que componen el modelo de regre-
sión lineal clásico, pero que se han dejado algunos temas ya que
el espacio disponible es limitado; no obstante, esté seguro de la
utilidad que tiene lo que encontrará.
Atendiendo a lo que se ha indicado, en la primera parte se
establece formalmente el modelo lineal clásico. En la segunda
parte, se presentan los datos, sus características, origen y tra-
tamiento, así como una rápida descripción de los mismos, ya
que esto es un procedimiento regular que debe seguirse previo a
la realización de cualquier modelo econométrico. En la tercera
parte se realizan las estimaciones, se hacen inferencias y predic-
ciones, para finalmente realizar las pruebas diagnósticas respec-
tivas. Para finalizar, en las conclusiones se resume lo presentado
y se realizan algunos comentarios finales.

Modelo de regresión lineal clásico1

En esta primera parte se exponen los lineamientos generales del


modelo de regresión lineal clásico. Primero se formaliza su pre-
sentación, después se explican los estadísticos a considerar en la
estimación y se continúa con las inferencias que se pueden hacer
a partir de una adecuada estimación. Se agrega un apartado de
predicción y estadísticos. Se termina con la exposición de las
pruebas diagnósticas que deben realizarse al modelo estimado.

El modelo en su forma básica


Con los modelos de regresión lineal se intenta explicar el com-
portamiento de una variable a partir de otras (variable endógena

1
  Esta parte del capítulo se basa en el trabajo de Carrascal, González y Rodríguez
(2001), particularmente los capítulos cinco, seis, siete y diez.
Modelo de regresión lineal aplicado al análisis regional 139

y variables exógenas). Se asume la existencia de una relación li-


neal entre la variable cuyo comportamiento se quiere explicar y
las variables usadas como explicativas.

La variable yt es la dependiente o endógena, las variables xit,


i=1,..., K son las variables explicativas o regresores y t es la
perturbación aleatoria. son los (K+1) parámetros asociados
a cada una de las variables explicativas, conocidos como coe-
ficientes de regresión, miden el impacto de cada variable en el
comportamiento de la variable endógena. 0 es un término in-
dependiente, parámetro asociado a una variable explicativa que
vale 1 para todas las observaciones. T es el tamaño de muestra
y t es una observación.
En notación matricial el modelo quedaría como: Y = X + ,
donde:

En este modelo se asume que se cumplen las siguientes hipó-


tesis básicas:

1. Linealidad de la relación y la constancia de los parámetros a lo


largo de la muestra.
2. No existen relaciones lineales exactas entre las variables explica-
tivas o regresores y éstos no son variables aleatorias.
3. La distribución de probabilidad del vector de perturbaciones
aleatorias es .
140 Teorias y técnicas para el Análisis Regional

Las perturbaciones son variables aleatorias independientes


e igualmente distribuidas, normales de media cero y varianza
. En función de que X no es aleatoria, la distribución de
probabilidad del vector Y se deriva a partir de la del vector de
perturbaciones:

A partir de aquí se tiene que la meta es obtener estimadores


de los parámetros desconocidos que configuran la media y la
varianza del vector Y.

Estadísticos de la estimación
Junto con la estimación es preciso anotar una serie de estadísti-
cos para evaluar la regresión realizada, esta tarea la llevan a cabo
todos los paquetes computacionales disponibles en el mercado.
Lo que se hace a continuación es exponerlos brevemente2.
1. Coeficiente. Da el valor de los estimadores de los parámetros
asociados a cada una de las variables explicativas, los cuales se ob-
tienen a partir de la siguiente expresión.

Si se cumplen las hipótesis clásicas, apuntadas en la sección


anterior, estos estimadores son lineales, insesgados, óptimos y
consistentes. Cada coeficiente indica el cambio que experimenta
la variable endógena ante un cambio unitario de la variable ex-
plicativa, suponiendo que el resto permanece constante.
2. Errores estándar. Informa sobre la desviación típica estimada de
los estimadores y mide, siempre que los estimadores sean insesga-
dos, la precisión con la que son estimados los parámetros. Indican
el grado de confianza que se puede depositar en las estimaciones.

2
  Este capítulo usa Eviews 7.0.
Modelo de regresión lineal aplicado al análisis regional 141

La matriz de varianza y covarianzas estimada de los estima-

dores es es

un estimador insesgado y consistente, sujeto a las hipótesis clá-


sicas, de varianza de las perturbaciones ( ). En consecuencia,
los errores estándar se obtienen como la raíz cuadrada de los
elementos en la diagonal principal de la matriz.
3. Estadístico t. Resulta de dividir el estimador entre su error es-
tándar. Permite contrastar la hipótesis de que el coeficiente es igual
a cero o diferente de cero (el primer caso es la hipótesis nula y el
segundo la alternativa). Si el primer caso se valida entonces la va-
riable en cuestión no es individualmente significativa para explicar
a la variable endógena.
4. Probabilidad. Es dos veces el área que el valor absoluto del es-
tadístico t deja a su derecha e indica la probabilidad de rechazar la
hipótesis nula siendo verdadera (error tipo I). Los valores se cal-
culan a partir de la distribución t de Student con T - K - 1 grados
de libertad, siendo K + 1 el número de coeficiente de regresión
incluyendo el intercepto.
5. R cuadrada. O coeficiente de determinación, sirve para valorar
la calidad de la regresión para predecir los valores de la variable
endógena dentro del periodo muestral y se define como la parte
de la varianza de la variable dependiente explicada por las variables
independientes:

6. R cuadrada ajustada. Es la R cuadrada, ponderada por los grados


de libertad:
142 Teorias y técnicas para el Análisis Regional

Este estadístico permite comparar la capacidad explicativa de


modelos referidos a una misma muestra de la misma variable
endógena con distinto número de variables explicativas.
7. Error estándar de la regresión. Medida que sirve para medir
la capacidad explicativa del modelo, ya que involucra la función
objetivo ponderada por sus grados de libertad. Asumiendo las hi-
pótesis clásicas, el cuadrado de este coeficiente es una estimación
insesgada y consistente de la varianza de las perturbaciones.
8. Suma de los errores al cuadrado. Valor de la función objetivo en
el mínimo, en el caso de mínimos cuadrados, es decir, cuando se
obtienen los estimadores de modo que las diferencias entre el valor
observado de Yy el estimado sean lo más pequeños posibles.
9. Logaritmo de la función de verosimilitud. Valor de la función
objetivo en el máximo cuando se estima por máxima verosimili-
tud, es decir, cuando se obtienen los estimadores de los parámetros
que maximizan la probabilidad de la muestra.
10. Durbin-Watson. Ayuda a contrastar la hipótesis de incorre-
lación entre las perturbaciones aleatorias frente a la presencia de
autocorrelación bajo un esquema AR(1). Se expresa de la siguien-
te forma:

Modelo de regresión lineal aplicado al análisis regional 143

11. Criterio de información de Akaike y de Schwarz. Sirven para


analizar la capacidad explicativa de un modelo y se usan para
hacer comparaciones entre modelos anidados. Su definición es
la siguiente:

donde l es el logaritmo de la verosimilitud calculado en los


valores obtenidos para los estimadores y cuya expresión viene
dada por:

12. Estadístico F. Se usa para contrastar si los parámetros asociados


a las variables explicativas del modelo son conjuntamente iguales
a cero. El estadístico ayuda a contrastar la capacidad explicativa
conjunta de las variables introducidas en el modelo:


Como se usa el coeficiente de determinación en su cálculo,
puede usarse para determinar si éste es suficientemente elevado
estadísticamente como para concluir que la capacidad explicati-
va del modelo es adecuada.
13. Probabilidad del estadístico F. Similar a lo que ocurre con el
estadístico t, este valor es la probabilidad de cometer el error tipo
I, rechazar la hipótesis nula siendo verdadera. Su cálculo implica el
uso de la distribución F de Snedecor con K grados de libertad en
el numerador y T - K- 1 en el denominador.
144 Teorias y técnicas para el Análisis Regional

Inferencia en el modelo de regresión lineal clásico


Después de realizar la estimación básica, comúnmente se pro-
cede a realizar contrastes de las hipótesis sobre los parámetros.
Los principales son restricciones lineales exactas. Los cuatro más
comunes son: 1) restricciones lineales exactas de los parámetros;
2) restricciones sobre un parámetro; 3) restricciones sobre una
combinación lineal de los parámetros; y 4) la hipótesis nula se
formula en términos de igualdad a cero de los coeficientes que
en ella intervienen (los ejemplos se establecerán en la tercera
parte del capítulo).
Para estos contrastes se ocupa de un estadístico de deci-
sión en relación al rechazo o no de la hipótesis nula. Tal esta-
dístico se construye a partir de la distribución del estimador
de los coeficientes, por lo que depende del cumplimiento de
las hipótesis clásicas del modelo. Si el modelo cumple las
hipótesis y las perturbaciones tiene una distribución normal,
se verifica que:

La distribución del estadístico que se emplea para realizar el


contraste sobre los parámetros sigue también, bajo la hipótesis
nula, una distribución normal o la t de Student, Chi-cuadrada
o la F de Snedecor.
Un conjunto de H combinaciones lineales de los paráme-
tros se puede expresar matricialmente como: R = r donde R
es una matriz de orden (H*(K + 1)) y rango H, que contiene
los coeficientes de cada combinación lineal y r es un vector de
H elementos. Por ejemplo, el contraste de las dos restricciones:

Modelo de regresión lineal aplicado al análisis regional 145

Matricialmente sería:

Cumpliéndose los supuestos del modelo de regresión se de-


muestra que, bajo H0, el estadístico de contraste para las restric-
ciones anteriores tiene la siguiente distribución:

H es el número de restricciones, es el estimador mco de


los parámetros, R la matriz de restricciones y r el vector de coefi-
cientes al que se igualan las restricciones. El estadístico obtenido
es general y se usa para contrastar cualquier conjunto de restric-
ciones, como las indicadas al inicio de esta subsección.

Predicción en el modelo lineal clásico


Uno de los puntos más atractivos de los modelos econométri-
cos es su capacidad para realizar predicciones acerca del valor
que tomaría la variable endógena ante cambios en las variables
exógenas fuera de las observaciones muestrales. Las predicciones
se pueden realizar si el modelo fue estimado correctamente, la
146 Teorias y técnicas para el Análisis Regional

relación causal determinada en el modelo se mantiene para las


observaciones fuera de la muestra y se conoce el valor de las va-
riables explicativas en el periodo de predicción.
Una vez realizada la predicción, debe evaluarse su eficiencia,
lo que lleva a los siguientes estadísticos:

1. Raíz del error cuadrático medio:


2. Error absoluto medio:


3. Error absoluto medio del porcentaje del error (a diferencia de los an-
teriores, no depende de las unidades de medida de la variable endógena):

4. Coeficiente de desigualdad de Theil:



Modelo de regresión lineal aplicado al análisis regional 147

Todos estos estadísticos indican una mejor capacidad predic-


tiva del modelo cuanto más cercanos a cero estén.

5. La descomposición del error cuadrático medio de predicción:


6. Proporción del sesgo:


7. Proporción de la varianza:

8. Proporción de la covarianza:


Estas proporciones varían entre cero y uno, su suma es la
unidad. Lo deseable con los dos primeros es que su valor sea
pequeño. La última mide la parte no sistemática de los errores
de predicción, en donde debería recaer la mayor parte del error
148 Teorias y técnicas para el Análisis Regional

total cometido. Los tres ayudan a comparar modelos y ver cuál


es el mejor.

Diagnóstico del modelo econométrico


El modelo que se estima debe ser sometido a pruebas de validez
y calidad, dirigidas a la parte sistemática (selección de las varia-
bles explicativas y forma funcional que relaciona las variables) y
a las propiedades que debe cumplir la perturbación aleatoria. En
caso de error, en muchas ocasiones, la solución implica volver a
especificar el modelo con las correcciones necesarias.

Estabilidad estructural
Una de las hipótesis que se espera cumpla el modelo de regresión
estimado es que los coeficientes se mantienen constantes para
todo el periodo muestral. No obstante, es posible que existan
submuestras para las que su estructura, sea diferente, por lo que
es necesario evaluar esta posibilidad. El mecanismo de mayor
uso en este sentido es el contraste de Chow, en el cual la muestra
total de datos se divide en varios grupos y se estima la ecuación
cuya estabilidad se está evaluando para cada uno de ellos.
La hipótesis nula de estabilidad estructural plantea un solo
modelo para el conjunto de las observaciones (modelo restringi-
do), mientras que la hipótesis alternativa establece un compor-
tamiento diferente en cada grupo en el que se divide a muestra.
Por lo tanto, el modelo sin restringir es aquel en el que los pará-
metros pueden cambiar de una sub-muestra a otra. La solución
convencional a un problema de estabilidad consiste en volver a
especificar el modelo, incorporando variables ficticias.
Si se tiene un modelo de regresión múltiple con K + 1 re-
gresores, la existencia de estabilidad estructural conllevaría la
siguiente especificación:

Modelo de regresión lineal aplicado al análisis regional 149

Si existe un cambio estructural en el momento T1 por el que


todos los parámetros cambian, la especificación sería:

Las hipótesis nula (estabilidad estructural) y la alternativa


(cambio estructural), en términos de los parámetros son:


Si no existen diferencias estadísticas entre el modelo restrin-
gido y sin restringir no se rechaza la hipótesis nula de estabilidad
del modelo. De rechazarse, entonces, existe cambio estructural.

Incorrecta forma funcional


Para verificar errores en la formulación del modelo se usa el
contraste reset de Ramsey. El cual parte de la idea de que
cualquier función lineal puede aproximarse mediante el uso de
un polinomio de orden adecuado, lo que equivale a introdu-
cir términos de potencia y productos cruzados de las variables
explicativas.
El análisis de la hipótesis de linealidad del modelo se reali-
za contrastando la restricción de que los coeficientes de las po-
tencias de la variable endógena estimada incluidas son iguales
a cero. Si la hipótesis nula se rechaza, la conclusión es que la
forma funcional lineal del modelo inicialmente especificado es
incorrecta y debe incluir las no linealidades detectadas.
150 Teorias y técnicas para el Análisis Regional

Normalidad de las perturbaciones


Aunque probar la normalidad de las perturbaciones no es ne-
cesario para la estimación de los estimadores de los coeficien-
tes de regresión, sí es útil en la realización de inferencias sobre
el modelo. El estudio de la normalidad se lleva a cabo con los
residuos. Si la hipótesis se cumple, la distribución empírica de
dichos residuos debería presentar características similares a las
de la distribución normal. Para probar esto se usa el histograma
de los residuos y el estadístico Jarque-Bera. En el primer caso, si
aproximadamente la distribución de los residuos es una normal,
la representación del histograma debería parecer una campana
de Gauss simétrica. En el segundo, como los momentos pobla-
cionales de orden impar de una variable normal son cero (lo
mismo su coeficiente de asimetría-skewness) y su coeficiente de
kurtosis es tres, se tiene que encontrar valores similares a éstos al
calcular los momentos muestrales de los residuos.
La prueba Jarque-Bera implica una hipótesis nula que esta-
blece la normalidad de las perturbaciones y la alternativa de no
normalidad. El estadístico del contraste es el de los multiplica-
dores de Lagrange, construido usando los coeficientes de asime-
tría y kurtosis:

La distribución asintótica que sigue el estadístico, bajo la hi-


pótesis nula de normalidad, es una Chi-cuadrada con 2 grados
de libertad, siendo m los momentos muestrales centrados de or-
den i de los residuos:

Modelo de regresión lineal aplicado al análisis regional 151

En caso de no normalidad la solución consiste en investigar


la causa de esto. Se puede deber a observaciones atípicas que
generan distribuciones con falta de simetría. También puede
deberse a problemas de especificación, omisión de variables re-
levantes y falta de linealidad. Otra causa puede ser la utilización
de datos procedentes de distintas poblaciones.
Hasta este punto, se ha establecido la forma básica del mo-
delo de regresión lineal clásico, con lo que se está en posi-
bilidad de realizar la estimación. También se ha presentado
formalmente la inferencia y la predicción en esta clase de mo-
delos, para finalmente exponer los contrastes diagnósticos bá-
sicos que es necesario realizar para tener certeza de la eficiencia
del modelo utilizado (cabe destacar que se ha dejado fuera, por
su extensión, el tema autocorrelación y heterocedasticidad).
En la siguiente parte del capítulo se exponen los datos utili-
zados, su origen, características, transformaciones y una breve
descripción de los mismos.

Datos utilizados como ejemplo y su descripción

En los ejercicios se usaron datos regionales (estatales) de la


economía mexicana para los años 2003 y 2012. La base de
datos completa se encuentra disponible para el lector en el
portal www.Researchgate.net, donde debe seguir al autor de
este capítulo, el sitio es muy útil en la realización de una in-
vestigación y para interactuar con investigadores de todo el
planeta. Dicho lo anterior, la variable dependiente es el pib
(Producto Interno Bruto), mientras que las independientes
son: fbkf (Inversión Privada), ied (Inversión Extranjera Di-
recta), ig (Inversión Pública) y esc (Promedio de años de Es-
colaridad). Recordar que la economía mexicana se compone
de 32 entidades.
152 Teorias y técnicas para el Análisis Regional

Como en todo estudio serio de economía, la elección de va-


riables se sustenta en un marco teórico, en este caso, lo que se
supone es que la producción depende positivamente de las va-
riables indicadas, los aumentos en ellas se espera contribuyan a
una mayor producción en cada una de las entidades federativas
mexicanas (respecto al sustento teórico véase Helpman, 2007 y
Sala-i-Martin, 2000).
Las series de producción e inversión privada fueron obteni-
das del Banco de Información Económica del inegi, están en
millones de pesos a precios del 2008. La ied, la inversión pú-
blica y los años promedio de escolaridad se obtuvieron de las
estadísticas que publica por entidad federativa la consultoría
Aregional. La serie de ied estaba en dólares, así que primero
se procedió a convertirla a pesos corrientes, usando para ello el
tipo de cambio promedio anual que proporciona el Banco de
México, enseguida fue deflactada usando como base el 2008. La
inversión pública también se deflactó usando el año 2008 como
base, los datos refieren al gasto en obras y servicios sociales rea-
lizado por el gobierno. Finalmente, los años de escolaridad no
sufrieron ninguna transformación y se dejaron como estaban.
En función de lo expuesto, la formulación básica de los mo-
delos queda como sigue:

Se evalúa el impacto sobre la producción de cuatro variables


teóricamente relevantes, en dos años.
Modelo de regresión lineal aplicado al análisis regional 153

Cuadro 1
Estadísticas básicas

Variable Media Máximo


2003 2012 2003 2012
PIB 218,674 285,871 1,710,592 2,204,492
FBKF 1,431 3,789 6,380 28,296
IED 862 1,465 150,040 38,814
IG 1,255,971 1,708,610 5,900,255 9,592,299
ESC 8 9 10 11
Obs. 32 32 32 32

Variable Mínimo Desviación Estándar


2003 2012 2003 2012
PIB 58,017 71,637 334,489 419,073
FBKF 346 748 1,380 4,978
IED 1 59 26,,465 7,516
IG 212,380 102,171 1,451,459 2,399,497
ESC 6 7 1 1
Obs. 32 32 32 32

Los valores medios, máximos y mínimos del PIB, FBKF, IED e IG,
están en millones de pesos del 2008.
Fuente: Elaboración propia.

El cálculo de los estadísticos descriptivos permite tener una


primera imagen del comportamiento de las variables indepen-
dientes y dependiente. Tradicionalmente en todo ejercicio debe
presentarse el valor mediano o la media, máximo, mínimo y
desviación estándar. En este caso se hace para los dos años de
los que se dispone información y con los cuales se elaborará
un modelo econométrico. Realizado esto, lo que sigue es ver el
comportamiento gráfico que siguen las series, para lo cual ense-
guida se presentan los gráficos de dispersión.
154 Teorias y técnicas para el Análisis Regional

Gráfica 1
Representación de las series en 2003

Fuente: Elaboración propia.

Gráfica 2
Representación de las series en 2012

Fuente: Elaboración propia.


Modelo de regresión lineal aplicado al análisis regional 155

Los gráficos para los dos años, apuntan a la existencia de una


relación positiva entre la variable dependiente (pib) y las indepen-
dientes, particularmente en el caso de la fbkf. La ig también se
observa correlacionada con el pib en 2003, no así en 2012. Para
complementar el análisis gráfico, deben presentarse las matrices de
correlaciones. Lo que informa la del primer año es que existe una
fuerte asociación del pib con la ied, fbkf, ig y finalmente esc, en
ese orden. También se detecta una fuerte correlación entre la fbkf
e ig. Para 2012 la correlación más elevada es nuevamente del pib
con la ied, fbkf, esc y finalmente ig. No se observa, a diferencia del
2003, una correlación elevada entre las variables independientes,
destaca un valor negativo entre la esc e ig.

Cuadro 2
Matriz de correlaciones para 2003

PIB FBKF IED ESC IG


PIB 1.000000 0.650936 0.803713 0.443999 0.640316
FBKF 0.650936 1.000000 0.655508 0.108627 0.808082
IED 0.803713 0.655508 1.000000 0.509372 0.537046
ESC 0.443999 0.108627 0.509372 1.000000 0.250854
IG 0.640316 0.808082 0.537046 0.250854 1.000000

Fuente: Elaboración propia.

Cuadro 3
Matriz de correlaciones para 2012
PIB FBKF IED IG ESC
PIB 1.000000 0.583835 0.899362 0.220725 0.431682
FBKF 0.583835 1.000000 0.497445 0.596238 0.095609
IED 0.899362 0.497445 1.000000 0.096343 0.545428
IG 0.220725 0.596238 0.096343 1.000000 -0.057165
ESC 0.431682 0.095609 0.545428 -0.057165 1.000000
Fuente: Elaboración propia.
156 Teorias y técnicas para el Análisis Regional

Estimación, inferencia, predicción y diagnóstico

En esta parte se encuentran los resultados de la aplicación de la


técnica econométrica a datos regionales, recordar que lo que se
busca es una relación positiva entre las variables independientes
y la dependiente, que es el volumen de producción de bienes y
servicios. La información con la que se cuenta es para 2003 y
2012. En primer lugar, se presentan los resultados de las estima-
ciones y sus estadísticos respectivos; después, se realizan inferen-
cias, básicamente pruebas sobre los parámetros y de variables re-
dundantes; enseguida, se procede al diagnóstico de los modelos
y se termina con un ejercicio de predicción.

Estimación y sus estadísticos


En los cuadros 4 y 5 aparecen los resultados de las estimaciones
para cada modelo. Destaca que en ambos, la única variable sig-
nificativa es la ied, esto se obtiene del t-estadístico y su valor de
probabilidad, el cual indica que es posible rechazar la hipótesis
nula de no significatividad del coeficiente asociado a esta varia-
ble, a un 90, 95 y 99 por ciento de confianza.
En los dos modelos el ajuste es bueno, ya que la R-cuadrada
ajustada es superior a 0.7 en el primer caso y 0.8 en el segundo.
El estadístico F también confirma lo anterior. Aun y cuando
las variables fbkf, ig y esc no fueron estadísticamente signi-
ficativas en el primer modelo, presentaron el signo positivo
esperado. Para el segundo modelo, la única variable que no
presentó el signo esperado fue esc, lo que no se corresponde
con la teoría del crecimiento económico (a los lectores se re-
comienda ampliamente el contraste de sus resultados con un
modelo teórico).
Modelo de regresión lineal aplicado al análisis regional 157

Cuadro 4
Resultados de la estimación para 2003

Variable dependiente: PIB


Método: Mínimos cuadrados
Muestra: 1 32
Observaciones incluidas: 32
Variable Coeficiente Error Std. t-estadístico Prob.
FBKF 2.339127 53.81472 0.043466 0.9656
IED 7.739859 2.176469 3.556154 0.0014
ESC 22292.83 51871.92 0.429767 0.6708
IG 0.066588 0.043013 1.548103 0.1332
C -40246.08 421939.8 -0.095383 0.9247
R-cuadrada 0.709479
R-cuadrada ajustada 0.666438
E.S. de la regresión 193183.7
Sum cuadrados resid 1.01E+12
Log verosimilitud -432.1723
F-estadístico 16.48409
Prob(F-estadístico) 0.000001
Media var depend 316246.8
D.E. var depend 334489.4
Criterio infoAkaike 27.32327
Criterio Schwarz 27.55229
Durbin-Watson 2.032214

Fuente: Elaboración propia.


158 Teorias y técnicas para el Análisis Regional

Cuadro 5
Resultados de la estimación para 2012

Variable dependiente: PIB


Método: Mínimos cuadrados
Muestra: 1 32
Observaciones incluidas: 32
Variable Coeficiente Error Std. t-estadístico Prob.
FBKF 10.75209 9.980290 1.077333 0.2909
IED 47.56976 6.322055 7.524414 0.0000
IG 0.010468 0.017666 0.592545 0.5584
ESC -21322.21 48011.37 -0.444108 0.6605
C 300605.4 419354.2 0.716829 0.4796
R-cuadrada 0.836816 Prob(F-estadístico) 0.000000
R-cuadrada ajustada 0.812641 Media var depend 403528.3
E.S. de la regresión 181396.0 D.E. var depend 419073.8
Sum cuadrados resid 8.88E+11 Criterio infoAkaike 27.19735
Log verosimilitud -430.1577 Criterio Schwarz 27.42637
F-estadístico 34.61447 Durbin-Watson 2.227922

Fuente: Elaboración propia.

En las dos estimaciones, el coeficiente asociado a la constante


no fue significativo, siendo negativo en el primer caso y positivo
en el segundo. En conclusión, con los resultados, puede afirmar-
se que para 2003 y 2012, la ied fue una variable correlacionada
positivamente con la producción, lo que teóricamente puede ser
evidencia de causalidad (debe advertirse que con esta técnica no
es posible determinar totalmente lo anterior, para ello serían ne-
cesarias series de tiempo y la aplicación de un test de Granger)3.

3
  Se recomienda la lectura de Sánchez (2011), para un ejemplo de la aplicación de
un test de causalidad en el sentido de Granger.
Modelo de regresión lineal aplicado al análisis regional 159

Inferencia: Test de Wald y de variables redundantes


Una vez terminada la estimación, se procedió a la realización de
inferencias, un test de Wald y una prueba de variables redundantes.
En los cuadros 6 y 7 se presentan los resultados de la primera prue-
ba para los dos modelos. La hipótesis nula supone que el valor del
coeficiente de la ied es igual cero y que los coeficientes de fbkf e
ied son iguales. Como se puede apreciar en los cuadros, en los dos
casos no es posible sostener que la hipótesis nula sea cierta, para ello
se usan los valores de probabilidad del estadístico F y Chi-cuadrada.

Cuadro 6
Test de Wald para 2003

Test Wald:
Test Estadístico Valor df Prob.
F-estadístico 9.934011 (2, 27) 0.0006
Chi-cuadrada 19.86802 2 0.0000
Hipótesis nula: IED=0, FBKF-IED=0

Fuente: Elaboración propia.

Cuadro 7
Test de Wald para 2012

Test Wald:
Test Estadístico Valor df Prob.
F-estadístico 48.81402 (2, 27) 0.0000
Chi-cuadrada 97.62804 2 0.0000
Hipótesis nula: IED=0, FBKF-IED=0

Fuente: Elaboración propia.


160 Teorias y técnicas para el Análisis Regional

En los cuadros 8 y 9 se presenta la prueba de variables re-


dundantes, con ella se deja claro que las variables fbkf, esc e
ig no son significativas para los modelos estimados. Se utiliza el
estadístico F para comprobar si la hipótesis nula de existencia de
variables redundantes es verdadera.

Cuadro 8
Test de variables redundantes para 2003

Especificación: PIB C FBKF IED ESC IG


Variables redundantes: FBKF ESC IG
Valor df Probabilidad
F-estadístico 1.967875 (3, 27) 0.1426
Verosimilitud 6.327871 3 0.0967
Test de ecuación restringida:
Variable dependiente: PIB
Método: Mínimos cuadrados
Muestra: 1 32
Observaciones incluidas: 32
Variable Coeficiente Error Std. t-estadístico Prob.
IED 10.15794 1.373007 7.398314 0.0000
C 237285.7 37323.40 6.357558 0.0000
R-cuadrada 0.645955 Prob(F-estadístico) 0.000000
R-cuadrada ajustada 0.634154 Media var depend 316246.8
E.S. de la regresión 202316.7 D.E. var depend 334489.4
Sum cuadrados resid 1.23E+12 Criterio infoAkaike 27.33352
Log verosimilitud -435.3363 Criterio Schwarz 27.42513
F-estadístico 54.73505 Durbin-Watson 1.935513

Fuente: Elaboración propia.

En el primer caso, existe una alta probabilidad de que se rechace


la hipótesis nula siendo verdadera (0.1426), lo mismo ocurre en el
Modelo de regresión lineal aplicado al análisis regional 161

segundo caso (0.2263). De esta forma, se estimaron dos modelos,


en los cuales la única variable explicativa es la ied, el resultado es
una menor bondad de ajuste (R-cuadrada ajustada) para el primer
modelo al quitar tres variables explicativas; en el segundo modelo
la bondad de ajuste no se ve afectada, lo que se concluye del uso del
F-estadístico y la R-cuadrada ajustada. Los resultados apuntan a la
importancia, para esos años, de la ied para la producción.

Cuadro 9
Test de variables redundantes para 2012

Especificación: PIB C FBKF IED ESC IG


Variables redundantes: FBKF ESC IG
Valor df Probabilidad
F-estadístico 1.542357 (3, 27) 0.2263
Verosimilitud 5.061651 3 0.1673
Test de ecuación restringida:
Variable dependiente: PIB
Método: Mínimos cuadrados
Muestra: 1 32
Observaciones incluidas: 32
Variable Coeficiente Error Std. t-estadístico Prob.
IED 50.14288 4.450411 11.26702 0.0000
C 182283.8 38335.69 4.754938 0.0000
R-cuadrada 0.808851 Prob(F-estadístico) 0.000000
R-cuadrada ajustada 0.802480 Media var depend 403528.3
E.S. de la regresión 186250.1 D.E. var depend 419073.8
Sum cuadrados resid 1.04E+12 Criterio infoAkaike 27.16803
Log verosimilitud -432.6885 Criterio Schwarz 27.25964
F-estadístico 126.9458 Durbin-Watson 2.003110

Fuente: Elaboración propia.


162 Teorias y técnicas para el Análisis Regional

Diagnóstico de las estimaciones


Normalmente, cuando se usa esta sencilla técnica por parte de
los investigadores, se concentran en las estimaciones, dejando
fuera las pruebas de diagnóstico, las cuales permiten conocer si
la forma funcional elegida es la adecuada y si existe normalidad
en las perturbaciones, a lo que se puede agregar una prueba de
estabilidad estructural. En los cuadros 10 y 11 se exponen los
resultados de las pruebas de estabilidad estructural, consideran-
do la hipótesis nula de estabilidad, el punto de rompimiento
propuesto fue el 16 de las observaciones.

Cuadro 10
Test de Chow de estabilidad estructural para 2003

Punto de rompimiento: 16
Hipótesis nula: Estabilidad estructural
Muestra de la ecuación: 1 32
F-estadístico 2.833355 Prob. F(5,22) 0.0402
Log verosimilitud 15.90715 Prob. Chi-Cuadrada(5) 0.0071
Estadístico Wald 14.16678 Prob. Chi-Cuadrada(5) 0.0146

Fuente: Elaboración propia.

Cuadro 11
Test de Chow de estabilidad estructural para 2012

Punto de rompimiento: 16
Hipótesis nula: Estabilidad estructural
Muestra de la ecuación: 1 32
F-estadístico 1.533368 Prob. F(5,22) 0.2203
Log verosimilitud 9.567598 Prob. Chi-Cuadrada(5) 0.0885
Estadístico Wald 7.666839 Prob. Chi-Cuadrada(5) 0.1756

Fuente: Elaboración propia.


Modelo de regresión lineal aplicado al análisis regional 163

Para el 2003, al 95 por ciento de confianza, puede rechazarse


la hipótesis nula de estabilidad estructural, lo que sugiere ha-
cer ajustes en el modelo para tener una mejor estimación. Para
2012, el valor de probabilidad del estadístico F indica que no
es posible rechazar la hipótesis nula, por lo tanto existe estabili-
dad estructural. Cabe mencionar que para la realización de esta
prueba se seleccionó de forma aleatoria el valor de rompimiento
dentro de las observaciones, esto es algo que resulta de una deci-
sión del investigador, en función de lo que pretende demostrar.
Para evaluar la forma funcional elegida, se usó el test reset
de Ramsey, lo que se hizo fue ajustar al cuadrado los valores y
ver el resultado. En los cuadros 12 y 13 aparecen los resultados.
Para los dos años, lo que se encontró es que la forma funcional
elegida es la adecuada, ya que no se puede rechazar la hipótesis
nula. En el primer caso el valor del estadístico t es de 0.7191 y
en el segundo de 0.2309.

Cuadro 12
Test RESET de Ramsey de forma funcional para 2003

Especificación: PIB C FBKF IED ESC IG


Variables omitidas: Cuadrado de los valores ajustados
Valor df Probabilidad
T-estadístico 0.363555 26 0.7191
F-estadístico 0.132173 (1, 26) 0.7191
Tasa de verosimilitud 0.162262 1 0.6871

Fuente: Elaboración propia.


164 Teorias y técnicas para el Análisis Regional

Cuadro 13
Test RESET de Ramsey de forma funcional para 2012

Especificación: PIB C FBKF IED IG ESC


Variables omitidas: Cuadrado de los valores ajustados
Valor df Probabilidad
T-estadístico 1.226849 26 0.2309
F-estadístico 1.505158 (1, 26) 0.2309
Tasa de verosimilitud 1.800864 1 0.1796

Fuente: Elaboración propia.

Respecto a la normalidad, se usó el estadístico Jarque-Bera,


con la hipótesis nula de normalidad. Los resultados aparecen en
las gráficas 3 y 4. Para el 2003 se rechaza la hipótesis nula de nor-
malidad, mientras que para el 2012 confirmamos la normalidad.

Gráfica 3
Prueba de normalidad de las perturbaciones para 2003

Fuente: Elaboración propia.


Modelo de regresión lineal aplicado al análisis regional 165

En resumen, el modelo que fue creado para el 2012 es mucho


mejor, ya que presenta estabilidad estructural, tiene la forma fun-
cional adecuada y las perturbaciones son normales. Además, se
debe considerar el resultado de la prueba de variables redundan-
tes, para concluir que la principal variable que en ese año deter-
minó positivamente a la producción fue la ied. Por supuesto, este
resultado está sujeto a mayores pruebas y al uso de una muestra de
información más amplia, de aquí que en todo estudio economé-
trico regional, la aplicación del modelo lineal clásico sea apenas la
primera aproximación (pero siempre necesaria).

Gráfica 4
Prueba de normalidad de las perturbaciones para 2012

Fuente: Elaboración propia.

Predicción usando el modelo lineal


Observe que se ha dejado para el final la predicción; a diferencia
de la presentación de la técnica que se hizo en la primera parte,
la razón es que se cambiaron las series para la realización del
ejercicio. En esta sección se usaron datos anuales del 2003 al
166 Teorias y técnicas para el Análisis Regional

2012 de la producción (pib) y de la escolaridad (esc). La razón


del cambio es que se buscó demostrar que la educación, medida
como años promedio de escolaridad, sí tiene un impacto posi-
tivo sobre la producción, y no negativo como se presentaba en
la estimación de corte transversal para 2012. De esta forma se
llegó a la estimación que aparece en el cuadro 14. Recuerde que
lo que se intenta es pronosticar el valor que asumiría la variable
dependiente ante cambios en la independiente. Se supuso que
para 2013 y 2014 la variable explicativa aumentaba un 10 por
ciento, lo mismo que la dependiente y a partir de ahí se calcula-
ron los estadísticos de la predicción que aparecen en la gráfica 5.

Cuadro 14
Estimación del modelo

Variable dependiente: PIB


Método: Mínimos cuadrados
Muestra: 2003-2012
Observaciones: 10
Variable Coeficiente Error Std. t-estadístico Prob.
ESC 2669169. 402028.4 6.639254 0.0002
C -10758025 3359568. -3.202205 0.0126
R-cuadrada 0.846389 Prob(F-estadístico) 0.000163
R-cuadrada ajustada 0.827188 Media var depend 11534539
E.S. de la regresión 355040.8 D.E. var depend 854065.5
Sum cuadrados resid 1.01E+12 Criterio infoAkaike 28.57471
Log verosimilitud -140.8735 Criterio Schwarz 28.63523
F-estadístico 44.07970 Durbin-Watson 1.169831

Fuente: Elaboración propia.


Modelo de regresión lineal aplicado al análisis regional 167

Gráfica 5
Estadísticos para evaluar la predicción

Fuente: Elaboración propia.

El modelo estimado exhibe que la escolaridad determina po-


sitivamente la producción durante el periodo estudiado, aunque
claro, como se ha mostrado en las anteriores secciones, deben
realizarse las pruebas de diagnóstico respectivas para tener ma-
yor certeza. Por la prueba F y la R-cuadrada ajustada se puede
concluir que el modelo presenta un buen ajuste. Como se ha
indicado antes, se ha supuesto que la escolaridad para dos años
más (2013 y 2014) aumenta 10 por ciento, lo que anticipa in-
crementos en la producción.
Se calcularon los estadísticos de una predicción como ésta sin
llegar a resultados definitivos, ya que la raíz del error cuadrado
medio, el error absoluto medio y el error absoluto medio del por-
centaje del error, presentan valores muy alejados del cero, no así
el coeficiente de desigualdad de Theil que es 0.05. La descompo-
sición del error cuadrático medio, particularmente, la proporción
de la covarianza, indican una buena predicción. Se puede concluir
que el modelo es aceptable para fines de predicción.
168 Teorias y técnicas para el Análisis Regional

Conclusiones

Existen diversas técnicas de análisis regional, una de las más co-


nocidas es el modelo de regresión lineal clásico, éste a pesar de
su sencillez, tiene un gran poder explicativo de los problemas
a los que se enfrentan estudiantes, profesores, investigadores y
realizadores de políticas públicas. Es por ello que ha sido objeto
de estudio del capítulo.
Una aplicación adecuada de la técnica involucra la estima-
ción de los coeficientes asociados a las variables explicativas,
determinar si en lo individual son significativos, así como en
forma conjunta; una vez que esto se ha llevado a cabo es necesa-
rio realizar inferencias sobre la base del modelo estimado, para
finalmente llevar a cabo las pruebas diagnósticas respectivas.
Si el modelo ha sido bien estimado y se tiene interés en co-
nocer el valor que asume la variable dependiente en el futuro
ante cambios en las variables independientes, entonces, deben
realizarse predicciones y calcular estadísticos para la misma
que informen sobre su calidad, en base a ello se realiza el re-
porte de investigación.
Una de las principales lecciones que debe atenderse es la que
la aplicación de la técnica implica contar con el mayor número
de observaciones posible, lo que muchas ocasiones resulta com-
plicado en estudios de economía regional, donde la información
es siempre escasa. Al final, la meta ha sido proporcionar una
alternativa para la realización de más y mejores estudios regio-
nales que contribuyan a establecer una sociedad en donde prive
la calidad de vida y la satisfacción.
Modelo de regresión lineal aplicado al análisis regional 169

Bibliografía

Carrascal Ursicino, Yolanda González y Beatriz Rodríguez


(2001), Análisis econométrico con Eviews, Alfaomega Edito-
res, Madrid.
Helpman, Elhanan (2007), El misterio del crecimiento económico,
Antoni Bosch Editores, Madrid.
Sala-i-Martin, Xavier (2000), Apuntes de crecimiento económico,
Antoni Bosch Editores, Madrid.
Sánchez, Isaac (2011), Insuficiencia dinámica manufacturera y
estancamiento económico en México, 1982-2010. Análisis y re-
comendaciones de política, Universidad Autónoma de Ciudad
Juárez, ciudad Juárez.

View publication stats

También podría gustarte