Investn Alis
Investn Alis
Investn Alis
dependiente y más de una variables independientes. En este tipo de modelos es importante testar
la heterocedasticidad, la multicolinealidad y la especificación.
La regresión es una técnica estadística que consiste en calcular dicha similitud en forma de función
matemática. Esta función nos ofrece mucha más información sobre dicha relación. Por ejemplo, el
modelo más sencillo: la regresión lineal simple, ya nos informa de las siguientes magnitudes: la
magnitud de la correlación; el incremento marginal, el valor de una de ellas cuando la otra es cero
y si dicha relación puede considerarse significativa o fuerte (distinta de una relación normal) o no
significativa o débil (similar a una relación normal)
. Hipótesis y Estimación Para que los resultados de la regresión sean “confiables” (confiable es una
forma coloquial de referirse a: insesgados, es decir que sus resultados sean parecidos a los reales; y
óptimos, es decir que su varianza sea mínima) es necesario que: a) La relación entre las variables
sea lineal. Ser lineal no significa que forzosamente tenga que ser una línea recta sino también que
pueda ser lineal con alguna transformación. b) Las perturbaciones (es decir los efectos provocados
aleatoriamente o por variables no incluidas en el modelo) deben ser: de media cero,
homocedásticas y no autocorrelacionadas. Se suelen resumir estos bajo la denominación de
“esfericidad” de los residuos.
Donde
Figura 7 Plano para la estimación por mínimos cuadrados en un modelo con dos regresores (
y ).
1. Las tres primeras hipótesis del modelo se justifican igual que en regresión
simple.
3. El número de datos debe ser mayor o igual que k + 2 para poder estimar todos
los parámetros del modelo.
2. Para todo βˆi, con i = 0, 1, . . . , k, se cumple que E ( βˆi ) = βi. Es decir βˆi es
un estimador centrado de βi, para todo i.
Hipótesis nula
CONCLUSIONES
Los modelos de regresión simple y múltiple presentan las características ideales para el
tratamiento de variables cuantitativas que responden según las variables predictoras
oregresoras dentro del fenómeno estudiado.
El Internet de las Cosas puede ser aplicado en el estudio estadístico del crecimiento de
la microalga Chlorella sp., en conjunto con algoritmos de predicción de alta
complejidad que requieran procesamiento estadístico, como lo es el modelo de
regresión múltiple. El hecho de poder acceder a la nube de Internet facilita el manejo
de los datos para los investigadores y especialistas que requieran información del
estado del cultivo.
https://www.scielo.sa.cr/scielo.php?script=sci_arttext&pid=S0379-
39822016000900033
Evans, D., (2011). Internet of Things - How the Next Evolution of the Internet Is
Changing Everything. White paper Cisco Internet Business Solutions Group (IBSG).
[ Links ]
Fox, R. (1996) Spirulina production and potential, France: Edisud, ISBN 2-84744-883-
X. [ Links ]
Gutiérrez, H., De la Vara, R., (2012) Análisis y diseño de experimentos, 3ra edición,
McGraw -Hill, México. [ Links ]
Rosenberg, J., Oyler, G., Wilkinson, J. and Betenbaugh, M. (2008) A green light for
engineered algae: Redirecting metabolism to fuel a biotechnology revolution. Current
Opinion in Biotechnology 19: 430-436. [ Links ]
En definitiva, y al igual que en regresión lineal simple, vamos a considerar que los valores de la
variable dependiente Y han sido generados por una combinación lineal de los valores de una o más
variables explicativas y un término aleatorio: y = b0 + b1 ⋅ x1 + b2 ⋅ x2 + ... + bk ⋅ xk + u Los
coeficientes son elegidos de forma que la suma de cuadrados entre los valores observados y los
pronosticados sea mínima, es decir, que se va a minimizar la varianza residual. Esta ecuación recibe
el nombre de hiperplano, pues cuando tenemos dos variables explicativas, en vez de recta de
regresión tenemos un plano:
Con tres variables explicativas tendríamos un espacio de tres dimensiones, y así sucesivamente.
Vamos a ir introduciendo los elementos de este análisis a través de un sencillo ejemplo.
Consideramos una muestra de personas como la que sigue a continuación:
Al igual que en regresión lineal simple, los coeficientes b van a indicar el incremento en el peso por
el incremento unitario de la correspondiente variable explicativa. Por lo tanto, estos coeficientes
van a tener las correspondientes unidades de medida.
Si admitimos que los datos presentan estas hipótesis entonces el teorema de Gauss-Markov
establece que el método de estimación de mínimos cuadrados va a producir estimadores óptimos,
en el sentido que los parámetros estimados van a estar centrados y van a ser de mínima varianza
Es importante observar que si las variables explicativas X están muy correlacionadas entre si, la
matriz (X ′* X ) va a tener el determinante con valor cero o muy cercano a cero. Si hay al menos una
variable que puede ser expresada como combinación lineal del resto (ingresos mensuales, ingresos
anuales) el determinante de esta matriz es cero y dicha matriz será singular y por lo tanto no
tendrá inversa. Si no hay variables que sean combinación lineal de las demás, pero están
fuertemente correlacionadas, el determinante no será cero pero tendrá un valor muy próximo a
cero; este caso va a producir una inestabilidad en la solución del estimador, en general, se va a
producir un aumento en su varianza. En estos casos se impone la utilización de un método de
selección de variables explicativas. A los problemas provocados por la fuerte correlación entre las
variables explicativas se les llama multicolinealidad.
Varianza residual