Ayudantía 3 PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

Universidad Técnica Federico Santa María Departamento de Industrias

Econometría
Ayudantía N°3
Primer Semestre 2023
Conceptos
1. Test de Hipótesis: Busca contrastar resultados con la teoría

2. Hipótesis Nula (𝑯𝟎 ): Es sobre quien se quiere decidir. Toma este nombre porque la hipótesis que se
plantea se acomoda para que haya un parámetro igual a 0.

3. Hipótesis Alternativa (𝑯𝒂 ): Suele aceptarse temporalmente cuando se rechaza la hipótesis nula.

4. Nivel de significación (𝜶): Límite para juzgar un resultado como estadísticamente significativo.
Generalmente se define con un valor de 0,5.

5. Valor-p: Valor que se obtiene por tabla o calculadora TI en base al valor de la F calculada de la tabla de
análisis de varianza.

6. Propiedades de los estimadores β:

➢ 𝛽̂ = (𝑋´𝑋)−1 𝑋´𝑌
➢ Son combinaciones lineales de Y
➢ Tienen distribución normal
➢ Son insesgados: 𝐸[𝛽̂ ] = 𝛽
➢ Son de varianza mínima
➢ Suficientes: no se requiere información adicional a la ya obtenida para representar el modelo
➢ Consistentes: Si se agregan más datos esto será un aporte para que el modelo este más correcto
➢ Son MELI (mejor estimador lineal insesgado)

7. Coeficiente de determinación (𝑹𝟐 ): Es la proporción de la varianza total de la variable explicada


por la regresión, es decir, esta determina la calidad del modelo para explicar los resultados de la variación
de Y, si es más cercano a 1 es mejor. Pero hay que tener consideración que es peligroso usar esta medida
para evaluar la calidad del ajuste pues este valor está afectado por problemas en la regresión como lo es la
colinealidad de las variables.

8. 𝑹𝟐 ajustado: Se utiliza en la regresión múltiple para ver el grado de intensidad o efectividad que tienen
las variables independientes en explicar la variable dependiente y generalmente se ocupa para comparar
regresiones con diferentes números de variables, referidos a la misma variable endógena Y.

Profesor: Pedro Fernández de la Reguera Ayudantes: Miguel Godoi; Cesar Valdés


Universidad Técnica Federico Santa María Departamento de Industrias

Análisis de varianza (ANOVA)


Se busca determinar un estimador insesgado de la varianza residual aplicable tanto a MCO como a MV

Para las dócimas de hipótesis en el ANOVA, es necesario definir un nivel de significación (generalmente se
define α=0,5) y luego obtener la F calculada para poder encontrar por tabla el valor-p asociado a este valor
obtenido. De esto se plantea la hipótesis global de la tabla (la que no incluye a 𝛽0) definiendo la hipótesis nula y
la alternativa.

• 𝐻0 : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑗 = 0

• 𝐻𝑎 : Al menos un 𝛽 es distinto a 0

De esto se desprende que:

• Si valor-p < α rechazo la hipótesis nula. Se acepta temporalmente la hipótesis alternativa, pues al
menos un β es significativo.

• Si valor-p > α se acepta la hipótesis nula. Esto quiere decir que los 𝛽 no son significativos, pues
toman valor 0
• Si F calculada > 𝐹 𝑝; 𝑛−1−𝑝; 1−𝛼 se rechaza la hipótesis nula. Se acepta temporalmente la hipótesis
alternativa, pues al menos un β es significativo.

• Si F calculada < 𝐹 𝑝; 𝑛−1−𝑝; 1−𝛼 se acepta la hipótesis nula. Esto quiere decir que los 𝛽 no son
significativos, pues toman valor 0
Si la dócima global del ANOVA resulta en que todos los 𝛽 son nulos (iguales a 0), se debería descartar el
análisis, pero esto suele no hacerse pues el modelo podría estar mal formulado o existir otro tipo de problemas
que expliquen este resultado.

Profesor: Pedro Fernández de la Reguera Ayudantes: Miguel Godoi; Cesar Valdés


Universidad Técnica Federico Santa María Departamento de Industrias
Anotaciones y fórmulas
• n: Número de muestra

• p: Cantidad de variables exógenas

• SC: Suma de Cuadrados

• CM: Cuadrados Medios

• 𝑅 2 : Coeficiente de determinación

𝑆𝐶(𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛)
𝑆𝐶(𝑡𝑜𝑡𝑎𝑙)
• Coeficiente de correlación múltiple

√𝑅 2

Ejercicio 1
Suponga que Ud. está analizando los resultados impresos de un modelo estimado
cuando su gato “mamadisimo”, de solo 1 mes de edad, se sube arriba de ellos y se
hace pipi. El desastre le borra la tabla ANOVA. Pero Ud. logra rescatar los
siguientes datos:
• p= 5
• SC (total)= 1750
• SC (residual)= 350
• F calculada= 28
Se le pide:
a) Reconstruir la tabla ANOVA
b) Aplicar la dócima F de la tabla, explicando qué significa el resultado
obtenido.
c) Obtener el coeficiente de determinación e interpretarlo

Profesor: Pedro Fernández de la Reguera Ayudantes: Miguel Godoi; Cesar Valdés


Universidad Técnica Federico Santa María Departamento de Industrias

Desarrollo
a)

ANOVA SC gl CM F calc
Regresión 1.400 5 280 28
Residual 350 35 10
Total 1750 40

b) 𝐻0 : 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 0

𝐻𝑎 : Al menos un 𝛽 es distinto a 0

Como la F calculada es mayor que la F de la tabla de SNEDECOR (2,485) con 5% de nivel


de significación, se rechaza la hipótesis nula y esto significa que al menos una o más
variables explican la variabilidad de la respuesta Y.

C) El R^2= 1400/1750 = 0,8. Entonces, R = correlación multiple = 0,894, por lo que hay una
buena correlación entre las variables explicativas y la respuesta. Todo parece normal,
pero podría haber falta de ajuste o un sesgo por tener una variable explicativa muy
excelente y las demás muy malas para explicar Y.

Ejercicio 2
Un modelo sobre la resistencia a la tracción de ladrillos para edificación considera
las variables antigüedad del cemento usado en la mezcla, tamaño del tamiz de la
arcilla, temperatura del agua usada en la mezcla y tiempo de mezclado de los
ingredientes. Se registran 115 observaciones y se estima el modelo. La varianza
estimada de los residuales es 100 y la SC (total) es 33.400.
a) Construya la tabla ANOVA
b) Determine si el modelo es significativo
c) Calcule la correlación múltiple de la resistencia con las variables exógenas

Profesor: Pedro Fernández de la Reguera Ayudantes: Miguel Godoi; Cesar Valdés


Universidad Técnica Federico Santa María Departamento de Industrias

Desarrollo
a)

ANOVA SC gl CM F calc
Regresión 22.400 4 5.600 56
Residual 11.000 110 100
Total 33.400 114

b) 𝐻0 : 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 0

𝐻𝑎 : Al menos un 𝛽 es distinto a 0

Dado que el valor-p de F de ANOVA es cero, se declara significativo al modelo, por lo que
al menos uno de los cuatro coeficientes es significativamente diferente de cero.

c) R^2 = 22400/33400 = 0,671 = coeficiente de determinación


R= raíz (0,671) = 0,819 = coeficiente correlación múltiple

Profesor: Pedro Fernández de la Reguera Ayudantes: Miguel Godoi; Cesar Valdés

También podría gustarte