Este documento presenta un análisis de regresión cuadrática para modelar la relación entre la rapidez de un automóvil y la distancia requerida para detenerse. Se describen los pasos para estimar el modelo, incluyendo la construcción de una tabla de datos, el cálculo de estimadores, el análisis de varianza y la prueba de hipótesis. Finalmente, se proporciona un ejemplo numérico donde se aplican estos pasos para modelar los datos de distancia de frenado contra la velocidad de un automóvil.
0 calificaciones0% encontró este documento útil (0 votos)
130 vistas12 páginas
Este documento presenta un análisis de regresión cuadrática para modelar la relación entre la rapidez de un automóvil y la distancia requerida para detenerse. Se describen los pasos para estimar el modelo, incluyendo la construcción de una tabla de datos, el cálculo de estimadores, el análisis de varianza y la prueba de hipótesis. Finalmente, se proporciona un ejemplo numérico donde se aplican estos pasos para modelar los datos de distancia de frenado contra la velocidad de un automóvil.
Este documento presenta un análisis de regresión cuadrática para modelar la relación entre la rapidez de un automóvil y la distancia requerida para detenerse. Se describen los pasos para estimar el modelo, incluyendo la construcción de una tabla de datos, el cálculo de estimadores, el análisis de varianza y la prueba de hipótesis. Finalmente, se proporciona un ejemplo numérico donde se aplican estos pasos para modelar los datos de distancia de frenado contra la velocidad de un automóvil.
Este documento presenta un análisis de regresión cuadrática para modelar la relación entre la rapidez de un automóvil y la distancia requerida para detenerse. Se describen los pasos para estimar el modelo, incluyendo la construcción de una tabla de datos, el cálculo de estimadores, el análisis de varianza y la prueba de hipótesis. Finalmente, se proporciona un ejemplo numérico donde se aplican estos pasos para modelar los datos de distancia de frenado contra la velocidad de un automóvil.
Descargue como DOCX, PDF, TXT o lea en línea desde Scribd
Descargar como docx, pdf o txt
Está en la página 1de 12
Alirrosai Reyes Torres
Anlisis de Regresin Cuadrtica
UNIVERSIDAD DE SAN CARLOS FACULTAD DE INGENIERIA
ANALISIS DE REGRESION CUADRATICA Ing. Agr. Luis Manfredo Reyes Chvez Profesor Titular Departamento de Estadstica
1. INTRODUCCION: El modelo de regresin cuadrtica es una alternativa cuando el modelo lineal no logra un coeficiente de determinacin apropiado, o cuando el fenmeno en estudio tiene un comportamiento que puede considerarse como parablico. La forma ms simple de tratar de establecer la tendencia es a travs de un diagrama de dispersin o nube de puntos, tal como la siguiente:
Este modelo tambin es conocido como parablico, y es el caso ms simple de modelos de regresin polinomiales, siendo su grado igual a 2.
2. Ecuacin caracterstica La funcin que define el modelo es la siguiente:
Y i =A+Bx i +Cx i 2 +E
En la cual: Y i : Variable dependiente, isima observacin A, B, C: Parmetros de la ecuacin, que generalmente son desconocidos E: Error asociado al modelo X i : Valor de la -esima observacin de la variable independiente
Al sustituir los parmetros por estimadores, el modelo adopta la siguiente forma:
y i =a+bx i +cx i 2
Alirrosai Reyes Torres
3. Tabla de datos Para el ajuste de un conjunto de datos al modelo cuadrtico de regresin, se construye la siguiente tabla de datos:
X y X 2 X 3 X 4 X* y X 2 *y y 2
.. .. .. .. .. .. .. .. x y x 2 x 3 x 4 x*y x 2 y y 2
4. Estimadores del modelo los estimadores para el ajuste del modelo se calculan de la siguiente manera:
Alirrosai Reyes Torres
5. Anlisis de varianza para la regresin Con el objeto de determinar si el modelo explica o no el fenmeno en estudio, se realiza el anlisis de varianza, que se calcula de la siguiente manera
Fuente de Variacin Grados de libertad Suma de cuadrados Cuadrado medio F calculada F tabulada Regresin 2 b* (xy-x*y/n)+c*(x 2 y- x 2 * y/n) S.C. Reg/2 C.M.Reg/C.M.Error Error n-3 S.C. Total- S.C. Regresin S.C. Error/(n- 3)
Total n-1 (y) 2 -(y) 2 /n
Ho: El modelo no explica el fenmeno en estudio Ha: El modelo s explica el fenmeno en estudio
Para buscar en la tabla la F tabulada, se usan el el numerador los grados de libertad de regresin y en el denominador, de acuerdo al nivel de significancia escogido (los ms usuales son al 5% y al 1%) Si el valor de F calculada es mayor que el de F tabulada, se rechaza Ho, en caso contrario se acepta
6. Grado de ajuste del modelo Para determinar el grado de ajuste del modelo, se calcula el coeficiente de determinacin, de la siguiente manera:
7. Clculo de estimadores, coeficiente de determinacin y anlisis de varianza mediante el uso de matrices Un mtodo alternativo para realizar los clculos, es el uso de matrices. En este caso, el procedimiento es el siguiente:
i) formar la matriz x: (matriz de variable independiente), agregando la primera columna formada por unos y una tercera columna formada por los valores de x elevados al cuadrado:
1 x 1 X 1 2
1 x 2 X 2 2
... ..... ..... 1 x n X n 2
Alirrosai Reyes Torres
ii) Formar el vector de valores de y
y 1
y 2
..... y n
iii) Formar la matriz x transpuesta ( x)
1 1 ... 1 x 1 x 2 ... xn X 1 2 X 2 2 ... X n 2
iv) Calcular el producto matricial xx v) Calcular la inversa del producto xx (o sea [xx] -1
vi) Calcular el producto xy vii) Calcular el producto (xx) -1 *(xy)=D El resultado de esta operacin es el vector de coeficientes de regresin en el orden a,b,c viii) Para el clculo del anlisis de varianza, se tienen las siguientes operaciones matriciales:
Fuente de Variacin Grados de libertad Suma de cuadrados Cuadrado medio F calculada F tabulada Regresin 2 D( x )(y)-ny m 2 S.C. Reg/2 C.M.Reg/C.M.Error * Error n-3 yy-D( x )(y) S.C. Error/(n- 3)
Total n-1 yy- ny m 2
El valor de y m que se usa
en los clculos es el promedio de valores de y (y/n)
ix) Finalmente, el coeficiente de determinacin por matrices se obtiene de la siguiente manera:
r 2 = [D(x)(y)- ny m 2 ]/[(yy)-ny m 2 ]
8. Pruebas de Hiptesis para el modelo Para el planteo y prueba de hiptesis, es necesario definir el trmino multiplicadores de Gauss Los multiplicadores de Gauss son los elementos de la matriz inversa xx:
Alirrosai Reyes Torres
7.1 Para el coeficiente b Para probar la hiptesis de que el coeficiente b es igual a un valor b, se procede de la siguiente manera:
i) Se plantea la hiptesis Ho: b= b y la alternativa Ha: b b ii) Se calcula el estadstico :
S b es conocido como el error standard de b y se calcula de la siguiente manera:
El cuadrado medio del error se obtiene del anlisis de varianza.
iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos: n-3 grados de libertad y un nivel /2
iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, se acepta .
7.2 Para el coeficiente c Para probar la hiptesis de que el coeficiente c es igual a un valor c, se procede de la siguiente manera:
i) Se plantea la hiptesis Ho: c= c y la alternativa Ha: c c ii) Se calcula el estadstico :
S b es conocido como el error standard de b y se calcula de la siguiente manera:
El cuadrado medio del error se obtiene del anlisis de varianza.
iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos: n-3 grados de libertad y un nivel /2
iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, se acepta .
7.3 Para el coeficiente a Alirrosai Reyes Torres
Se puede probar la hiptesis de que el coeficiente a es igual a un valor a, para lo cual se sigue el siguiente procedimiento:
i) Se define la hiptesis: Ho: a=a y la alternativa Ha: aa ii) Se calcula el error standard para a con la siguiente frmula:
iii) Se calcula el estadstico de prueba:
iv) Se obtiene en la tabla de t de student el estadstico comparador, con los siguientes datos: n-3 grados de libertad y nivel /2 v) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la hiptesis se acepta
8. Intervalos de confianza
8.1 Para el coeficiente b El intervalo de confianza para el coeficiente b se calcula as:
El cuadrado medio del error se obtiene del anlisis de varianza El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un nivel /2
8.2 Para el coeficiente c El intervalo de confianza para el coeficiente b se calcula as:
El cuadrado medio del error se obtiene del anlisis de varianza El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un nivel /2
8.3 Para el coeficiente a El intervalo de confianza para el coeficiente a se calcula as:
Alirrosai Reyes Torres
El cuadrado medio del error se obtiene del anlisis de varianza El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un nivel /2
8.5 para la respuesta media de y, con valores de x fijos Un intervalo de confianza para la respuesta media de y, dado x 0 sera:
El cuadrado medio del error se obtiene del anlisis de varianza El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un nivel /2 El vector x 0 contiene los valores de x para los que se calcula el valor de y. Para obtener el valor de y que se usa en sta frmula, se sustituye en la ecuacin de regresin obtenida los valores de x y x al cuadrado.
8.4 para la estimacin de y El intervalo de confianza para la estimacin de y, dado un valor de x 0 se obtiene de la siguiente manera:
El cuadrado medio del error se obtiene del anlisis de varianza El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un nivel /2
10. Por fin un ejemplo! Se realiza una prueba de frenado de un automvil nuevo, midiendo la distancia de parada de acuerdo a la rapidez del vehculo al momento de aplicar los frenos, obtenindose los siguientes resultados:
RAPIDEZ Km/h DISTANCIA Metros 35 16 50 26 65 41 80 62 95 88 110 119
En base a los datos anteriores: a) Construya un diagrama de dispersin b) Efecte la estimacin del modelo cuadrtico c) Determine el grado de ajuste e interprtelo d) Elabore el anlisis de varianza y disctalo e) Si el vehculo viaja a 100 km/h, en qu distancia se detiene? f) Pruebe la hiptesis que b=1 con un 99% de confianza g) Calcule intervalo de confianza al 95% para a y b h) Efecte la estimacin del modelo, el andeva y obtenga el coeficiente de determinacin por medio de matrices. Alirrosai Reyes Torres
c) Grado de ajuste del modelo El coeficiente de determinacin se calcula as: Alirrosai Reyes Torres
Se puede concluir que el grado de ajuste del modelo es alto (casi perfecto!), por lo que el modelo es confiable para hacer predicciones.
d) Anlisis de varianza del modelo
i) Suma de cuadrados de regresin:
ii) Suma de cuadrados Total
=7711.3333
iii) Suma de cuadrados del error : 7711.3333-7711.2119=0.12143 iv) Grados de libertad de regresion=2 v) Grados de libertad totales= 6-1=5 vi) Grados de libertad del error=6-3=3 vii) Cuadrado medio de regresin= 7711.2119/2=3855.5069 viii) Cuadrado medio del error= 0.1243/3=0.04048 ix) F Calculada=3855.5069/0.04048=95256.147 x) F Tabulada (2,3,0.01)=30.82 xi) Tabla de Andeva:
Fuente de Variacin Grados de libertad Suma de cuadrados Cuadrado medio F calculada F tabulada Regresin 2 7711.2119 3855.60595 95256.14 30.82** Error 3 0.12143 0.04048 Total 5 7711.33333
Debido a que F calculada es mayor que F tabulada, se rechaza la Ho y se acepta la Ha, con lo cual se concluye que el modelo s explica el fenmeno en estudio y que los resultados obtenidos no se deben a la casualidad.
e) Si el vehculo viaja a 100 km/h, en qu distancia se detiene?
Para esto, simplemente se utiliza la ecuacin anteriormente encontrada por estimacin, sustituyendo el valor de x por 100
y= 13.3587-.3394(100)+0.01182(100) 2 =97.618 m
Alirrosai Reyes Torres
f) Pruebe la hiptesis de que b=1 con un 99% de confianza Inicialmente se plantea Ho: b=1 y su alterna Ha: b1 A continuacin se obtiene el error standard de b:
El valor de t de student de calcula de la siguiente manera:
El valor de t se obtiene en la tabla de t de student, con 6-3 grados de libertad y (1-.99)/2=0.005 de , siendo el valor igual a 5.840
Finalmente, dado que t calculada es mayor que la tabulada, se concluye al 99% que el coeficiente b no es igual a 1.
g) Calcule intervalos de confianza al 95% para a y b El valor de t de student al 95% (/2=0.05/2=0.025) con 3 grados de libertad es= 3.182 Intervalo de confianza para b:
El intervalo final ser entonces el siguiente: -0.40766<B<-0.27114
Intervalo de confianza para a:
El intervalo final para a sera: 11.0775<A<15.6399
i) Ajuste del modelo y anlisis de varianza mediante matrices:
Anlisis de varianza y m =352/6=58.666 Suma de cuadrados de regresin= bxy-ny m 2 =
Suma de cuadrados total= yy- ny m 2 =
Suma de cuadrados del error : 7711.3333-7711.2119=0.12143 Grados de libertad de regresion=2 Alirrosai Reyes Torres
Grados de libertad totales= 6-1=5 Grados de libertad del error=6-3=3 Cuadrado medio de regresin= 7711.2119/2=3855.5069 Cuadrado medio del error= 0.1243/3=0.04048 F Calculada=3855.5069/0.04048=95256.147 F Tabulada (2,3,0.01)=30.82
Anlisis de Varianza Final:
Fuente de Variacin Grados de libertad Suma de cuadrados Cuadrado medio F calculada F tabulada Regresin 2 7711.2119 3855.60595 95256.14 30.82** Error 3 0.12143 0.04048 Total 5 7711.33333