Regresión Por Mínimos Cuadrados
Regresión Por Mínimos Cuadrados
Regresión Por Mínimos Cuadrados
AJUSTE DE CURVAS
Es común que los datos se dan como valores discretos a lo largo de un continuo. Sin embargo, quizás
se requiera la estimación de un punto entre valores discretos. Además, se puede necesitar de la
versión simplificada de una función complicada. Una manera de hacerlo es calcular valores de la
función en un número discreto de valores en el intervalo de interés. Después, se obtiene una función
más simple para ajustar dichos valores. Estas dos aplicaciones se conocen como ajuste de curvas.
Existen dos métodos generales para el ajuste de curvas que se distinguen entre sí al considerar la
cantidad de error asociado con los datos. Primero, si los datos exhiben un grado significativo de error
o “ruido”, la estrategia será obtener una sola curva que represente la tendencia general de los datos.
Como cualquier dato individual puede ser incorrecto, no se busca intersecar todos los puntos. En
lugar de esto, se construye una curva que siga la tendencia de los puntos tomados como un grupo. Un
procedimiento de este tipo se llama regresión por mínimos cuadrados.
PRÁCTICA 14
REGRESIÓN POR MÍNIMOS CUADRADOS
Cuando los datos tienen errores sustanciales, la interpolación polinomial es inapropiada y puede dar
resultados poco satisfactorios cuando se utiliza para predecir valores intermedios. Con frecuencia los
datos experimentales son de este tipo.
Una estrategia más apropiada en tales casos consiste en obtener una función de aproximación que se
ajuste a la forma o a la tendencia general de los datos, sin coincidir necesariamente en todos los
puntos. Una forma de hacerlo es obtener una curva que minimice la discrepancia entre los puntos y la
curva. Una técnica para lograr tal objetivo, llamada regresión por mínimos cuadrados.
1. REGRESION LINEAL
El ejemplo más simple de una aproximación por mínimos cuadrados es ajustar una línea recta a
un conjunto de observaciones definidas por puntos: (x1, y1), (x2, y2),..., (xn, yn). La expresión
matemática para la línea recta es
r2 = coeficiente de determinación
r = coeficiente de correlación
Sr = suma de cuadrados de los residuos
2° Seleccionar los datos de las columnas A y B y seleccionar Insertar gráfico de dispersión (X, Y) o
de dispersión y pulsar sobre Dispersión del menú Insertar. Se genera el siguiente gráfico:
3° Pulsar con el botón derecho sobre cualquier punto del grafico generado y pulsar sobre Agregar
línea de tendencia… para visualizar el panel de Formato de línea de tendencia. Seleccionar La
opción Lineal. En la parte inferior active las opciones Presentar ecuación en el gráfico y
Presentar el Valor R cuadrado en el gráfico. Cierre el Panel.
2° Las sumas requeridas por la regresión lineal se calculan fácilmente con una función de
MATLAB. Esta función calcula la pendiente y la intersección de la ecuación de regresión lineal.
p = polyfit(x, y, n)
Debido a que una línea recta es un polinomio de primer orden, polyfit (x, y, 1)
devolverá la pendiente y el intercepto de la recta de mejor ajuste.
>> y = polyval(p, x)
2. REGRESIÓN POLINOMIAL
El procedimiento de mínimos cuadrados se puede extender fácilmente al ajuste de datos con un
polinomio de grado superior. Por ejemplo, suponga que ajustamos un polinomio de segundo
grado o cuadrático:
Esta cantidad se divide entre n - (m + 1), ya que (m + 1) coeficientes obtenidos de los datos, a0, ab..., am, se
utilizaron para calcular Sr; se ha perdido m + 1 grados de libertad. Además del error estándar, también se
calcula un coeficiente de determinación para la regresión polinomial (R 2).
EJERCICIO 2
Ajustar a un polinomio de segundo grado los datos dados en las dos columnas siguientes
hold on
plot(x,y,'ro','markersize',4,'markerfacecolor','r')
z=@(x) polyval(p,x);
fplot(z,[x(1),x(end)])
xlabel('x')
ylabel('y')
grid on
title('Polinomio aproximador')
hold off
%gráficos
hold on
plot(x,y,'ro','markersize',4,'markerfacecolor','r')
z=@(x) polyval(p,x);
fplot(z,[x(1),x(end)])
xlabel('x')
ylabel('y')
grid on
title('Polinomio aproximador')
hold off
En particular tal ecuación es útil cuando se ajustan datos experimentales donde la variable sujeta a
estudio es una función de otras dos variables. En este caso bidimensional, la “línea” de regresión se
convierte en un “plano”.
Como en los casos anteriores, los “mejores” valores para los coeficientes se determinan al realizar la
suma de los cuadrados de los residuos,
Los coeficientes que dan la suma mínima de los cuadrados de los residuos se obtienen al igualar a
cero las derivadas parciales y expresando el resultado en forma matricial:
EJERCICIO 3
Los siguientes datos se calcularon con la ecuación y = 5 + 4x1 - 3x2:
2° Pulsar sobre Opciones del Menú Archivo del Excel para visualizar la ventana de Opciones de
Excel.
5° Pulsar sobre la ventana Datos para visualizar la ventana de menú y hacer clic izquierdo sobre
Análisis de datos, donde se debe seleccionar la opción de Regresión pulsar sobre Aceptar
7° Excel visualiza los datos de regresión calculados en otra hoja de cálculo, donde se puede ubicar
los coeficientes del polinomio para ajustar los dataos.