Regresion Lineal Multiple
Regresion Lineal Multiple
Regresion Lineal Multiple
Docente
ESTADÍSTICA II
2019
PROBLEMA
Se desea estimar los gastos en alimentación de una familia ubicada de Santa Marta, dada los
ingresos mensuales y el número de miembros de la familia.
Ahora, dentro del ramo clasificado como vivienda, los gastos de ocupación (arriendo/cuota,
administración e impuestos) logran 70,3% del total. Entre tanto, el gasto de servicios públicos
representa 17,9%. Según un estudio de Fedelonjas el porcentaje de colombianos de zonas
urbanas que vive en arriendo llega a 44%; eso es equivalente a 4,9 millones de hogares.
Como parte de la actualización de información decenal del gasto de los hogares, principal
insumo para la medición de la inflación desde el 2019, el Dane publicó los datos de nueva
Encuesta Nacional de Presupuestos de los Hogares, en la que se reflejó el nivel de consumo
mensual de los 14,3 millones de hogares del país.
Es decir, en promedio cada hogar reporta gastos mensuales por 1,9 millones de pesos en
bienes y servicios como alimentación, comida, diversión, educación, salud, transporte y
comunicaciones, entre otros, que ahora fueron clasificados en 12 grupos, tres más que los
que hasta la fecha usa el Dane para medir la inflación o costo de vida durante cada mes.
FORMULACIÓN DEL PROBLEMA
Con el siguiente estudio estadístico se busca comprobar si la variable “gasto” está relacionada
con la variable “ingresos” y “número de integrantes en la familia” lo anterior haciendo uso
del modelo de regresión lineal múltiple.
De este modo, si existe relación entre las variables, buscar los mecanismos gubernamentales
y entes privados, para aumentar el salario mínimo, disminuir la inflación y bajar los precios
de los productos de la canasta familiar.
OBJETIVOS
OBJETIVO GENERAL
Determinar si la variable gasto está relacionada con las variables ingresos y tamaño de la
familia.
OBJETIVOS ESPECÍFICOS
Regresión lineal múltiple: La regresión lineal permite trabajar con una variable a nivel de
intervalo o razón. De la misma manera, es posible analizar la relación entre dos o más
variables a través de ecuaciones, lo que se denomina regresión múltiple o regresión lineal
múltiple. Constantemente en la práctica de la investigación estadística, se encuentran
variables que de alguna manera están relacionadas entre sí, por lo que es posible que unas de
las variables puedan relacionarse matemáticamente en función de otra u otras variables.
(Wikipedia, 2019)
Programa SPSS: es un programa estadístico informático muy usado en las ciencias sociales
y aplicadas, además de las empresas de investigación de mercado. El nombre originario
correspondía al acrónimo de Statistical Package for the Social Sciences (SPSS), reflejando
la orientación a su mercado original (ciencias sociales), aunque este programa es también
muy utilizado en otros campos como la mercadotecnia. Sin embargo, en la actualidad la parte
SPSS del nombre completo del software (IBM SPSS) no es acrónimo de nada. (Questionpro,
2019).
1. Se recolecta información por medio de una encuesta, donde se toma una muestra de
15 familias de forma aleatoria. Principalmente se realiza preguntas relacionadas con
el ingreso y gasto promedio mensuales. En la tabla 1, se resume los datos
obtenidos.
Tabla 1
2. La información se ingresa en el Software SPSS para su posterior análisis. Como se
muestra en la imagen 1 e imagen 2.
Sin embargo, el concepto de método cualitativo analiza el conjunto del discurso entre los
sujetos y la relación de significado para ellos, según contextos culturales, ideológicos y
sociológicos. Si hay una selección hecha en base a algún parámetro, ya no se considerará
cualitativo. Digamos que es el método de investigación cualitativa no descubre, sino que
construye el conocimiento, gracias al comportamiento entre las personas implicadas y toda
su conducta observable.
POBLACIÓN Y MUESTRA
RECOLECCIÓN DE LA INFORMACIÓN
INFORMACIÓN PRIMARIA
PROCESAMIENTO DE LA INFORMACIÓN
Coeficientes
Coeficientes no Coeficientes 95,0% intervalo de
estandarizados estandarizados confianza para B Correlaciones
Límite Límite Orden
Modelo B Desv. Error Beta t Sig. inferior superior cero Parcial Parte
1 (Constante) 56606,960 116742,231 ,485 ,636 - 310966,430
197752,510
ingreso ,130 ,014 ,922 9,192 ,000 ,099 ,160 ,931 ,936 ,919
tamano 33390,551 29160,094 ,115 1,145 ,275 -30143,837 96924,938 ,189 ,314 ,114
a. Variable dependiente: gasto
Dado que r2 es 0,88 es decir se acerca a 1, podemos concluir que el modelo se ajusta sobresalientemente, en otras palabras la variable
dependiente gasto y las independientes ingreso y tamaño de la familia tienen correlación.
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1 Regresión 1259983868519,432 2 629991934259,716 44,041 ,000b
Residuo 171656131480,568 12 14304677623,381
Total 1431640000000,000 14
a. Variable dependiente: gasto
b. Predictores: (Constante), tamano, ingreso
Se esta utilizando un nivel de confianza del 95%, por lo tanto, el nivel de significancia es 0,05. Dado que 0,05 al estadístico p , se
concluye que el modelo es significativo. Bajo la hipótesis de que existe una relación lineal entre la variable respuesta y la regresora.
En la regresión lineal múltiple vamos a utilizar más de una variable explicativa; esto nos va
a ofrecer la ventaja de utilizar más información en la construcción del modelo y,
consecuentemente, realizar estimaciones más precisas. Al tener más de una variable
explicativa (no se debe de emplear el término independiente) surgirán algunas diferencias
con el modelo de regresión lineal simple. Una cuestión de gran interés será responder a la
siguiente pregunta: de un vasto conjunto de variables explicativas: x1, x2, …, xk, cuáles son
las que más influyen en la variable dependiente Y.
WEBGRAFIA
Mexico, D. (21 de 05 de 2019). Dm Mexico. Obtenido de Tabla Anova:
http://dm.udc.es/asignaturas/estadistica2/sec6_6.html