BrillynNarvaezVargas - Paso 4 - Descripcion de La Informacion
BrillynNarvaezVargas - Paso 4 - Descripcion de La Informacion
BrillynNarvaezVargas - Paso 4 - Descripcion de La Informacion
Descripción de la información.
Grupo: 204040_149
1
Introducción
2
Objetivos
3
Actividad 1. Mentefacto Conceptual
Mediante un mentefacto conceptual las medidas estadísticas Bivariantes
de regresión y correlación.
Link
https://www.goconqr.com/es-ES/mindmap/34656438/MEDIDAS-ESTADISTICAS-
BIVARIANTES-DE-REGRESI-N-Y-CORRELACI-N-
4
Actividad 2. Definición de Conceptos.
Descripción de la Actividad:
Definir brevemente los conceptos básicos asociados a Regresión y
Correlación como:
Diagrama de dispersión.
Los diagramas de dispersión le permiten estudiar la relación entre
dos conjuntos de datos relacionados que aparecen en pares por
ejemplo, (X, Y) uno de cada conjunto. El gráfico muestra estos pares
como una nube de puntos.
-La relación positiva entre X y Y significa que un valor creciente de
X viene con un valor creciente de Y.
-Relación inversa significa que un aumento en el valor de X viene con
una disminución en el valor de Y.
Correlación lineal simple.
Según el concepto de correlación, algunos procedimientos e
indicadores estadísticos utilizados para determinar el grado de
correlación entre dos variables; La más simple es la correlación
lineal, basado en una comparación de las diferencias relevantes
para dos variables (covarianza) y desviación estándar para cada
categoría calculando el coeficiente r de Pearson.
Coeficiente de determinación R2
El coeficiente de determinación se define como el porcentaje de la
varianza total de la variable que se explica por regresión también
conocida como R cuadrado refleja el ajuste del modelo variable
para tratar de explicar.
5
negativa perfecto, significa la determinación absoluta entre dos
variables (es decir Inversa): Existe una relación funcional perfecta
entre los dos (relación lineal de pendiente negativa).
6
variables explicativas. En el caso de una sola variable explicativa,
si ésta es X la regresión será de Y sobre X (Y/X de forma
abreviada), mientras que si es Y, la regresión será de X sobre Y
(X/Y de forma abreviada).
7
Respuesta a los interrogantes:
DIAGRAMA DE DISPERSIÓN
Horas dormidas – Horas de televisión
4.5
4
3.5
f(x) = − 0.540540540540541 x + 6.62162162162162
3 R² = 0.675675675675676
2.5
2
1.5
1
0.5
0
5.5 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5
8
Coeficiente de correlación: -0,821994937
R² = 0,6757
r -0,821994937
Modelo matemático
y=−0,5405 x +6,6216
9
que se optó por consultar con sus padres información sobre el número
de horas que dedican diariamente a dormir y ver la televisión. La
relacion de estas dos variables Nº de horas dormidas (x) y la variable Nº
de horas de televisión (y). Uno asocia la pendiente negativa,o este valor
negativo nos dice que es una funcion decreciente quiere decir que a
medida que yo voy aumentando los valores en el eje x,los valores del
eje y van disminuyendo y viceversa.Esa relacion entre las dos me
muestra que es inversamente proporcional, que es una funcion
decreciente. ANALISIS: apartir de estos datos yo podria deducir que
estre mas número de horas dedicadas diariamente a dormir tenga los
niños,menos seria las horas para ver la television. Claramente, Sí este r
es negativo (Indice de correlacion negativo r(-)o sea -0,821994937 la
pendiente tambien es negativa en este caso seria -0,5405 quiere decir
que estos tienen una relacion en la tabla de interpretacion. Es una
correlacion aceptable negativa donde es inversamente proporcional que
la funcion decreciente. El indice o coeficiente de determinacion me dice
que tambien se juntaron o unieron los puntos al modelo que se esta
trabajando, pero no me dice si la relacion de proporcionalidad en inversa
o directa tenemos la nesesidad de tener Indice de correlacion como
ayuda para saber que el signo que tiene indice de correlacion si nos da
la orientacion que pueda tener la funcion o relacion entre estas las
variables.
10
Variable dependiente (y): Presupuesto en millones Salud y
Proteccion Social.
700000
f(x) = 37392.8627541112 x + 30068.5283038646
600000 R² = 0.904825731621897
500000
teccion Social
400000
300000
200000
100000
0
00 00 00 00 00 00
0
00
0
00
0
00
0
00
0
00
0
00 00 00 00 00 .0 .0 .0 .0 .0 .0
0. 2. 4. 6. 8. 10 12 14 16 18 20
r 0,951223282
Modelo matemático
11
y=37393 x +30069
12
Actividad 5. Regresión y correlación múltiple.
Descripción de la Actividad:
- A partir de la base de datos suministrada “Anexo 1- Indicadores de
pobreza en algunos municipios de Colombia para el primer
trimestre de 2021 (16-4)”, cada estudiante, deberá:
a) Identificar una variable cuantitativa dependiente y varias variables
cuantitativas independientes del estudio de investigación.
Intercepción 38,215557118733
Variable X 1 -7,02689900173461
Variable X 2 0,0000025452323381107
13
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,59254869
Coeficiente de determinación R^2 0,35111395
R^2 ajustado 0,343781904
Error típico 13,85586126
Observaciones 180
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 18387,38482 9193,69240987774 47,887582970397 2,38180793519059
Residuos 177 33981,32576 191,984891272568
Total 179 52368,71058
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 38,215557118733 1,57860006172443 24,2085111012774 4,71532792750621 35,1002574584865 41,3308567789795 35,1002574584865 41,3308567789795
Variable X 1 -7,02689900173461 1,11201811451055 -6,31905084102652 2,06995016528828 -9,22141915811821 -0,000004832378845351 -9,22141915811821 -0,04832378845351
Variable X 2 0,025452323381107 0,012360944082545 2,05909218674069 0,0409500496636619 1,05852926291022 4,98461174993039 1,05852926291022 4,98461174993039
14
DIAGRAMA DE DISPERSIÓN
Variable independiente (x1): Promedio salarial en el municipio
Variable dependiente (y): Tasa de ocupación
80
70
60
Tasa de ocupación
50
40
f(x) = − 5.00651813372914E-06 x + 39.2172058423141
30 R² = 0.33557052377402
20
10
0
0 1000000 2000000 3000000 4000000 5000000 6000000 7000000 8000000
Promedio salarial en el municipio (X1)
DIAGRAMA DE DISPERSIÓN
Variable independiente (x2): Gasto promedio por vivienda en
los ultimos seis meses
Variable dependiente (y): Tasa de ocupación
80
70
60
Tasa de ocupación
50
40
30 f(x) = − 4.34682824177294E-06 x + 37.6857368071718
R² = 0.20472817683644
20
10
0
0 2000000 4000000 6000000 8000000 10000000 12000000
Gasto promedio por vivienda en los ultimos seis meses
15
c) Calcular la recta de regresión y el coeficiente de correlación para
probar estadísticamente su relación.
Estadísticas de la regresión
Coeficiente de correlación múltiple -0,59254869
Coeficiente de determinación R^2 0,35111395
R^2 ajustado 0,343781904
Error típico 13,85586126
Observaciones 180
Intercepción 38,215557118733
Variable X 1 -7,02689900173461
Variable X 2 0,0000025452323381107
Modelo matemático
y=−7,02689900173461 x 1+0,025452323381107 x 2+38,215557118733
16
d) Relacionar la información obtenida con el problema.
17
Conclusión
En esta actividad se trabaja los métodos estadísticos aplicados a la
problemática estudiada podemos concluir que las variables dependientes
e independientes son una variante muy importante para determinar el
enfoque que se va a abordar en un estudio de investigación, con esta
unidad y a manera de conclusión se puede afirmar que las técnicas de
correlación y regresión nos permiten obtener un modelo confiable y que
en estadística son muy esenciales.
La regresión lineal expresa la asociación entre una variable dependiente
y una independiente, en cambio la correlación simple indica el grado o la
cercanía de la relación entre don variable, expresado en términos de un
coeficiente de correlación que aportan una medida indirecta de la
variabilidad de los puntos buscando un mejor ajuste de las variables el
cual se basa en el indicador de pobreza en Colombia donde se evidencia
la población más afectada es zonas rurales.
18
Referencias Bibliográficas
19