BrillynNarvaezVargas - Paso 4 - Descripcion de La Informacion

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 19

Paso 4

Descripción de la información.

Brillyn Narváez Vargas


1117528309

Grupo: 204040_149

Nombre Docente: Olman de Jesús Zapata Flórez

Universidad Nacional abierta y a distancia-UNAD


Escuela de ciencias básicas, Tecnología e ingeniería
Estadística Descriptiva
Ingeniería de sistemas
Noviembre del 2021.
Florencia Caquetá.

1
Introducción

En este curso de Estadística descriptiva es hoy en día más útiles e influyentes en


la mayoría de los campos del conocimiento los métodos estadísticos aplicados a la
problemática estudiada podemos concluir que las variables dependientes e
independientes son una variante muy importante para determinar el enfoque que
se va a abordar en un estudio de investigación, con esta unidad y a manera de
conclusión se puede afirmar que las técnicas de correlación y regresión nos
permiten obtener un modelo confiable y que en estadística son muy esenciales.
Que ofrece amplísimas posibilidades de aplicación, y más todavía si se consideran
la velocidad con la que se genera el desarrollo tecnológico, los volúmenes de
nueva información y el avance de la ciencia. Una de las grandes áreas en las que
la Estadística ha encontrado un amplio espacio y una utilidad sin precedente es,
sin duda, la del desarrollo social, específicamente, por su contribución a la
generación de distintos indicadores para medir el bienestar social de los pueblos.
Se han desarrollado simultáneamente las metodologías, los indicadores y, en
general, la planeación y evaluación de políticas y programas de desarrollo social;
en todos los casos apoyados en la utilización de métodos estadísticos cada vez
más complejos y sofisticados, pero a la vez cada más precisos y de mayor utilidad.

En el marco de la sociedad del conocimiento y la información, la Estadística tiene


un gran porvenir en el siglo XXI, y cada vez se abren más nichos de oportunidad
para los principios, técnicas y procedimientos que forman el cuerpo de esta
ciencia.

2
Objetivos

Aplicar las medidas estadísticas bivariantes, por medio del cálculo e


interpretación del software estadístico, en función de la problemática
objeto de estudio.

3
Actividad 1. Mentefacto Conceptual
Mediante un mentefacto conceptual las medidas estadísticas Bivariantes
de regresión y correlación.

Link
https://www.goconqr.com/es-ES/mindmap/34656438/MEDIDAS-ESTADISTICAS-
BIVARIANTES-DE-REGRESI-N-Y-CORRELACI-N-

4
Actividad 2. Definición de Conceptos.
Descripción de la Actividad:
Definir brevemente los conceptos básicos asociados a Regresión y
Correlación como:
 Diagrama de dispersión.
Los diagramas de dispersión le permiten estudiar la relación entre
dos conjuntos de datos relacionados que aparecen en pares por
ejemplo, (X, Y) uno de cada conjunto. El gráfico muestra estos pares
como una nube de puntos.
-La relación positiva entre X y Y significa que un valor creciente de
X viene con un valor creciente de Y.
-Relación inversa significa que un aumento en el valor de X viene con
una disminución en el valor de Y.
 Correlación lineal simple.
Según el concepto de correlación, algunos procedimientos e
indicadores estadísticos utilizados para determinar el grado de
correlación entre dos variables; La más simple es la correlación
lineal, basado en una comparación de las diferencias relevantes
para dos variables (covarianza) y desviación estándar para cada
categoría calculando el coeficiente r de Pearson.

 Coeficiente de determinación R2
El coeficiente de determinación se define como el porcentaje de la
varianza total de la variable que se explica por regresión también
conocida como R cuadrado refleja el ajuste del modelo variable
para tratar de explicar.

 Correlación positiva y correlación negativa.


Dos variables interrelacionadas por el contrario, un valor alto de
uno suele corresponder a un valor bajo de el otro y viceversa.
Más cercano a -1 es el coeficiente de correlación más obvio esta
será la covarianza extrema, Si r = -1 hablaremos de correlación

5
negativa perfecto, significa la determinación absoluta entre dos
variables (es decir Inversa): Existe una relación funcional perfecta
entre los dos (relación lineal de pendiente negativa).

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda


a medir?
Coeficiente o grado de matemáticas correlación de Pearson,
diseñada para variables cuantitativas (escala mínima intervalo), es
un indicador que mide el grado de varianza entre diferentes
variables relacionado lineal. Tenga en cuenta que decimos
variables correlacionadas linealmente. Esto significa que puede
haber variables que estén estrechamente relacionadas, pero no de
una manera particular lineal, en cuyo caso no se aplicaría la
correlación de Pearson. por ejemplo ,la relación entre ansiedad y
rendimiento tiene forma de U invertida; De todos modos hay
conectamos población y tiempo, y la relación será exponencial. En
estos casos (y en muchos otros casos), no es apropiado utilizar un
enlace de Pearson. Insisto en ello el intervalo que parece olvidarse
con cierta frecuencia.

 Regresión lineal simple y múltiple

El comportamiento de una variable, denominada explicada


(dependiente o endógena), en función de otra u otras,
denominadas explicativas (independientes o exógenas). Se puede
establecer una primera clasificación en función del número de
variables explicativas: la regresión (y correlación) será simple si
únicamente hay una variable explicativa; por el contrario, será
múltiple si el número de variables explicativas son varias. Así, si
se quiere explicar el salario de los trabajadores en función de su
antigüedad en la empresa la regresión será simple. Si, además de
la antigüedad en la empresa, se considera también el grado de
formación de los trabajadores a la hora de explicar su salario, la
regresión será múltiple.
En cualquiera de las dos situaciones anteriores (regresión simple o
múltiple), la cuestión que se plantea es qué valor de la variable
explicada le corresponde a cada uno de los valores de la variable o

6
variables explicativas. En el caso de una sola variable explicativa,
si ésta es X la regresión será de Y sobre X (Y/X de forma
abreviada), mientras que si es Y, la regresión será de X sobre Y
(X/Y de forma abreviada).

Actividad 3. Ejercicio práctico.


EJERCICIOS
3.3. Horas dormidas – Horas de televisión.
Una investigación desarrollada por un grupo de psicólogos busca
determinar fatores asociados al rendimiento académico en una muestra
de 8 niños menores de 10 años, de modo que se optó por consultar con
sus padres información sobre el número de horas que dedican
diariamente a dormir y ver la televisión. La clasificación de las
respuestas ha permitido elaborar la siente tabla:

Nº de horas dormidas (x) 6 7 8 9 10 8 6 7


Nº de horas de televisión 4 3 3 2 1 2 3 2
(y)

En esta actividad cada estudiante deberá resolver un ejercicio de los que


aparecen a continuación; posterior a ello compartirá su elección en el
foro del entorno de Aprendizaje Foro de discusión Unidad 3- Paso 4
Descripción
de la Información. En cada ejercicio deberá responder los siguientes
interrogantes:

a) Realice el diagrama de dispersión y determine el tipo de


asociación entre las variables.
b) Encuentre el coeficiente de determinación y correlación.
c) Determine el modelo matemático que permite predecir el efecto
de una variable sobre la otra. ¿Es confiable?
d) Determine el grado de relación de las dos variables.

7
Respuesta a los interrogantes:

Nº de horas dormidas (x) Nº de horas de televisión (y)


6 4
7 3
8 3
9 2
10 1
8 2
6 3
7 2

DIAGRAMA DE DISPERSIÓN
Horas dormidas – Horas de televisión
4.5
4
3.5
f(x) = − 0.540540540540541 x + 6.62162162162162
3 R² = 0.675675675675676
2.5
2
1.5
1
0.5
0
5.5 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5

 Coeficiente de determinación: 0,6757

8
 Coeficiente de correlación: -0,821994937

R² = 0,6757

r -0,821994937

Determine el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Modelo matemático
y=−0,5405 x +6,6216

Es una correlacion aceptable negativa donde es inversamente proporcional que


la funcion decreciente ya que se encuentra en el rango de -0.90 < r < -0.80.

Coeficiente de determinación o R2: 0,6757,


Podemos decir que la confiabilidad de la investigación es de:
0,6757∗100=67,57 %
Es decir que es fiable para la investigación.

Determine el grado de relación de las dos variables.


Correlacion moderada negativa
Con estos datos se busca determinar fatores asociados al rendimiento
académico en una muestra de 8 niños menores de 10 años, de modo

9
que se optó por consultar con sus padres información sobre el número
de horas que dedican diariamente a dormir y ver la televisión. La
relacion de estas dos variables Nº de horas dormidas (x) y la variable Nº
de horas de televisión (y). Uno asocia la pendiente negativa,o este valor
negativo nos dice que es una funcion decreciente quiere decir que a
medida que yo voy aumentando los valores en el eje x,los valores del
eje y van disminuyendo y viceversa.Esa relacion entre las dos me
muestra que es inversamente proporcional, que es una funcion
decreciente. ANALISIS: apartir de estos datos yo podria deducir que
estre mas número de horas dedicadas diariamente a dormir tenga los
niños,menos seria las horas para ver la television. Claramente, Sí este r
es negativo (Indice de correlacion negativo r(-)o sea -0,821994937 la
pendiente tambien es negativa en este caso seria -0,5405 quiere decir
que estos tienen una relacion en la tabla de interpretacion. Es una
correlacion aceptable negativa donde es inversamente proporcional que
la funcion decreciente. El indice o coeficiente de determinacion me dice
que tambien se juntaron o unieron los puntos al modelo que se esta
trabajando, pero no me dice si la relacion de proporcionalidad en inversa
o directa tenemos la nesesidad de tener Indice de correlacion como
ayuda para saber que el signo que tiene indice de correlacion si nos da
la orientacion que pueda tener la funcion o relacion entre estas las
variables.

Actividad 4. Regresión y correlación Lineal Simple.


Descripción de la Actividad:
A partir de la base de datos suministrada: Anexo 1- Indicadores de
pobreza en algunos municipios de Colombia para el primer
trimestre de 2021 (16-4), cada estudiante, deberá:
a) Identificar dos variables cuantitativas de la situación estudiada
que puedan estar relacionadas e identificar la variable dependiente
e independiente.

Variable independiente (x): Porcentaje de inversión en salud

10
Variable dependiente (y): Presupuesto en millones Salud y
Proteccion Social.

b) Realizar el diagrama de dispersión de dichas variables y


determinar el tipo de relación entre las variables.
800000
Presupuesto en millones Salud y Pro-

700000
f(x) = 37392.8627541112 x + 30068.5283038646
600000 R² = 0.904825731621897
500000
teccion Social

400000
300000
200000
100000
0
00 00 00 00 00 00
0
00
0
00
0
00
0
00
0
00
0
00 00 00 00 00 .0 .0 .0 .0 .0 .0
0. 2. 4. 6. 8. 10 12 14 16 18 20

Porcentaje de inversión en salud

c) Determine al coeficiente de determinación y de correlación de las


dos variables. Interprete los resultados
d)

r 0,951223282

Coeficiente de determinación: 0,9048


Coeficiente de correlación: 0,951223282

e) Encuentre el modelo matemático que permite predecir el efecto de


una variable sobre la otra. ¿Es confiable?

Modelo matemático

11
y=37393 x +30069

Conforme al grado de correlación podemos determinar que es una correlacion


aceptable ya que se encuentra en el rango de 0.80 < r <0.90.

Coeficiente de determinación o R2: 0,9048,


Como se acerca a 1, el modelo es confiable.
Podemos decir que la confiabilidad de la investigación es de:
0,9048∗100=90,48 %
Es decir que es fiable para la investigación.

f) Determine el tipo de correlación de las dos variables.

Correlación fuerte positiva

g) Relacionar la información obtenida con el problema.


Ocurre cuando una variable aumenta y la otra también la variable porcentaje
de inversión en salud y la variable presupuesto en millones Salud y Proteccion
Social; mientras aumenta la inversión en salud, el presupuesto en millones
para Salud y Proteccion Social también.

12
Actividad 5. Regresión y correlación múltiple.
Descripción de la Actividad:
- A partir de la base de datos suministrada “Anexo 1- Indicadores de
pobreza en algunos municipios de Colombia para el primer
trimestre de 2021 (16-4)”, cada estudiante, deberá:
a) Identificar una variable cuantitativa dependiente y varias variables
cuantitativas independientes del estudio de investigación.

Variable independiente (x1): Promedio salarial en el municipio


Variable independiente (x2): Gasto promedio por vivienda en
los ultimos seis meses

Variable dependiente (y): Tasa de ocupación

Intercepción 38,215557118733
Variable X 1 -7,02689900173461
Variable X 2 0,0000025452323381107

y=−7,02689900173461 x 1+0,025452323381107 x 2+38,215557118733

13
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,59254869
Coeficiente de determinación R^2 0,35111395
R^2 ajustado 0,343781904
Error típico 13,85586126
Observaciones 180

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 18387,38482 9193,69240987774 47,887582970397 2,38180793519059
Residuos 177 33981,32576 191,984891272568
Total 179 52368,71058

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 38,215557118733 1,57860006172443 24,2085111012774 4,71532792750621 35,1002574584865 41,3308567789795 35,1002574584865 41,3308567789795
Variable X 1 -7,02689900173461 1,11201811451055 -6,31905084102652 2,06995016528828 -9,22141915811821 -0,000004832378845351 -9,22141915811821 -0,04832378845351
Variable X 2 0,025452323381107 0,012360944082545 2,05909218674069 0,0409500496636619 1,05852926291022 4,98461174993039 1,05852926291022 4,98461174993039

b) Realizar el diagrama de dispersión de dichas variables.

14
DIAGRAMA DE DISPERSIÓN
Variable independiente (x1): Promedio salarial en el municipio
Variable dependiente (y): Tasa de ocupación

80

70

60
Tasa de ocupación

50

40
f(x) = − 5.00651813372914E-06 x + 39.2172058423141
30 R² = 0.33557052377402

20

10

0
0 1000000 2000000 3000000 4000000 5000000 6000000 7000000 8000000
Promedio salarial en el municipio (X1)

DIAGRAMA DE DISPERSIÓN
Variable independiente (x2): Gasto promedio por vivienda en
los ultimos seis meses
Variable dependiente (y): Tasa de ocupación

80
70
60
Tasa de ocupación

50
40
30 f(x) = − 4.34682824177294E-06 x + 37.6857368071718
R² = 0.20472817683644
20
10
0
0 2000000 4000000 6000000 8000000 10000000 12000000
Gasto promedio por vivienda en los ultimos seis meses

15
c) Calcular la recta de regresión y el coeficiente de correlación para
probar estadísticamente su relación.
Estadísticas de la regresión
Coeficiente de correlación múltiple -0,59254869
Coeficiente de determinación R^2 0,35111395
R^2 ajustado 0,343781904
Error típico 13,85586126
Observaciones 180

Intercepción 38,215557118733
Variable X 1 -7,02689900173461
Variable X 2 0,0000025452323381107

Modelo matemático
y=−7,02689900173461 x 1+0,025452323381107 x 2+38,215557118733

16
d) Relacionar la información obtenida con el problema.

Podemos determinar por el coeficiente de correlación que es


-0,59254869 que es una correlación moderada negativa, Es una
función decreciente e inversamente proporcional.

Coeficiente de determinación o R2: 0,35111395


Podemos decir que la confiabilidad de la investigación es de:
0,35111395∗100=35,11 %

17
Conclusión
En esta actividad se trabaja los métodos estadísticos aplicados a la
problemática estudiada podemos concluir que las variables dependientes
e independientes son una variante muy importante para determinar el
enfoque que se va a abordar en un estudio de investigación, con esta
unidad y a manera de conclusión se puede afirmar que las técnicas de
correlación y regresión nos permiten obtener un modelo confiable y que
en estadística son muy esenciales.
La regresión lineal expresa la asociación entre una variable dependiente
y una independiente, en cambio la correlación simple indica el grado o la
cercanía de la relación entre don variable, expresado en términos de un
coeficiente de correlación que aportan una medida indirecta de la
variabilidad de los puntos buscando un mejor ajuste de las variables el
cual se basa en el indicador de pobreza en Colombia donde se evidencia
la población más afectada es zonas rurales.

18
Referencias Bibliográficas

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.


Paginas. 130 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.


México City: Cengage Learning. Páginas 675 – 686

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.


Paginas. 130 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.


México City: Cengage Learning. Páginas 675 – 686

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:


Paraninfo.
Paginas. 151 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.


México City: Cengage Learning. Páginas 675 – 686.

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de


mercados. Mexico City: Cengage Learning. Páginas 686 – 695

19

También podría gustarte