Emel Pedrozo Vásquez - Paso 5 Presentación de Resultados

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 21

Paso 5. Presentación de resultados.

Estudiante

Emel De Jesús Pedrozo Vásquez

Código

204040

Escuela

Ciencias Básicas Tecnología E Ingeniería – ECBTI

Estadística Descriptiva (N) 204040

Tutor

Olman De Jesús Zapata Flórez

Universidad Nacional Abierta Y A Distancia – UNAD.

Programa:

Ingeniería De Sistemas

2023
Introducción

La estadística principalmente trata del recuento, ordenación y

clasificación de los datos obtenidos por el proceso de observación, para

realizar comparaciones y sacar conclusiones.

Como en estadística se manejan bases de datos, para el desarrollo de

este trabajo estaré utilizando el Anexo 1 - Indicadores de lectura y asistencia

a bibliotecas en Colombia para el año 2022, del cual estaré tomando

variables cualitativas cuantitativas discretas y continuas para realizar un

informe detallado de cada una de las variables cualitativas y cuantitativas.


Justificación

El presente trabajo radica su importancia en la elaboración de resultados

estadísticos de medidas para halla e interpretar datos que van a servir de

conocimiento en estudios estadísticos, la cual se estará enfocada en reforzar

los conocimientos de variables dependientes y variables independientes,

dispersión, correlación lineal simple, regresión lineal simple, para así poder

hallar resultados de cualquier índole facilitándome el estudio estadístico, y

que a su vez favorezcan a la toma de decisiones en cualquier ámbito

cotidiano y laboral.
Objetivos

Objetivo general

Identificar y aplicar las medidas estadísticas a través del cálculo y la

interpretación de datos, haciendo uso de los softwares estadísticos, en

función de la problemática de estudio.

Objetivos específicos

Identificar al tipo de variable que se nos presenta, de acuerdo a los

datos que contiene, ya sea cualitativa o cuantitativa con el propósito

de identificar la problemática y establecer un análisis con relación a la

problemática tratada.

Proponer alternativas para una mejor visualización y entendimiento de

los datos presentados, haciendo uso de tablas y gráficos, que por su

estructura arrojan datos claros de los cuales nos brindan soluciones a

través de la aplicación de la ingeniería.


Actividad 1. Ajuste de datos.

Tabla 1. Variables tomadas

Variables Cualitativas Variables Cauntitativas Discretas Variables Cuantitativas Continuas

Número de Cantidad de
Ingreso
Nivel educativo Estrato consultas libros leídos en Edad
Famialiar
por tema el último año
TECNÓLOGO 3 8 2 67 657145
UNIVERSITARIO 2 9 2 65 2713551
POSTGRADO 3 10 2 78 727877
UNIVERSITARIO 2 3 3 86 5442175
NO TIENE 2 8 2 10 5893642
UNIVERSITARIO 1 10 1 34 891305
SECUNDARIA 2 7 3 15 4456278
UNIVERSITARIO 2 9 1 35 7557664
UNIVERSITARIO 3 6 2 32 6662373
PRIMARIA 2 1 1 12 1222614
SECUNDARIA 2 3 2 12 721606
SECUNDARIA 3 3 2 14 1253226
TÉCNICO 3 10 2 29 7645434
TÉCNICO 3 7 2 43 5782688

Actividad 2. Procesamiento de variables


Informe de las variables cualitativas
Tabla 2. Tabla de Frecuencia datos no agrupados, Nivel Educativo

Tabla de Frecuencia datos no agrupados


Frecuencia Frecuencia Frecuencia
Nivel Frecuencia Frecuencia Frecuencia
Absoluta Relativa Porcentual
Educativo Absoluta Relativa Porcentual
Acumulada Acumulada Acumulada
NO TIENE 7 7 0,07 0,07 7,00 7,00
PRIMARIA 10 17 0,10 0,17 10,00 17,00
SECUNDARIA 29 46 0,29 0,46 29,00 46,00
TÉCNICO 16 62 0,16 0,62 16,00 62,00
TECNÓLOGO 14 76 0,14 0,76 14,00 76,00
UNIVERSITARIO 19 95 0,19 0,95 19,00 95,00
POSTGRADO 5 100 0,05 1,00 5,00 100,00
Total (N) 100 1 100,00
Figura 1. Diagrama de Barras, Nivel educativo y Frecuencia absoluta

Diagrama de Barras
35

30 29

25
Frecuencia Absoluta

20 19
16
15 14
Frecuencia
10 Absoluta
10
7
5 Lineal
5 (Frecuencia
Absoluta)

Nivel Educativo

Figura 2. Diagrama de Líneas, Nivel educativo y Frecuencia absoluta

Figura 2. Diagrama de Líneas


35

29
30

25
Frecuencia Absoluta

19
20
16
14
15

10 Frecuencia
10 Absoluta
7
5
5

Nivel Educativo
Se puede observar que en la variable “Nivel educativo” la moda es
“SECUNDARIA”, pues es el dato de mayor frecuencia absoluta, lo que
quiere decir que, de los 100 datos registrados, 29 tienen estudios
secundarios cursados.
También se observa dentro de los 100 registros hay 7 personas que no
tiene estudios cursados, 10 sólo tiene estudios de “PRIMARIA”, 29
“SECUNDARIA”, hay 16 personas con estudios “TÉCNICOS” 14
“TECNÓLOGOS” y sólo 5 personas tienen estudios de “POSTGRADO”.
Tabla 3. Variables Cualitativas
Variables Cualitativas

Nivel educativo Estrato

TECNÓLOGO 3
UNIVERSITARIO 2
POSTGRADO 3
UNIVERSITARIO 2
NO TIENE 2
UNIVERSITARIO 1
SECUNDARIA 2
UNIVERSITARIO 2
UNIVERSITARIO 3
PRIMARIA 2

Tabla 4. Contingencia, Nivel educativo y Estrato.


Tabla de Contingencia
Estrato
Nivel
1 2 3 4 5 Total general
Educativo

NO TIENE 2 5 0 0 0 7
PRIMARIA 0 8 2 0 0 10
SECUNDARIA 0 17 12 0 0 29
TÉCNICO 1 3 12 0 0 16
TECNÓLOGO 0 4 10 0 0 14
UNIVERSITARIO 1 11 5 2 0 19
POSTGRADO 0 0 4 0 1 5
Total general 4 48 45 2 1 100
Figura 3. Diagrama de Barras Dobles, Nivel educativo y Estrato

Diagrama de Barras Dobles


1
0
0
5 0
0
0
0
0
2
0
4 0
0
0
0
4
5
Estrato
Estrato

10
3 12
12
2
0
0
11
4
2 3
17
8
5
0
1
0
1 1
0
0
2
0 2 4 6 8 10 12 14 16 18
Nivel Educativo

POSTGRADO UNIVERSITARIO TECNÓLOGO TÉCNICO SECUNDARIA PRIMARIA NO TIENE

Las conclusiones que puedo extraer al interpretar los datos consignado en


la “Tabla de Contingencia” de las dos variables cualitativas “Nivel
educativo” y “Estrato” son las siguientes:
✓ Las personas que no tiene estudios pertenecen a los estratos uno y dos
con 2 personas y 5 respectivamente
✓ En el estrato uno sólo hay dos personas que tienen estudios (un
técnico y un universitario)
✓ En el estrato cinco, de los 100 datos analizados sólo hay una persona y
tiene estudios de postgrado
✓ En el estrato 4 solo encontramos 2 personas, y ambas tiene estudios
universitarios
✓ El estrato 3 tiene concentrado el mayor número de personas con
estudios realizados (45), distribuidos de la siguiente manera (2
primaria, 12 secundaria, 12 técnicos, 10 tecnólogos, 5 universitarios y
4 con postgrado)
✓ En el estrato 2 encontramos 48 personas distribuidas de la siguiente
manera (5 sin estudios, 8 primaria, 17 secundaria, 3 técnicos, 4
tecnólogos y 11 universitarios)
Informe de las variables cuantitativas discretas
Tabla 5. Variables Cuantitativas Discretas

Variables Cuantitativas Discretas

X= Número de Y= Cantidad de libros


consultas por tema leídos en el último año

8 2
9 2
10 2
3 3
8 2
10 1
7 3
9 1
6 2
1 1
3 2
3 2
10 2
7 2

Tabla 6. Frecuencia datos no agrupados


Tabla de Frecuencia datos no agrupados
Número de Frecuencia Frecuencia Frecuencia
Frecuencia Frecuencia Frecuencia
consultas Absoluta Relativa Porcentual
Absoluta Relativa Porcentual
por tema Acumulada Acumulada Acumulada
1 16 16 0,16 0,16 16,00 16,00
2 8 24 0,08 0,24 8,00 24,00
3 11 35 0,11 0,35 11,00 35,00
4 8 43 0,08 0,43 8,00 43,00
5 8 51 0,08 0,51 8,00 51,00
6 8 59 0,08 0,59 8,00 59,00
7 11 70 0,11 0,70 11,00 70,00
8 11 81 0,11 0,81 11,00 81,00
9 9 90 0,09 0,90 9,00 90,00
10 10 100 0,10 1,00 10,00 100,00
Total (N) 100 1,00 100,00
Tabla 7. Resumen de Medidas.
Resumen de Medidas
Medidas Valor
Medidas de Tendencia Central
Media 5,31 5
Moda 1 1
Mediana 5 5
Medidas de Dispersión
Varianza 9,246363636 9
Desviación 3,040783392 3
Mínimo 1
Máximo 10
Rango 9
Coeficiente de variación 0,57265224 57,265224
Medidas de Posición
Q1 3 25%
Q2 5 50%
Q3 8 75%
Rango Intercuartílico 5 5
Medidas de Forma
P30 3 30%
P90 9,9 90%
Asimetría 0,010524179
Curtosis -1,336604369

Figura 4. Diagrama de Barras, Número de consultas por tema y


Frecuencia absoluta.

Diagrama de Barras
18
16
16
14
Frecuencia Absoluta

12 11 11 11
10
10 9
8 8 8 8
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10
Número de consultas por tema
Al analizar la información consignada en la Tabla 6. Frecuencia de datos
no agrupados, y la Tabla 7. Resumen de medidas; puedo observar que en
la variable “Número de consultas por tema”, en promedio se hacen cinco
(5) consultas por cada tema.
Tenemos una moda igual a uno (1), lo que quiere decir que, de los 100
datos registrados, 16 personas consultan un tema.
La mediana es igual a cinco (5), lo que quiere decir que el 50% de las
personas realizan cinco (5) consultas.
La variación de los datos es 9, es decir, hay una variación significativa.
La desviación es igual a 3, lo cual quiere decir que en promedio hay una
diferencia de tres (3) consultas por tema.
El número mínimo de consultas por tema es 1 y el máximo es 10.
El coeficiente o porcentaje de variación en los datos analizados es
aproximadamente del 57%
La asimetría es (0,010524179), lo cual indica que los valores se concentran más
hacia el centro.
La curtosis es negativa (-1,3366), por lo tanto, se distribuye de forma
Platicúrtica, indicando que los datos presentan valores atípicos menos
extremos que la distribución normal.
Figura 5. Diagrama de dispersión, Relación número de consultas por tema
vs cantidad de libros leídos en el último año.

Relación Número de consultas por tema


vs
9
Cantidad de libros leídos en el último año
Cantidad de libros lídos en el último año)

8 y = -0,0612x + 2,5852
7 R² = 0,0254
6

4 Y= Cantidad
de libros
3 leídos en el
último año
2

0
0 2 4 6 8 10 12
Número de consultas por tema

Variables Cuantitativas Discretas

Número de Cantidad de
consultas libros leídos en
por tema el último año
8 2
9 2
10 2
3 3
8 2
10 1

Tabla 9. Coeficientes (determinación y correlación), Modelo matemático


lineal.

Coeficiente de
Coeficiente de correlación Modelo matemático lineal
Determinación
R² = 0,0254 √𝟎, 𝟎𝟐𝟓𝟒 y = -0,0612x + 2,5852
0,15937 Confiabilidad: R²*100%
No hay una correlación Confiabilidad=2,54%
Tabla 10. Ecuación Línea de tendencia, Punto de intersección.

y=ax+b
a=-0,0612
b=2,5852

Punto de intersección
b=2,5852

Tabla 11. Comprobación de confiabilidad del modelo matemático.

Comprobación de confiabilidad
del modelo matemático
y = -0,0612x + 2,5852
X Y
-10 3,1972
-5 2,8912
-2 2,7076
-1 2,6464
0 2,5852
1 2,524
2 2,4628
5 2,2792
8 2,0956
10 1,9732
15 1,6672
20 1,3612
25 1,0552
30 0,7492
35 0,4432
40 0,1372
Tabla 11. Grado de correlación lineal.

Al realizar el análisis de los datos consignados en la Figura 5. Diagrama


de dispersión, Relación número de consultas por tema vs cantidad de
libros leídos en el último año, y las tablas: Tabla 8. Coeficientes
(determinación y correlación), Modelo matemático lineal, Tabla 9.
Ecuación Línea de tendencia, Punto de intersección, Tabla 10.
Comprobación de confiabilidad del modelo matemático; puedo concluir lo
siguiente:
➢ Es una asociación inversamente proporcional, ya que al aumentar el
número de consultas por tema la cantidad de libros leídos disminuye, y
cuando se disminuye el número de consultas por tema la cantidad de
libros leídos aumenta, pero no está del todo condicionada a esta opción
ya que hay otras maneras por las cuales podemos leer libros (internet,
comprarlos en una librería, etc.)
➢ El coeficiente de correlación es demasiado bajo, lo cual indica que
entre las dos variables no hay una relación.
➢ El modelo matemático no es confiable, ya que es de un 2,54% y para
que haya una buena confiabilidad en el presente caso el resultado
debería ser mayor al 70%
➢ Según el resultado obtenido y basado en la Tabla 11. Grado de
correlación lineal, puedo concluir que no hay un grado de relación, ya
que se encuentra en el rango que va desde 𝟎 𝒉𝒂𝒔𝒕𝒂 𝟎, 𝟑𝟎
Informe de las variables cuantitativas continuas
Informe de regresión y correlación lineal
Variables Cuantitativas Continuas
Horas de
Edad (X) dedicación a
Internet (Y)

67 1
65 1
78 1
86 1
10 1
34 2,5
15 2,5
35 2,5
32 2,5
Tabla 12. Frecuencia para datos agrupados.

n 100
Máximo 86
(Regla de
Sturges) Mínimo 7
3,3*log(n)+1 Clases 7,6 8
Rango 79
Amplitud 10,39473684 10

Tabla de frecuencia para datos agrupados


Edad fi xi Fi
Frecuencia Marca de Frecuencia
Clases Lim_inf Lim_sup
Absoluta Clases Acumulada
1 7 17,39473684 29 12,19736842 29
2 17,3947368 27,78947368 8 22,59210526 37
3 27,7894737 38,18421053 21 32,98684211 58
4 38,1842105 48,57894737 22 43,38157895 80
5 48,5789474 58,97368421 7 53,77631579 87
6 58,9736842 69,36842105 8 64,17105263 95
7 69,3684211 79,76315789 4 74,56578947 99
8 79,7631579 90,15789474 1 84,96052632 100
100
Tabla 13. Resumen de Medidas

Resumen de medidas
Medidas Valor
Medidas de Tendencia Central
Media 34,88 35
Moda 45 45
Mediana 34,5 35
Medidas de Dispersión
Varianza 381,3389899 381
Desviación 19,52790285 20
Mínimo 7
Máximo 86
Rango 79
Coeficiente de variación 0,5598596 56
Medidas de Posición
Q1 15,75 25%
Q2 34,5 50%
Q3 45 75%
Rango Intercuartil 29,25 29
Medidas de Forma
P40 29,4 40%
P60 42 60%
Asimetría 0,490002842 0,5
Curtosis -0,498611896 -0,5
Figura 6. Histograma de Frecuencia

Histograma de Frecuencia
35

30
29

25
Frecuencia Absoluta

22
21
20

Frecue
15
ncia
Absolut
10 a
8 8
7
5
4

1
0
1 2 3 4 5 6 7 8
Edad

El promedio de edad es de 35 años Media


La eddad que aparece con mayor frecuencia es 45 años Moda
En el 50% de edad es 35 años Mediana
Hay una gran variación en los datos (381)
En promedio de edad hay una diferencia de 20 Desviación
La edad mínima en los datos analizados es 7
La edad máxima en los datos analizados es 86
La diferencia entre la observación máxima y mínima es 79
El porcentaje de variación o variabilidad en los datos
analizados es de 56%
El 25% de las edades es 16
El 50% de las edades es 35
El 75% de las edades es 45
La diferencia entre el cuartil máximo y el mínimo es 29
El 40% de las edades es 29
El 60% de las edades es 45
Tenemos una simetría positiva con valores que se encuentran
concentrados en el centro
La Curtosis se distribuye de una forma Platicúrtica, es decir,
es negativa con valores atípicos menos extremos que una
distribución normal
Figura 7. Diagrama de dispersión

Relación Edad vs Horas de dedicación a internete


4

3,5

y = 0,0029x + 1,9123
Hora de decicación a Internet

3
R² = 0,0023
2,5

2
Horas
de
1,5 dedicaci
ón a
1 Internet
(Y)
0,5

0
0 20 40 60 80 100
Edad

Tabla 14. Coeficientes (determinación y correlación), Modelo matemático


lineal, Punto de intersección.

Coeficiente de
Coeficiente de correlación Modelo matemático lineal
Determinación
R² = 0,0023 √𝟎, 𝟎𝟎𝟐𝟑 y = -0,0029x + 1,9123
0,04796 Confiabilidad: R²*100%
No hay correlación Confiabilidad=0,23%

y=ax+b Nota: Una buena confiabilidad debe ser mayor al 70%


a=-0,0029
b=1,9123

Punto de intersección
b=1,9123
Tabla 15. Comprobación de confiabilidad del modelo matemático.

Comprobación de confiabilidad
del modelo matemático
y = 0,0029x + 1,9123
X Y
-10 1,8978
-5 1,9065
-2 1,9094
-1 1,9123
0 1,9152
1 1,9268
5 1,9413
10 1,9558
15 1,9703
20 1,9848
25 1,9123

Al realizar el análisis de los datos consignados en la Figura 7. Diagrama


de dispersión, Relación edad vs horas de dedicación a internet, y las
tablas: Tabla 14 Coeficientes (determinación y correlación), Modelo
matemático lineal, Punto de intersección, Tabla 15. Comprobación de
confiabilidad del modelo matemático; puedo concluir lo siguiente:
➢ Es una asociación directamente proporcional, ya que al aumentar el
valor en, el valor en Y va aumentando
➢ El coeficiente de correlación es demasiado bajo, lo cual indica que
entre las dos variables no hay una relación.
➢ El modelo matemático no es confiable, ya que es de un 0,23% y para
que haya una buena confiabilidad en el presente caso el resultado
debería ser mayor al 70%
➢ Según el resultado obtenido y basado en la Tabla 11. Grado de
correlación lineal, puedo concluir que no hay un grado de relación, ya
que se encuentra en el rango que va desde 𝟎 𝒉𝒂𝒔𝒕𝒂 𝟎, 𝟑𝟎
Conclusiones

Al haber realizado los análisis necesarios he podido comprender la

temática estadística descriptiva durante el presente curso en cada uno de

los ejercicios desarrollados en relación a los diferentes tipos de medidas,

relación, regresión, análisis de tablas, diagramas de barras, líneas,

dispersión, que me permitieron realizar los análisis a fondo de variables

cualitativas y cuantitativas, y analizar la regresión y correlación

elaboradas en este trabajo para así brindar un análisis a los estudios para

definir y organizar las decisiones finales.


Referencias Bibliográficas

Churchill, G.A. (2009). Análisis de Correlación y de Regresión

Simple. México City: Cengage Learning. (pp-675–686). Recuperado de:

https://link.gale.com/apps/doc/CX4058900232/GVRL?u=unad&sid=GVRL

&xid=a2479593

Martínez, C. (2013). Capítulo 12. Regresión y correlación.

En: Estadística y muestreo, 13a ed. [Online] Bogotá: Ecoe Ediciones. (pp

570 – 582). Recuperado de: https://elibro-

net.bibliotecavirtual.unad.edu.co/es/ereader/unad/131880

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX:

Instituto Politécnico Nacional. (pp 21-29). Recuperado de: https://elibro-

net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:

Paraninfo. (pp 130 – 158). Recuperado de:

https://link.gale.com/apps/doc/CX4052100011/GVRL?u=unad&sid=GVRL

&xid=696103db

Ortegón Pava, M. (2020). OVI. Medidas Bivariantes - Regresión

lineal Múltiple. Recuperado

de: https://repository.unad.edu.co/handle/10596/35464

También podría gustarte