Monografia Final Estadistica
Monografia Final Estadistica
Monografia Final Estadistica
“ESTADÍSTICA Y PROBABILIDADES”
Alumnos:
Docente:
CUSCO – PERÚ
2020
1. INTRODUCCIÓN
y probabilidades”, los cuales fueron obtenidos mediante encuesta a 260 alumnos durante
Este trabajo está basado en una muestra de 101 estudiantes, a los cuales
fin de comprobar las relaciones que pueden existir entre estos datos (análisis
teniendo en cuenta que existe un cierto nivel de significancia en las proyecciones que
realizamos.
tablas). Pero a través del texto usted podrá encontrar un análisis metódico y sistemático
1.2. Objetivo
Estimadores Muéstrales.
Utilizar los conocimientos adquiridos en clase para realizar los diferentes literales
ESTADÍSTICA.
términos estadísticos los cuales, debemos tener muy claro su definición. Entre estos
tenemos:
Población
conoce como tal. Una población se precisa como un conjunto finito o infinito de
de investigación estadístico, y este tamaño vienen dado por el número de elementos que
puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos
los números positivos. Una población finita es aquella que está formada por un limitado
número de elementos.
sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado
población o universo, se examina una pequeña parte del grupo llamada muestra.
Muestra
representarla.
El estudio de muestras es más sencillo que el estudio de la población completa;
cuesta menos y lleva menos tiempo. Por último, se aprobado que el examen de una
En nuestro caso, tomaremos una muestra de 101 elementos escogidos al azar para
realizar el estudio además de establecer una relación entre la muestra y la población a fin
muestra y población son conceptos relativos. Una población es un todo y una muestra es
Variable Aleatoria
continuas. Si se permite que una variable aleatoria adopte solo un número limitado de
Función de probabilidad
frecuencia, es decir, es una distribución que describe como se espera que varíen los
resultados. Dado que esta clase de distribuciones se ocupan de las expectativas son
modelos de gran utilidad para hacer inferencias y tomar decisiones en condiciones de
incertidumbre.
Media
que la componen.
Varianza
Moda
Es el valor que ocurre con mayor frecuencia en una muestra puede ser que no
Mediana
Una mediana es el valor de la variable que deja el mismo número de datos antes
Matriz de correlación
Histograma
Diagrama de Cajas
Intervalos de Confianza
el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.
Nivel de significancia
Variables cualitativas
en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y
nominales.
Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos
valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir
variable puede tomar distintos valores ordenados siguiendo una escala establecida,
residencia.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables
ausencia de valores entre los distintos valores específicos que la variable pueda
dentro de un intervalo especificado de valores. Por ejemplo, la masa (2,3 kg, 2,4
kg, 2,5 kg,) o la altura (1,64 m, 1,65 m, 1,66 m), que solamente está limitado
por la precisión del aparato medidor, en teoría permiten que siempre exista un
de esta variable fue una muestra de tamaño n=101 que tomamos de una población de
tamaño N=260, la cual nos dio como resultado los siguientes datos que se te detallan en
Masculine 0
Femenino 1
Tabla#1
Masculino 1 90 0,8
1 101 1
9
Para la Variable Aleatoria Discreta “Género”, el soporte que puede tomar es:
Femenino y Masculino. De los cuales, el 11% son personas del género Femenino y el
Gráfico #1
El gráfico #1 muestra una proporción muy marcada del género masculino (color
rojizo) de los estudiantes de la materia Estadística. Puesto que, del tamaño de nuestra
Gráfico #2
acumulada. El programa Minitab (con el que se realizó esta gráfica) por su naturaleza
Gráfico #3
Esta distribución empírica nos indica que solo el 11% son del género
femenino (línea horizontal más baja) y el 89% son del género masculino (línea
horizontal superior)
Análisis estadístico para la variable fecha de nacimiento
fecha de nacimiento, la cual es una variable de tipo cuantitativa discreta por que toma
variable año por mes, y en la segunda parte la vamos a analizar por año.
Primera parte: Análisis estadístico para la variable fecha de nacimiento por mes.
nacimiento por mes, para que los resultados de nuestro análisis sean más específicos y
obtener resultados más claros sobre la fecha de nacimiento de los estudiantes que están
Tabla #2
una muestra de tamaño n=101 de la cual podemos decir que el mes donde nacieron
mayo con una cantidad de 14 alumnos, y el mes con más bajo número de estudiantes
Gráfico #4
mayo es la de mayor altura lo cual quiere decir que en este mes existe la mayor
corresponde la barra con menor altura ya que tiene menor cantidad de datos.
Segunda parte: Análisis estadístico para la variable fecha de nacimiento por año.
estudiantes que están tomando la materia de estadística para ingenieros, los cuales
continuación:
Tabla #3
FRECUENCIA
ORDINAL CLASE FRECUENCIA
RELATIVA
ACUMULADA
nacimiento por año la cual es una variable de tipo cuantitativa y fue analizada a partir
de una muestra de tamaño n=101, nuestra clases o intervalos fue tomado de año en año,
edad nació en 1978, también podemos concluir que no existen alumnos encuestados
encuestados nació 1990 y que solo un alumno joven encuestado nació en el año de
1992.
Tabla #4
Dispersión y
Media (1988-1989)
Varianza 4.821
Mediana 1989
Q1 – Cuartil 1 1988
Q3 – Cuartil 3 1990
Rango 14
Rango Intercuartil - RI 2
Moda 1990
Sesgo -1.96
La tabla #4 nos da una representación más clara de los resultados sobre los datos de
la variable cuantitativa discreta año de nacimiento, se puede observar que la media del
año de nacimiento está en un intervalo entre 1989 y 1990, con una varianza de 4.821.
1988 y así mismo el tercer cuartil está en 1990, el cuartil 2 es igual que la mediana
negativa), lo cual quiere decir que los datos se encuentran concentrados a la derecha
Gráfico #5
Notamos que la barra más alta es la correspondiente al año de 1990 lo cual nos indica
estos nació en el año de 1990, además se puede ver que de la muestra que estamos
analizando no existen estudiantes que hayan nacido en los años de 1979, 1980, 1981,
1983.
Gráfico #6
el 25% (Cuartil 1) nació antes de 1987. Que el 50% de los encuestados (Cuartil 2)
nació antes de 1989. Y que el 75% de los estudiantes nació antes de la llegada de 1991.
Gráfico #7
Para realizar este análisis nos ayudaremos de las variables nacimiento por mes y
nacimiento por años, puesto que tenemos que calcular para cada entrevistado de la
muestra, la edad entera para el corte de este análisis martes 8 de febrero de 2011.
101 estudiantes.
Tabla #5
32 1
31 0
30 0
29 0
28 2
27 0
26 2
25 3
24 3
23 9
22 17
21 18
20 28
19 17
18 1
Gráfico #8
localizada a los 20 años. Mientras no existen alumnos con 27, 29, 30 y 31 años en el
Gráfico #8
Esta Ojiva de edad, nos indica que el 25% de los datos de la muestra (Cuartil 1) es
significativamente menor a 20 años, que el 50% de los datos es menor que la mediana
22.5 (Cuartil2) y que el 75% de los datos es relativamente mayor a 22.5 (Cuartil 3).
Gráfico #9
encuestados, esta variable es de tipo cuantitativa discreta debido a que los valores o el
soporte que puede tomar esta variable es a partir del año 1997 hasta 2009, el análisis de
Tabla #6
que el año donde ingreso la mayor cantidad de estudiantes encuestados es en el 2007, con
un total de 30 estudiantes, también podemos ver que en los años de 1998 , 1999, y 2000
ninguno de los estudiantes encuestados ingreso en estos años, en los años del 2007, 2008,
2009 fue en estos tres años donde ingreso la mayoría de los estudiantes encuestados, lo
Tabla #7
profesional de ingeniería civil corresponde al año 2007, con una varianza de 3.46 años,
la mediana de esta variable es el año del 2008, y el primer cuartil quedo establecido en
el año 2007 y el tercer cuartil en el año del 2008, el rango es de 12 años, el valor que
Gráfico #10
Gráfico #11
De esta Ojiva, podemos observar que el 25% de la muestra (Cuartil 1) entró antes del
2006. Que antes de junio de 2007 entro el 50% de la muestra (Cuartil 2). Y que el 75%
Gráfico #12
Una de las variables del cuestionario realizado a los estudiantes que están
carrera, esta variable es de tipo cuantitativa discreta, el análisis se lo hace a partir de una
muestra de tamaño n =101, esta variable toma valores o el soporte de esta variable es
continuación:
Tabla #8
MATERIAS
APROBADAS f f/n F F/n
9 1 0.01 1 0.01
(10-12) 4 0.04 5 0.05
(13-14) 7 0.07 12 0.11
(15-16) 11 0.11 23 0.22
(17-18) 11 0.11 34 0.33
(19-20) 18 0.18 52 0.51
(21-22) 8 0.08 60 0.59
(23-24) 3 0.03 63 0.62
(25-26) 11 0.11 74 0.73
(27-28) 4 0.04 78 0.77
(29-30) 4 0.04 82 0.81
(31-33) 4 0.04 86 0.85
(35-36) 2 0.02 88 0.87
(39-40) 2 0.02 90 0.89
(41-48) 3 0.03 93 0.92
(50-52) 2 0.02 95 0.94
(53-55) 2 0.02 97 0.96
(57- 58) 2 0.02 99 0.98
facias 2 0.02 101 1
que toma cada uno de los intervalos, para este caso hemos tomados intervalos de 4 en 4,
y el valor mínimo es de 10 hasta un valor máximo 58, donde el intervalo que tiene la
intervalo.
Tabla #9
Media 24,76
Varianza 118.81
Desviación Estándar 10,9
Mediana 20
Q1 – Cuartil 1 17
Q3 – Cuartil 3 27
Rango 49
Rango Intercuartil - RI 10
Moda 20
media de esta variable es 22,825 materias, con una varianza de 91,989 y la mediana
es 20 materias.
esta variable es 47 y el rango Inter cuartil es 7, el valor que más se repite es decir la
positiva), lo cual quiere decir que los datos se encuentran concentrados a la izquierda.
Una de las variables del cuestionario realizado a los estudiantes que están
Tabla #10
Análisis Estadístico de Algunas Características de los estudiantes de Estadística para la
escuela profesional de ingeniería civil
Tabla de Frecuencia de la Variable Número de Materias Aprobadas
Materias
Aprobadas f f/n F F/n
9 1 0.01 1 0.01
(10-12) 4 0.04 5 0.05
(13-14) 7 0.07 12 0.11
(15-16) 11 0.11 23 0.22
(17-18) 11 0.11 34 0.33
(19-20) 18 0.18 52 0.51
(21-22) 8 0.08 60 0.59
(23-24) 3 0.03 63 0.62
(25-26) 11 0.11 74 0.73
(27-28) 4 0.04 78 0.77
(29-30) 4 0.04 82 0.81
(31-33) 4 0.04 86 0.85
(35-36) 2 0.02 88 0.87
(39-40) 2 0.02 90 0.89
(41-48) 3 0.03 93 0.92
(50-52) 2 0.02 95 0.94
(53-55) 2 0.02 97 0.96
(57- 58) 2 0.02 99 0.98
vacìas 2 0.02 101 1
que toma cada uno de los intervalos, para este caso hemos tomados intervalos de 4 en 4,
y el valor mínimo es de 10 hasta un valor máximo 58, donde el intervalo que tiene la
intervalo. Cabe recalcar que en la muestra que nosotros tomamos tres estudiantes no
Tabla #11
Análisis Estadístico de Algunas Características de los estudiantes de Estadística para la
escuela profesional de ingeniería civil
Media 24,76
Varianza 118.81
Desviación Estándar 10,9
Mediana 20
Q1 – Cuartil 1 17
Q3 – Cuartil 3 27
Rango 49
Rango Intercuartil - RI 10
Moda 20
La tabla #11 muestra detalladamente el análisis estadístico de esta variable, la
media de esta variable es 22,825 materias, con una varianza de 91,989 y la mediana es
sesgada al derecho (distribución asimétrica positiva), lo cual quiere decir que los datos
Gráfico #13
podemos ver gráficamente que para el intervalo correspondiente para [18 - 22) se
localiza la barra más alta es decir que este intervalo se encuentra la mayoría de los
Gráfico #14
aprobadas, la cual nos dice que el 25% de los encuestados han aprobado un máximo
Gráfico #15
compendio de entre 18 a
Una de las variables del cuestionario realizado a los estudiantes que están
tomando el curso de Estadística para Ingeniería fue la variable dígito al azar, esta
tiene un soporte del digito 0 hasta el digito 9, el análisis de esta variable se detalla a
continuación:
Tabla # 12
0 0 0,00 0 0,01
1 6 0,06 6 0,06
2 7 0,07 13 0,13
3 9 0,09 22 0,22
4 8 0,08 30 0,30
5 12 0,12 42 0,42
6 9 0,09 51 0,50
7 32 0,32 83 0,82
8 14 0,14 97 0,96
9 4 0,04 101 1
frecuencia de cada una de las clases, donde se puede ver que el digito 7 es el que tiene
mayor frecuencia, con un total de 31 estudiantes los cuales escogieron este dígito, y el
Tabla #13
Dispersión
Media y
5,594
Varianza 4,94
Desviación Estándar 2,223
Mediana 6
Q1 – Cuartil 1 4
Q3 – Cuartil 3 7
Rango 8
Rango Intercuartil - RI 3
Moda 7
La tabla #13 muestra la estadística descriptiva de esta variable, dándonos a
de esta variable es 5,632 con una varianza de 4,825 con una mediana de 6, el primer
negativa), lo cual quiere decir que los datos se encuentran concentrados a la derecha.
Gráfico #15
acumulación a la derecha, esto se debe que el sesgo que se determinó en la tabla #12 es
de signo negativo
El dígito que tiene una mayor frecuencia es el digito 7 por lo que le corresponde
la barra con mayor altura, y el digito con la barra más baja, es el 0 y se debe a que muy
Gráfico #16
Gráfico #17
si existen datos aberrantes, y vemos que para esta variable no existen datos aberrantes.
Esto quiere decir que los datos de esta variable son usuales.
Una de las variables del cuestionario realizado a los estudiantes que están
tomando el curso de Estadística para Ingeniería fue la variable de tener internet en casa,
esta variable es de tipo cualitativa por que el soporte de esta no son números sino que el
soporte de esta es si tiene internet en casa o que no tiene internet en casa, esta variable
se la analiza a partir de una muestra de tamaña n =106 y los detalles de este analices se
Tabla # 14
No 0 25 0,25 25 0,11
Is 1 76 0,75 101 1
La tabla #14 nos muestra la frecuencia del número de estudiantes que como
respuesta dieron que, si tenían internet en casa y de los que no tienen internet en casa,
obteniendo que los que respondieron que si tenían internet en casa fueron 76 de los 106
Tabla #15
Media
Dispersión y 0,7225
Varianza 0,188
Desviación Estándar 0,4337
Mediana 1
Q1 – Cuartil 1 0,5
Q3 – Cuartil 3 1
Rango 8
Rango Intercuartil - RI 0,5
Moda 1
La tabla #15 es el histograma de frecuencia de la variable sí que posee internet en
casa, este grafico nos muestra de una manera gráfica lo que nosotros habíamos
determinado en la tabla #14, en este grafico ya se nota que los estudiantes que
respondieron que si tenían internet en casa son una gran mayoría con respecto a los
que respondieron que no poseen internet en casa, por eso la barra correspondiente a la
Gráfico #18
en casa, en este grafico ya se nota que los estudiantes que respondieron que si tenían
internet en casa son una gran mayoría con respecto a los que respondieron que no
Gráfico #19
Análisis Estadístico de Algunas Características de los estudiantes de Estadística para
Ingenierías de la escuela profesional de ingeniería civil
internet en casa, y que el 24.8% del estudiante respondió que no posee internet en casa.
profesional de ingeniería civil que están tomando el curso de Estadística para Ingeniería
n=101, y es soporte que puede tener es la respuesta de que si posee cuenta en alguna red
Tabla # 16
Los datos obtenidos fueron los siguientes, los estudiantes que respondieron que si
tenían una cuenta en la red social Facebook fue un total de 99 de los 101 estudiantes de
la muestra lo que representa el 93.4% y los estudiantes que respondieron que no tenían
una cuenta en la red social Facebook fueron 7 lo que representa el 6.6 % de la muestra
Gráfico #20
Análisis Estadístico de Algunas Características de los estudiantes de Estadística para
Ingenierías de la escuela profesional de ingeniería civil
Histograma de la Variable a una Red Social.
no tienen tiempo
Gráfico #21
En el grafico anterior nos podemos dar cuenta que la mayor parte de la población
es menor que 1 que es representada por Twitter esto se debe porque en nuestra muestra
escuela profesional de ingeniería civil que están tomando el curso de Estadística para
se lo presenta a continuación
Tabla # 17
Análisis Estadístico de Algunas Características de los estudiantes de
favorito que son la frecuencia relativa y frecuencia absoluta en la que nos podemos dar
gusta el futbol.
Gráfico #22
Gráfico #23
muestra en donde Barcelona está representado por el numero 2 para realizar nuestros
Una de las variables del cuestionario realizado a los estudiantes que están
tomando el curso de Estadística para Ingeniería fue la variable de cuantas horas diarias
permanece en el computador
Tabla # 18
Computador.
frecuencia de cada una de las clases, donde se puede ver que el intervalo de [2-3) horas es
el que tiene mayor frecuencia, con un total de 31 estudiantes los cuales escogieron que
Tabla #19
Computador.
Media 3.255
Varianza 3.982
Mediana 3
Q1 – Cuartil 1 2
Q3 – Cuartil 3 4
Rango 11.5
Rango Intercuartil - RI 2
Moda 2
Sesgo 2.02
de esta variable es 3.255 con una varianza de 3.982 con una mediana de 3 horas, el
sesgada a la derecha (distribución asimétrica positiva), lo cual quiere decir que los datos
Gráfico #24
intervalos y vemos que para el intervalo correspondiente para [2 - 3) tiene la barra más
alta es decir este intervalo tiene la mayor frecuencia lo que significa que la mayor
habíamos determinado en la tabla #18 al haber quedado un valor del sesgo positivo.
Gráfico #25
computador, y esta grafica nos da a conocer los valores porcentuales que toman cada
Los más destacado es que 40.6 % corresponde a los estudiantes que están
menos de tres horas en un computador, y que el 59.4 % de los estudiantes pasa más de
Gráfico #26
representa los datos aberrantes de la variable y vemos que esta variable tiene datos
esto quiere decir que muy pocos estudiantes pasa esta cantidad de horas en el
computador.
permanece en Internet
FRECUEN FRECUENC
ORDINA CLASE FRECUEN
CIA IA
1 [0-1) 6 0.059 6 0.059
2 [1-2) 11 0.109 17 0.168
3 [2-3) 35 0.346 52 0.514
4 [3-4) 21 0.208 73 0.723
5 [4-5) 10 0.099 83 0.821
6 [5-6) 10 0.099 93 0.920
7 [6-7) 2 0.019 95 0.941
8 [7-8) 0 0 95 0.941
9 [8-9) 2 0.019 97 0.960
10 [9-10) 1 9.90x10-3 98 0.970
11 [10-11) 1 9.90x10-3 99 0.980
12 [11-12) 0 0 99 0.980
13 9.90x10-3
14 9.90x10-3
frecuencia de cada una de las clases, donde se puede ver que el intervalo de [2-3) horas es
el que tiene mayor frecuencia, con un total de 36 estudiantes los cuales escogieron que
Internet.
Dispersión y
Media 3
Varianza 4.879
Mediana 2
Q1 – Cuartil 1 2
Q3 – Cuartil 3 4
Rango 12.6
Rango Intercuartil - RI 2
Moda 2
Sesgo 2.2
esta variable es 3 con una varianza de 4.879 con una mediana de 2 horas, el primer
positiva), lo cual quiere decir que los datos se encuentran concentrados a la izquierda.
Gráfico #28
intervalos y vemos que para el intervalo correspondiente para [2 - 3) tiene la barra más
alta es decir este intervalo tiene la mayor frecuencia lo que significa que la mayor
2 horas diarias en internet, también observamos que la gráfica tiene una acumulación de
Gráfico #29
esta grafica nos da a conocer los valores porcentuales que toman cada uno de los
intervalos, los más destacado es que 52.8 % corresponde a los estudiantes que están
menos de tres horas diarias en internet, y que el 57.2 % de los estudiantes pasa
Gráfico #30
representa los datos aberrantes de la variable y vemos que esta variable tiene datos
en internet, esto quiere decir que muy pocos estudiantes pasa esta cantidad de horas en
Una de las variables del cuestionario realizado a los estudiantes que están
Perú, esta variable es de tipo cualitativa, el análisis se lo realiza a partir de una muestra
otro tipo de problema que el crea que hay en el Perú, donde la mayoría de los
estudiantes respondió que el problema actual que más afecta al Perú es la seguridad
ciudadana con un total de 40 estudiantes de los 106 escogieron esta opción, la opciones
que muy pocos escogieron fue el Déficit Fiscal y los problemas internacionales solo un
estudiante respectivamente.
Gráfico #31
respuesta que la mayor cantidad de estudiantes escogió fue la seguridad ciudadana, por
lo tanto la barra que corresponde a este problema debe ser la más alta, lo que se puede
notar en el grafico #31, 40 de los estudiantes escogieron esta opción lo que representa el
38.5 % de toda la muestra, cabe recalcar que para esta variable 2 de los estudiantes de la
afirmativo en averiguar qué tan fuerte es la relación lineal entre ellas. El investigador
Para esta sección fue necesaria la asignación de letras a cada variable para
representar la matriz; una vez hecho esto denotamos que la relación entre:
Materias Aprobadas………………………………………………………………………… x
Materias Semestre……………………………………………………………………………y
Dígito al Azar………………………………………..…………………………………..…..z
correlación entre 2 variables con sus respectivos valores, la cual nos sirve
Tabla # 25
resultan
dado con la correlación entre sí mostrada en la matriz. Podremos decir que mientras
También se podría interpretar que el estudiante tiene una mayor edad va a tener
una mayor cantidad de materias aprobadas. Los estudiantes de la muestra con mayor
la tendencia a escoger un digito al azar bajo. Así también podemos entender que cuando
el coeficiente de correlación tiende a cero se podría entender que no existe una relación
lineal, este caso se presenta en las variables Digito al azar y Materias Aprobadas que
Número
Mes de horas en internet
de Nacimiento-Año - Número de horas en el
de Ingreso 0.911
0.828
Año de Nacimiento-Mes de Nacimiento 0.855
Año de Nacimiento-Número
Número de horas en internet -deAño
horas
de en internet
ingreso 0.202
0.198
Número de Materias Aprobadas-Número de horas en el 0.183
computador
Número de horas en el computador - Número de Materias 0.17
0.132
Aprobadas
Año de Nacimiento-Número de horas en el computador 0.119
0.115
Mes dealNacimiento-Número
Digito de en
azar-Número de horas horas en el computador
el computador 0.09
0.046
Digito al azar-Número de horas en internet 0.042
mayor edad tiene un estudiante de la muestra siendo esta una relación lineal casi
perfecta.
Los estudiantes de la muestra que pasan una mayor cantidad de horas en el
por diferentes motivos una mayor cantidad de horas en el computador este resultado
puede ser posible porque a mayores materias el estudiante debe pasar una mayor
cantidad de hora frente a un computador para resolver sus trabajos académicos y por
lo que podríamos decir que tiende a cero por lo tanto en estas combinaciones de
Tabla # 25
Tabla de distribución
bivariado.
Los datos fueron obtenidos en base a los estudiantes del curso de Estadística para
Ingeniería d e los cuales sacamos una muestra de 101 estudiantes, las cuales nos dan
como resultado cuantos hombres ingresaron por año así mismo de cuantas mujeres
Además, nos proporciona el total de alumnos que ingresaron por año y el total de
hombres que ingresaron en el rango del año de ingreso de los estudiantes de estadística
para Ingeniera encuestados y el total de las mujeres que ingresaron en todos los años.
Gráfico #32
año 2004, mientras que desde el año de 1998 hasta el año 2000 no ingreso ningún estudiante
que este cursando en este momento el curso de Estadística para Ingeniería teniendo una
pendiente aproximada de 0.170 lo cual nos indica que su relación lineal es casi nula
Gráfico #33
femenino y que el 89.1% son de género masculino, por lo cual se concluye que el
Con el fin de realizar el análisis entre las variables año de nacimiento e internet en
casa, con fin de establecer una relación entre la cantidad de horas que los estudiantes de
estadística para ingenierías de género femenino pasan en internet y cuantas horas los del
género masculino.
Tabla #26
estudiada y que estas personas han nacido entre los años de 1988-1991 y que las
personas que no poseen internet en sus casas son 24.8% y que la mayoría que pertenece
año de nacimiento e internet en casa, en la cual se puede observar que las personas que
poseen internet en casa en su mayoría han nacido en el año de 1990; por otro lado, la
mayoría de personas que no poseen internet se puede observar en la tabla que también
Gráfico # 33
personas que suelen tener internet en sus casas pertenecen a los años de nacimiento
entre los años de 1988-1991, mientras que las personas que no poseen internet
pertenecen a 1987-1991.
Según lo observado se puede decir que las variables no demuestran relación lineal
entre ellas debido a que la gráfica demuestra que existe tal relación buscada por lo tanto
se dice que no depende del año de nacimiento para tener internet en casa o no.
Gráfico # 34
La grafica marginal de Genero del análisis bivariado entre las Internet y Año de
internet en sus casas según los años de nacimiento, y así mismo nos da a conocer
cuantas personas que han nacido según esos los años poseen internet en sus casas.
5. ESTADÍSTICA INFERENCIAL.
Kolmogorov- Smirnov.
Vs
H1: ¬ Ho
Gráfico # 35
Minitab: en este test el valor p es: p<0.01, por lo tanto, por el criterio del valor p
y varianza mencionadas
Vs
H1: ¬ Ho
Gráfico # 36
Ingenierías
Minitab: en este test el valor p es: p<0.01, por lo tanto, por el criterio del valor p
varianza mencionadas.
hipótesis:
uniforme con y
α=0 β=9
Vs
H1: ¬ Ho
Tabla # 27
k Clase Oi Probabilida Ei
1 1 10 0.1 10.1
2 31.5 3 0.1 10.1
3 2 22 0.1 10.1
4 3 21 0.1 10.1
5 4 18 0.1 10.1
6 5 12 0.1 10.1
7 6 7 0.1 10.1
8 8 3 0.1 10.1
9 9 3 0.1 10.1
10 10 2 0.1 10.1
En la
tabla #37 observamos detalladamente los valores que toma el test Ji- cuadrado, la
de tamaño n=101
probabilidad para cada clase es la misma, Ei es el valor esperado de la clase que resulta
Gráfico # 37
Gráfico # 38
En gráfico #38 se muestran los valores que se esperaría que tome cada clase de
uniforme con α y
=0 β=9
Vs
H1: ¬ Ho
Tabla # 28
K Clase Oi Probabilida Ei
1 1 6 0.11111 11,111
2 2 7 0.11111 11,111
3 3 9 0.11111 11,111
4 4 8 0.11111 11,111
5 5 12 0.11111 11,111
6 6 9 0.11111 11,111
7 7 32 0.11111 11,111
8 8 14 0.11111 11,111
9 9 3 0.11111 11,111
En la tabla #28 observamos detalladamente los valores que toma el test Ji-
la muestra.
Gráfico # 39
Gráfico # 40
Gráfico # 41
Computador
Gráfico # 42
Computador
Internet
Cálculo de Intervalos de confianza para la Variable Número de Materias
Aprobadas
Materias Aprobadas
Gráfico # 44
Materias Aprobadas
5.3.Prueba de Hipótesis
a p r o x i m a c o n u n a Distribución Normal:
*Región de Rechazo:
n=101
*Region de Rephase:
Materias Aprobadas
5.4.Análisis de Contingencia
TABLAS DE CONTINGENCIA
Terminología:
n: Cantidad de observaciones.
r: Cantidad de Filas.
c: Cantidad de Columnas
Muéstrales).
(Frecuencia Esperada)
Edad
Máximo: 33
Mínimo: 19
Intervalos
Joven X<=20
Adulto X>20
Materias Aprobadas
Máximo: 57
Mínimo: 12
Intervalos
Pocas X<=15
Bastantes X>=20
Tabla de contingencia:
Materias Aprobadas
Pocas Muchas Bastantes Totales
Joven 4 7 6 17
Edad Adulto 13 19 52 84
Totales 17 26 58 101
Frecuencia esperada:
1 2 3
1 2,86 4,38 9,76
2 14,14 21,62 69,8
Prueba de hipótesis.
Ho: Las Materias Aprobadas es independiente de
Ho).
Estadístico de Prueba:
Región de Rechazo:
Apoyados en MINITAB:
Año de Ingreso
Máximo: 1997
Mínimo: 2009
Intervalos
1Gerneración X<=2007
2Generación X>=2008
Materias Aprobadas
Máximo: 57
Mínimo: 12
Intervalos
Pocas X<=20
Mediana 20< X ≤ 25
Bastantes X>25
Tabla de contingencia:
Ingreso
1Generación 2Generación Totales
Materias Pocas 19 32 51
Aprobadas Mediana 19 8 27
bastante 18 5 23
Totales 54 47 101
Frecuencia esperada:
1 2
1 27,26 23,73
2 14,43 12,69
3 12,29 10,70
Prueba de hipótesis.
Estadístico de Prueba:
Región de Rechazo:
Apoyados en MINITAB:
aprobadas.
6. CONCLUSIONES
2. Las variables de género, internet en casa, mayor dedicación a una red social,
5. Existe una estrecha relación entre las materias tomadas por los estudiantes
básicas para cumplir con sus responsabilidades académicas. Véase fig. 20, 21,
22.
método de Ji cuadrado, para lo cual nos dio lo siguiente: Que la variable horas
9. En las pruebas de hipótesis resultaron positivas para la Hipo tesis Nula H0. Esto
se debe a que dicha hipótesis se hizo con un valor de prueba muy cercano a la
realidad.
10. Las Tablas de Contingencia indican que las variables materias aprobadas y las
edades son independientes entre sí, lo cual es lógico ya que no depende la edad
ingreso y materias aprobadas lo que nos dio a conocer que son dependientes,
era algo de esperarse debido a que los estudiantes según el año de ingreso a la
afectado.
poblacionales.
5. Se debería realizar una encuesta con similitud en cuanto al género para poder
Guayaquil-Ecuador.
desde:http://www.facmed.unam.mx/deptos/salud/censenanza/spii/unidad2/bondad.p