Sol Ex 80.512 24012024 1 Esp

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

80.

512 Técnicas de Análisis de Datos Cuantitativas (Septiembre 2023 -


Febrero 2024)

EX DIA 24/01/2024

SOLUCIÓN

1. A continuación, te presentamos el gráfico y listado correspondientes a los análisis de la variable


Cuestionario de Salud GHQ-12 (Tot_GHQ) según el consumo de tabaco en 3 categorías
(Fumar_3CAT). Una vez analizados todos los datos, responde a las preguntas que tienes a
continuación: (1 punto)

24/01/2024 pág 1
a) ¿Consideras que las distribuciones son simétricas o asimétricas? Justifica tu respuesta. (0,5
puntos)

La distribución de la variable Puntuación en el Cuestionario de Salud GHQ-12 en el grupo


de participantes que no fuma es ligeramente asimétrica. La media es 9,62 y la mediana 9.
Analizando su boxplot, confirmamos que las partes superior e inferior de la caja son
ligeramente distintas, siendo más larga la parte superior, donde también encontramos dos
valores outliers.

En cuanto a la distribución de la variable Puntuación en el Cuestionario de Salud GHQ-12


en el grupo de participantes que tiene un consumo de tabaco leve, vemos que la distribución
es asimétrica. El valor de la media (12,91) es superior al de la mediana (10). Observando el
boxplot de esta distribución, encontramos que las partes superior e inferior de la caja
delimitadas a partir de la mediana no tienen una distancia similar, siendo en este caso mayor
la parte superior.

Finalmente, en cuanto a la distribución de la variable Puntuación en el Cuestionario de Salud


GHQ-12 en el grupo de participantes que consume tabaco de forma moderada/alta,
podemos afirmar que la distribución es bastante simétrica, aunque la mediana queda

24/01/2024 pág 2
ligeramente desviada hacia la mitad inferior de la caja. En este caso, el valor de la media
(13,52) es ligeramente superior al de la mediana (12). Observando el boxplot de esta
distribución, identificamos un valor outlier en la zona superior del gráfico.

b) ¿Cuál de los tres grupos presenta menor puntuación en el Cuestionario de Salud GHQ-12?
Justifica tu respuesta. (0,5 puntos)

El grupo de participantes que presentan menor puntuación en el Cuestionario de Salud


GHQ-12 es el formado por aquellos que no fuman. En este grupo, tanto la media (9,62) como
la mediana (9) son menores respecto al grupo de participantes que consume tabaco de
forma leve (12,91 y 10, respectivamente) y el grupo de participantes que tiene un consumo
de tabaco moderado/alto (13,52 y 12, respectivamente).

2. Propón 4 variables nuevas que no salgan en el enunciado del examen "ESTUDIO SOBRE El
ESTADO DE SALUD Y LA PRÁCTICA DIARIA DE ACTIVIDAD FÍSICA" (pueden ser de otros
estudios o investigaciones) que se midan con una escala de medida de intervalo o de razón.
A continuación, describe cómo es cada variable dando las explicaciones que consideres
oportunas. (1 punto)

Nombre variable Escala de Descripción de la variable


medida

1. Temperatura Intervalo Temperatura ambiental existente en el momento en


que se realiza la recogida de datos, medida en grados
centígrados.

1. Puntuación en Intervalo Puntuación obtenida en la escala de inteligencia


CI WISC-V.

2. Número de Razón Número de hijos o hijas del/la participante.


hijos

3. Sueldo Razón Sueldo mensual en euros que percibe el/la


mensual participante.

24/01/2024 pág 3
3. Teniendo en cuenta el enunciado de la prueba, indica si las siguientes afirmaciones son
verdaderas o falsas (V/F) en función de si la variable a la cual hacen referencia es cuantitativa
o categórica, y justifica brevemente tu respuesta. (1 punto)

V/F Justificación

La variable Consumo de alcohol (Alcohol) V Se trata de una variable cualitativa.


se puede resumir mediante frecuencias y
porcentajes

La variable Cuestionario de Salud GHQ-12 F Se trata de una variable cualitativa.


Categorizado (GHQ_CAT) se puede
representar gráficamente mediante un
histograma

La prueba t-student permite analizar la F Estamos trabajando con una variable


relación entre la variable Talla y la variable cuantitativa y una cualitativa de tres categorías.
Consumo de fármacos (Fármacos) La prueba t de Student requiere que la variable
cualitativa tenga dos categorías.

La regresión lineal permite analizar la V Estamos trabajando con dos variables


relación entre la variable Índice de masa cuantitativas.
corporal (IMC) y la variable Kilocalorías
totales quemadas a la semana (Tot_kcal)

4. En la siguiente tabla de contingencia se presenta la relación cruzada entre el Cuestionario


Internacional de Actividad Física (IPAQ) y el consumo de tabaco en 3 categorías
(Fumar_3CAT). Calcula la frecuencia esperada de las personas con un IPAQ alto y que no
consumen tabaco. Presenta el resultado con dos decimales y detalla los cálculos para llegar a
este resultado. (0,5 puntos)

24/01/2024 pág 4
Respuesta y procedimiento de cálculo:

total (Fumar_3cat = No) = 20 + 34 + 121 = 175

total (IPAQ = Alto) = 121 + 20 + 28 = 169

total = 20 + 33 + 37 + 34 + 11 + 17 + 121 + 20 + 28 = 321

fe = (175 x 169) / 321 = 92,13

5. Se quiere evaluar si hay relación estadísticamente significativa entre los siguientes pares de
variables. Indica para cada uno de ellos cuál de las siguientes pruebas estadísticas (Chi
cuadrado, t-Student, ANOVA y prueba de correlación de Pearson) habría que aplicar,
suponiendo que se cumplen las condiciones de aplicación de la prueba, y justifica brevemente
tu respuesta (0,5 puntos)

Prueba estadística Justificación

Hábito de dormir (Dormir) y Chi cuadrado Estamos trabajando con dos


Consumo de fármacos variables cualitativas.
(Fármacos)

Edad (Edad) y Hábito de ANOVA Estamos trabajando con una


consumo de alcohol y variable cuantitativa (Edad) y una
tabaco (AlcFum3_CAT) cualitativa de tres categorías
(Consumo alcohol y tabaco).

24/01/2024 pág 5
6. Se quiere evaluar si existe relación estadísticamente significativa entre el consumo de alcohol
(Alcohol) y la percepción sobre si se ha llevado una dieta equilibrada (Dieta). Se trabaja
con un nivel de confianza del 95%. Responde cada uno de los apartados que te presentamos
a continuación, justificando tu respuesta. (2 puntos)

A continuación, te presentamos los listados que ponen en relación estas dos variables. Analízalos
y responde las preguntas siguientes:

Listados

a) Indica si se cumplen las condiciones de aplicación de la prueba y justifica tu respuesta.


(0,25 puntos)

Respuesta: se cumplen las condiciones de aplicación de la prueba, dado que todas las
frecuencias esperadas son superiores a 5 (la frecuencia esperada menor es de 8,60).

24/01/2024 pág 6
b) Redacta la hipótesis nula y la hipótesis alternativa. (0,5 puntos)

Respuesta:

Hipótesis nula: las variables Dieta y Consumo de alcohol no están relacionadas. No existen
diferencias entre las frecuencias observadas y las frecuencias teóricas. (Foij = Feij)

Hipótesis alternativa: las variables Dieta y Consumo de alcohol están relacionadas. Existen

diferencias entre las frecuencias observadas y las frecuencias teóricas. (Foij ≠ Feij)

c) Indica cuál es la decisión estadística y redacta la interpretación que se deriva,


contextualizándola en la investigación planteada en el enunciado. (1,25 puntos)

Respuesta:

Con la muestra disponible podemos afirmar que, con un nivel de confianza del 95%, existe
una relación estadísticamente significativa entre las variables Dieta y Consumo de alcohol.
La significación del estadístico Chi cuadrado=41,980; gl=4 es p<0,001 y, en consecuencia,
inferior al nivel de significación (α=0,05). Por tanto, la probabilidad de equivocarnos al
rechazar la hipótesis nula es inferior al umbral de 0,05, así que la rechazamos.

Si miramos los datos por columnas, vemos cómo los porcentajes de los hábitos de consumo
de alcohol varían significativamente en función de la percepción de si se ha llevado una dieta
equilibrada. Entre los participantes que llevan una dieta equilibrada, más de la mitad no bebe
alcohol (56,20%), el 33,88% realiza un consumo leve y el 9,92% lo consume de forma
moderada. Entre quienes intentan llevar una dieta equilibrada, casi la mitad de la muestra
(49,28%) no bebe, el 33,33% consume alcohol de forma leve y el restante 17,39% lo hace
de forma moderada. Por último, en el grupo de participantes que no lleva una dieta
equilibrada, el 67,18% hace un consumo leve, el 20,61% no bebe alcohol y el 12,21%
consume alcohol de forma moderada. Por tanto, se puede concluir que llevar una dieta
equilibrada se relaciona con un menor consumo de alcohol.

24/01/2024 pág 7
7. Se quiere evaluar si existe relación estadísticamente significativa entre el número de
kilocalorías quemadas a la semana al caminar (Kcal_caminar) y el género (Género).
Asume que se cumplen las condiciones de aplicación de la prueba y trabaja con un nivel de
confianza del 95%. Responde a cada uno de los apartados que te presentamos a continuación
justificando tu respuesta. (2 puntos)

A continuación, te presentamos los listados que ponen en relación estas dos variables.

Listados

* Asumimos que se cumplen las condiciones de aplicación de la prueba

a) Redacta la hipótesis nula y la hipótesis alternativa. (0,5 puntos)

Respuesta:

Hipótesis nula: la media de kilocalorías totales quemadas a la semana al andar es igual entre
las dos categorías de la variable Género. Es decir, no existe relación entre el número de
kilocalorías totales quemadas a la semana y el Género.

μ1 = μ 2 -> μ 1 - μ 2 = 0

Hipótesis alternativa: la media de kilocalorías totales quemadas a la semana al andar es


diferente entre las dos categorías de la variable Género. Es decir, existe relación entre el
número de kilocalorías totales quemadas a la semana y el Género.

μ1 ≠ μ 2 -> μ 1 – μ 2 ≠ 0

24/01/2024 pág 8
b) Indica cuál es la decisión estadística y redacta la interpretación que se deriva,
contextualizándola en la investigación planteada en el enunciado. (1,5 puntos)

Respuesta:

La significación del estadístico t=-2,468; gl=319 es p=0,014. Es decir, la probabilidad de


equivocarnos al rechazar la hipótesis nula es inferior al umbral de 0,05, por tanto, la
rechazamos. Con un nivel de confianza del 95%, la media de kilocalorías totales quemadas
a la semana al andar es diferente entre las personas del género masculino y las del
femenino. Si analizamos las medias de ambos grupos, encontramos que son las personas
del género masculino las que presentan una media superior de kilocalorías totales
quemadas a la semana (3399,374 vs. 2488,562).

8. A partir de los resultados obtenidos en el listado que te presentamos a continuación, elabora la


interpretación estadística de la información del listado en el marco de la investigación planteada.
Hay que plantear las hipótesis de cada prueba, interpretar la significación de la prueba de
hipótesis, y redactar una conclusión final, interpretando el sentido de la relación entre las
variables en caso de que haya. Asume que se cumplen las condiciones de aplicación de la
prueba y trabaja con un nivel de confianza del 95%. Tienes una extensión máxima de 350
palabras. (2 puntos)

Relación entre la edad (Edad) y el índice de masa corporal (IMC)

* Asumimos que se cumplen las condiciones de aplicación de la prueba

24/01/2024 pág 9
Respuesta:

Hipótesis:

Hipótesis nula: no existe relación entre la Edad y el Índice de masa corporal. (⍴xy = 0)

Hipótesis alternativa: existe relación entre la Edad y el Índice de masa corporal. (⍴xy ≠ 0)

Conclusión estadística e interpretación de los resultados:

La significación del estadístico Pearson's r=0,173 es p=0,002 y, por tanto, inferior al nivel de
significación (α=0,05). Es decir, la probabilidad de equivocarnos al rechazar la hipótesis nula es
inferior al umbral de 0,05, por tanto, la rechazamos. Con un nivel de confianza del 95%, podemos
concluir que existe una relación estadísticamente significativa entre la edad (Edad) y el índice de
masa corporal (IMC). La relación es directa (a mayor edad, mayor IMC) aunque es de intensidad
leve.

24/01/2024 pág 10

También podría gustarte