Primer Preparcial Probabilidad y Estadistica 2024-I

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

Probabilidad y Estadística

2024-I
2020 -II
Pre parcial de probabilidad – Primer parcial
Febrero 2024

Este Pre parcial tiene como objetivo acercar al estudiante a los contenidos y competencias de la
asignatura. Es un material de apoyo para la preparación del primer parcial.

Competencias:
✓ Distinguir entre tipos de variables y sus escalas de medición
✓ Elaborar tablas para datos cualitativos y cuantitativos.
✓ Representar gráficamente conjuntos de datos (Diagramas de puntos, tallos de hojas, gráficos
de barra, gráficos de sectores o circulares, histogramas, polígonos de frecuencia, ojivas,
diagramas de dispersión, cajas de bigotes.
✓ Analizar e interpretar conjuntos de datos haciendo uso adecuado de las medidas de tendencia central,
localización y dispersión.
✓ Conocer los comandos básicos o scripts para elaborar gráficos y calcular medidas de tendencia central,
variabilidad, forma y asociación con el paquete estadístico R

1. Clasifique las siguientes variables según su tipo de escala (nominal, ordinal, intervalo o razón) y
tipo de variable: cualitativa o cuantitativa (discreta o continua):
a. Número de empleados en una entidad financiera.
b. Número en la camiseta de una jugadora en un equipo de baloncesto.
c. Precipitación diaria medida en milímetros (Se refiere a la cantidad de agua caída por
metro cuadrado en un período de tiempo determinado, en este caso, en un día.)
d. Ingresos de un almacén de cadena en el mes de enero de 2024
e. Coeficiente intelectual (Escala de Wechsler)
f. Estado civil
g. Estrato socioeconómico
h. Necesidades básicas insatisfechas – NBI
i. Producto interno bruto
j. Precio del dólar
k. Inflación – Índice de precios al consumidor IPC

2. Los datos sin procesar mostrados a continuación son los cobros por consumo de electricidad
durante el mes de enero de 2024 para una muestra aleatoria de 60 apartamentos en un sector
residencial de Bogotá.
Datos sin procesar de cobros de servicios públicos (Miles de pesos)
171 280 178 147 102 153 197 127 82 157 185 90 116 172
111 148 130 165 141 149 206 175 325 210 144 300 400 167
163 150 250 130 143 187 166 88 210 100 110 120 130 140
150 160 170 180 190 90 50 60 500 450 70 420 65 90
300 280 600 50

Página 1 de 4
Probabilidad y Estadística
2024-I
Utilizando el paquete estadístico R 2020 -II

a. Construya una representación tallo hoja


b. Realice un histograma, polígono de frecuencia, un gráfico circular y una ojiva. Interprételos
c. Calcule e intérprete (para datos agrupados y sin agrupar) Media aritmética, mediana, moda,
desviación estándar, coeficiente de variación.
d. Calcule e interprete los cuartiles (Q1, Q2 y Q3). Percentil 80, decil 7, sextil 4 y quintil 2.
e. Construya e interprete una caja de bigotes.
f. Calcule e intérprete las medidas de forma (asimetría y curtosis)

3. Los salarios de una empresa son en promedio de $2.000.000 al final de un período dado. Con
posterioridad se incorpora a la empresa un grupo de empleados igual al 25% de los que estaban
anteriormente. El nuevo grupo ingresa a la empresa con un salario medio igual al 60% de los
antiguos. Dos meses más tarde la empresa concede un aumento de $250.000 por salario.
a. ¿Cuál es el salario promedio del total de empleados? Rta. p = $2.090.000
b. ¿Si el aumento hubiera sido del 25%, cuál sería el salario medio? Rta. p = $2.300.000

4. 120 empleados de una entidad financiera tienen un salario promedio de $2.500.000 y una varianza
de $500.000. Cuando la entidad divulgó dicho promedio, el sindicato de la entidad protestó porque
en él se había incluido una bonificación de $400.000 que había sido pagada únicamente en ese
mes, con base en los datos rectifique los valores e indique cuales son los correctos. Rta. =
$2.100.000; V(X) = $500.000

5. El departamento de recursos humanos de una importante empresa de servicios desea realizar un


estudio y análisis de los ingresos ($US semana) de sus empleados frente a otras empresas. Para
tal efecto se tomaron a los empleados de tres empresas similares.
Empresa I
Total, de empleados: 35
Ingreso promedio por empleado: 33.72
Suma de los cuadrados de los ingresos: 48004.24

Empresa II
Total, de empleados: 13
Volumen total de los ingresos: 847.1
Varianza: 318.27589

Empresa III
Ingresos Número acumulado de empleados Nj
10 - 18 15
18 - 26 29
26 - 36 36
36 - 40 44
40 - 48 56
48 - 55 68
55 - 75 90

Página 2 de 4
Probabilidad y Estadística
2024-I
2020 el
En la empresa III se desea realizar una clasificación de los empleados según -IInivel de ingreso,
para poder adjudicar algunos beneficios que se han acordado en la última asamblea. Al 19% que
tienen menores ingresos se les otorgara un crédito para comprar un automóvil, al 36% de los que
tienen ingresos medios se les otorgara un crédito para vivienda, al 30% con ingresos medios altos
se les brindara un auxilio y tiempo para continuar estudios de especialización y al resto que son
considerados con ingresos altos tendrán la oportunidad de realizar una maestría en el exterior.
¿Dentro de que limites salariales estarán cada uno de los grupos? ¿Cuántos empleados se verán
beneficiados en cada una de las situaciones?
Rta.
categoría
10-19,2 crédito para comprar un automóvil
19,2-43,7 crédito para vivienda
43,7-62,7 auxilio y tiempo para continuar estudios de especialización
62,7-75 oportunidad de realizar una maestría en el exterior

6. Para cada uno de los siguientes ejercicios podemos calcular medidas de tendencia central
como la media y la mediana. Identifique una razón importante por la que, en estos casos,
la media y la mediana no son estadísticos que puedan servir de manera precisa y efectiva
como medidas de tendencia central.
a. Códigos postales: 12601 90210 02116 76177 19102
b. Clasificaciones de los niveles de estrés de distintos empleos: 2, 3, 1, 7, 9
c. Los encuestados se codifican de la siguiente manera: 1 (demócratas), 2 (republicanos),
3 (liberales), 4 (conservadores) o 5 (cualquier otro partido político).
SOLUCIÓN
a. Los códigos postales no miden ni cuentan algo. Los números en realidad son etiquetas
de ubicaciones geográficas. En este caso, la media y la mediana son estadísticos
carentes de significado.
b. Las clasificaciones reflejan un orden, pero no miden ni cuentan algo. La clasificación 1
podría indicar un empleo que tiene un nivel de estrés mucho mayor que el nivel de un
empleo con una clasificación 2, por lo que los distintos números no corresponden a las
magnitudes de los niveles de estrés. En este caso, la media y la mediana son estadísticos
carentes de significado.
c. Los resultados codificados son números, pero no miden ni cuentan algo. Estos números
son simplemente distintas maneras de expresar nombres. Como consecuencia, en este
caso, la media y la mediana son estadísticos carentes de significado.

7. Un fanático de la selección femenina de futbol de Colombia registra el número de la


camiseta de cada jugadora del equipo en un juego amistoso, ¿Tiene algún sentido
calcular la media de estos números? ¿Por qué si o no?

8. Una socióloga desea calcular la media del tiempo que tardan en transportarse al trabajo
todos los ciudadanos de Bogotá que tienen un empleo. Ella sabe que no es práctico
encuestar a cada uno de los miles de individuos que trabajan, por lo que realiza una
búsqueda en Internet y encuentra la media del tiempo de transporte en cada una de las
20 localidades de Bogotá. La socióloga suma los 20 tiempos y los divide entre 20. ¿Es
probable que el resultado sea un buen estimador de la media del tiempo de transportación
de todos los trabajadores si o no? ¿Por qué?
Página 3 de 4
Probabilidad y Estadística
2024-I
2020 -II

9. Quince estudiantes del segundo año de la facultad de medicina de cierta universidad en


Bogotá midieron la presión sanguínea de la misma persona. A continuación, se listan las
lecturas sistólicas (en mmHg). ¿Qué es notorio acerca de este conjunto de datos? 138
130 135 140 120 125 120 130 130 144 143 140 130 150 145
10. A continuación, se presentan los tiempos de espera (en minutos) de los clientes del banco
A (donde todos los clientes forman una sola fila) y del banco B (donde los clientes esperan
en filas individuales, en tres ventanillas diferentes). Determine si existe una diferencia
entre los dos conjuntos de datos, que no sea aparente cuando se comparan las medidas
de tendencia central. Si tal diferencia existe, ¿cuál es?
Banco A (una sola fila): 6.5, 6.6, 6.7, 6.8, 7.1, 7.3, 7.4, 7.7, 7.7, 7.7
Banco B (filas individuales): 4.2, 5.4, 5.8, 6.2, 6.7, 7.7, 7.7, 8.5, 9.3, 10.0

11. Una profesora de estadística aplica un examen que tiene una media de 50 y una
desviación estándar de 10. (Ella no está utilizando un examen típico con una puntuación
máxima de 100 y promete hacer una curva con las calificaciones). Un estudiante obtiene
una calificación de 85 en el examen. En este contexto, ¿la calificación de 85 es “poco
común”? ¿Por qué?

12. Es bien sabido que los hombres tienden a pesar más y a ser más altos que las
mujeres. El índice de masa corporal (IMC) es una medida que se basa en el
peso y en la estatura. A continuación, se muestran los valores de IMC de
hombres y mujeres elegidos de manera aleatoria. ¿Parece existir una diferencia
en la variación entre los dos conjuntos de datos?
Hombres: 23.8 23.2 24.6 26.2 23.5 24.5 21.5 31.4 26.4 22.7 27.8 28.1
Mujeres: 19.6 23.8 19.6 29.1 25.2 21.4 22.0 27.5 33.5 20.6 29.9 17.7

13. Los siguientes datos corresponden a las edades ordenadas de las mejores
actrices ganadoras del Óscar:
21 22 24 24 25 25 25 25 26 26 26 26 27 27 27 27 28 28 28 28 29 29 29 29
29 29 30 30 31 31 31 32 32 33 33 33 33 33 34 34 34 35 35 35 35 35 35 35
36 37 37 38 38 38 38 39 39 40 41 41 41 41 41 42 42 43 45 46 49 50 54 60
61 63 74 80.
a. Calcule el percentil correspondiente a una edad de 30 años. Rta: La edad de
30 años es el percentil 34 (justifique la respuesta)
b. calcular el valor del percentil 20, P20 y Q3 Rta: 27 y 39.5 años respectivamente.

Página 4 de 4

También podría gustarte