3 Estadistica Desriptiva - Admin
3 Estadistica Desriptiva - Admin
3 Estadistica Desriptiva - Admin
Presentación de datos
De acuerdo con la cantidad de datos que se recolectan y a los valores que presenta la variable los
datos se pueden agrupar o no.
No agrupados
Datos frecuencia
Agrupados por intervalo
De acuerdo con cómo se agrupen los datos, difiere ligeramente la forma de trabajar los mismos.
Vamos a ver las tres formas de agrupación
1_ Datos no agrupados: el conjunto de datos dispuestos tal como se presentan se utiliza cuando
en general son pocos datos (15 ó 20 máximo) y los valores de la variable no se repiten en general.
Ejemplo datos sin agrupar
Los montos depositados por un comercio durante 15 días hábiles en miles de pesos: 2,5 – 1,6 – 2,1
– 1,5 – 1,6 – 2,2 – 2,3 – 2,6 – 1,6 – 1,8 – 1,4 – 1,9 – 1,2 – 2,3 – 2,4.
En este caso lo que se hace primeramente es ordenar los datos de menor a mayor:
1,2 – 1,4 – 1,5 – 1,6 – 1,6 – 1,6 – 1,8 – 1,9– 2,1– 2,2 – 2,3 – 2,3 – 2,4 – 2,5 – 2,6.
Se debe definir los siguientes ítems, organizan el trabajo que vamos a realizar y nos ayuda a
escribir las respuestas e interpretaciones, es lo que llamo el encabezado del ejercicio, siempre
debe hacerse:
• Variable: montos depositados por un • Cantidad de valores distintos de la
comercio variable: 12
• Tipo de variable: cuantitativa continua • Unidad de medida: miles de $
• Unidad de análisis: días (observar que la • Cantidad de datos: N = 15
unidad de análisis coincide con la frecuencia)
• Cantidad de valores de la variable: 12
Para obtener rápidamente y en forma resumida, la información que contienen los datos, se han
creado distintas medidas, entre ellas las de tendencia central o de posición son valores
destacados que sugieren o indican el lugar de ubicación o posición en que se encuentra una
distribución de frecuencias, resumen los datos en un solo valor que los representa. No
necesariamente toman los valores de la variable pero pueden ser localizadas en el mismo eje de
coordenadas.
En el siguiente ejemplo usaremos la nomenclatura poblacional
Se desea saber:
a) ¿Cuál es el promedio diario de los montos depositados?
Promedio o media aritmética es el número que resulta de sumar todos los valores de la variable y
dividir esa suma por la cantidad de datos.
N
x i
29
μ= 1
= = 1,93 miles de pesos
N 15
Interpretación: El promedio diario de montos depositados por un comercio es de $1933,33.
Es muy importante que TODAS las medidas sean interpretadas en términos del problema
Para su cálculo se deben ordenar los datos de menor a mayor como se realizó al comienzo del
ejercicio:
1,2 – 1,4 – 1,5 – 1,6 – 1,6 – 1,6 – 1,8 – 1,9 – 2,1– 2,2 – 2,3 – 2,3 – 2,4 – 2,5 – 2,6.
8º lugar
Vemos que quedan 7 valores a ambos lados de la mediana
Interpretación: El 50% de los días se depositaron hasta 1,9 miles de pesos diarios y el otro 50%
de los días se depositaron hasta 1,9 miles de pesos diarios o más.
Nota: Si la cantidad de datos fuera par el valor de la mediana se calcula como el promedio de los
dos valores centrales, por ejemplo si la cantidad de datos fuera 8, el orden de la mediana es
N +1 8 +1
= = 4,5 , este lugar “no cae” en un valor de la variable, sino en el medio de dos valores,
2 2
por lo que se hace el promedio entre el 4º y el 5º valor.
Si los datos fueran: 6 - 7 - 9 - 10 - 13 - 14 - 16 - 19
La mediana está entre el lugar 4º y el 5º, eso indica que entre los valores 10 y 13. La mediana es
(10 + 13) / 2 = 11,5
IMPORTANTE para interpretar las medidas se usó el encabezado del ejercicio
1
Algunos autores consideran que en tan pocos números y con tan baja repetición no se debería considerar que el valor 1,6 es el modo.
Material preparado por Lic. Adriana Ibero 25
LIC. EN ADMINISTRACIÓN DE EMPRESAS - LIC EN RELACIONES COMERCIALES INTERNACIONALES
σ2 =
x 2i − μ 2 = 58,79 − 3,7378 = 0,18089 miles de pesos2
N 15
El Desvío estándar es σ = σ 2 = 0,18089 == 0,42531 miles de pesos
Ambas medidas no llevan interpretación
En el caso A el CV % es muy alto, la distribución no es homogénea ( los valores son muy distintos
entre sí) y el promedio no representa lo que está ocurriendo.
En el caso B el CV % es bajo, la distribución es homogénea ( los valores son similares entre sí) y el
promedio representa lo que está ocurriendo.
Las medidas de forma permiten observar si los datos se distribuyen uniformemente alrededor de
la media aritmética. Se pueden distinguir tres formas:
En una curva con asimetría a izquierda los valores de la variable se concentran en valores altos.
Hay más frecuencia en valores altos de la variable
En una curva simétrica los valores de la variable se concentran en el centro. Hay más frecuencia en
valores centrales de la variable
En una curva con asimetría a derecha los valores de la variable se concentran en valores bajos. Hay
más frecuencia en valores bajos de la variable
Se considera la regla empírica que compara tres medidas de posición central: media aritmética,
mediana y modo. Se ordenan estos valores de menor a mayor:
Por ambos métodos, regla empírica o coeficiente de asimetría de Pearson, nos indica que la
distribución se concentra en los valores bajos de la variable, la asimetría es a derecha y el sesgo es
positivo.
Interpretación: Hay más días en que los depósitos bancarios tienen montos bajos.
Ejercicio I
Indique cuál es el valor del modo y la mediana en los siguientes casos:
a) 5, 6, 2, 9, 4, 7, 3
b) 3, 3, 3, 3, 3, 3
c) 4, 5, 8, 4, 3, 9, 4, 6
d) 4, 5, 8, 4, 3, 9, 8, 6
Rta.: a) Mo: no tiene, Ma = 5 b) Mo: no tiene, Ma = 3 c) Mo = 4, Ma = 4,5 d) Bimodal Mo = 4, Mo = 8, Ma = 5,5
Ejercicio II
En una fábrica se producen fallos debido a equipos con cierta antigüedad y se está pensando si es
conveniente invertir en la compra de unos nuevos. Se toman los datos de los últimos diez meses
en que los equipos fallaron y los datos son los siguientes:
3–5–4–7–9–6–4–8–4–2
a) Definir la variable y clasificarla indique la unidad de análisis y cantidad de observaciones.
b) ¿Cuál es el número promedio de equipos con fallos que produjeron accidentes?
c) Calcule la mediana y el modo.
d) Indique el valor de la variancia y del desvío estándar.
e) Indique el coeficiente de variación porcentual.
f) Realice un gráfico que represente la cantidad de equipos con fallos mensuales que
producen accidentes.
Rtas.: b) 5,2 equipos; c) 4.5 y 4 equipos; d) 4,56 equipos 2 y 2,1354 equipos e) 41,07%
2_ Datos agrupados por frecuencia: se tiene una cantidad importante de datos y los valores de la
variable se repiten.
Ejemplo una empresa de logística tiene camiones propios y por su desarrollo en el último año
contrata a otras empresas, se toma una muestra de 36 semanas y se contabiliza la cantidad de
camiones alquilados por semana, ello ocasiona un gasto a la empresa, no sólo por el alquiler si no
por la contratación de personal; los datos son los siguientes:
6 5 4 7 9 6 8 6 10
7 7 8 5 7 8 6 7 4
8 6 7 7 5 6 4 6 4
4 6 5 8 9 8 8 7 7
- Frecuencia acumulada por izquierda absoluta Fai: es el número de veces que se repiten valores
iguales o menores de la variable. Interpretación: En 17 semanas se alquilaron como máximo 6
camiones (o 6 o menos camiones, o como mucho 6 camiones)
- Frecuencia acumulada por derecha absoluta Gai: es el número de veces que se repiten valores
iguales o mayores de la variable. Interpretación: En 27 semanas se alquilaron como mínimo 6
camiones ( o por lo menos 6 camiones, o 6 camiones o más)
- Frecuencia simple relativa fri o fri%: indica la parte del total o el porcentaje de veces que se
repite un valor de la variable. Interpretación: El 22,2% de las semanas se alquilaron exactamente 6
camiones.
- Frecuencia acumulada por izquierda relativa Fri o Fri%: es la parte del total o el porcentaje de
veces que se repiten valores iguales o menores de la variable. Interpretación: El 47,2% de las
semanas se alquilaron como máximo 6 camiones (o 6 o menos camiones, o como mucho 6
camiones)
- Frecuencia acumulada por derecha relativa Gri o Gri%: es la parte del total o el porcentaje de
veces que se repiten valores iguales o mayores de la variable. Interpretación: El 75% de las
semanas se alquilaron como mínimo 6 camiones ( o por lo menos 6 camiones, o 6 camiones o
más)
Se desea saber:
a) ¿Cuál es la cantidad de camiones promedio alquilados por semana?
Material preparado por Lic. Adriana Ibero 29
LIC. EN ADMINISTRACIÓN DE EMPRESAS - LIC EN RELACIONES COMERCIALES INTERNACIONALES
x i fa
235
x= 1
= = 6,5278 6,5 camiones alquilados por semana
n 36
Interpretación: El promedio de camiones alquilados semanalmente es de 6,5 camiones.
b) ¿Cuál es la cantidad de camiones alquilados más frecuente?
Se observa en la tabla que el valor más frecuente es 7 camiones en 9 semanas: Mo = 7 camiones
Interpretación: hubo más semanas con 7 camiones alquilados.
c) ¿Cuál es el valor central?
n 36
1°. Se obtiene el orden de la mediana: = = 18
2 2
2°. Para obtener el valor de la mediana, hay que observar la de frecuencia absoluta acumulada por
izquierda (Fai) en la tabla, vemos que la primera frecuencia que supera al 18º lugar es la que
corresponde al valor 7 de la variable, en este caso 26, por lo tanto la mediana es: Ma = 7 camiones
semanales.
Interpretación: El 50% de las semanas se alquilaron hasta 7 camiones y el otro 50% de las semanas
se alquilaron 7 o más camiones.
d) Calcule las dos medidas de variabilidad absoluta
- Variancia S 2
=
( x 2
i )
fa − n x
2
=
1619 - 36 6,5278 2 84,9722
= = 2,4278 camiones2
n -1 35 35
3_ Datos agrupados por intervalo: se tiene una cantidad importante de datos y los valores de la
variable no se repiten.
En el siguiente ejemplo usaremos la nomenclatura poblacional
Ejemplo En una empresa importadora se considera la posibilidad de abrir una sucursal en una
ciudad capital del interior, con este objetivo se recolectan los datos de las importaciones
realizadas con países limítrofes en los últimos diez años y una de las variables de interés es la
duración en horas del trámite aduanero. Se recolectan los siguientes datos
19 25 26 58 25 24 45 51 56 34 24 37
20 28 40 58 26 38 46 52 56 35 24 37
25 28 41 25 28 39 47 53 58 36 55 24
20 29 41 18 29 39 47 53 21 37 56 24
21 30 45 34 31 39 49 54 29 38 35 42
21 33 48 32 31 40 50 55 30 39 37 44
21 33 52 21 32 40 37 23 33 41 24 30
21 35 53 27 33 42 25 23 33 41 22 32
26 35 53 23 34 42 26 24 34 41 34 43
23 35 55 23 35 42 21 29 34 41 34 43
Como se tiene una cantidad importante de datos, los valores de la variable se encuentran en un
rango amplio, el menor es 18 y el mayor 58, y los valores no todos se repiten, se agrupan por
intervalo. La agrupación de datos por intervalo es la siguiente:
X 18 - 24 24 - 30 30 - 36 36 - 42 42 - 48 48 - 54 54 - 60
fa 17 24 26 21 12 10 10
Los intervalos tienen límite superior que pertenece al intervalo y límite superior que no pertenece
al intervalo. En el primer intervalo [18 - 24) incluye los valores 18 al 23,999999… . Para hallar la
frecuencia de cada intervalo se cuenta cuántos valores hay, o sea contar la cantidad de 18, 19, 20,
21, 22 y 23 hay, la cantidad es 17.
Se desea saber:
a) ¿Cuál es la duración promedio del trámite?
Al tener los datos agrupados por intervalo se necesita tener un valor que los represente en cada
Li + Ls
uno y se toma el punto medio PM = , quedando la siguiente tabla:
2
X 18 - 24 24 - 30 30 - 36 36 - 42 42 - 48 48 - 54 54 - 60
PM 21 27 33 39 45 51 57
fa 17 24 26 21 12 10 10
Fa 17 41 67 88 100 110 120
N
PM f i a
4302
μ= 1
== = 35,85 horas
N 120
Interpretación: El promedio de duración del trámite aduanero es de 35,85 horas.
b) ¿Cuál es la duración más frecuente?
Como se puede observar en la tabla, el intervalo más frecuente es de 30 a 36 horas en el cual se
contaron 26 importaciones, por lo tanto el intervalo modal es 30 - 36
El valor del modo se obtiene con la siguiente fórmula:
d1 2
Mo = Li + a = 30 + 6 = 31,71 horas
d1 + d 2 2+5
Interpretación: Hay más importaciones con una duración del trámite aduanero de 31,71 horas.
c) ¿Cuál es el valor central?
Se obtiene el orden de la mediana: N 120
= = 60
2 2
Se puede observar en la tabla, en la frecuencia acumulada, cual es la primera que contiene al 60,
por lo tanto el intervalo de la mediana es 30 – 36
El valor de la mediana se obtiene
N/2 − Fa i −1 60 − 41
Ma = Li + a = 30 + 6 = 34,38 horas
fa i 26
Interpretación: El 50% de las importaciones tienen una duración del trámite de hasta 34,38 horas
y el otro 50% tiene 34,38 o más horas.
d) Indique las dos medidas de variabilidad absoluta
Variancia:
σ2 =
PM 2
i fa
− μ2 =
168048
− 35,85 2 = 1400,4 − 1285,22235 = 115,1775 horas2
N 120
Interpretación: El CV% es mayor del 20% y se puede afirmar que la distribución de “la duración del
trámite aduanero” no es homogénea, y en consecuencia la media aritmética no es representativa
de los datos.
f) Realice una tabla de frecuencias e interprete.
48 − 41
P40 = 30 + 6 = 31,62
26
Interpretación: El 40% de las importaciones tienen una duración del trámite de hasta 31,62 horas,
el otro 60% duran 31,62 horas o más.
Se considera la regla empírica que compara tres medidas de posición central: media aritmética,
mediana y modo. Se ordenan estos valores de menor a mayor:
31,7 horas < 34,38 horas < 35,85 horas
Mo < Ma < μ
Por ambos métodos, regla empírica o coeficiente de asimetría de Pearson, nos indica que la
distribución se concentra en los valores bajos de la variable, la asimetría es a derecha y el sesgo es
positivo.
Interpretación: Hay más cantidad de importaciones cuyo trámite es rápido, es decir tiene una
duración corta.
i) Realice un gráfico de la frecuencia absoluta simple (Histograma y polígono de frecuencia) y
de la acumulada ( Ojiva)
j) Realice un gráfico que reúna las medidas de posición
El gráfico que muestra las medidas de posición es el Box-plot o diagrama de caja –bigote, en su
construcción se usan tres medidas de posición: mediana, 1º cuartil y 3º cuartil, y los valores
máximo y mínimo. El beneficio de este gráfico es que permite tener información de la tendencia
central, dispersión, simetría y valores extremos o atípicos.
El gráfico consiste en un rectángulo o caja de cuyos lados superior e inferior se derivan dos
segmentos. Las partes del gráfico se obtienen teniendo los siguientes datos: mediana, 1º cuartil y
3º cuartil, rango intercuartílico y los valores máximo y mínimo. En nuestro ejemplo los datos son
los siguientes:
a) Tercer cuartil: Q3 = 43 horas
b) Mediana: Ma = 34,38 horas
c) Primer cuartil: Q1 = 27,25 horas
d) RI: rango intercuartílico = Q3 – Q1 = 43 horas - 27,25 horas =
15,75 horas
e) Valor máximo: 58 horas
f) Valor mínimo: 18 horas
g) Límite superior: es el extremo superior del bigote
Q3 + 1,5RI = 43 horas + 1,5 • 15,75 horas = 66,625
h) Límite inferior: es el extremo inferior del bigote
Q1 - 1,5RI = 25,25 horas –1,5 • 15,75 horas = 3,625
i) Valores extremos o atípicos: datos que están apartados del cuerpo principal del conjunto
de datos. Pueden representar efectos de causas extrañas, opiniones extremas o en el caso
de la tabulación manual, errores de medición o registro. Se representan con un asterisco
(*) o puntos (.) y son los que se encuentran antes del límite inferior o después del límite
superior.
j) Media aritmética: originalmente no forma parte del box-plot, sin embargo, se consideró su
inclusión para dar una idea del puntaje general obtenido por pregunta.
El gráfico box-plot tiene una interpretación más profunda que un gráfico convencional:
➢ Cuánto más larga es la caja y los bigotes, más dispersa es la distribución de datos.
➢ La línea que representa la mediana indica la simetría. Si está relativamente en el centro
de la caja la distribución es simétrica. Si por el contrario se acerca al primer o tercer cuartil, la
distribución pudiera ser sesgada a la derecha (asimétrica positiva) o sesgada a la izquierda
(asimétrica negativa respectivamente.
Los siguientes ejemplos muestran la curva de una distribución teórica y su gráfico de box-plot:
Media
aritmética
siguiente: Mediana
30
1º Cuartil
20 Límite
inferior
Ejercicio IV
En una institución bancaria se venden pólizas de seguros de vida a clientes que tiene caja de
ahorro y cuenta corriente. Todo cliente debe pasar por un proceso de aprobación que dura
distinto tiempo, dependiendo de cada caso. La institución necesita mayor agilidad en la
tramitación para obtener una rentabilidad mayor. Los datos recolectados de 180 pólizas otorgadas
en el último mes son los siguientes:
Resumiendo
Media aritmética o promedio
central Modo
Mediana
de posición o localizaci ón
Cuartiles
Quintiles
no central
Deciles
Percentile s
Medidas Rango
absolutas Rango intercuart ílico
Variancia
de variació n o dispersión Desvío estándar
relativas Coeficient e de variación porcentual
Regla empírica
de forma
Coeficient e de Asimetría de Pearson
Trabajo Práctico 3
3.1_ Se tiene los datos de los accidentes, leves o graves, de una fábrica en los últimos 30 meses:
6 8 10 12 14 15 8 9 12 15
7 8 10 13 14 15 8 9 12 13
7 9 11 13 14 16 13 15 16 17
Se pide:
a) Indique la variable, clasifíquela, indique la unidad de medida y la unidad de análisis.
b) Organice los datos en una distribución de frecuencias, analícelas en términos del problema.
c) ¿En cuántos meses hubo exactamente 13 accidentes?
d) ¿Qué porcentaje de los meses hubo más de 10 accidentes?
e) ¿Qué porcentaje de los meses hubo 10 accidentes o menos?
f) ¿En cuántos meses la cantidad de accidentes fue superior15?
g) ¿Cuál es el porcentaje de meses donde hubo hasta 8 accidentes?
h) ¿Cuál es el porcentaje de meses donde hubo 14 accidentes o más?
Rta.:
x fa Fa Ga fr fr% Fr% Gr%
6 1 1 30 0,033 3,3 3,3 100,0
7 2 3 29 0,067 6,7 10,0 96,7
8 4 7 27 0,133 13,3 23,3 90,0
9 3 10 23 0,100 10,0 33,3 76,7
10 2 12 20 0,067 6,7 40,0 66,7
11 1 13 18 0,033 3,3 43,3 60,0
12 3 16 17 0,100 10,0 53,3 56,7
13 4 20 14 0,133 13,3 66,7 46,7
14 3 23 10 0,100 10,0 76,7 33,3
15 4 27 7 0,133 13,3 90,0 23,3
16 2 29 3 0,067 6,7 96,7 10,0
17 1 30 1 0,033 3,3 100,0 3,3
30 1 100
3.2_ Las emisiones de monóxido de carbono detectadas en las estaciones de control de la calidad
del aire provienen principalmente de las combustiones de los motores de combustión interna de
los vehículos móviles. De esta forma, pueden registrarse valores más altos en aquellos lugares en
los que la cercanía de cruces de tráfico elevado ó regulado por semáforos, facilitan la emisión y
acumulación del monóxido de carbono.2
Se tomaron mediciones del nivel de monóxido de carbono (en gr/m3) en varias esquinas céntricas
cada hora durante los cinco días laborables. Los datos son los siguientes:
40,09 37,09 35,89 37,66 37,85 36,00 42,65 33,79 32,00 35,04
34,07 32,41 39,94 29,36 40,68 39,48 41,91 36,47 24,72 31,15
34,06 35,32 35,62 34,53 35,00 32,56 37,72 32,96 32,62 35,83
32,80 38,07 39,89 34,22 37,49 43,65 37,62 35,98 32,14 37,18
39,56 38,38 34,60 38,44 38,92 28,47 35,56 37,91 33,01 34,56
2
http://pagina.jccm.es/medioambiente/rvca/legisla04b.htm
Material preparado por Lic. Adriana Ibero 38
LIC. EN ADMINISTRACIÓN DE EMPRESAS - LIC EN RELACIONES COMERCIALES INTERNACIONALES
35,87 37,54 32,74 40,06 36,10 29,38 42,27 29,78 37,48 37,15
35,13 38,08 37,87 36,14 36,54 38,85 36,18 29,38 35,56 33,84
37,06 36,03 36,04 38,02 34,24 35,70 37,48 34,46 33,52 37,07
37,78 39,37 32,40 39,26 35,36 35,13 33,28 36,03 37,16 33,55
31,39 27,47 35,74 34,85 27,48 36,45 39,19 32,73 35,39 35,71
3.3_ En la empresa “Ponto & hermanos” se necesita conocer la información de los sueldos
cobrados por el personal para evaluar la posibilidad de incorporar empleados en una futura
sucursal. Se solicita a tesorería la información y es la siguiente:
Salario 3000 - 4000 4000 - 5000 5000 - 6000 6000 - 7000 7000 - 8000 8000 - 9000
Empleados 8 10 14 12 4 2
a) Indique la variable, clasifíquela, unidad de análisis y cantidad de observaciones.
b) ¿Cuántos empleados cobran hasta $6000? ¿Qué frecuencia utilizó?
c) ¿Cuál es el porcentaje de empleados que cobran entre $4000 y $5000? ¿Qué frecuencia
utilizó?
d) ¿Cuántos empleados cobran $7000 o más? ¿Qué frecuencia utilizó?
e) ¿Cuál es el porcentaje de empleados que cobran entre $5000 y $8000?
f) Calcule el promedio, la mediana y el modo.
g) Calcule las medidas de variabilidad absoluta.
3.4_ La empresa “Ponto & hermanos” decide contratar a 8 empleados para la nueva sucursal, los
salarios que se pagarán son: $13250; $13500; $13450; $13650; $13500; $13300; $13600; $13350.
a) Defina la variable y clasifíquela. Indique la unidad de análisis.
b) ¿Qué porcentaje de los empleados cobra menos de $13400?
c) ¿Qué porcentaje de los empleados cobra más de $13500? ¿A qué percentil hace referencia
este porcentaje?
d) ¿Cuál es el valor del salario más frecuente?
e) La media aritmética es representativa del conjunto de datos?
Rta.: a) Variable: sueldo cobrado por el personal de la empresa “Ponto & hermanos” en la nueva sucursal. Variable
cuantitativa continua, unidad de análisis: empleados. b) 37,5%. c) 25%, P75. d) $13500. e) Si. CV % = 0,98%.
3.5_ Un negocio inmobiliario tiene departamentos de dos ambientes, con una antigüedad menor
de 10 años. De acuerdo con la zona en la que se encuentran los separó en dos categorías: CABA y
oeste del Gran Buenos Aires. Los precios en dólares son:
CABA: 65000; 83000; 77000; 95000; 110000; 68000; 86000; 132000
Oeste del Gran Buenos Aires: 55000; 67000; 69000; 59000; 85000; 62000; 73000
El dueño de la inmobiliaria está considerando en promocionar los departamentos por Internet.
¿Qué conjunto de datos es más homogéneo?
Defina la variable y clasifíquela. Indique la unidad de análisis.
Rta.: Oeste del Gran Buenos Aires CV % = 13,8%
3.6_ Una empresa que realiza envíos al interior está considerando la posibilidad de aumentar su
flota de camiones ante un incremento de viajes largos, tiene los siguientes datos de los últimos
tres meses:
Distancia en km 300 - 400 400 - 500 500 - 600 600 - 700 700 - 800 800 - 900 900 - 1000
Cantidad de
63 78 85 70 65 55 52
camiones
a) Defina la variable y clasifíquela. Indique la unidad de análisis.
b) ¿Cuál es la distancia más frecuente?
c) ¿Cuál es la distancia del 20% de los viajes más cortos?
d) ¿Cuál es la distancia del 30% de los viajes más largos?
e) ¿Qué porcentaje de los camiones recorren como mínimo 700 km?
f) ¿Qué porcentaje de los camiones recorren como mínimo 720 km?
g) ¿Cuáles son las distancias que recorren los camiones a menos un desvío de la media
aritmética o a más un desvío de la media aritmética?
h) ¿Qué porcentaje de los camiones recorren una distancia a más y menos un desvío estándar
de la media aritmética?
i) ¿Entre qué distancias se encuentran el 25% y el 75% de los camiones?
j) ¿Es la media aritmética representativa?
k) ¿Están sesgados los datos? Si es así indique cómo.
Rta.: a) Distancia recorrida por los camiones, variable cuantitativa continua. Camiones b) 531,8182 km.
c) 439,23 km. d) 748,62 km. e) 36,75% f) 33,97% g) 438,4767 km y 819,2157 km. h) 79,4% - 19,9% = 59,5%
i) 469,2308 km y 784,6154 km j)No, CV % = 30,3% k) Cap 0,5097 Sesgo positivo, asimetría a derecha.
3.7_ En una encuesta a alumnos universitarios de la carrera de Sistemas, una de las preguntas que
se les realizó fue cuántos libros leyeron en el último año, que no fueran de lectura obligatoria. Los
datos son los siguientes:
Cantidad de libros 0 1 2 3 4 5 6 7 8 9
Cantidad de alumnos 8 15 26 34 49 60 55 42 38 23
a) Defina la variable y clasifíquela. Indique la unidad de análisis.
b) ¿Cuántos alumnos fueron pertenecen a la carrera de Sistemas?
c) ¿Qué porcentaje no leyó libros?
d) ¿Qué porcentaje leyó por lo menos 7 libros?
e) ¿Cuál es el promedio de libros leídos por los estudiantes?
f) Indique la forma de la distribución?
g) ¿Qué cantidad de libros leyeron el 50% de los alumnos?
h) ¿Es una distribución homogénea?
Rta.: a) Cantidad de libros de lectura no obligatoria leídos por los alumnos en el último año, variable cuantitativa
discreta. Alumnos. b) 350 alumnos. c) 2,29% d) 29,4% e) 5,14 libros f) CAP = 0,063 asimétrica a derecha, sesgo
positivo g) 5 libros h) No, CV % = 43,9%
3.8_ Se analizan las ventas semanales de en una empresa que fabrica tanzas para bordeadoras es
la siguiente:
Ventas ($) 0 - 6000 6000 - 12000 12000 - 18000 18000 - 24000 24000 - 30000 30000 - 36000
Semanas 4 6 10 16 12 4
a) Defina la variable y clasifíquela. Indique la unidad de análisis.
b) ¿Qué cantidad de semanas las ventas fueron entre $18000 y $ 24000?
c) ¿Qué cantidad de semanas las ventas fueron entre $18000 y $ 30000?
d) ¿Qué porcentaje de semanas se vendieron al menos $24000?
e) ¿Qué porcentaje de semanas se vendieron a lo sumo $12000?
f) Determinar si el promedio es representativo de la distribución.
g) Determinar cuál es el monto de las ventas del 50% de las semanas.
h) Determinar cuál es la forma de la distribución.
3.11_ Una empresa dedicada a seguridad industrial presenta un crecimiento muy importante en
los últimos años. Brinda un servicio de asesoramiento y venta de insumos. Se toman los datos de
los montos de las facturas del último año con el fin de aumentar las ventas a través de una
campaña publicitaria. Se recolectaron los siguientes valores:
Material preparado por Lic. Adriana Ibero 42
LIC. EN ADMINISTRACIÓN DE EMPRESAS - LIC EN RELACIONES COMERCIALES INTERNACIONALES
Monto ($) 500 - 1000 1000 - 1500 1500 - 2000 2000 - 2500 2500 - 3000 3000 - 3500 3500 - 4000
Cantidad
125 189 246 312 298 205 169
de facturas
a) Defina la variable y clasifíquela. Indique la unidad de análisis.
b) ¿Qué porcentaje de las facturas tienen un monto inferior a $2000?
c) ¿Qué cantidad de facturas hay con un monto mayor a $1500?
d) ¿Qué porcentaje de las facturas tienen un monto superior a $3000?
e) ¿Qué cantidad de facturas hay con un monto menor a $2500?
f) ¿Qué porcentaje de las facturas tienen un monto entre $1500 y $3000?
g) ¿Qué cantidad de facturas hay con un monto entre $2000 y $3500?
h) ¿Cuál es el monto promedio?
i) ¿Cuál es el monto más frecuente?
j) ¿Cuál es el monto del 50% de las facturas de menor valor?
k) Indique la forma de la distribución.
l) ¿Cuál es el máximo del 30% de las facturas de menor monto?
m) ¿Cuál es el mínimo del 25% de las facturas de mayor monto?
n) ¿Es el promedio de lotes separados representativo de la distribución?
o) ¿Qué porcentaje de la distribución se encuentra a más o menos un desvío estándar de la
media?
p) ¿Qué porcentaje de la distribución se encuentra entre más o menos un desvío estándar de
la media?
q) Indique entre qué valores e encuentra el 60% central de la distribución.
r) Indique el porcentaje de facturas menores a $2200
s) Indique el porcentaje de facturas que superan los $2200
t) Grafique la frecuencia absoluta simple. Halle el modo gráficamente.
u) Grafique la frecuencia absoluta acumulada. Halle la mediana, cuartil 1 y cuartil 3
gráficamente.
Rta.: b) 36,27% c) 1230 facturas d) 24,22% e) 872 facturas f) 55,44% g) 815 facturas h) $2319,95
i) $2412,50 j) $2339,74 k) Asimétrica a izquierda, l) $1803,25 m) $2979,87 n) No. CV % =37,75%
sesgo negativo o) 38% p) 62% q)Entre $1486,24 y $ 3159,02 r) 44,4% s) 55,6%
3.12_ Considere una distribución de 7 observaciones y obtenga las tres medidas. A la misma
distribución cuadriplique el último valor y obtenga nuevamente las tres medidas. De las tres
medidas de posición ¿cuáles se ven afectadas por valores extremos?
3.13_ Una empresa que realiza envíos al interior está considerando la posibilidad de aumentar su
flota de camiones ante un incremento de viajes largos, tiene los siguientes datos de los últimos
tres meses:
Distancia en km 300 - 400 400 - 500 500 - 600 600 - 700 700 - 800 800 - 900 800 - 900
Camiones 63 78 85 70 65 55 52
Material preparado por Lic. Adriana Ibero 43
LIC. EN ADMINISTRACIÓN DE EMPRESAS - LIC EN RELACIONES COMERCIALES INTERNACIONALES
3.14_ Una empresa indica el día de la semana que realizó depósitos bancarios. Tiene un total de
30 depósitos en los últimos 6 meses. Los datos son:
martes jueves lunes miércoles jueves lunes viernes jueves
martes lunes viernes jueves viernes miércoles lunes martes
martes jueves viernes miércoles lunes miércoles jueves jueves
viernes martes miércoles jueves viernes lunes jueves lunes
3.15_ Una empresa gastronómica a nivel nacional tiene distintos proveedores y necesita evaluar la
situación de estos; los datos de las compras son los siguientes:
A C F E G G B E C D
A F E D G C A E G A
A F E D G C A E G A
F G A D D B E C E G
A D B E G F D A G E
B E D A C E F B E A
a) Indique la variable, tipo de variable
b) Realice una tabla estadística y grafique
c) Halle las medidas estadísticas que considere adecuadas