Brayan Gamboa. Actividad Número 4.

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 29

UNIVERSIDAD NACIONAL EXPERIMENTAL DEL TÁCHIRA

VICERRECTORADO ACADÉMICO
DECANATO DE DOCENCIA
DEPARTAMENTO DE MATEMÁTICA Y FÍSICA
UNIDAD CURRICULAR: ESTADÍSTICA

ACTIVIDAD DE APRENDIZAJE N° 4:
RESOLUCIÓN DE EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL Y
POSICIÓN

Brayan Alejandro Gamboa Leal


Nombre: __________________________________ 26 988 878
CI: ____________________

1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas medidas en °C:
32, 31, 28, 29, 33, 26, 31, 32, 31, 31,
23, 28, 29, 25, 34, 31, 31, 30, 30, 29,
27, 30, 30, 31, 30, 31, 34, 33, 33, 30,
29.
a) Construir una tabla de frecuencia
b) Calcular las medidas de tendencia central: Media aritmética, mediana y moda
c) Calcular las medidas de posición: Q1, D3 y P40.

Resolución
Inciso a. Construcción de la tabla de frecuencia para datos no agrupados
a.1 Primeramente, se procede a ordenas los datos de manera ascendente.
23 25 26 27 28 28 29 29 29 29
30 30 30 30 30 30 31 31 31 31
31 31 31 31 32 32 33 33 33 34
34
a.2 Al tratarse de un conjunto de datos en el que varias de las mediciones constan de
valores repetidos de temperatura, se opta por la elaboración de una tabla de frecuencias
para datos no agrupados.

Para el llenado de la tabla de frecuencia, solamente se tomarán en cuenta las


frecuencias simples o absolutas y la frecuencia acumulada, pues es información
suficiente para los cálculos de las medidas de tendencia central pertinentes.
Para recordar, la frecuencia absoluta consiste solamente en el conteo de veces en que
se repite un dato, y la frecuencia acumulada es la cantidad de mediciones que se llevan
estudiadas hasta el momento.

Tabla 1. Temperaturas máximas medidas en


grados centígrados en una ciudad
Temperaturas
Ciudad determind (ºC) fi fa
23 1 1
25 1 2
26 1 3
27 1 4
28 2 6
29 4 10
30 6 16
31 8 24
32 2 26
33 3 29
34 2 31
Total 31
Fuente. Data de la actividad 4.

Hasta este momento esta es la tabla de frecuencias necesaria. Para el posterior cálculo
de las medidas de tendencia central, se le anexará una columna más que representa la
suma del valor del dato en cuestión tantas veces como aparezca en la distribución.

Inciso b. Cálculo de las medidas de tendencia central


Media aritmética
b.1.1 Para realizar este cálculo, se hará uso de la siguiente fórmula

∑𝑖=𝑛
𝑖=1 𝑓𝑖 ∙𝑥𝑖 (1)
𝑋̅ =
𝑁
de donde:

𝑋̅ representa la media aritmética del conjunto


𝑥𝑖 representa cada dato diferente de la muestra
𝑓𝑖 representa la frecuencia de cada dato en la muestra
𝑁 representa el número total de mediciones
∑𝑖=𝑛
𝑖=1 𝑓𝑖 𝑥𝑖 representa la suma de cada producto del dato con su frecuencia
b.1.2 Con el fin de hacer este cálculo más compacto y bien organizado, a la tabla 1 se
la anexa una nueva columna que corresponda con el cálculo de 𝑓𝑖 ∙ 𝑥𝑖 y se completan
las casillas, obteniendo así al final de esta columna la suma total de todos estos
productos.
Tabla 2. Temperaturas máximas medidas en grados
centígrados en una ciudad. Extendida.
Temperaturas
Ciudad determind (ºC) fi fa 𝒇𝒊 ∙ 𝒙𝒊
23 1 1 23
25 1 2 25
26 1 3 26
27 1 4 27
28 2 6 56
29 4 10 116
30 6 16 180
31 8 24 248
32 2 26 64
33 3 29 99
34 2 31 68
Total 31 932
Fuente. Data de la actividad 4.

Por lo tanto, aplicando la fórmula (1) para hallar la media aritmética

∑𝑖=𝑛
𝑖=1 𝑓𝑖 ∙𝑥𝑖
𝑋̅ =
𝑁
∑𝑖=11
𝑖=1 𝑓𝑖 ∙𝑥𝑖
𝑋̅ =
31
23 + 25 + 26 + 27+ 56 + 116 + 180 + 248 + 64 + 99 + 68
𝑋̅ =
31
932
𝑋̅ = ≈ 30, 06
31
̅ = 30.1ºC
𝑿

Se tiene entonces que la temperatura máxima a la que tienden las demás temperaturas
es de 30,1ºC. En otras palabras, el promedio de temperatura durante el mes de julio fue
de 30,1ºC

Nota: La media se redondeó a un decimal dada la recomendación de expresar los


resultados de las medidas de tendencia central con un decimal adicional del que tienen
los datos (Triola, M. 2018. Estadística. Pág. 86)
Mediana
b.2.1 En primer lugar, los datos deben estar estrictamente ordenados de menor a mayor.

23 25 26 27 28 28 29 29 29 29
30 30 30 30 30 30 31 31 31 31
31 31 31 31 32 32 33 33 33 34
34
b.2.2 Se identifica si el conjunto de datos contiene un número par o impar de ellos. En
este caso, la familia de mediciones es de carácter impar. Se determina el valor de la
mediana a través de la expresión

𝑀𝑒 = 𝑥(𝑛+1) (2)
2

De donde

𝑀𝑒 es el valor de la mediana

𝑥 es el valor de la medición

𝑛 es el total de mediciones
𝑛+1
corresponde a la posición en donde se encuentra el dato que corresponde a la
2
mediana. Es el subíndice.

b.2.3 Determinar cuál valor es la mediana aplicando (2)

𝑀𝑒 = 𝑥(𝑛+1)
2

𝑀𝑒 = 𝑥(31+1)
2

𝑀𝑒 = 𝑥(32)
2

𝑀𝑒 = 𝑥16

La mediana es el valor número 16 en la data ordenada de menor a mayor que, para


caso, 𝑥16 = 30º C

𝑴𝒆 = 30º C

Esto indica que el 50% de las temperaturas registradas durante el mes de julio
están por debajo de los 30 grados centígrados; o también que el otro 50% está
por encima de este valor.
Moda
b.3.1 Para hallar esta medida, solo basta con observar la tabla 1 o la tabla 2 y escoger
cuál es el valor con el mayor valor de frecuencia simple. En este caso, el mayor número
de frecuencia es 8 para la temperatura de 31ºC, por lo tanto

Mo = 31ºC

Este conjunto de datos cuenta con una sola moda, por lo tanto, es unimodal

Inciso c. Cálculo de las medidas de posición


Primer cuartil 𝑸𝟏
c.1.1 Esta es una de las medidas de posición que permiten dividir la data en cuatro
partes. Se calculará la primera de esas divisiones por medio de la siguiente fórmula

𝑖 ∙(𝑛+1)
𝑃𝑄𝑖 = (3)
4
de donde

𝑃𝑄𝑖 es la posición del cuartil 𝑄𝑖

𝑖 es el número de cuartil con el que se trabaja

𝑛 es el número de datos

c.1.2 Aplicar la fórmula para el primer cuartil

𝑖 ∙(𝑛+1)
𝑃𝑄𝑖 =
4
1 ∙(31+1)
𝑃𝑄1 =
4
32
𝑃𝑄1 =
4
𝑷𝑸𝟏 = 8
Observando nuevamente la distribución

23 25 26 27 28 28 29 29 29 29
30 30 30 30 30 30 31 31 31 31
31 31 31 31 32 32 33 33 33 34
34
El primer cuartil se encuentra en la posición número 8 del conjunto de datos, cuando la
temperatura es igual a 29ºC. Al ser el primer valor de tres que dividen al conjunto en
cuatro partes iguales o casi iguales, significa que el 25% de las temperaturas máximas
reportadas no superan los 29ºC.

Tercer decil 𝑫𝟑
c.2.1 Los deciles dividen la data en diez partes. Se usa la siguiente fórmula

𝑖 ∙(𝑛+1)
𝑃𝐷𝑖 = (4)
10
de donde

𝑃𝐷𝑖 es la posición del decil 𝐷𝑖

𝑖 es el número de decil con el que se trabaja

𝑛 es el número de datos

c.2.2 Aplicar la fórmula (4)


𝑖 ∙(𝑛+1)
𝑃𝐷𝑖 =
10
3 ∙(31+1)
𝐷3 =
10
3 ∙(32)
𝐷3 =
10
3 ∙(32)
𝐷3 =
10
96
𝐷3 =
10
𝑫𝟑 = 𝟗, 𝟔 ≈ 𝟏𝟎
El decil número 3 se encuentra en la posición 10 del conjunto
23 25 26 27 28 28 29 29 29 29
30 30 30 30 30 30 31 31 31 31
31 31 31 31 32 32 33 33 33 34
34
El cuartil tres corresponde al 30%, esto indica que el 30% de las temperaturas para el
mes de julio son menores o iguales a 29ºC
Cuadragésimo percentil 𝑷𝟒𝟎
c.3.1 Los percentiles dividen la data en 100 partes iguales. Se calculan mediante la
fórmula

𝑖 ∙(𝑛+1) (5)
𝑃𝑃𝑖 =
100
de donde

𝑃𝑃𝑖 es la posición del percentil 𝑃𝑖

𝑖 es el número de percentil con el que se trabaja

𝑛 es el número de datos

c.3.2 Hallar el percentil usando a (4)

𝑖 ∙(𝑛+1)
𝑃𝑃𝑖 =
100
40 ∙(31+1)
𝑃𝑃40 =
100
40 ∙(32)
𝑃𝑃40 =
100
1280
𝑃𝑃40 =
100
𝑷𝑷𝟒𝟎 = 𝟏𝟐, 𝟖𝟎 ≈ 𝟏𝟑
El percentil número cuarenta se encuentra en la posición 13 del conjunto

23 25 26 27 28 28 29 29 29 29
30 30 30 30 30 30 31 31 31 31
31 31 31 31 32 32 33 33 33 34
34
Este corresponde al 40% de los datos, por lo que se puede decir que el 40% de las
temperaturas para el mes de julio fueron registradas con valores menores o iguales a
30ºC
2. El dueño de restaurante EL GUSTAZO desea conocer el precio promedio del café, el
cual ofrece al público en tres tamaños: pequeño, mediano y grande. El tamaño pequeño
cuesta $0.25, el mediano $0.75 y el grande $1.10. Un día a la semana él observó que
se vendieron 20 cafés pequeños, 50 medianos y 30 grandes, ¿cuál es el precio
ponderado por café?

Resolución
2.1 Se necesita conocer el precio promedio del café dadas tres tarifas diferentes. No
obstante, cada una va asociada a un determinado tamaño de la taza de su presentación.
Además, han sido vendidas diferentes cantidades de las tres presentaciones
disponibles. Esto quiere decir que se hace necesario el cálculo de una media
ponderada.

Para ello, se recurre a la siguiente expresión:

∑𝑖=𝑛
𝑖=1 𝑤𝑖 ∙𝑥𝑖 (6)
𝑥̅𝑝 =
∑𝑖=𝑛
𝑖=1 𝑤𝑖
de donde:

𝑋̅𝑝 representa la media aritmética del conjunto

𝑥𝑖 representa cada dato diferente de la muestra

𝑤𝑖 representa el peso que tiene el dato sobre el total

𝑛 representa el número total de mediciones

∑𝑖=𝑛
𝑖=1 𝑤𝑖 𝑥𝑖 representa la suma de cada producto del dato con su peso

∑𝑖=𝑛
𝑖=1 𝑤𝑖 representa la suma de cada peso de los datos

2.2 Se procede a distinguir los datos y sus pesos


• Datos: $0,25 el café pequeño, $0,75 el mediano y $1,10 el grande.
• Pesos: 20 tazas para el pequeño, 50 tazas para el mediano y 30 tazas para el grande.

2.3 Entonces se procede a hallar el precio ponderado del café mediante (6)

∑𝑖=𝑛
𝑖=1 𝑤𝑖 ∙𝑥𝑖
𝑥̅𝑝 =
∑𝑖=𝑛
𝑖=1 𝑤𝑖
20∙(0,25) + 50∙(0,75) + 30∙(1,10)
𝑥̅𝑝 =
20 + 50 + 30

5 + 37,5 + 33
𝑥̅𝑝 =
100

75,5
𝑥̅𝑝 =
100

̅𝒑
𝒙 = $𝟎, 𝟕𝟓𝟓 ≈ $𝟎, 𝟕𝟔

El precio ponderado para el café es de aproximadamente 0,76 dólares, o lo que


es lo mismo, 76 centavos.

3. Las ganancias obtenidas por la empresa de construcción TODO QUEDA BIEN en


cuatro proyectos recientes fueron de: 3%, 2%, 4% y 6%, ¿Cuál fue la media de la
ganancia?

Resolución
3.1 Al tratarse de la media de una serie de porcentajes de ganancia, la medida de
tendencia central más apta para este caso es la media geométrica. Esta permite
determinar el cambio de porcentaje en ventas o cualquier otra actividad económica.

Se calcula mediante

𝑖=𝑛
𝑛
𝐺 = √∏ 𝑥𝑖 (7)
𝑖=1

De donde

𝐺 representa a la media geométrica

𝑛 representa el número total de mediciones


∏𝑖=𝑛
𝑖=1 𝑥𝑖 representa los productos o multiplicaciones continuas entre los datos
3.2 Hay un total de 4 porcentajes (n = 4). Se procede a hallar la media de la ganancia.
En este caso se escogerá por preservar la forma de porcentaje de los datos y no llevarlo
a su equivalente decimal.

𝑖=𝑛
𝑛
𝐺 = √∏ 𝑥𝑖
𝑖=1

4
𝐺 = √3 ∙ 2 ∙ 4 ∙ 6
4
𝐺 = √144
𝑮 ≈ 3, 46%
La media de la ganancia de la empresa de construcción TODO QUEDA BIEN fue de
aproximadamente 3,46%

4. Los siguientes datos corresponden a la ganancia de peso por día (expresada en


gramos), de novillos sometidos a una dieta experimental.
704 890 986 806 798 995 876 705 706 915
801 720 807 960 858 606 798 708 893 906
660 780 615 895 969 880 700 697 804 918
825 809 758 705 800 910 896 708 690 830
Obtener medidas descriptivas, graficar e interpretar la información contenida en esta
muestra.

Resolución
4.1 Primeramente, se organizan los datos en orden ascendente.

606 615 660 690 697 700 704 705 705 706

708 708 720 758 780 798 798 800 801 804

806 807 809 825 830 858 876 880 890 893

895 896 906 910 915 918 960 969 986 995

Debido a la naturaleza de la gama de datos y a la casi nula repetición de valores, se


procede entonces a analizar el conjunto en forma de datos agrupados.

4.2 Primero se calcula el rango para la distribución como se ha v como la diferencia


entre el mayor y la menor medida del conjunto.
𝑅𝑎𝑛𝑔𝑜 = 𝑑𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 (8)
𝑅𝑎𝑛𝑔𝑜 = 995 − 606

𝑅𝑎𝑛𝑔𝑜 = 389

4.3 Calcular el número de clases (K) por medio de la regla de Sturges


𝐾 = 1 + 3,322 𝑙𝑜𝑔 𝑛
Donde es el número de mediciones. En este caso, n es igual a 40. Entonces:

𝐾 = 1 + 3.322𝑙𝑜𝑔 (40)

𝐾 ≈ 6,322 ≈ 7

4.4. Calcular el intervalo de clase IC mediante la fórmula


𝑅𝑎𝑛𝑔𝑜
𝐼𝐶 = (9)
𝐾
389
𝐼𝐶 = ≈ 55,57 ≈ 56
7

Se redondea a un valor entero debido a que el conjunto de datos está dado de forma de
enteros.

4.5 Construir la tabla de frecuencias para los datos no agrupados

Tabla 3. Ganancia de peso por día en gramos de un grupo de novillos


sometidos a una dieta experimental

Clase Li Ls 𝒙𝒊 fi fa
1 606 661 633,5 3 3
2 662 717 689,5 9 12
3 718 773 745,5 2 14
4 774 829 801,5 10 24
5 830 885 857,5 4 28
6 886 941 913,5 8 36
7 942 997 969,5 4 40
Total 40
Fuente. Cálculos propios, 2021
Observaciones

• Para la ubicación de la data se recurrió al empleo de colores para distinguir con


mayor facilidad a qué clase pertenecía cada valor. Cada grupo de datos fue
resaltado con el respectivo color al de la clase a la cual pertenece.

• La columna 𝑥𝑖 corresponde a las marcas de clase, que es el punto medio o


representativo de la misma. Se trata de una serie de datos que se obtiene con el
fin de intentar modelar el conjunto de datos como una serie de datos no
agrupados. Es entonces el promedio. Se calcula mediante la fórmula
𝐿𝑖 + 𝐿𝑠
𝑥𝑖 = (10)
2

Para cada una de las clases. Por ejemplo, la clase 1 quedaría

606+ 661
𝑥2 = = 633,5
2

4.6 Calcular medidas descriptivas para este conjunto

De tendencia central
Media aritmética
* Primeramente se agrega la columna correspondiente a la multiplicación de las marcas
de clase con sus respectivas frecuencias, 𝑓𝑖 ∙ 𝑥𝑖 , a la tabla 3

Tabla 4. Ganancia de peso por día en gramos de un grupo de novillos


sometidos a una dieta experimental. Extendida

Clase Li Ls 𝒙𝒊 fi fa 𝒇𝒊 ∙ 𝒙𝒊
1 606 661 633,5 3 3 1900,5
2 662 717 689,5 9 12 6205,5
3 718 773 745,5 2 14 1491
4 774 829 801,5 10 24 8105
5 830 885 857,5 4 28 3430
6 886 941 913,5 8 36 7308
7 942 997 969,5 4 40 3878
Total 40 32318
Fuente. Cálculos propios, 2021

* La ecuación (1) se puede aplicar igualmente para este caso, con la única diferencia
de que 𝑥𝑖 ya no corresponde al valor de una sola medida, sino a la marca de clase.
Se usa la N con el fin de diferenciarla de la otra n usada para los límites del operador
Sigma. En este caso, N es igual a 40.
∑𝑖=𝑛
𝑖=1 𝑓𝑖 ∙𝑥𝑖
𝑋̅ =
𝑁
32318
𝑋̅ =
40
̅ = 807,95 gramos
𝑿
Según este resultado, la ganancia de peso por día entre los novillos tiende a ser de 807,
95 gramos, o es este resultado en promedio.

Mediana
* Para el cálculo de esta medida, como es una distribución par, se requiere de la
siguiente expresión
𝑛
− 𝑓𝑎 𝑖−1
2 (11)
𝑀𝑒 = 𝐿𝑖 + ∙ 𝐼𝐶
𝑓𝑖
de donde
𝒏 indica en qué clase se encuentra la mediana mediante la frecuencia
𝟐 acumulada. El dato 𝑛 es el número de mediciones La clase a la que apunta
recibe el nombre de clase medianal

𝒇𝒂 𝒊−𝟏 Es la frecuencia acumulada anterior a la clase medianal

𝒇𝒊 Es la frecuencia absoluta de la clase medianal

𝑳𝒊 Es el límite inferior de la clase medianal

𝑰𝑪 Es el intervalo de clase

* Se calcula entonces la clase medianal

𝑛 40
= = 20
2 2

* Se busca en la tabla 3 o en la tabla 4 la clase que contenga una frecuencia acumulada


igual o superior a 20. En este caso, tal búsqueda corresponde con la clase 4. Esta es
la clase medianal. Se procede a sustituir los valores correspondientes a esta clase en la
fórmula. La frecuencia acumulada anterior a esta clase es de 14; su frecuencia absoluta,
de 10; su límite inferior, de 774 y su intervalo de clase, al igual que los demás, de 56.
𝑛
− 𝑓𝑎 𝑖−1
2
𝑀𝑒 = 𝐿𝑖 + ∙ 𝐼𝐶
𝑓𝑖

𝑀𝑒 = 774 + (20 10
− 14
) ∙ 56

6 ) ∙ 56
𝑀𝑒 = 774 + (10

6
𝑀𝑒 = 774 + (10 ) ∙ 56

𝑀𝑒 = 774 + (336
10
)

𝑀𝑒 = 774 + 33,6

𝑴𝒆 = 807,6 ≈ 808 gramos por día

Se puede decir que el 50% de los pesos de los novillos están por debajo de
aproximadamente los 808 gramos.

Moda

* Como se trata de una distribución de datos agrupados, lo primero que se hace en este
caso es escoger la clase en que existe la mayor frecuencia de valores. Esta clase es la
que recibirá el nombre de clase modal

Tabla 4. Ganancia de peso por día en gramos de un grupo de novillos


sometidos a una dieta experimental. Extendida

Clase Li Ls 𝒙𝒊 fi fa 𝒇𝒊 ∙ 𝒙𝒊
1 606 661 633,5 3 3 1900,5
2 662 717 689,5 9 12 6205,5
3 718 773 745,5 2 14 1491
4 774 829 801,5 10 24 8105
5 830 885 857,5 4 28 3430
6 886 941 913,5 8 36 7308
7 942 997 969,5 4 40 3878
Total 40 32318
Fuente. Cálculos propios, 2021
Como se determinó, la clase número 4 constituye la clase modal.

* Como resulta ser una distribución par, se utiliza la siguiente expresión para el cálculo
de la moda:

𝑑1
𝑀𝑜 = 𝐿𝑖 + ∙ 𝐼𝐶 (12)
𝑑1 + 𝑑2

De donde

𝑳𝒊 es el límite inferior de la clase modal

𝒅𝟏 es la diferencia entre la frecuencia de la clase modal y la frecuencia anterior a


la clase modal. Es decir

𝑑1 = 𝑓𝑚 − 𝑓𝑚−1 (13)
𝒅𝟐 es la diferencia entre la frecuencia de la clase modal y la frecuencia siguiente
a la clase modal. Es decir

𝑑2 = 𝑓𝑚 − 𝑓𝑚+1 (14)
𝑰𝑪 es el intervalo de clase

* De la tabla 4 se pueden extraer estos datos para el previo cálculo de 𝑑1 y 𝑑2

𝑓𝑚 = 10 𝑑1 = 𝑓𝑚 − 𝑓𝑚−1
𝑓𝑚−1 = 2 𝑑1 = 10 − 2
𝑓𝑚+1 = 4 𝑑1 = 8

𝑑2 = 𝑓𝑚 − 𝑓𝑚+1
𝑑1 = 10 − 4
𝑑2 = 6

* Se aplica entonces la expresión (12) anteriormente descrita para hallar la moda

𝑑1
𝑀𝑜 = 𝐿𝑖 + ∙ 𝐼𝐶
𝑑1 + 𝑑2
8
𝑀𝑜 = 774 + (8+ 6 ) ∙ 56
8
𝑀𝑜 = 774 + ( ) ∙ 56
14
448
𝑀𝑜 = 774 +
14

𝑀𝑜 = 774 + 32
𝑴𝒐 = 𝟖𝟎𝟔 gramos por día
Esto quiere decir que el peso que más frecuencia tuvo entre los novillos ronda entre los
806 gramos

De posición
Primer cuartil 𝑸𝟏
* Para el cálculo de esta medida de posición, al tratarse de datos agrupados por
intervalos, re realiza un procedimiento muy similar al aplicado para el cálculo de la
media. La expresión

𝑖 ∙𝑛
𝑃𝑄𝑖 = (15)
4
Permite ubicar la clase en donde se encuentra el primer cuartil del conjunto de datos
mediante la frecuencia acumulada; el resultado obtenido, como se hizo con la mediana,
será comparado con aquella clase que posea el mismo o superior valor al encontrado.

Como se desea calcular el primer cuartil, 𝑖 = 1 y 𝑛 es el número de datos, en este caso,


40.

𝑖 ∙𝑛 (1) ∙(40) 40
𝑃𝑄1 = = = = 10
4 4 4

Este resultado indica que en la tabla 4 se debe buscar el valor de frecuencia acumulada
que sea igual o superior a 10. La clase que cumple este requerimiento es la clase 2 con
una frecuencia acumulada de 12. Entonces, se extraen los valores pertenecientes a esta
para ser usados en la siguiente expresión:

𝑖 ∙𝑛
− 𝑓𝑎 𝑗−1 (16)
4
𝑄𝑖 = 𝐿𝑖 + ∙ 𝐼𝐶
𝑓𝑗
De donde

𝒊 es el número de cuartil con el que se trabaja

𝒋 es la posición de la clase en donde se encuentra el cuartil

𝒇𝒋 es la frecuencia simple de la clase en donde está el cuartil

𝒇𝒂 𝒋−𝟏 es la frecuencia acumulada de la clase anterior a la clase del cuartil

𝑳𝒊 es el límite inferior de la clase en donde se halla el cuartil

𝑰𝑪 es el intervalo de clase

* Al sustituir los respectivos valores en la expresión anterior (16) ya es posible


determinar el cuartil correspondiente

𝑖 ∙𝑛
− 𝑓𝑎 𝑗−1
4 𝒇𝒋 = 𝒇𝟐 = 9
𝑄𝑖 = 𝐿𝑖 + ∙ 𝐼𝐶
𝑓𝑗
𝐿𝑖 = 662
10 −3
𝑄1 = 662 + ( 9
) ∙ 56 𝐼𝐶 = 56

𝑓𝑎 𝑗−1 = 𝑓𝑎 1 = 3

7
𝑄1 = 662 + (9) ∙ 56
392
𝑄1 = 662 +
9
𝑄1 = 662 + 43,56
𝑸𝟏 = 𝟕𝟎𝟓, 𝟓𝟔 ≈ 𝟕𝟎𝟔 gramos por día
El 25% de los pesos en gramos por día de los novillos es menor o igual a los 706 gramos,
o es lo mismo que decir que el 75% de estos superan los 706 gramos.
Sexto decil 𝑫𝟔
* Se desea calcular, por ejemplo, el sexto decil. Se procede a ubicar la clase en la que
se encuentra el decil, con una expresión similar a la anteriormente usada para el cálculo
del cuartil.

𝑖 ∙𝑛
𝑃𝐷𝑖 = (17)
10

Como se desea calcular el sexto decil, 𝑖 = 6 y 𝑛 es el número de datos, en este caso,


40.

𝑖 ∙𝑛 (6) ∙(40) 240


𝑃𝐷6 = = = = 24
10 10 10
Este resultado indica que en la tabla 4 se debe buscar el valor de frecuencia acumulada
que sea igual o superior a 24. La clase que cumple este requerimiento es la clase 4 con
una frecuencia acumulada de 24. Entonces, se extraen los valores pertenecientes a esta
para ser usados en la siguiente expresión, semejante a la del cálculo del cuartil:

𝑖 ∙𝑛
− 𝑓𝑎 𝑗−1
10
𝐷𝑖 = 𝐿𝑖 + ∙ 𝐼𝐶 (18)
𝑓𝑗

Las variables representan las mismas magnitudes que las de la fórmula para el cálculo
de cuartiles.

* Al sustituir los respectivos valores en la expresión anterior ya es posible determinar el


cuartil correspondiente

𝑖 ∙𝑛
− 𝑓𝑎 𝑗−1
10
𝐷𝑖 = 𝐿𝑖 + ∙ 𝐼𝐶 𝒇𝒋 = 𝒇𝟒 = 10
𝑓𝑗
𝐿𝑖 = 774
𝐷6 = 774 + (2410
− 14) ∙ 56
𝐼𝐶 = 56

𝑓𝑎 𝑗−1 = 𝑓𝑎 3 = 14
𝐷6 = 774 + (10
10
) ∙ 56

𝐷6 = 774 + 56
𝑫𝟔 = 𝟖𝟑𝟎 gramos por día
El 60% del grupo de novillos tiene un peso en gramos por día menor o igual a 830
gramos.

Decimoquinto percentil 𝑷𝟏𝟓


* Ahora se desea calcular el decimoquinto percentil. Se procede a ubicar la clase en la
que se encuentra el percentil, con una expresión similar a las anteriormente usadas para
el cálculo del cuartil y del decil.

𝑖 ∙𝑛 (19)
𝑃𝑃𝑖 =
100
Como se desea calcular el decimoquinto percentil, 𝑖 = 15 y 𝑛 es el número de datos, en
este caso, 40.

𝑖 ∙𝑛 (15) ∙(40) 600


𝑃15 = = = =6
100 100 100
Este resultado indica que en la tabla 4 se debe buscar el valor de frecuencia acumulada
que sea igual o superior a 6. La clase que cumple este requerimiento es la clase 2 con
una frecuencia acumulada de 12. Entonces, se extraen los valores pertenecientes a esta
para ser usados en la siguiente expresión, semejante a la del cálculo del cuartil y al del
decil:

𝑖 ∙𝑛
− 𝑓𝑎 𝑗−1
100 (20)
𝑃𝑖 = 𝐿𝑖 + ∙ 𝐼𝐶
𝑓𝑗
Las variables representan las mismas magnitudes que las de la fórmula para el cálculo
de cuartiles y deciles.

* Al sustituir los respectivos valores en la expresión anterior ya es posible determinar el


cuartil correspondiente

𝑖 ∙𝑛
− 𝑓𝑎 𝑗−1 𝒇𝒋 = 𝒇𝟐 = 9
100
𝑃𝑖 = 𝐿𝑖 + ∙ 𝐼𝐶
𝑓𝑗 𝐿𝑖 = 662

𝑃15 = 662 + (6 −
9
3) ∙ 56 𝐼𝐶 = 56

𝑓𝑎 𝑗−1 = 𝑓𝑎 1 = 3
𝑃15 = 662 + (3
9
) ∙ 56

168
𝑃15 = 662 +
9
𝑃15 = 662 + 18,67
𝑷𝟏𝟓 = 𝟔𝟖𝟎, 𝟔𝟕 ≈ 𝟔𝟖𝟏 gramos por día
Esto indica que el 15% del peso en gramos por día de los novillos es menor o igual a
aproximadamente 681 gramos.

4.7 Realizar una representación gráfica

Gráfica 1. Ganancia de peso por día expresada en gramos de


40 novillos sometidos a una dieta expermiental

10
Número de novillos

0
606-661 662-717 718-773 774-829 830-885 889-941 942-997
Ganancia de peso por día (en gramos)

Gráfica 2. Ganancia de peso por día expresada en gramos de


40 novillos sometidos a una dieta expermiental
12

10
Número de novillos

0
606-661 662-717 718-773 774-829 830-885 889-941 942-997
Ganancia de peso por día (en gramos)
Observaciones:

• Para esta distribución de datos, lo primero que se puede observar a simple vista
es que la organización de los datos en sus respectivas clases es casi pareja, o
en términos más formales, parece ser simétrica. Si se observa la gráfica 1 o la
gráfica 2, se puede notar que la altura de los rectángulos de frecuencia a ambos
lados del rectángulo central más alto es semejante. Esto se debe a que, dado el
centro de la distribución, las distribuciones para las clases adyacentes tienen
valores parecidos.

• Lo que determina si la distribución es realmente simétrica son las medidas de


tendencia central. Si estas poseen el mismo valor, se dice que la distribución es
simétrica. En el caso del estudio en cuestión, sus valores son casi los mismos,
de allí que parezca ser simétrica

𝑥̅ = 807,95
𝑀𝑒 = 807,6
𝑀𝑜 = 806

Sin embargo, si se comparan estos tres valores, es posible notar que

𝑀𝑜 < 𝑀𝑒 < 𝑥̅
806 < 807,6 < 807,95

Pese a que algunos valores en términos de aproximación son prácticamente los


mismos, hay que tener cuidado, pues para poder considerar estas magnitudes
de igual valor, el error o la diferencia entre sus cifras significativas debe ser lo
mínima posible. En este caso, esa diferencia entre los valores informa que la
distribución realmente no es simétrica. Este conjunto tiende a ser simétrico,
pero realmente está sesgado ligeramente o asimétrico a la derecha por la
condición planteada arriba
5. Halle la media aritmética, media geométrica, mediana y moda con los siguientes datos
sin agrupar: 3, 6, 13, 22, 46, 89. ¿Cuál de estas medidas estadísticas es mejor y por
qué?

Resolución
5.1 Cálculo de la media aritmética

Como se trata de un conjunto de datos no agrupados, se prosigue al cálculo de la media


aritmética mediante la fórmula (1), en donde las frecuencias de cada dato son igual a 1.

∑𝑖=𝑛
𝑖=1 𝑓𝑖 ∙𝑥𝑖
𝑋̅ = Todas las frecuencias absolutas son 1
𝑁
∑𝑖=𝑛
𝑖=1 𝑥𝑖
𝑋̅ =
𝑁

Aplicando la fórmula, donde N = 6 y n=6, se tiene que

∑𝑖=𝑛
𝑖=1 𝑥𝑖
𝑋̅ =
𝑁
3 + 6 + 13 + 22 + 46 + 89
𝑋̅ =
6
179
𝑋̅ =
6
̅ = 𝟐𝟗, 𝟖
𝑿
Según este resultado, los datos “tienden” a 29

5.2 Cálculo de la media geométrica

Para realizar este cálculo, basta con aplicar (7) para los seis datos existentes

𝑖=𝑛
𝑛
𝐺 = √∏ 𝑥𝑖
𝑖=1

6
𝐺 = √3 ∙ 6 ∙ 13 ∙ 22 ∙ 46 ∙ 89
6
𝐺 = √21 075 912

𝑮 = 𝟏𝟔, 𝟔𝟐

5.3 Cálculo de la mediana

Como se trata de un conjunto de datos no agrupados de cantidad par, se emplea la


siguiente expresión:

𝑥𝑛 + 𝑥𝑛
2 2 +1 (21)
𝑀𝑒 =
2

donde 𝑥𝑛 y 𝑥𝑛+1 son los valores centrales del conjunto y n es el número de datos.
2 2

Se aplica entonces (21) para hallar el valor de la mediana

𝑥𝑛 + 𝑥𝑛
+1
2 2
𝑀𝑒 =
2
𝑥6 + 𝑥6
2 2+1
𝑀𝑒 =
2
𝑥3 + 𝑥4
𝑀𝑒 =
2
Como las medidas ya se encuentran ordenadas de manera ascendente, se puede
decir que 𝑥3 = 13 y 𝑥4 = 22

𝑥3 + 𝑥4
𝑀𝑒 =
2
13+ 22
𝑀𝑒 =
2
35
𝑀𝑒 =
2
𝑴𝒆 = 17,5
5.4 Cálculo de la moda

Debido a que ninguno de los valores de las distintas mediciones se repite, se puede
decir que el conjunto no posee moda.

5.5 Elección de medida de tendencia central

La medida de tendencia central para este grupo de datos es entonces la media


geométrica. Es posible afirmar esto dado que la distribución de datos, ordenada de
forma ascendente, se apega casi totalmente a la definición de una progresión
geométrica.

Recordando que una progresión geométrica es de la forma 𝑎𝑛 = 𝑎1 ∙ 𝑟 𝑛−1 para la


obtención de cada término de la razón, se sabe que, si se divide un término de la
progresión por su inmediato anterior, este cociente debe dar como resultado dicha
razón. Esto se ve claramente porque un término inicial 𝑎1 es multiplicado por la razón
para obtener el siguiente.

Con base en esto, si se divide el segundo término del conjunto entre el primero,
𝑥2 6
= =2
𝑥1 3

y si se divide el tercero entre el segundo


𝑥3 13
= ≈ 2,12
𝑥2 6

Se puede notar que el siguiente término de este conjunto es aproximadamente el doble


del anterior, por lo que siempre que se presente este suceso, es de mejor actuar recurrir
a la media geométrica.

6. Señale brevemente:

a) Dos ventajas de la media aritmética


b) Dos ventajas de la mediana
c) Dos ventajas de la moda
d) ¿En qué condiciones son iguales la media, mediana y moda?
e) Cuando las condiciones no son iguales, cual medida de tendencia central es mejor
para la interpretación de los datos.

Resolución
Inciso a. Ventajas de la media aritmética
• De las principales ventajas que ofrece la media aritmética se señala no solo la
facilidad de realizar el cálculo de esta, sino más bien la cantidad de procesos
estadísticos en los que esta está involucrada. Gracias a este valor, es posible
conllevar cálculos posteriores que permiten la determinación y clasificación de la
población o muestra en estudio.
• Cuando el conjunto presenta valores muy distintos o alejados (atípicos) es una
excelente indicadora de variaciones en la población, pues esta medida no es
resistente, llevándola a hacer susceptible a valores extremos.

Inciso b. Ventajas de la mediana


• Cuando se tiene un conjunto de datos bastante numeroso y, además, valores
extremos muy elevados, la mediana es una excelente medida de tendencia
central, pues no presenta o no se ve afectada por estos valores. En ella
solamente influyen los valores centrales de la distribución.

• Admite la escala ordinal, pues un grupo de variables categóricas pueden tener


cierta frecuencia o tener un orden específico asignado por números, por lo que
la mediana permite identificar el centro de la distribución. También se puede usar
en el cálculo de datos cuantitativos; es decir, es la medida más representativa
en toda clase de variables.

Inciso c. Ventajas de la moda

• En el caso de datos no agrupados, la moda no necesita de ningún tipo de cálculo,


por lo que su obtención es realmente sencilla y, a su vez, fácil de interpretar.

• No se ve influenciada para nada por valores extremos o atípicos, debido a que,


en distribuciones simétricas, por ejemplo, la moda coincide con el centro de los
datos o en donde mayor concurrencia o peso de información existe.

Inciso d. Condiciones de igualdad de la media, la mediana y la moda


Se dice que la media, la mediana y la moda coinciden en valor y ubicación cuando la
distribución de las que se están estudiando es de carácter simétrico. Esto es, cuando
el número de valores tanto a la izquierda como a la derecha de la media es igual. Cuando
se sabe entonces que estos tres valores de medida central son iguales para una
distribución, ni siquiera se hace necesario el esbozo de la gráfica par el conjunto, pues
se sabe que es simétrica con respecto al eje vertical trazado desde la media.

Como se vio anteriormente, estas medidas casi coincidían en su valor en el apartado 4,


con el cálculo de la ganancia en peso de unos novillos, pues en la tabla 4 se pudo
observar que a partir de la clase 4, las clases superiores e inferiores casi poseían el
mismo número de mediciones. La ligera variación entre estas fue lo que hizo que
variasen los valores de la media, mediana y moda ínfimamente.

Inciso e. Uso recomendado de las medidas de tendencia central


Dependiendo del carácter del conjunto o de la distribución, siempre se optará por una
u otra medida de tendencia central:
• Cuando se esté trabajando con datos de variables cualitativas, la moda es
siempre la opción factible e interpretable, pues se estará hablando de la
frecuencia de dichas variables en la distribución.

• La media es la medida de tendencia central por excelencia para conocer la


concentración de los datos en una muestra o población, y su uso es altamente
recomendado cuando se desea conocer el peso que tiene cada valor de estos
datos sobre el conjunto en general. Además, con ella se puede conocer con más
exactitud el comportamiento del grupo. Cuando no existan valores atípicos muy
representativos, el uso de la mediana siempre será pertinente.

• Para una distribución bastante numerosa tanto en valores simples como atípicos
la media no puede ser una buena opción, pues, como se ha mencionado en
varias ocasiones anteriormente, no es resistente a estos extremos y su cálculo
puede mostrar falsos comportamientos de la población en estudio. Es aquí
cuando la mediana, al no ser afectada por dichos valores, puede dar un resultado
más acorde a los comportamientos estadísticos reales. Además, también
permite la realización de cálculos para discernir fenómenos distributivos.

7. Un grupo de 400 empleados, que tiene una compañía, se dividen en operarios y


técnicos con un salario promedio Bs. 10.260.960. Los salarios promedios para cada uno
de los grupos son de Bs. 8.570.300 y Bs. 10.320.856, respectivamente.

a) ¿Cuántos operarios y técnicos tiene la compañía?

b) Si el gerente establece una bonificación de Bs. 30.000 para los operarios y del 8%
para los técnicos, ¿Cuál será el salario promedio para los 400 empleados de la
compañía?

Resolución
Inciso a. Cantidad de técnicos y operarios
Se sabe que el número de empleados es de 400 con operarios y técnicos entre ellos.
Se puede representar simbólicamente y algebraicamente lo siguiente:

𝑋 = número de operarios

𝑌 = número de técnicos

Entonces

𝑋 + 𝑌 = 400 I
Por otro lado, se conoce el salario promedio de cada grupo y el cálculo del promedio
para los trabajadores de la empresa en general. Dado que el peso que ejerce cada grupo
sobre este último promedio no es equitativo, se sabe que se está en presencia de una
media ponderada. Se puede plantear entonces, usando (6):

∑𝑖=𝑛
𝑖=1 𝑤𝑖 ∙𝑥𝑖
𝑥̅𝑝 = 𝑥̅𝑝
∑𝑖=𝑛
𝑖=1 𝑤𝑖
= 10 260 960 Bs

𝑤1 ∙𝑥1 + 𝑤2 ∙𝑥2 𝑥1 = 8 570 300 Bs


𝑥̅𝑝 =
𝑤1 + 𝑤2 𝑥2 = 10 320 856 Bs

𝑋∙8 570 300+ 𝑌∙10 320 856


𝑥̅𝑝 =
𝑋+ 𝑌
8 570 300𝑋+ 10 320 856𝑌
𝑥̅𝑝 =
𝑋+ 𝑌

8 570 300𝑋+ 10 320 856𝑌


= 10 260 960
𝑋+ 𝑌

Se sabe por I que

𝑋 + 𝑌 = 400

Entonces

8 570 300𝑋+ 10 320 856𝑌


= 10 260 960
400
8 570 300𝑋+ 10 320 856𝑌
= 10 260 960
400
8 570 300𝑋 + 10 320 856𝑌 = 4 104 384 000 II

Despejando a 𝑋 de I
𝑋 + 𝑌 = 400
𝑋 = 400 − 𝑌
Sustituyendo en II
8 570 300𝑿 + 10 320 856𝒀 = 4 104 384 000

8 570 300 ( 400 − 𝒀) + 10 320 856𝒀 = 4 104 384 000

3 428 120 000 − 8 570 300𝒀 + 10 320 856𝒀 = 4 104 384 000

3 428 120 000 + 1 750 556𝒀 = 4 104 384 000

1 750 556𝒀 = 676 264 000


676 264 00
𝒀=
1 750 556
𝒀 ≈ 386,31

𝒀 = 𝟑𝟖𝟔

Remplazando este valor en I


𝑋 = 400 − 𝑌

𝑋 = 400 − 386

𝑿 = 𝟏𝟒
Finalmente, el número de operarios en la empresa es de 14, mientras que el número de
técnicos es de 386 técnicos.

Inciso b. Nuevo salario promedio


Como ya es conocido el número de empleados por grupo en la empresa, entonces se
procede a calcular el nuevo sueldo promedio aplicando las nuevas directivas sobre los
salarios de cada uno

Por propiedades de la media, se sabe que, si a cada dato involucrado en la media se le


suma una misma cantidad, entonces es válido decir que esto es igual a sumarle esa
cantidad a la respectiva media, por lo que

𝑤1 ∙𝑥1 + 𝑤2 ∙𝑥2
𝑥̅𝑝 =
𝑤1 + 𝑤2
𝑋∙(8 570 300 +30 000) + 𝑌∙( 10 320 856 + 0,08 ∙10 320 856)
𝑥̅𝑝 =
𝑋+ 𝑌
14∙(8 600 300) + 386∙( 10 320 856 + 825 668,48)
𝑥̅𝑝 =
400
14 ∙(8 600 300) + 386 ∙(11 146 524,48)
𝑥̅𝑝 =
400
120 404 200 + 4 302 558 449
𝑥̅𝑝 =
400
4 422 962 649
𝑥̅𝑝 =
400

̅𝒑 = 𝟏𝟏 𝟎𝟓𝟕 𝟒𝟎𝟔, 𝟔𝟐 𝑩𝒔
𝒙

El salario promedio para los 400 empleados de la compañía es entonces de 11 057


406,62 Bs

También podría gustarte