Capitulo 2 - Distribución de Frecuencias
Capitulo 2 - Distribución de Frecuencias
Capitulo 2 - Distribución de Frecuencias
PRÓLOGO
¿Es posible prescindir del concurso de la Estadística en la tarea de
Preparación y Evaluación de Proyectos?...., indudablemente que no.
El presente trabajo fue realizado tomando como base las notas de las clases
que me correspondió dictar en la Universidad Mayor de San Andrés,
Universidad Católica Boliviana y en el primer Curso de Preparación y
Evaluación de Proyectos (Programa BID-ISAP-CONEPLAN-OEA - Ciudad de
La Paz, 1973). Se han incluido los temas que se consideraron más
importantes, tratando de dejar claras las ideas centrales y sus aplicaciones, sin
entrar a muchas demostraciones matemáticas, de acuerdo al objetivo
perseguido. Se recomienda a los estudiantes ampliar la lectura de cada
Capítulo, al menos con uno de los textos mencionados en la bibliografía.
Deseo resaltar la persona de Don Hugo Javier Ochoa G., Director del Curso de
Preparación y Evaluación de Proyectos, citado anteriormente, de quién surgió
la idea de realizar el presente documento. Para él, mis mejores palabras de
elogio y agradecimiento por su colaboración desinteresada, tolerancia y
estímulo constante de que fui objeto durante el tiempo que duró mi labor.
La Paz - Bolivia 1974
PRÓLOGO
A LA TERCERA EDICIÓN
La Paz - Bolivia
Agosto, 1990
CAPITULO 2
DISTRIBUCIÓN DE FRECUENCIAS
Tal como habíamos adelantado en la sección 1,6 del capítulo anterior, las
decisiones estadísticas están basadas sobre datos numéricos; los mismos que
pueden presentarse en forma resumida en una tabla de distribución de
frecuencias, cuya importancia es innegable, en virtud de que nos proporciona
una primera aproximación respecto de la forma en que están distribuidas las
series de datos estadísticos. Por otro lado, la representación gráfica de una
distribución de frecuencias también es útil, puesto que ello nos dará una
primera idea del tipo de distribución de que se trata.
Recordemos, sin embargo, que a los datos se los necesita sólo cuando los
estados de la naturaleza son desconocidos. Por otro lado, los tipos de datos
que se requieren dependen sobre todo del problema de decisión a resolver.
Así, muchas veces inclusive es necesario recoger varias características
simultáneamente de cada elemento de la muestra o población. Cuando
obtengamos los valores de una sola variable de las unidades elementales,
llamaremos variables univariantes, si obtenemos los valores de dos variables,
diremos que son bivariantes; y en general, si obtenemos los valores de dos o
más variables, diremos son multivariantes. En el presente capítulo, ilustraremos
las distribuciones de frecuencias y sus características, utilizando una sola
variable,
2.1
Construcción de Distribuciones
de Frecuencias
Se ha visto que los datos recogidos de las unidades elementales de la
población o de la muestra, individualmente significan poco para el investigador.
En cambio, prestan gran utilidad, cuando éstos se hallan ordenados o
clasificados de alguna manera sistemática. Las distribuciones de frecuencias
dependerán del tipo de series que son posibles de obtener para resolver un
problema estadístico. Así, las series pueden ser discretas o continuas. En el
caso de tener valores discretos, de acuerdo a su número, pueden ser
clasificados en clases o grupos,
Empezaremos por ver el caso más simple de las distribuciones de frecuencias.
Partiremos de la siguiente información correspondiente a las calificaciones
(redondeadas) obtenidas en una prueba por 50 alumnos, en escala de 10 a 70.
TABLA 2.1 Calificaciones obtenidas por 50 alumnos en una prueba de
evaluación, en una escala de 10 a 70.
40 40 60 30 50 50 60 50 60 30
30 10 50 20 30 30 40 40 50 40
60 20 40 70 30 30 30 30 40 10
20 50 30 40 10 10 20 60 40 60
50 70 20 40 40 40 10 30 50 30
i
Distribucion de frecuencias absolutas (ni)
Numero de estudiantes
12 0.25
10 0.2
8 0.15
6
0.1
4
0.05
2
0
0
Xi 10 20 30 40 50 60 70
Xi 10 20 30 40 50 60 70
Calificacion en %
Calificacion en %
Distrib. de Frec. Abs. Acumuladas (Ni) Ditrib. de Frecuencias Relativas
Acumuladas (Hi)
Numero de estudiantes 60 1.20
2.2
Propiedades y relaciones de las frecuencias
n
i 1
i n ; Esta relación es por definición
h
𝑛 ∑𝑚
1 𝑛𝑖 𝑛
i 1 , cuya demostración es: ∑𝑚 𝑚 𝑖
1 ℎ𝑖 = ∑1 𝑛 = 𝑛
=
𝑛
=1
i 1
Por lo que: 0 hi 1
También Nm n ; Hm 1
Finalmente,
n1 N1 N 2 ... N m n
h1 H1 H 2 ... H m 1
Todas estas relaciones, pueden observarse en las Tablas 2.3 y 2.4
2.3
Distribución de frecuencias para Variables
Continuas
Una clase es un intervalo dentro del cual se sitúan todos los valores
comprendidos entre los límites inferior y superior de cada clase. La amplitud de
una clase se denomina intervalo de clase, la cual es la diferencia entre los
límites superior e inferior, de la clase. El número de valores de una serie que
caen en una clase, se denomina frecuencia de clase. Para fines de cálculos,
como veremos más adelante, se usa el punto medio de la clase (que algunos
autores denominan marca de clase o representante de clase), que es la media
de los límites de una clase. Así, en los cálculos basados en datos agrupados,
se asigna el valor del punto medio de la clase a todas las observaciones
contenidas en ésta. En este caso el tratamiento para los datos continuos o
discretos es el mismo.
En donde: 𝑌0′ 𝑦 𝑌1′ son los límites inferior y superior, respectivamente del
primer intervalo de clase. Como el valor medio de la clase en este caso es un
número no muy maniobrable, podríamos cambiar el número de clases, ejemplo
a 10 en lugar de 8. Además, otra regla alternativa para el cálculo del número
aproximado de clases es: m = √𝑛 = √110 = 10,48 ≅ 10. En tal caso la amplitud
del intervalo de clase es:
c = (430 – 280)/10 = 15
De modo que el primer intervalo será de 280 a 295, y el punto medio 287,5.
Este punto medio es algo mejor que el calculado anteriormente con m = 8.
Por lo que la tabla de distribución de frecuencias de datos agrupados para
nuestro ejemplo es: ESTADISTICA DESCRIPTIVA 18-08-2022
TABLA 2.6 Distribución de frecuencias de salarios semanales de una muestra
de 110 obreros
′
𝑌𝑖−1 - 𝑌𝑖′ 𝑌𝑖 𝑛𝑖 𝑁𝑖 𝑁𝑖∗ ℎ𝑖 100ℎ𝑖 𝐻𝑖 100𝐻𝑖 𝐻𝑖∗ 100𝐻𝑖∗
280-295 287,5 4 4 110 0.04 4 0.04 4 1.00 100
Para calcular algunas medidas de los datos observados, los puntos medios de
los intervalos de clase equivalen a valores de 𝑌𝑖 . Este concepto se usará
bastante a partir del próximo capítulo.
De la Tabla 2.6 puede obtenerse bastante información respecto de los valores
observados de la variable, referida al salario semanal de un conjunto de 110
trabajadores; ejemplo, el número y porcentaje de los obreros que ganan entre
340 y 355 $, el porcentaje de obreros con ingreso inferior a 370 $, etc.
Hay una observación importante que debe hacerse cuando se confecciona una
distribución de frecuencias por intervalos de clase para una variable continua.
En nuestro ejemplo el límite superior de un intervalo, coincide con el límite
inferior del intervalo inmediato que sigue, lo cual da lugar a la siguiente
pregunta: Si un obrero gana, digamos 295 $, será incluido en el primer intervalo
o en el segundo? Nosotros convencionalmente lo incluiremos en el intervalo
inmediato superior. Algunos autores para salvar este tipo de dificultad trivial,
clasifican los intervalos, de la siguiente manera:
Intervalo de Clase
280 a 294,99
295 a 309,99
............
Como puede apreciarse, con la salvedad del caso, podemos evitar el uso de
números como 294,99, etc.
A continuación, se presenta una distribución de frecuencias agrupada en forma
simbólica:
Distribución de Frecuencias Agrupada en forma simbólica
Intervalo de Marca de Frec. Frec. Frec. absoluta Frec.
clase clase absoluta relativa acumulada relativa
Y! i-1 a Y! i 𝑌 ! 𝑖−1 +𝑌 ! 𝑖 ni hi Ni acumulada
Yi = 2 Hi
Y! 0 - Y!1 Y1 n1 h1 = n1/n N1 = n1 H1 = h1
Y! 1 - Y!2 Y2 n2 h2 = n2/n N2 = N1+n2 H2 = H1+h2
! !
Y2 - Y3 Y3 n3 h3 = n3/n N3 = N2+n3 H3 = H2+h3
. . . . . .
. . . . . .
. . . . . .
Y! m-1 - Y!m Ym nm hm = nm/n Nm=Nm-1+nm=n Hm=Hm-1+hm=1
Totales - n 1,00 - -
2.4
Representación Gráfica de Distribuciones
de Frecuencias
No sólo una Tabla de distribución de frecuencias presta una información
adecuada para un primer análisis del conjunto de observaciones de una
variable, también la representación gráfica de la distribución de frecuencias,
permite visualizar la forma en que se distribuye un conjunto de observaciones.
Los gráficos más usuales son los denominados: histograma de frecuencias y
polígono de frecuencias. Hay una serie de técnicas para esto, sobre todo
cuando los intervalos de clase son diferentes. Nosotros veremos únicamente el
caso en que los intervalos de clase son iguales, puesto que es el más frecuente
y además, siempre es posible condicionar cualquier conjunto de observaciones
en intervalos iguales. La representación gráfica, se realiza básicamente
utilizando los ejes coordenados en un plano cartesiano, tomando una escala
adecuada.
El diagrama de frecuencias para la Tabla 2.6 estará dada por:
Figura 2.3 Histograma de frecuencias absolutas.
20
15
Percent
105
0
Distribución de frecuencias de
variables cualitativas
Estas distribuciones se elaboran para las variables que se denominan también como
categóricas, ya que se describen por las distintas categorías que poseen las variables
cualitativas. Incluyen en la primera columna justamente las categorías, en las
siguientes tres columnas se incluyen las frecuencias absolutas, las relativas y estas
convertidas en porcentajes. Finalmente, se incluyen también los grados centígrados
para obtener los gráficos circulares que se denominan también como gráficos de torta.
Los grados centígrados se calculan utilizando una regla de tres simple; o sea, si para
(100%ℎ𝑖 )(3600 )
100% existen 360𝑜 , entonces para 100%ℎ𝑖 existen 𝑥 𝑜 ; luego, 𝑥 𝑜 = =
100%
0%
Alto Medio alto Medio Medio bajo Bajo
Ejemplo 4. Distribución de frecuencias de políticas para POLITICAS PARA REVERTIR UNA
revertir una economía en crisis ECONOMIA EN CRISIS
Liberar
100𝒉𝒊 Incrementa
Categoría 𝒏𝒊 𝒉𝒊 G. C. impuestos
(%) r el gasto
como
publico; 8%
Incrementar el gasto incentivo …
público 10 0.083 8.3 30
Disminuir la carga de Disminu
impuestos 30 0.250 25.0 90
ir la
Incrementar la inversion 50 0.417 41.7 150 tasa de Disminuir
interes; la carga
Disminuir la tasa de interés 10 0.083 8.3 30 de
8%
Liberar impuestos como impuesto
incentivo a la industria 20 0.167 16.7 60 s; 25%
TOTALES 120 1.000 100.0 360 Incrementar
G.C. Significa grados centígrados la
inversion;
42%
Figura 2.5 Curvas que representan las principales formas que toman las
distribuciones de frecuencias de variables poblacionales o de muestras.
verdadera.
5.4) La relación es falsa, ya que si ℎ1 +ℎ2 +ℎ3 +ℎ4 = 1, entonces 𝑛6 = 3 y 𝐻5 = 1
están fuera de la distribución de frecuencias de cuatro clases (m = 4).
5.5) Esta relación es falsa, ya que las frecuencias relativas (ℎ𝑖 ) son valores
fraccionarios positivos no mayores a la unidad.
5.6) Esta relación es falsa, ya que 𝐻6 = 1 (m = 6); por lo que, 𝐻3 +𝐻4 no puede
ser igual a 1,90; ni 𝐻3 = 1,90 – 𝐻4 = 1,90 – 0,20 = 1,70.
Grupo A Grupo B
Diferencia
Frec. Frec.
Calificaciones Alumnos 100h1i Alumnos 100h2i de B – A
Rel. Rel.
en %
(n1i) (h1i) (%) (n2i) (h2i) (%)
16 – 19 4 0,06 6 0 0,00 0 -6
20 – 23 3 0,05 5 5 0,03 3 -2
24 – 27 2 0,03 3 15 0,09 9 6
28 – 31 8 0,12 12 10 0,06 6 -6
32 – 35 12 0,18 18 22 0,13 13 -5
36 – 39 20 0,31 31 40 0,23 23 -8
40 – 43 10 0,15 15 58 0,33 33 18
44 – 47 5 0,08 8 12 0,07 7 -1
48 – 51 0 0,00 0 5 0,03 3 3
52 – 55 1 0,02 2 8 0,05 5 3
Totales 65 1,00 100 175 1,00 100 0
15
15
% de hogares
10
10
5
5
2 4 6 8 2 4 6 8
Tamaño de hogar - Numero de personas Tamaño de hogar - Numero de personas
19, 22, 19, 18, 20, 23, 19, 19, 20, 19, 20, 21, 22, 21, 20, 22, 20, 21, 20, 21,
19, 21,,21,19, 19, 20, 29, 29, 29, 20, 20, 19, 21, 23, 24, 22, 23, 21, 20, 23,
24, 21, 25, 21, 23, 24, 22, 20, 25, 19:
16. Un investigador del área social desea determinar en una localidad pequeña,
la cantidad de horas por semana que dedican los niños menores de 6 años
de edad para ver televisión. Una muestra de 36 niños, arrojó los siguientes
resultados (en cantidad de horas por semana):
10 19 25 19 26 16 19 27 27 25 23 22 17 12 20 15 21 23 26 14
18 25 23 24 21 28 30 25 24 25 19 22 18 25 26 23
9 7 8 9 6 4 5 6 4 5 3 4 3 3 -1 1 -3 -1 -2 -4 -
5 -9 -6 -4 -3 -4 -6 -3 -2 -2 5
𝑛7 𝑛7 8
c) Tomando en cuenta que ℎ7 = se obtiene n = ; o sea n = = 200;
𝑛 ℎ7 0,04
luego 𝑛3 = 𝑛5 = nℎ3 = 200(0,21) = 42.
1.260
h) Tomando en cuenta que 𝑌3 𝑛3 = 1.260, se obtiene 𝑌3 = = 30. Con este
42
𝑌2′ +𝑌3′ 𝑌0′ +2𝐶+𝑌0′ +3𝐶 2𝑌0′ +5𝐶
resultado se obtiene: 𝑌3 = = = Este resultado permite
2 2 2
1Estadística Descriptiva, Nueva Edición, Conceptos y Aplicaciones, Rufino Moya Calderón, ejemplo 2.9,
página 73.
2𝑌0′ +5𝐶 2(30)−5(10)
escribir la siguiente igualdad: = 30; de donde se tiene: 𝑌0′ = = 5.
2 2
Totales - n 1,00 - -