Capitulo 2 - Distribución de Frecuencias

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 26

Elementos de

Estadística para Preparación y


Evaluación de Proyectos

mario murillo oporto

La Paz - Bolivia - 1990

PRÓLOGO
¿Es posible prescindir del concurso de la Estadística en la tarea de
Preparación y Evaluación de Proyectos?...., indudablemente que no.

Es innegable que una de las herramientas principales para la elaboración de


todo trabajo de investigación, donde los factores que intervienen sufren
cambios constantes que implican incertidumbre y que frente a ellos hay
necesidad de hacer predicciones para tomar la acción adecuada en una política
de decisiones, es la Estadística.

El presente trabajo fue realizado tomando como base las notas de las clases
que me correspondió dictar en la Universidad Mayor de San Andrés,
Universidad Católica Boliviana y en el primer Curso de Preparación y
Evaluación de Proyectos (Programa BID-ISAP-CONEPLAN-OEA - Ciudad de
La Paz, 1973). Se han incluido los temas que se consideraron más
importantes, tratando de dejar claras las ideas centrales y sus aplicaciones, sin
entrar a muchas demostraciones matemáticas, de acuerdo al objetivo
perseguido. Se recomienda a los estudiantes ampliar la lectura de cada
Capítulo, al menos con uno de los textos mencionados en la bibliografía.

Deseo resaltar la persona de Don Hugo Javier Ochoa G., Director del Curso de
Preparación y Evaluación de Proyectos, citado anteriormente, de quién surgió
la idea de realizar el presente documento. Para él, mis mejores palabras de
elogio y agradecimiento por su colaboración desinteresada, tolerancia y
estímulo constante de que fui objeto durante el tiempo que duró mi labor.
La Paz - Bolivia 1974

PRÓLOGO
A LA TERCERA EDICIÓN

Al presentar esta nueva edición, deseo expresar especialmente mi más


profundo sentir de agradecimiento a todos cuantos me honraron con la lectura
de las dos impresiones anteriores.
La aceptación que tuvo el texto y el actual interés manifestado por contar con
el, sobre todo por estudiantes de carrera y muchos egresados, han constituido
motivos suficientes para haber emprendido la tarea de hacer las correcciones
que eran necesarias y de añadir las soluciones de ejercicios seleccionados.

Abrigo, nuevamente, la esperanza de que esta obra en el nivel dado, pueda


servir de un elemento más de apoyo para quienes están incursionando en el
conocimiento de la Estadística y sus aplicaciones; entre ellos, a estudiantes de
la Universidad Boliviana y de otras Instituciones donde se enseña esta ciencia.
Mario Murillo Oporto

La Paz - Bolivia
Agosto, 1990
CAPITULO 2
DISTRIBUCIÓN DE FRECUENCIAS
Tal como habíamos adelantado en la sección 1,6 del capítulo anterior, las
decisiones estadísticas están basadas sobre datos numéricos; los mismos que
pueden presentarse en forma resumida en una tabla de distribución de
frecuencias, cuya importancia es innegable, en virtud de que nos proporciona
una primera aproximación respecto de la forma en que están distribuidas las
series de datos estadísticos. Por otro lado, la representación gráfica de una
distribución de frecuencias también es útil, puesto que ello nos dará una
primera idea del tipo de distribución de que se trata.

Recordemos, sin embargo, que a los datos se los necesita sólo cuando los
estados de la naturaleza son desconocidos. Por otro lado, los tipos de datos
que se requieren dependen sobre todo del problema de decisión a resolver.
Así, muchas veces inclusive es necesario recoger varias características
simultáneamente de cada elemento de la muestra o población. Cuando
obtengamos los valores de una sola variable de las unidades elementales,
llamaremos variables univariantes, si obtenemos los valores de dos variables,
diremos que son bivariantes; y en general, si obtenemos los valores de dos o
más variables, diremos son multivariantes. En el presente capítulo, ilustraremos
las distribuciones de frecuencias y sus características, utilizando una sola
variable,
2.1
Construcción de Distribuciones
de Frecuencias
Se ha visto que los datos recogidos de las unidades elementales de la
población o de la muestra, individualmente significan poco para el investigador.
En cambio, prestan gran utilidad, cuando éstos se hallan ordenados o
clasificados de alguna manera sistemática. Las distribuciones de frecuencias
dependerán del tipo de series que son posibles de obtener para resolver un
problema estadístico. Así, las series pueden ser discretas o continuas. En el
caso de tener valores discretos, de acuerdo a su número, pueden ser
clasificados en clases o grupos,
Empezaremos por ver el caso más simple de las distribuciones de frecuencias.
Partiremos de la siguiente información correspondiente a las calificaciones
(redondeadas) obtenidas en una prueba por 50 alumnos, en escala de 10 a 70.
TABLA 2.1 Calificaciones obtenidas por 50 alumnos en una prueba de
evaluación, en una escala de 10 a 70.

40 40 60 30 50 50 60 50 60 30
30 10 50 20 30 30 40 40 50 40
60 20 40 70 30 30 30 30 40 10
20 50 30 40 10 10 20 60 40 60
50 70 20 40 40 40 10 30 50 30

De acuerdo a los conceptos y definiciones anteriores, cada uno de los


elementos de la Tabla 2.1 corresponden al valor de cada una de las 50
unidades elementales de la muestra, a los que simbólicamente designaremos
por xi (en este caso, i varía de 1 a 50, o sea que hay x1...., x50 valores). En
forma general, los datos u observaciones se simbolizan con x1, x2, .... , xn; en
donde n es el número de observaciones o tamaño de la muestra.
Los valores de la Tabla anterior, pueden resumirse en una Tabla de
Distribución de Frecuencias, agrupando a todos aquellos valores iguales, en
cada una de las categorías de calificaciones, como se ve en la Tabla 2.2

TABLA 2.2 Distribución de Frecuencias Absolutas correspondiente a las


calificaciones obtenidas por 50 alumnos en una prueba de evaluación
(Escala: 10 al 70)

Calificación Registro o cómputo de las repeticiones Frecuencias


𝑋𝑖 de los valores distintos que toma la Absolutas ni = fi
variable
x1 = 10 ///// n1 = 5
x2 = 20 ///// n2 = 5
x3 = 30 ///// ///// // n3 = 12
x4 = 40 ///// ///// // n4 = 12
x5 = 50 ///// /// n5 = 8
x6 = 60 ///// / n6 = 6
x7 = 70 // n7 = 2
TOTAL n = 50
En la Tabla 2.1 vemos que hay varios valores de xi iguales. Sin embargo, en la
Tabla 2.2, en la primera columna aparecen tan sólo siete valores para la
variable x; esto se debe a que se han clasificado a xi, sólo en los distintos
valores que ella toma, ya que en la columna de las frecuencias absolutas
aparecen el número de veces que se repite un valor de x i particular. Algunos
autores, usan otra letra para designar a los distintos valores que toma la
variable X, por ejemplo, la letra Yi; de manera que en este caso tendríamos y1,
y2,..., y7 para la primera columna de la Tabla 2,2. Nosotros usaremos la misma
letra para designar la variable que se esté considerando, sea que tengamos el
conjunto de datos originales sin agrupar, o cuando los tengamos agrupados.
Para la notación de las frecuencias absolutas usaremos ni, que nos indica el
número de veces que aparece repetido un valor x i; de esta manera, en nuestro
ejemplo, n4=12 significa que se han encontrado 12 alumnos con una
calificación de 40. En la columna central de la Tabla 2.2 se lleva la cuenta
mediante rayas, las que son marcadas a medida que aparece un valor de x i
(De la misma manera que se hace un recuento de votos, en una elección
cualquiera). Esto es lo que se llama también clasificación de la información
original, que de acuerdo al volumen de los datos puede realizarse en forma
manual o mecánica.
Por otro lado, podemos representar gráficamente una distribución de
frecuencias absolutas, como se ve en la Figura 2.1

Una tabla de distribución de frecuencias es más completa cuando además


incluye otras frecuencias que se calculan con base a las frecuencias absolutas.
La frecuencia relativa de un valor observado distinto, es la razón que existe
entre el número de repeticiones de xi. y el número total de elementos de la
𝑛𝑖
muestra, la que se representa con hi = . Una tabla de distribución de
𝑛

frecuencias, también puede incluir las acumulaciones de las frecuencias, tanto


absolutas como relativas. Así, Ni representa la frecuencia absoluta acumulada,
y Hi representa a las frecuencias relativas acumuladas. La Tabla 2.3 ilustra
estos conceptos para el ejemplo de las calificaciones de los 50 alumnos.
TABLA 2.3 Distribución de frec. de calificaciones de 50 alumnos de un examen

100𝒉𝒊 100𝑯𝒊 100𝐻𝑖∗


𝑿𝒊 𝒏𝒊 𝑵𝒊 𝑵∗𝒊 𝒉𝒊 𝑯𝒊 𝐻𝑖∗
(%) (%) (%)
10 5 5 50 0,10 10 0.10 10 1.00 100
20 5 10 45 0,10 10 0.20 20 0.90 90
30 12 22 40 0,24 24 0.44 44 0.80 80
40 12 34 28 0,24 24 0.68 68 0.56 56
50 8 42 16 0,16 16 0.84 84 0.32 32
60 6 48 8 0,12 12 0.96 96 0.16 16
70 2 50 2 0,04 4 1.00 100 0.04 4
 50 - - 1.00 100 - - - -
donde,
Xi son los distintos valores de la variable calificación, denominados también clases.
ni son las frecuencias absolutas, o sea, el número de estudiantes con las distintas
calificaciones (𝑋𝑖 )
Ni son las frecuencias absolutas acumuladas iguales y menores que 𝑋𝑖
Ni∗ son las frecuencias absolutas acumuladas iguales y mayores que 𝑋𝑖
hi son las frecuencias relativas que representan la proporción de estudiantes que
poseen una determinada calificación (𝑋𝑖 )
100ℎ𝑖 son las frecuencias relativas multiplicadas por 100, que representan el % de
estudiantes que poseen una determinada calificación 𝑋𝑖
Hi son las frecuencias relativas acumuladas iguales y menores que 𝑋𝑖 (calificaciones).
100𝐻𝑖 son las frecuencias relativas acumuladas iguales y menores que 𝑋𝑖
multiplicadas por 100.
Hi∗ son las frecuencias relativas acumuladas iguales y mayores que 𝑋𝑖 (calificaciones).
100𝐻𝑖∗ son las frecuencias relativas acumuladas iguales y mayores que 𝑋𝑖
multiplicadas por 100.
Figura 2.1 Diagrama de frecuencias correspondiente a las calificaciones
obtenidas por 50 alumnos en una prueba de evaluación.
Distribucion de frecuencias relativas
0.3 (h )
14
Proporcion de estudiantes

i
Distribucion de frecuencias absolutas (ni)
Numero de estudiantes

12 0.25
10 0.2
8 0.15
6
0.1
4
0.05
2
0
0
Xi 10 20 30 40 50 60 70
Xi 10 20 30 40 50 60 70
Calificacion en %
Calificacion en %
Distrib. de Frec. Abs. Acumuladas (Ni) Ditrib. de Frecuencias Relativas
Acumuladas (Hi)
Numero de estudiantes 60 1.20

Frecuencia relativa acumulada


50 1.00
40 0.80
30 0.60
20 0.40
10 0.20
0 0.00
10 20 30 40 50 60 70 10 20 30 40 50 60 70
Calificaciones en % Calificaciones en %

Figura 2.2. Gráfico acumulativo de las calificaciones obtenidas por 50


alumnos en una prueba de evaluación

Otro gráfico que también es útil, es el que corresponde a las frecuencias


acumuladas, (Ver Figura 2.2)
Las frecuencias absolutas y relativas acumuladas se obtienen utilizando los
siguientes procedimientos:
𝑛1 = 𝑁1 ; 𝑁2 = 𝑁1 +𝑛2 ; y así sucesivamente. En general 𝑁𝑗 = 𝑁𝑗−1 + 𝑛𝑗
ℎ1 = 𝐻1 ; 𝐻2 = 𝐻1 +ℎ2 ; y así sucesivamente. En general 𝐻𝑗 = 𝐻𝑗−1 + ℎ𝑗
En general, si se tienen n valores observados, una tabla de distribución de
frecuencias, simbólicamente está dada por: (Ver Tabla 2.4)
Cuando se dice, distribución de frecuencias, se entiende también la forma en
que están distribuidas las repeticiones (ni = fi) de cada valor distinto de la
variable.
TABLA 2.4. Distribución de frecuencias absolutas y relativas y sus
acumulaciones de clase única
Valores de Frecuencias Frecuencias Frecuencias Frecuencias
la variable absolutas relativas absolutas relativas
xi ni hi acumuladas acumuladas
Ni Hi
x1 n1 h1 = n1/n N1 = n1 H1 = h1
X2 n2 h2 = n2/n N2 = n1+n2 H2 = h1+h2
X3 n3 h3 = n3/n N3 = n1+n2+n3 H3 = h1+h2+h3
. . . . .
. . . . .
. . . . .
Xm nm hm = nm/n Nm=n1+...+nm=n Hm=h1+...+hm=1
Totales n 1,00 - -

2.2
Propiedades y relaciones de las frecuencias

Vale la pena hacer algunas consideraciones sobre los elementos que


constituyen una Tabla de Distribución de Frecuencias. Los valores de la
variable 𝑋𝑖 no tienen restricción alguna, puesto que pueden ser números
enteros negativos o positivos, o números fraccionarios. Así, por ejemplo, si la
variable representa al número de hojas, de más o de menos, en un proceso
mecánico de empaquetado de 1.000 hojas, las 𝑋𝑖 pueden tomar valores como x
= -2, x = 0 ó x = 4; lo que significa respectivamente que faltan dos hojas, que
está exacto o que hay 4 hojas demás.

Propiedades. Las frecuencias absolutas o repeticiones n i, y las frecuencias


absolutas acumuladas Ni y 𝑁𝑖∗ , son números enteros positivos. Las frecuencias
relativas hi y sus acumuladas Hi y 𝐻𝑖∗, son números fraccionarios positivos no
mayores que 1.
Relaciones
Por la anotación de las dos propiedades de las frecuencias, se tienen las
siguientes relaciones:
m

n
i 1
i  n ; Esta relación es por definición

h
𝑛 ∑𝑚
1 𝑛𝑖 𝑛
i  1 , cuya demostración es: ∑𝑚 𝑚 𝑖
1 ℎ𝑖 = ∑1 𝑛 = 𝑛
=
𝑛
=1
i 1

Por lo que: 0  hi  1

Por otro lado, para una 𝑁𝑗 y 𝐻𝑗 cualquiera se tiene:


j j
N j   ni = 𝑁𝑗−1 + 𝑛𝑗 ; H j   hi = 𝐻𝑗−1 + ℎ𝑗 =
𝑁𝑗
𝑛
i 1 i 1

También Nm  n ; Hm  1
Finalmente,
n1  N1  N 2  ...  N m  n
h1  H1  H 2  ...  H m  1
Todas estas relaciones, pueden observarse en las Tablas 2.3 y 2.4
2.3
Distribución de frecuencias para Variables
Continuas

En la mayor parte en que se tratan datos continuos, o cuando se tiene un


número grande de valores distintos de la variable discreta, no es posible
asignar una clase única a todos los valores distintos de la variable (sobre todo
si son numerosos). La única novedad que aparece, en relación a lo estudiado
en las secciones anteriores, es que los datos se agrupan en un número
razonable de intervalos de clases que usualmente es de 5 a 15.
Consideremos la información de la Tabla 2.5 para tratar todos estos conceptos.
TABLA 2.5 Salario semanal de una muestra de 110 obreros, que trabajan en
distintas empresas constructoras de viviendas de una ciudad-En bolivianos
280 405 300 330 295
330 335 338 328 329
360 365 358 366 365
290 420 305 320 365
360 370 405 330 375
355 355 400 335 380
375 305 380 355 390
410 420 375 370 300
400 390 385 385 315
390 385 395 380 340
310 380 360 370 365
290 360 355 320 375
360 350 355 330 385
370 350 310 315 330
420 400 325 380 315
285 380 335 345 320
370 370 410 360 340
390 350 390 345 350
415 345 360 340 345
345 430 310 395 365
350 415 325 375 355
410 380 320 395 335

Una clase es un intervalo dentro del cual se sitúan todos los valores
comprendidos entre los límites inferior y superior de cada clase. La amplitud de
una clase se denomina intervalo de clase, la cual es la diferencia entre los
límites superior e inferior, de la clase. El número de valores de una serie que
caen en una clase, se denomina frecuencia de clase. Para fines de cálculos,
como veremos más adelante, se usa el punto medio de la clase (que algunos
autores denominan marca de clase o representante de clase), que es la media
de los límites de una clase. Así, en los cálculos basados en datos agrupados,
se asigna el valor del punto medio de la clase a todas las observaciones
contenidas en ésta. En este caso el tratamiento para los datos continuos o
discretos es el mismo.

Para determinar el número aproximado de clases, se puede usar la Regla de


Sturges como una guía, la que está dada por:
m = 1+3,3 log n
En donde:
m = número aproximado de clases (número aproximado de intervalos)
n = número total de observaciones en la muestra
log = logaritmo de base 10
Ejemplo para la información de la Tabla 2.5 tendremos
m = 1 + 3,3 log 110 = 1 + (3,3) 2,0414 = 7,74 ≅ 8
Entonces, el número de clases para los salarios semanales de los obreros será
8. Esto no es rígido, puesto que se trata solo de una aproximación; por tanto, si
es necesario la distribución de frecuencias puede tener 7; 9 ó 10 clases.

La selección del número de clases puede establecerse también tomando la


consideración de que el punto medio de la clase tome un valor fácil de trabajar
en cómputos. Otro aspecto importante, es propender a que todas las clases en
que se divida un conjunto de observaciones, tengan la misma amplitud.
Finalmente, si se denota con la C la amplitud del intervalo de clase, los límites
de la primera clase o intervalo se determinan a partir del menor valor
observado más la amplitud (C). En nuestro ejemplo, la amplitud de clase o de
intervalo es:
𝑋𝑚𝑎𝑥 −𝑋𝑚𝑖𝑛 430−280
C= = = 18,5
𝑚 8
En donde: 𝑋𝑚𝑎𝑥 es el valor observado más grande y 𝑋𝑚𝑖𝑛 el valor observado
más pequeño, que toman las observaciones. Luego, el primer intervalo de
clase será de 280 a 298,5; el segundo de 298,5 a 317,0; y así sucesivamente.
Por otro lado, el punto medio de la primera clase es:
′ +𝑌 ′
𝑌1−1 𝑌0′ +𝑌1′ 280+298,5
1
𝑌1 = = = = 289,25
2 2 2

En donde: 𝑌0′ 𝑦 𝑌1′ son los límites inferior y superior, respectivamente del
primer intervalo de clase. Como el valor medio de la clase en este caso es un
número no muy maniobrable, podríamos cambiar el número de clases, ejemplo
a 10 en lugar de 8. Además, otra regla alternativa para el cálculo del número
aproximado de clases es: m = √𝑛 = √110 = 10,48 ≅ 10. En tal caso la amplitud
del intervalo de clase es:
c = (430 – 280)/10 = 15
De modo que el primer intervalo será de 280 a 295, y el punto medio 287,5.
Este punto medio es algo mejor que el calculado anteriormente con m = 8.
Por lo que la tabla de distribución de frecuencias de datos agrupados para
nuestro ejemplo es: ESTADISTICA DESCRIPTIVA 18-08-2022
TABLA 2.6 Distribución de frecuencias de salarios semanales de una muestra
de 110 obreros

𝑌𝑖−1 - 𝑌𝑖′ 𝑌𝑖 𝑛𝑖 𝑁𝑖 𝑁𝑖∗ ℎ𝑖 100ℎ𝑖 𝐻𝑖 100𝐻𝑖 𝐻𝑖∗ 100𝐻𝑖∗
280-295 287,5 4 4 110 0.04 4 0.04 4 1.00 100

295-310 302,5 5 9 106 0.05 5 0.09 9 0.96 96

310-325 317,5 10 19 101 0.09 9 0.18 18 0.91 91

325-340 332,5 14 33 91 0.13 13 0.30 30 0.82 82

340-355 347,5 18 51 77 0.16 16 0.47 47 0.70 70

355-370 362,5 15 66 59 0.14 14 0.60 60 0.53 53

370-385 377,5 18 84 44 0.16 16 0.77 77 0.40 40

385-400 392,5 12 96 26 0.11 11 0.88 88 0.23 23

400-415 407,5 8 104 14 0.07 7 0.95 95 0.12 12

415-430 422,5 6 110 6 0.05 5 1.00 100 0.05 5


Totales - 110 - - 1.00 100 - - - -
Donde: ESTADISTICA I 17-08-2022

𝑌𝑖−1 - 𝑌𝑖′ Son los limites inferior y superior de los intervalos de clase del salario
semanal en bolivianos, para i = 1, 2, . . ., m, donde m es el número de intervalos.

𝑌𝑖−1 + 𝑌𝑖′
𝑌𝑖 = . Se denominan marcas de clase o representante de clase, pero que son los
2

valores de la variable, que en el presente ejemplo son el Salario Semanal en


bolivianos.
Los restantes símbolos representan las frecuencias absolutas (𝑛𝑖 ), frecuencias
absolutas acumuladas (𝑁𝑖 ) igual y menor que un determinado valor de la variable,
frecuencias absolutas acumuladas (𝑁𝑖∗) igual y mayor que un determinado valor de la
variable, frecuencias relativas (ℎ𝑖 ) y sus acumulaciones (𝐻𝑖 y 𝐻𝑖∗ ), estas tres últimas
frecuencias multiplicadas por 100 para su interpretación correspondientes igual que en
una distribución de frecuencias de clase única.

Para calcular algunas medidas de los datos observados, los puntos medios de
los intervalos de clase equivalen a valores de 𝑌𝑖 . Este concepto se usará
bastante a partir del próximo capítulo.
De la Tabla 2.6 puede obtenerse bastante información respecto de los valores
observados de la variable, referida al salario semanal de un conjunto de 110
trabajadores; ejemplo, el número y porcentaje de los obreros que ganan entre
340 y 355 $, el porcentaje de obreros con ingreso inferior a 370 $, etc.

Hay una observación importante que debe hacerse cuando se confecciona una
distribución de frecuencias por intervalos de clase para una variable continua.
En nuestro ejemplo el límite superior de un intervalo, coincide con el límite
inferior del intervalo inmediato que sigue, lo cual da lugar a la siguiente
pregunta: Si un obrero gana, digamos 295 $, será incluido en el primer intervalo
o en el segundo? Nosotros convencionalmente lo incluiremos en el intervalo
inmediato superior. Algunos autores para salvar este tipo de dificultad trivial,
clasifican los intervalos, de la siguiente manera:
Intervalo de Clase
280 a 294,99
295 a 309,99
............
Como puede apreciarse, con la salvedad del caso, podemos evitar el uso de
números como 294,99, etc.
A continuación, se presenta una distribución de frecuencias agrupada en forma
simbólica:
Distribución de Frecuencias Agrupada en forma simbólica
Intervalo de Marca de Frec. Frec. Frec. absoluta Frec.
clase clase absoluta relativa acumulada relativa
Y! i-1 a Y! i 𝑌 ! 𝑖−1 +𝑌 ! 𝑖 ni hi Ni acumulada
Yi = 2 Hi
Y! 0 - Y!1 Y1 n1 h1 = n1/n N1 = n1 H1 = h1
Y! 1 - Y!2 Y2 n2 h2 = n2/n N2 = N1+n2 H2 = H1+h2
! !
Y2 - Y3 Y3 n3 h3 = n3/n N3 = N2+n3 H3 = H2+h3
. . . . . .
. . . . . .
. . . . . .
Y! m-1 - Y!m Ym nm hm = nm/n Nm=Nm-1+nm=n Hm=Hm-1+hm=1
Totales - n 1,00 - -

2.4
Representación Gráfica de Distribuciones
de Frecuencias
No sólo una Tabla de distribución de frecuencias presta una información
adecuada para un primer análisis del conjunto de observaciones de una
variable, también la representación gráfica de la distribución de frecuencias,
permite visualizar la forma en que se distribuye un conjunto de observaciones.
Los gráficos más usuales son los denominados: histograma de frecuencias y
polígono de frecuencias. Hay una serie de técnicas para esto, sobre todo
cuando los intervalos de clase son diferentes. Nosotros veremos únicamente el
caso en que los intervalos de clase son iguales, puesto que es el más frecuente
y además, siempre es posible condicionar cualquier conjunto de observaciones
en intervalos iguales. La representación gráfica, se realiza básicamente
utilizando los ejes coordenados en un plano cartesiano, tomando una escala
adecuada.
El diagrama de frecuencias para la Tabla 2.6 estará dada por:
Figura 2.3 Histograma de frecuencias absolutas.
20
15
Percent
105
0

250 300 350 400 450


Salario semanal obreros de construccion

Mientras que el polígono de frecuencias será

Figura 2.4 Polígono de frecuencias absolutas


El polígono se traza uniendo los puntos medios de los intervalos de clase
respectivos. Además, para cerrar el polígono, se toman los puntos medios
anterior y posterior al primer y último intervalos.

Si se tomaran los valores de las frecuencias relativas, su histograma y su


polígono de frecuencias, tendrían la misma forma de las Figuras 2.3 y 2.4 por la
proporcionalidad entre todas las frecuencias absolutas y relativas (Tabla 2.6),
además realizando un cambio de escala adecuado en el eje de las ordenadas,
los gráficos serán iguales. También es posible graficar fácilmente las
frecuencias acumuladas.

Insistimos en la importancia de hacer un gráfico, tan pronto se tengan los datos


de un experimento dado, puesto que ello ayudará bastante a tener una idea
objetiva de la forma en que están distribuidas las frecuencias, lo cual es útil
para el análisis estadístico.
Consideramos que no es necesario especular más sobre el tema, de manera
que terminaremos este capítulo mostrando algunas curvas que representan
los principales modelos de variables poblacionales

Distribución de frecuencias de
variables cualitativas

Estas distribuciones se elaboran para las variables que se denominan también como
categóricas, ya que se describen por las distintas categorías que poseen las variables
cualitativas. Incluyen en la primera columna justamente las categorías, en las
siguientes tres columnas se incluyen las frecuencias absolutas, las relativas y estas
convertidas en porcentajes. Finalmente, se incluyen también los grados centígrados
para obtener los gráficos circulares que se denominan también como gráficos de torta.

Los grados centígrados se calculan utilizando una regla de tres simple; o sea, si para
(100%ℎ𝑖 )(3600 )
100% existen 360𝑜 , entonces para 100%ℎ𝑖 existen 𝑥 𝑜 ; luego, 𝑥 𝑜 = =
100%

(ℎ𝑖 )(360𝑜 ). Un caso específico para el ejemplo 1 es el siguiente: 𝑥 𝑜 = (0,083)(360𝑜 ) ≅


30𝑜 .
A continuación, se incluyen algunos ejemplos de este tipo de distribución de
frecuencias:

Ejemplo 1. Distribución de frecuencias del


Opinion de una muestra de 120
funcionamiento de la democracia en un país entrevistados sobre el funcionamiento
100ℎ𝑖 de la democracia en un pais
Categoría 𝑛𝑖 ℎ𝑖 G. C.
(%)

Muy Satisfecho 10 0.083 8.3 30 8% 8%

Satisfecho 25 0.208 20.8 75


21% 21%
Indiferente 30 0.250 25.0 90
Insatisfecho 20 0.167 16.7 60
Muy Insatisfecho 25 0.208 20.8 75 17%
25%
No Opina 10 0.083 8.3 30
Muy Satisfecho Satisfecho
TOTALES 120 1.000 100.0 360 Indiferente Insatisfecho
(1) Significa grados centígrados Muy Insatisfecho No Opina

Ejemplo 2. Distribución de frecuencias sobre Opinion de una muestra de 120


la factibilidad de ejecución del proyecto “El entrevistados sobre la ejecucion
Bala” del proyecto Bala
100ℎ𝑖 8%
Categoría 𝑛𝑖 ℎ𝑖 G. C. 12%
(%)
21% 25%
Muy en
desacuerdo 10 0.083 8.3 30
En desacuerdo 30 0.250 25.0 90
33%
Indiferente 40 0.333 33.3 120
De acuerdo 25 0.208 20.8 75
Muy de Acuerdo 15 0.125 12.5 45 Muy en desacuerdo En desacuerdo
Totales 120 1.000 100.0 360
Indiferente De acuerdo
G.C. Significa grados centígrados
Muy de Acuerdo

Ejemplo 3. Distribución de frecuencias del Ingreso por categoria de una muestra de


nivel de ingreso de una muestra de hogares 120 hogares
de un municipio 35% 33%
100ℎ𝑖
Categoría 𝑛𝑖 ℎ𝑖 G. C.
(%) 30%
Alto 10 0.083 8.3 30 25%
25%
Medio alto 30 0.250 25.0 90 21%
Medio 40 0.333 33.3 120 20%
Medio bajo 25 0.208 20.8 75
15% 12%
Bajo 15 0.125 12.5 45
TOTALES 120 1.000 100.0 360 10% 8%
G.C. Significa grados centígrados
5%

0%
Alto Medio alto Medio Medio bajo Bajo
Ejemplo 4. Distribución de frecuencias de políticas para POLITICAS PARA REVERTIR UNA
revertir una economía en crisis ECONOMIA EN CRISIS
Liberar
100𝒉𝒊 Incrementa
Categoría 𝒏𝒊 𝒉𝒊 G. C. impuestos
(%) r el gasto
como
publico; 8%
Incrementar el gasto incentivo …
público 10 0.083 8.3 30
Disminuir la carga de Disminu
impuestos 30 0.250 25.0 90
ir la
Incrementar la inversion 50 0.417 41.7 150 tasa de Disminuir
interes; la carga
Disminuir la tasa de interés 10 0.083 8.3 30 de
8%
Liberar impuestos como impuesto
incentivo a la industria 20 0.167 16.7 60 s; 25%
TOTALES 120 1.000 100.0 360 Incrementar
G.C. Significa grados centígrados la
inversion;
42%

Figura 2.5 Curvas que representan las principales formas que toman las
distribuciones de frecuencias de variables poblacionales o de muestras.

a) Curva Normal b) Sesgada a la derecha c) Sesgada a la izquierda

d) curva de forma J e) Forma J invertida f) Curva de forma U

g) Curva bimodal h) Curva multimodal i) Curva logarítmica


2.5
Ejercicios
1. ¿Cuándo es aconsejable elaborar una distribución de frecuencias?
2. ¿Cuáles son las ventajas y desventajas del ordenamiento de datos? ¿Es el
orden necesario para la construcción de una tabla de distribución de
frecuencias?
3. ¿Qué rol importante juega el punto medio en una distribución de
frecuencias agrupada?
Respuesta. El punto medio, denominado también como representante de clase
o marca de clase, se utiliza para el cálculo de diversos estadígrafos, tales como
las medias, algunos estadígrafos de dispersión, de asimetría y de kurtosis.
4. Indique 4 ejemplos de distribuciones de frecuencias unidimensionales, 3
de bidimensionales y 2 de multidimensionales, relacionados con la
economía del país.
5. Determine si las siguientes relaciones son posibles y justifique su
respuesta.
5.1. H4 = 0,30 n = 10 n3 = 31
5.2. h1 = 4 h3 = 12 h4 = 15
5.3. h2 = 0,40 n = 50 n1 = 20
5.4. h1+h2+h3+h4 = 1 n6 = 3 H5 = 1
5.5. H4 = 0,20 H6 = 0,12 h5 = - 0,08
5.6. m=6 H2 = 0,6 h1 = 0,20
H3+H4 = 1,90 H4 = 0,2
Respuestas
5.1) Esta relación es falsa, ya que la suma de las frecuencias absolutas (𝑛𝑖 ) es
igual al valor de n = 10 y 𝑛3 = 31 no debe ser mayor a n = 10.
5.2) Esta relación es falsa, ya que las frecuencias relativas (ℎ𝑖 ) son valores
fraccionarios positivos no mayores a la unidad.
𝑛2
5.3) Se sabe que = ℎ2 ; o sea 𝑛2 = (50)(0,40) = 20, luego la relación es
50

verdadera.
5.4) La relación es falsa, ya que si ℎ1 +ℎ2 +ℎ3 +ℎ4 = 1, entonces 𝑛6 = 3 y 𝐻5 = 1
están fuera de la distribución de frecuencias de cuatro clases (m = 4).
5.5) Esta relación es falsa, ya que las frecuencias relativas (ℎ𝑖 ) son valores
fraccionarios positivos no mayores a la unidad.
5.6) Esta relación es falsa, ya que 𝐻6 = 1 (m = 6); por lo que, 𝐻3 +𝐻4 no puede
ser igual a 1,90; ni 𝐻3 = 1,90 – 𝐻4 = 1,90 – 0,20 = 1,70.

6. Comente las siguientes afirmaciones:


6.1 No tiene mayor importancia el criterio que se tome para determinar
a cuál intervalo pertenece un elemento cuyo valor coincide con el
límite de la clase.
Respuesta Afirmación falsa tiene importancia. Para resolver este
problema se disminuyen en un décimo o en un centésimo los
límites superiores de los intervalos de clase.
6.2 La suma de las frecuencias absolutas es siempre igual a 1.
Respuesta. Afirmación falsa. La suma de las frecuencias
absolutas es igual a n.
6.3 N7 indica la frecuencia relativa de valores de la variable mayores
que x7.
Respuesta. Afirmación falsa. N7 indica el número de casos
acumulados, para valores de la variable igual o menor a X7.
6.4 Mientras mayor es el número de intervalos elegidos para la
elaboración de una distribución de frecuencias menor es la
exactitud de los estadígrafos que se calculan.
Respuesta. Afirmación falsa. El error de agrupamiento es menor.
6.5 Hi > hi (para toda i).
Respuesta. Afirmación falsa para este caso ℎ1 = 𝐻1 . Para los
restantes casos la desigualdad es correcta, ejemplo H2 > h2; H5 >
h5; etc.
6.6 Es preferible trabajar siempre con pocos intervalos.
Respuesta. Afirmación falsa. Es preferible trabajar con mayor
número de intervalos ya que se disminuye el error de agrupamiento
(determinar el número de intervalos con una de las dos reglas
existentes).
6.7. El número de intervalos en que se clasifica un conjunto de datos,
depende de la cantidad de éstos.
Respuesta. Afirmación correcta, ya que m = √𝑛. Además, el número
aproximado de clases, se determina usando la Regla de Sturges
donde se encuentra n; o sea, m = 1+3,3 log n.

7. Indicar cuáles de las siguientes variables pertenecen a series continuas y


cuáles a discretas: a) tiempo: CONTINUA; b) sueldos en una empresa
pública: CONTINUA; c) magnitudes de grados: CONTINUA; d) edad:
CONTINUA; e) datos de censo: DISCRETAS, CONTINUAS Y
CUALITATIVAS; f) distancia recorrida por un móvil: CONTINUA; g) puntajes
de fútbol: DISCRETA; h) peso: CONTINUA; i) edades mentales:
CONTINUA; j) ingreso per cápita: CONTINUA.

8. Convertir las distribuciones de frecuencias A y B que siguen, a frecuencias


de porcentajes y trazar los polígonos de frecuencias sobre los mismos ejes.
Qué conclusiones se pueden obtener al respecto?
RESPUESTA. Las conclusiones pueden obtenerse utilizando la
información de la siguiente Tabla de Distribución de Frecuencias
Agrupada.

Grupo A Grupo B
Diferencia
Frec. Frec.
Calificaciones Alumnos 100h1i Alumnos 100h2i de B – A
Rel. Rel.
en %
(n1i) (h1i) (%) (n2i) (h2i) (%)
16 – 19 4 0,06 6 0 0,00 0 -6
20 – 23 3 0,05 5 5 0,03 3 -2
24 – 27 2 0,03 3 15 0,09 9 6
28 – 31 8 0,12 12 10 0,06 6 -6
32 – 35 12 0,18 18 22 0,13 13 -5
36 – 39 20 0,31 31 40 0,23 23 -8
40 – 43 10 0,15 15 58 0,33 33 18
44 – 47 5 0,08 8 12 0,07 7 -1
48 – 51 0 0,00 0 5 0,03 3 3
52 – 55 1 0,02 2 8 0,05 5 3
Totales 65 1,00 100 175 1,00 100 0

Respuesta. En el grupo A existe un solo estudiante aprobado. En el grupo B


existen 9 estudiantes aprobados.
9. Completar los datos que faltan en la siguiente distribución:
𝒀𝒊 𝒏𝒊 𝑵𝒊 𝒉𝒊 𝑯𝒊
1 4 4 0,08 0,08
2 4 8 0,08 0,16
3 8 16 0,16 0,32
4 7 23 0,14 0,46
5 5 28 0,10 0,56
6 10 38 0,20 0,76
7 7 45 0,14 0,90
8 5 50 0,10 1,00
TOTAL 50 1,00

10. La duración en horas de una muestra de lámparas incandescentes de 40


watts y 110 voltios en pruebas forzadas de control de calidad fueron las
siguientes:
Duración de las lámparas.
1,10 1,26 0,83 1,30 1,25 1,49 1,19
1,30 1,23 0,87 1,36 0,94 1,21 1,23
1,24 1,10 1,23 1,32 0,99 1,39 0,95
1,20 0,93 1,18 1,34 0,92 1,02 0,77
1,20 1,05 1,23 1,26 1,20 1,08 1,11
0,82 0,98 1,02 1,03 0,82 0,91 1,16
0,76 1,24 1,00 0,61 0,96 0,83 1,22
1,40 1,33 1,12 1,23 1,25 1,42 1,38
0,94 1,17 0,98 1,69 1,40 0,97 1,30
1,34 0,99 1,08 1,09 1,24 0,87 1,11

10.1 Construir una distribución de frecuencias sobre la duración de las


lámparas en la muestra.
10.2 Cuántas clases usaría usted para la distribución de frecuencias?
Justifique el número de clases que haya seleccionado.
10.3 Uso usted intervalos de clase iguales o desiguales? Por qué?
10.4 Se le presentó algún problema especial al seleccionar los límites de
clase?
10.5 Represente gráficamente el diagrama y polígono de frecuencias.
10.6 Represente gráficamente la distribución de frecuencias acumulativa.
10.7 En los puntos 10.5 y 10.6, trabajó usted con frecuencias absolutas o
relativas? Explique su elección.
10.8 Analice sus gráficos y escriba un breve comentario para presentar sus
descubrimientos.
11. Noventa hogares escogidos al azar, que viven en un campamento minero,
incluyen los siguientes números de personas por hogar:
6 4 5 3 2 4 5 7 8 2 3 4 5 6 8 2 3 3 4 5 6 5 4 7 8 6 5 4
3 6 4 5 2 3 6 5 5 7 8 3 4 6 2 3 8 6 4 5 3 2 4 5 7 8 2 3
4 5 6 8 2 3 3 4 5 6 5 4 7 8 6 5 4 3 6 4 5 2 3 6 5 5 7 8
3 4 6 2 3 8
11.1 Elaborar un histograma de frecuencias, que muestre las frecuencias de
los hogares según el número de personas.
𝒉𝒊 100 𝑯𝒊 100 𝑯∗𝒊 100
𝒀𝒊 𝒏𝒊 𝑵𝒊 𝒉𝒊 𝑯𝒊 𝑵∗𝒊 𝑯𝒊∗
(%) (%) (%)
2 10 10 0.11 11 0.11 11 90 1.00 100
3 16 26 0.18 18 0.29 29 80 0.89 89
4 16 42 0.18 18 0.47 47 64 0.71 71
5 18 60 0.20 20 0.67 67 48 0.53 53
6 14 74 0.16 16 0.82 82 30 0.33 33
7 6 80 0.07 7 0.89 89 16 0.18 18
8 10 90 0.11 11 1.00 100 10 0.11 11
TOTAL 90 1.00 100

11.2 Construir un polígono de frecuencias basado en los datos anteriores.


20
20
Numero de hogares

15
15

% de hogares
10
10

5
5

2 4 6 8 2 4 6 8
Tamaño de hogar - Numero de personas Tamaño de hogar - Numero de personas

twoway (connected FRECABS TAMHOGAR) - twoway (connected FRECREL TAMHOGAR)

11.3 El histograma o el polígono de frecuencias muestra mejor la imagen de


los tamaños de los hogares.
11.4 ¿De qué tipo es la variable? La variable es discreta
12. En un trabajo de investigación agrícola se determinó la producción por
hectárea (en toneladas métricas) de un cierto producto agrícola, el cual fue
cultivado en 36 hectáreas experimentales (parcelas). Los resultados
obtenidos fueron los siguientes:40, 33, 35, 27, 38, 25, 40, 28, 41, 44, 37, 22,
41, 41, 20, 40, 29, 38, 36, 20, 25,46, 34, 29, 35, 50, 46, 47, 39, 35, 37, 29,
33, 27, 26 y 44.
12.1 Construir una distribución de frecuencias completa
12.2 Representar gráficamente las frecuencias absolutas y relativas, así como
sus acumulaciones
12.3 Si el 80% de las hectáreas cultivadas (parcelas) arrojan una producción
por encima de 30 toneladas métricas es recomendable su cultivo. Con
base a la información contenida en la distribución de frecuencias
elaborada ¿Recomendaría usted su cultivo?

13. Los cambios porcentuales mensuales del Índice de Precios al Consumidor


(IPC) de Bolivia del año 2011 fueron los siguientes: 1.7, 2.0, 1.6, 1.4, 1.7,
2.7, 2.2, 2.8, 2.2, 2.4, 2.5, 2.4:
13.1 Elabore una tabla de distribución de frecuencias completa e interpreta
los resultados.
13.2 Representar gráficamente la información de la distribución de
frecuencias.

14. La edad de 50 personas jóvenes postulantes a un programa de


capacitación fue la siguiente:

19, 22, 19, 18, 20, 23, 19, 19, 20, 19, 20, 21, 22, 21, 20, 22, 20, 21, 20, 21,
19, 21,,21,19, 19, 20, 29, 29, 29, 20, 20, 19, 21, 23, 24, 22, 23, 21, 20, 23,
24, 21, 25, 21, 23, 24, 22, 20, 25, 19:

14.1 Construya una distribución de frecuencias completa de clase única


14.2 Construya una tabla de distribución de frecuencias agrupada completa;
es decir, con intervalos de clase
14.3 Compare los resultados de ambas distribuciones de frecuencias.
14.4 Cuál de las dos distribuciones de frecuencias es la adecuada.

15. De los registros estadísticos de un centro de salud correspondientes a un


determinado año, se obtuvo la siguiente información referida al nivel de
estudios alcanzados por 120 pacientes afectados por una determinada
enfermedad: ninguno 28, primaria 53, secundaria 30 y superior 9:

15.1 Elabore una tabla de distribución de frecuencias absolutas y relativas


15.2 Elabore el gráfico de barras y circular
15.3 Interpreta los resultados utilizando la tabla de distribución de frecuencias y
los gráficos.

16. Un investigador del área social desea determinar en una localidad pequeña,
la cantidad de horas por semana que dedican los niños menores de 6 años
de edad para ver televisión. Una muestra de 36 niños, arrojó los siguientes
resultados (en cantidad de horas por semana):

10 19 25 19 26 16 19 27 27 25 23 22 17 12 20 15 21 23 26 14
18 25 23 24 21 28 30 25 24 25 19 22 18 25 26 23

16.1 Clasificar la información en una tabla de distribución de frecuencias


completa
16.2 Elaborar los correspondientes gráficos.
16.3 interpretar los resultados más importantes presentados en la distribución
de frecuencias y los gráficos.

17. La temperatura mínima registrada en la ciudad de El Alto durante el mes de


julio de 2011, en grados centígrados fue como sigue:

9 7 8 9 6 4 5 6 4 5 3 4 3 3 -1 1 -3 -1 -2 -4 -
5 -9 -6 -4 -3 -4 -6 -3 -2 -2 5

17.1 Elaborar una tabla de distribución de frecuencias completa


17.2 Elaborar los correspondientes gráficos
17.3 Interpretar los resultados más importantes de la tabla de distribución de
frecuencias y de los gráficos.

18. De una tabla de distribución de frecuencias simétrica con 7 intervalos de


clase de igual amplitud se conocen los siguientes datos: C = 10; n1 = 8; 𝑌3 𝑛3
= 1.260; h3 = 0.21; H6 = 0.96, y n2 + n5 = 62. Reconstruir la tabla de
distribución de frecuencias completa1.
Solución
a) Por la simetría de la distribución de frecuencias y 7 intervalos de clase, se
tiene: 𝑛1 = 𝑛7 = 8 ; 𝑛2 = 𝑛6 ; 𝑛3 = 𝑛5 y 𝑛4 queda sola.
b) Tomando en cuenta la siguiente igualdad 𝐻7 = 𝐻6 + ℎ7 y sustituyendo los
datos se tiene 1 = 0,96 + ℎ7 ; de donde se obtiene ℎ7 = 0,04 y por la simetría de
la distribución de frecuencias ℎ7 = ℎ1 0,04.

𝑛7 𝑛7 8
c) Tomando en cuenta que ℎ7 = se obtiene n = ; o sea n = = 200;
𝑛 ℎ7 0,04
luego 𝑛3 = 𝑛5 = nℎ3 = 200(0,21) = 42.

d) Utilizando n2 + n5 = 62; o sea n2 + 42 = 62 se tiene que 𝑛2 = 20 = 𝑛6 ; luego


20
ℎ2 = ℎ6 = 200 = 0,10

e) Como 𝐻6 = 𝐻5 +ℎ6 ; o sea, 𝐻5 = 0,96 – 0,10 = 0,86.

f) Tomando en cuenta 𝐻5 = 𝐻4 +ℎ5 se obtiene 𝐻4 = 0,86 – 0,21 = 0,65.

g) Considerando 𝐻4 = 𝐻3 +ℎ4 se tiene ℎ4 = 0,65 – 0,35 = 0,30; por lo que, 𝑛4 =


nℎ4 = 200(0,30) = 60.

1.260
h) Tomando en cuenta que 𝑌3 𝑛3 = 1.260, se obtiene 𝑌3 = = 30. Con este
42
𝑌2′ +𝑌3′ 𝑌0′ +2𝐶+𝑌0′ +3𝐶 2𝑌0′ +5𝐶
resultado se obtiene: 𝑌3 = = = Este resultado permite
2 2 2

1Estadística Descriptiva, Nueva Edición, Conceptos y Aplicaciones, Rufino Moya Calderón, ejemplo 2.9,
página 73.
2𝑌0′ +5𝐶 2(30)−5(10)
escribir la siguiente igualdad: = 30; de donde se tiene: 𝑌0′ = = 5.
2 2

Este es el limite inferior del primer intervalo de clase y tomando en cuenta la


amplitude de clase que es C = 10 se obtienen los 7 intervalos de clase y las
correspondientes marcas de clase. Todos los datos calculados se incluyen en
la siguiente distribución de frecuencias agrupada reconstruida:

Distribución de Frecuencias Reconstruida



𝑌𝑖−1 a 𝑌𝑖′ 𝑌𝑖 𝑛𝑖 ℎ𝑖 𝑁𝑖 𝐻𝑖
5 a 15 10 8 0,04 8 0,04
15 a 25 20 20 0,10 28 0,14
25 a 35 30 42 0,21 70 0,35
35 a 45 40 60 0,30 130 0,65
45 a 55 50 42 0,21 172 0,86
55 a 65 60 20 0,10 192 0,96
65 a 75 70 8 0,04 200 1,00
TOTALES 200 1,00

Intervalo Marca Frec. Frec. Frec. Frec.


de clase de clase absoluta relativa absoluta relativa
Y!i-1 a Y!i Yi = ni hi acumulada
𝑌 ! 𝑖−1 +𝑌 ! 𝑖 Ni acumulada
2 Hi
Y!0 - Y!1 Y1 n1 h1 = N1 = n 1 H1 = h1
n1/n
Y!1 - Y!2 Y2 n2 h2 = N2 = N1+n2 H2 = H1+h2
n2/n
! !
Y2 - Y3 Y3 n3 h3 = N3 = N2+n3 H3 = H2+h3
n3/n
. . . . . .
. . . . . .
. . . . . .
Y!m-1 - Ym nm hm = Nm=Nm- Hm=Hm-
!
Ym nm/n 1+nm=n 1+hm=1

Totales - n 1,00 - -

También podría gustarte