Distribucion de Frecuencias

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

CAPÍTULO II.

Distribución de frecuencias e histograma

Las variables de tipo cuantitativo son aquellas que toman, en lugar de


categorías, valores numéricos. Las categorías de las variables cualitativas pueden
relacionarse con valores numéricos, pero eso no las convierte en cuantitativas,
puesto que el número, en su caso, no es más que una “etiqueta”, careciendo de
sentido operar matemáticamente con ellos.

Escala de intervalo y escala de cociente. Desde un punto de vista teórico se


distingue entre variables cuantitativas medidas en escala de intervalo y en escala
de cociente. Las variables cuantitativas tienen una escala de intervalo si se
pueden ordenar sus valores y, además, se pueden realizar con ellos las
operaciones de suma y resta. La primera característica la comparte con las
variables cualitativas ordinales, pero al contrario que en aquéllas, en la escala de
intervalo puede medirse la distancia entre distintas observaciones. Permite
afirmar, por ejemplo, que un individuo tiene un valor que supera en diez
unidades al que toma otro individuo, o que entre dos individuos hay una
diferencia de veinte unidades. Las variables con escala de cociente añaden a
estas características la de incorporar un origen no arbitrario. La diferencia
esencial es que este segundo tipo de variable admite un cero verdadero
(toneladas consumidas o número de empleados, por ejemplo, donde el cero se
entiende como inexistencia) y permite el cálculo de proporciones entre los
distintos valores (una observación toma un valor que es el doble que el de otra).
Normalmente, desde el punto de vista práctico, no siempre se realiza una
distinción entre ellas.

Variables discretas y continuas. También se suele distinguir en la estadística


descriptiva entre variables de tipo discreto (si la variable toma un número finito
o infinito numerable de observaciones) y de tipo continuo (infinito no
numerable). De nuevo, desde el punto de vista práctico esta distinción no es
importante en muchas ocasiones.

Distribución de frecuencias. Diagrama de barras. La idea de recuento, es


decir, la idea de crear una distribución de frecuencias debe ser, como en el caso
de las variables cualitativas, el primer paso del análisis. Observar los distintos
valores que toma una variable, ordenarlos de menor a mayor y contar el número
de veces que aparece cada valor nos dará una idea de su comportamiento. El
único problema que se plantea con una variable de tipo cuantitativo es que suele
tomar un número de valores mucho mayor que las posibles categorías de una
variable cualitativa. La imagen general que se pretende dar con la distribución de
frecuencias puede ser entonces poco útil, porque la información está poco
resumida. El trabajo con intervalos de la variable, en lugar de con cada uno de
sus posibles valores, es el procedimiento normal para conseguir una imagen
sintética de la distribución.

Ejemplo 1. Distribución de frecuencias del número de hijos. En este


primer ejemplo vamos a obtener la distribución de frecuencias y el
diagrama de barras del número de hijos de una muestra de familias
españolas. La muestra de 1254 familias está formada por una selección
aleatoria de declarantes del IRPF que ya hemos analizado anteriormente.
La distribución de frecuencias para una muestra de esta variable Número
de hijos del hogar aparece en el cuadro 1 y su representación en un
diagrama en barras en la gráfica 1.

Cuadro 1

Número de hijos del hogar


Cumulative Cumulative
Niños Frequency Percent Frequency Percent

0 562 44.8 562 44.8


1 307 24.5 869 69.3
2 301 24.0 1170 93.3
3 59 4.7 1229 98.0
4 23 1.8 1252 99.8
5 2 0.2 1254 100.0

Gráfica 1
600

562
500

400

300
307 301
Frecuencias absolutas

200

100

59
0
0 1 2 3 4 5

Número de hijos del hogar

El primer resultado interesante de la distribución es el disponer de


los valores que toma la variable, información que a priori no conocíamos.
El número de hijos en la muestra toma únicamente valores 0, 1, 2, 3, 4,
5. Se trata de una variable de tipo cuantitativo discreta. Como en el caso
de una variable cualitativa podríamos detectar la moda y mediana de la
distribución. La moda corresponde al valor 0, ya que el 44.8% de las
familias no tienen ningún hijo en el hogar. La mediana de la distribución
es el hijo único, ya que es en el valor 1 en donde se acumulan el 50% de
las observaciones. Se puede resaltar, además, la importancia de los tres
primeros valores para describir el comportamiento de la muestra: el
93.3% de las familias tendría un número igual o inferior a dos hijos.

Un problema diferente se enfrenta cuando la variable toma diversos


valores numéricos, pero con un número mayor de posibilidades. Pensemos en la
distribución de la edad del perceptor principal de rentas de una familia
(sustentador principal) en la misma muestra de declarantes. En concreto, si
solicitásemos la distribución de frecuencias en una muestra de 1460 familias,
para la variable Edad del sustentador principal, nos encontraríamos ahora con la
distribución del cuadro nº 2.

Cuadro 2
EDAD del sustentador principal
Valid Cum
Value Frequency Percent Percent Percent
16,00 1 ,1 ,1 ,1
17,00 4 ,3 ,3 ,3
18,00 13 ,9 ,9 1,2
19,00 9 ,6 ,6 1,8
20,00 20 1,4 1,4 3,2
21,00 18 1,2 1,2 4,5
22,00 33 2,3 2,3 6,7
23,00 34 2,3 2,3 9,0
24,00 37 2,5 2,5 11,6
25,00 36 2,5 2,5 14,0
26,00 42 2,9 2,9 16,9
27,00 33 2,3 2,3 19,2
28,00 31 2,1 2,1 21,3
29,00 33 2,3 2,3 23,6
30,00 32 2,2 2,2 25,8
31,00 27 1,8 1,8 27,6
32,00 34 2,3 2,3 29,9
33,00 45 3,1 3,1 33,0
34,00 31 2,1 2,1 35,1
35,00 32 2,2 2,2 37,3
36,00 31 2,1 2,1 39,5
37,00 26 1,8 1,8 41,2
38,00 31 2,1 2,1 43,4
39,00 31 2,1 2,1 45,5
40,00 25 1,7 1,7 47,2

(Continuación Cuadro 2)

41,00 34 2,3 2,3 49,5


42,00 27 1,8 1,8 51,4
43,00 34 2,3 2,3 53,7
44,00 31 2,1 2,1 55,8
45,00 40 2,7 2,7 58,6
46,00 32 2,2 2,2 60,8
47,00 35 2,4 2,4 63,2
48,00 23 1,6 1,6 64,7
49,00 20 1,4 1,4 66,1
50,00 28 1,9 1,9 68,0
51,00 11 ,8 ,8 68,8
52,00 34 2,3 2,3 71,1
53,00 32 2,2 2,2 73,3
54,00 28 1,9 1,9 75,2
55,00 21 1,4 1,4 76,6
56,00 25 1,7 1,7 78,4
57,00 30 2,1 2,1 80,4
58,00 38 2,6 2,6 83,0
59,00 25 1,7 1,7 84,7
60,00 15 1,0 1,0 85,8
61,00 15 1,0 1,0 86,8
62,00 12 ,8 ,8 87,6
63,00 18 1,2 1,2 88,8
64,00 11 ,8 ,8 89,6
65,00 17 1,2 1,2 90,8
66,00 14 1,0 1,0 91,7
67,00 12 ,8 ,8 92,5
68,00 20 1,4 1,4 93,9
69,00 10 ,7 ,7 94,6
70,00 9 ,6 ,6 95,2
71,00 6 ,4 ,4 95,6
72,00 8 ,5 ,5 96,2
73,00 5 ,3 ,3 96,5
74,00 7 ,5 ,5 97,0
75,00 8 ,5 ,5 97,5
76,00 4 ,3 ,3 97,8
77,00 1 ,1 ,1 97,9
78,00 5 ,3 ,3 98,2
79,00 5 ,3 ,3 98,6
80,00 5 ,3 ,3 98,9
81,00 5 ,3 ,3 99,2
82,00 5 ,3 ,3 99,6
83,00 1 ,1 ,1 99,7
84,00 1 ,1 ,1 99,7
85,00 1 ,1 ,1 99,8
86,00 1 ,1 ,1 99,9
87,00 1 ,1 ,1 99,9
88,00 1 ,1 ,1 100,0
------- ------- ------
Total 1460 100,0 100,0

Gráfica 2
50

40

30
Frecuencias absolutas

20

10

0
16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84 88
18 22 26 30 34 38 42 46 50 54 58 62 66 70 74 78 82 86

EDAD del sustentador principal

La lectura de esta distribución ya no resulta tan cómoda como cuando la


variable toma un número escaso de valores. La creación de la tabla sigue siendo
una ayuda para comprender el comportamiento de la variable (moda, mediana,
porcentajes acumulados hasta un determinado valor), pero resulta algo más difícil
hacerse una idea general de la distribución. La representación gráfica del
diagrama en barras (gráfica 2) nos ayuda a simplificar la imagen, pero también
presenta un exceso de información. Uno de los principales objetivos de las
técnicas estadísticas es facilitar la comprensión de la información numérica,
sacrificando volumen de información (menor precisión) por una mejor
comprensión de la misma (mayor eficiencia).

Histograma. Para tratar variables que toman gran cantidad de valores el


procedimiento usual es el de agrupar los valores en intervalos. Tomemos la
variable edad del sustentador principal con la que hemos trabajado en el
apartado anterior. De una manera arbitraria, podemos pensar en crear intervalos
de edad de 8 años: de los 16 a los 24 años, de los 24 a los 32, etc. En el cuadro 3
se recoge el resultado de esta agrupación de la variable y en la gráfica 3, la
representación correspondiente de las frecuencias relativas de cada intervalo.

Aunque ahora no dispone de información sobre el número de individuos


de la muestra que tienen una edad concreta, los rasgos generales de la
distribución de la edad es más clara.

Cuadro 3
Valid Cum
EDAD Frequency Percent Percent Percent

16 a 24 169 11,6 11,6 11,6


24 a 32 268 18,4 18,4 29,9
32 a 40 252 17,3 17,3 47,2
40 a 48 256 17,5 17,5 64,7
48 a 56 199 13,6 13,6 78,4
56 a 64 164 11,2 11,2 89,6
64 a 72 96 6,6 6,6 96,2
72 a 80 40 2,7 2,7 98,9
80 a 88 16 1,1 1,1 100,0
------- ------- -------
Total 1460 100,0 100,0
Gráfica 3
300

200

100

0
16 - 24 24 - 32 32 - 40 40 - 48 48 - 56 56 - 64 64 - 72 72 - 80 80 - 88

EDAD del sustentador principal

La representación realizada para la variable “Edad del sustentador


principal” se denomina histograma. Aunque se parece al diagrama de barras,
se diferencian en que en el diagrama, la altura de la barra es proporcional a la
frecuencia, mientras que en el histograma es el área del rectángulo la que es
proporcional a la frecuencia. Formalmente pueden establecerse otras
diferencias entre el diagrama en barras y el histograma. En el diagrama, cada
barra representa la frecuencia de un atributo de la variable, mientras que en un
histograma, cada uno de los rectángulos representa las frecuencias de
diversos valores de la variable (intervalos de valores). Además, debe tenerse
en cuenta que en los histogramas, cuando aparece un intervalo con frecuencia
cero, no se omite por ello su representación, mientras que en un diagrama de
barras no se incluye ningún espacio para aquellos valores con frecuencia nula.

En el histograma se representan las frecuencias de la variable definida en


intervalos. El área del rectángulo es proporcional a la frecuencia en el intervalo.

El histograma se construye de manera que el área correspondiente al


rectángulo que se dibuja sobre el intervalo sea proporcional a su frecuencia.
Carecería de sentido proceder como en el diagrama de barras. Puesto que los
intervalos en los que se puede dividir cualquier variable continua son de una
amplitud y número arbitrario, si dibujásemos barras con alturas proporcionales a
las frecuencias para cada intervalo, los resultados serían absurdos.

Haciendo el área proporcional a la frecuencia relativa para el intervalo i-


ésimo se tendrá:
ni
Area i = basei * alturai =
n

donde la base es la amplitud del intervalo y, por tanto, la altura del rectángulo es
igual a:

ni 1
alturai =
n basei

Si un intervalo tiene una gran amplitud tenderá en principio a ofrecer un


mayor número de frecuencias, no obstante en el histograma se seguirá
manteniendo un área total proporcional. La altura del rectángulo, de acuerdo con
su definición, se conoce como densidad de frecuencia.

Para identificar cada intervalo se emplea en ocasiones sus puntos medios,


denominados marcas de clase:

Límite superior del intervalo + Límite inferior del intervalo


marca de clase =
2

En muchos histogramas es la marca de clase el valor que identifica los


intervalos.

En general, se emplea el histograma: (i) cuando se trata de variables


que contienen muchos valores diferentes; (ii) cuando tiene sentido construir
intervalos, agrupando valores adyacentes.

Cómo trabajar con los histogramas. El histograma pretende facilitar la


comprensión de la forma de la distribución de la variable.

Al estudiar un histograma se debe estar dispuesto a descubrir cuáles son


los valores más frecuentes, los valores que ocurren con poca frecuencia, la
simetría o asimetría de la distribución, su dispersión y forma.

La moda y la mediana que utilizábamos para describir una variable


cualitativa pueden usarse con la misma definición sobre las variables
cuantitativas. La moda es el valor con mayor frecuencia. La mediana es aquel
valor que (ordenada la variable de menor a mayor) deja por debajo de sí mismo
el 50% de las observaciones. Estos estadísticos pueden calcularse sobre la
distribución original de la variable, aunque puede ser recomendable obtener la
moda y la mediana en los intervalos de la variable. Existen fórmulas para obtener
la moda y la mediana a partir de la información agregada en intervalos, pero es
también correcto detectar la moda y mediana en el propio intervalo y hablar, por
ejemplo, del intervalo modal cuando en una distribución se detecta un intervalo
con un área (una frecuencia) mayor que los restantes.

Uno de los problemas de los histogramas es decidir con cuántos


intervalos construirlos y si los intervalos deben ser todos de la misma amplitud.
Normalmente los histogramas se construyen con intervalos de igual amplitud,
de manera que o bien se define el número de intervalos y de ahí se deduce (a
partir del rango de la variable) la amplitud de cada intervalo, o bien se decide
arbitrariamente la amplitud del intervalo y luego se deduce el número de
intervalos. Estas decisiones están sujetas a una cierta arbitrariedad. Una regla
frecuentemente utilizada es la de definir intervalos de la misma amplitud, en
un número igual al entero más próximo a n .

Es normal definir intervalos de diferente amplitud en las colas de la


distribución (valores superiores e inferiores de la distribución), en donde además
se suelen emplear intervalos abiertos. El intervalo inferior se define tomando los
valores por debajo de una cantidad (menos de __ ) y el intervalo superior, por
encima de una cantidad (más de __ ). El propósito de estos intervalos abiertos es
evitar histogramas en los que “pesen” demasiado la representación de los valores
extremos, que pueden estar muy alejados del comportamiento común.

Ejemplo 2. Efecto del número de intervalos en la construcción del


histograma. La decisión sobre el número de intervalos que deben tomarse
para construir un histograma puede ser decisiva para la comprensión de
la distribución. Como ejemplo se ofrecen en los gráficos 4 a 7 cuatro
histogramas de la variable ingresos familiares de una muestra de familias
de la Encuesta de Presupuestos Familiares (EPF-90). En la gráfica 4 se
ofrece un histograma basado en 27 intervalos (número seleccionado
según criterios formales por un programa informático de estadística),
siendo la amplitud de cada intervalo de 20000 ptas. La gráfica 5 se basa
en 10 intervalos (amplitud 54000), la gráfica 6 en 25 intervalos (amplitud
21600) y, finalmente, la gráfica 7 con 50 intervalos de amplitud igual a
10800, cada uno de ellos.
Gráfica 4 Gráfica 5
400000 600000

500000

300000

400000

200000 300000

200000

100000

100000

0 0
200000 1000000 1800000 2600000 3400000 4200000 5000000 370000 1450000 2530000 3610000 4690000
600000 1400000 2200000 3000000 3800000 4600000 5400000 910000 1990000 3070000 4150000 5230000

Ingresos percibidos. Muestra EPF Ingresos percibidos. Muestra EPF

Gráfica 6 Gráfica 7
300000 200000

200000

100000

100000

0 0
208000 1504000 2800000 4096000 5392000 154000 1234000 2314000 3394000 4474000
856000 2152000 3448000 4744000 694000 1774000 2854000 3934000 5014000

Ingresos percibidos. Muestra EPF Ingresos percibidos. Muestra EPF

Observe que ni siquiera las gráficas 4 y 6 (con 27 y 25 intervalos)


proporcionan una imagen idéntica, detectándose una moda más señalada en el
primer histograma. En la gráfica 5 (con 10 intervalos) se recoge la imagen básica
de la distribución, siendo incluso suficiente para captar las grandes líneas de la
misma, caracterizada por ser una distribución asimétrica hacia la derecha. Sin
embargo, si uno está interesado en detectar posibles modas y submodas (o
modas relativas) parecería más adecuado el histograma basado en 50
intervalos.

Cuando se trabaja con histogramas, resulta recomendable experimentar


con el número de intervalos.

Ejemplo 3. Distribución de los porcentajes de gasto en alimentación y


vestido. En este ejemplo se consideran dos partidas del gasto en
consumo de una muestra de familias españolas. Se van a analizar los
histogramas y las distribuciones de frecuencias de las proporciones de
gasto del consumo en alimentos y en vestido y calzado. Cada uno de
estos agregados tienen características distintas, que se reflejan en las
formas de sus distribuciones.
La muestra que seleccionamos corresponde a 271 hogares,
provenientes de la Encuesta Continua de Presupuestos familiares
(ECPF). La ECPF es una encuesta realizada por el INE desde el primer
trimestre de 1985, efectuándose cada trimestre desde ese año. La
encuesta recoge el origen y cuantía de las rentas familiares y su
concreción en gastos de consumo (gastos trimestrales de más de 200
bienes). La unidad básica de la encuesta son los hogares, de los que se
seleccionan alrededor de 3200 de manera aleatoria, renovándose cada
trimestre el 12.5% de la muestra (como consecuencia de ello, un hogar
permanece en la encuesta como máximo ocho trimestres). Las 271
familias de nuestro ejemplo son las que cumplen su último trimestre en la
encuesta en el cuarto trimestre de 1991.

Las variables son proporciones de gasto (en alimentación, y en vestido y


calzado). Estas se han calculado, para cada bien y en cada familia como:

gasto del hogar en el bien i


proporción del gasto en el bien i = ⋅100
consumo total del hogar

En las gráficas 8 y 9 (alimentación y vestido y calzado,


respectivamente) aparecen conjuntamente las distribuciones de las
proporciones de gasto y sus histogramas. Estos resultados se han
obtenido utilizando un programa informático de estadística y el número
de intervalos en los que debían dividirse las variables ha sido calculado
por el propio programa. En los resultados se ofrecen el histograma (con
las frecuencias relativas en el eje horizontal) y la distribución de
frecuencias: FREQ. es la frecuencia absoluta, CUM. FREQ. la frecuencia
absoluta acumulada, PCT. la frecuencia relativa y CUM. PCT. la
frecuencia relativa acumulada. Los intervalos se definen por medio de su
marca de clase; recuerde que la marca de clase de un intervalo es su
punto medio, de manera que un valor de 4 al lado de uno de los
rectángulos del histograma indica que el intervalo correspondiente está
entre 0 y 8.

La primera impresión que se obtiene de los dos histogramas es la


de su diferente forma. Ambas son distribuciones unimodales (con un
intervalo definiendo la máxima frecuencia), aunque la distribución
correspondiente a alimentación presenta esa moda en el centro de los
valores que toma la variable, mientras que vestido y calzado tiene la
moda bastante desplazada del centro de la variable, muy cerca de sus
valores mínimos. Las distintas formas de las distribuciones son
importantes cuando se trata de describir el comportamiento de una
variable. Aunque más adelante volveremos sobre ello, puede ya retener
que un tipo de distribución como la de alimentos se conoce en estadística
como distribución simétrica, mientras que la de vestido y calzado se
conoce como distribución asimétrica por la derecha, al tener muchos más
valores alejados de la moda por la parte superior de la variable (una
distribución asimétrica por la izquierda tendría la imagen contraria).

¿Qué nos aporta la información de las distribuciones?


Centrémonos en el gasto en alimentación. El intervalo mínimo de la
variable tiene una marca de clase del 4% y el intervalo más alto es igual
al 84%. El intervalo más frecuente, que definiría la moda, se sitúa en el
28% del gasto, cifra que identificaría el 23.99% de las familias de la
muestra. Al tratarse del consumo de alimentos, parece que sería lógico
esperar que el porcentaje de gasto que éstos representan en un hogar no
fuera muy elevado. La moda, con un valor alrededor del 28%, nos ofrece
una buena referencia de cuál puede ser la proporción esperada. Sin
embargo, en la distribución destacan las observaciones que se sitúan en
la parte superior de la variable. El porcentaje de familias que dedican
algo más del 50% de su presupuesto a la alimentación resulta
significativo. En concreto, por encima del intervalo cuya marca de clase
es 44 (40% a 48%) se sitúa el 100-90.04=9.96%, es decir que alrededor
de un 10% de las familias, consumen más del 48% de su gasto total en
alimentación. La mayoría de hogares, sin embargo, limitan este
porcentaje, destacando que el 60.52% de los hogares tiene un porcentaje
de gasto inferior al 32%.

La descripción de la segunda variable puede hacerse en términos


parecidos. La moda, con un valor del 5%, nos define el valor más
frecuente. La distribución de este tipo de gasto es diferente a la de
alimentación. El recorrido de la variable es bastante menor, situándose
teóricamente entre el 0 y el 47.5% (valores inferior y superior del primer y
último intervalo, respectivamente). El intervalo inferior tiene como punto
medio 0, y debe interpretarse como definido entre 0 y 2.5%, al no ser
posible definir un porcentaje de gasto negativo (intervalo entre –2.5 y
2.5). En este intervalo se sitúa el 22.88% de los hogares, de manera que
destaca de la distribución el que el 50.18% de los hogares gasten menos
del 7.5% de su consumo trimestral en vestido y calzado. Los valores
superiores de la variable, sin embargo, no muestran frecuencias tan
altas. Por encima del 25% del gasto (y hasta un máximo del 47.5%) se
encontrarían nada más que alrededor del 7% de los hogares.
Gráfica 8
P r o p o r c i ó n d e g a s t o e n a l i me n t a c i ó n CUM. CUM.
FREQ. FREQ. PCT. PCT.

4 12 12 4. 4 3 4. 4 3

12 31 43 11. 44 15. 87

20 56 99 20. 66 36. 53

28 65 164 23. 99 60. 52

36 51 215 18. 82 79. 34

44 29 244 10. 70 90. 04

52 13 257 4. 8 0 94. 83

60 8 265 2. 9 5 97. 79

68 1 266 0. 3 7 98. 15

76 2 268 0. 7 4 98. 89

84 3 271 1. 1 1 100. 00

0 10 20 30
Fr e c u e n c i a s r e l a t i v a s

ECP F . I V t r i me s t r e 1 9 9 1

Gráfica 9
CUM. CUM.
Pr o p o r c i ó n g a s t o e n v e s t i d o y c a l z a d o
FREQ. FREQ. PCT. PCT.

0 62 62 22. 88 22. 88

5 74 136 27. 31 50. 18

10 52 188 19. 19 69. 37

15 37 225 13. 65 83. 03

20 14 239 5. 17 88. 19

25 12 251 4. 43 92. 62

30 14 265 5. 17 97. 79

35 1 266 0. 37 98. 15

40 4 270 1. 48 99. 63

45 1 271 0. 37 100. 00

0 10 20 30
Fr e c u e n c i a s r e l a t i v a s

ECP F . I V t r i me s t r e 1 9 9 1

Ejemplo 4. La influencia del salario mínimo en la desigualdad


salarial. El impacto que tiene el salario mínimo sobre la distribución de
los salarios ha sido analizado con datos de la economía portuguesa por
Rute (1997). La legislación sobre salario mínimo impone un efecto de tipo
igualitario en la estructura de salarios, al imponer restricciones en los
salarios pagados por los empleadores. En su trabajo discute diversos
histogramas que muestran la distribución de los salarios en distintos
años. El análisis de los mismos se dirige especialmente a la detección de
los picos (modas o submodas) del salario mínimo, clarificando además la
estructura de salarios que quiere describirse. En todos los histogramas
se señala la posición de los salarios mínimos correspondientes a la
agricultura y al conjunto de actividades económicas, excluyendo en este
caso la agricultura y el trabajo doméstico (estas posiciones se identifican
en el eje horizontal con las letras A y M, respectivamente).

En la gráfica 18 se muestra el histograma de los salarios del año


1983. En el mismo puede detectarse una moda en el salario mínimo
agrícola y una moda, más importante, en el salario mínimo del resto de la
economía. Hasta 1986 (gráfica 19), las relaciones económicas se
endurecieron, contrayéndose el nivel de empleo y aumentando el cierre
de empresas. La legislación sobre salario mínimo hizo que éste fuera
mayor en relación al salario medio en la economía. Esto tuvo un efecto
igualitario sobre la distribución, al acercar los salarios más bajos a los del
resto de trabajadores. Este efecto se dio también sobre los salarios
inferiores al mínimo legal, que se vieron arrastrados por el aumento del
salario mínimo. El histograma de los salarios del año 1992 se muestra en
la gráfica 20. En ese año no se permitieron salarios legales por debajo
del mínimo, el pico correspondiente todavía se detecta, pero la
concentración por encima del mínimo aumenta.

Los picos detectados en las distribuciones ilustran la importancia


de la legislación sobre salario mínimo y, en consecuencia, la importancia
de los factores institucionales en la distribución de los salarios.

Gráfica 18
.078947

Fraction

0
3000 A M 39990
salarios base 1983

Gráfica 19
.102424

Fraction

0
4000 A M 68992
salarios base 1986
Gráfica 20
.101049

Fraction

0
117000 A=M 176900
salarios base 1992

Las variables de tipo cuantitativo permiten un tratamiento más completo


que el visto para las variables cualitativas. Además de las distribuciones de
frecuencias, sus representaciones gráficas y estadísticos como la moda y la
mediana, es posible calcular otras medidas numéricas que de manera sencilla y
sintética faciliten información de la distribución de la variable. En el siguiente
capítulo se van a discutir algunos de estos estadísticos.

También podría gustarte