Glass y Stanley Cap 5. Medidas de Variabilidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

/4

S.

l \1AUI\IICU\

MI 101)0\

APLI( Al>OS A 1

\ 111 N( 11\\ \O(IAlC.S

Hallar la media y la mediana en la iguicntc distribucin de frecuencia agrupadas:

lmerralos

Frecuencia

20-24
15-19
10-14
S-9

0-4
(-S}-(-1)
n

2
11
17
13
9
7
59

MEDIDAS DE
VARIABILIDAD

6.

El grupo A comprende JO puntuaciones, y la media y la mediana son respectivamente


14,5 y 13. El grupo B comprende 20 puntuaciones, y la media y la mediana son respectivamente 12,7 y 10. Cules son la media y la mediana de las 30 puntuaciones obtenidas combinando los grupos A y B?
1. Los siete miembros de la Sociedad de Excursiones Dominicales (SAPS) viven a lo largo
de una recta de la carretera IOI. Sus hogares estn situados como sigue:

......

~----~~ ...............--~--.--~---~
8

5mi

2mi

Smi

2mi

EFG
!mi !mi

El valor de la gasolina (3,5 centavos por milla) para el viaje de todos los miembros de la
sociedad se tom de la tesorera del club. Puesto que cualquier punto a lo largo de la carretera 101 es un hennoso sitio para paseo campestre, en qu lugar de la vla podrlan detenerse
los miembros con objeto de gastar la menor cantidad de dinero para el transporte?
8. Hallar la media de las puntuaciones del SAT-V con las n = 903 puntuaciones para hombres
del problema 4 del final del Cap. 3. (Sugerencia: para encontrar rpidamente la media se
multiplica el punto medio de cada intervalo por las frecuencias relativas de las puntuaciones
en ese intervalo, y entonces se suman estos productos para los doce intervalos.)

1 1

INTROOUCCION

1 .- medidas de tendencia central se refieren a la concentracin de puntuaciones


111111 determinada escala numrica en un grupo. Una medida particular de tenden, In I cutral da lugar a una puntuacin que, en cierto sentido, representa a todas
I puntuaciones de un grupo. Este proceso pasa por alto las diferencias entre las
11111111:aciones en si. Asimismo, para evaluar la variacin de las puntuaciones, se
111, 1 -uan estadigrafos descriptivos y son los que se describirn en este captulo
h ,111tllgrafos que miden heterogeneidad, dispersin o esparcimiento).
Ms adelante, el estudiante empezar a comprender que unas de las ms impor1.1111, funciones de la estadlstica se relaciona con el clculo de la variabilidad,
, 111"1t1n que se resumir, demostrar y explicar a pesar de que pued resultar un
1111110 confuso en un comienzo, pero el trabajo cientifico en si, se relaciona con no' 1 111c, de variabilidad. Cuando la variabilidad es inexplicablemente alta, las pre1111 ~ iones nunca pueden ser muy exactas, pero cuando puede dar cuenta de las
,l1h1cncias entre la gente o las cosas, la incertidumbre y confusin pueden redu 11\\', suprimiendo parte de la variabilidad. Por ejemplo, si no se sabe nada respecto
,h por qu la gente difiere en inteligencia, se afronta una gran incertidumbre al
111t\11111r predecir tal variable y, aunque algunos resultaran inteligentes y otros
pes, serla imposible determinar la causa. Sin embargo, si se sabe que la herencia
)' d medio ambiente dan lugar a influencias cuantificables en el CJ, entonces, co,11~ rendo la herencia de un nio y su temprana educacin, se tendran las bases
p,11,1 una prediccin ms exacta de su inteligencia posterior. En otras palabras,
111

"''

76

71

\ll H>l>OS

l)ISTI( OS APLICADOS

i\ LA\

( 11 M li\\

\OCIA LES

la variabilidad entre el CI para personas cuya herencia y medio ambiente son seme-

jantes es menor que la de la poblacin general. Pero antes de continuar con este
tema complejo, debemos aprender los ndices convencionales de variabilidad.
5.2

El RANGO

El rango no es sino la medida de la distancia total en la escala numrica a lo largo


de la cual varan los puntajes. Como ya se dieron definiciones algo diferentes, ser
necesario distinguir dos tipos de rango: el rango incluyente y el excluyente.

1111111\~

77

roxn

,1, tu extremos. Por ejemplo, si el rango de 100 puntuaciones va de I a 10, el rango


1111 uyentc es 10.5 - 0,5 = 10. Pero si uno de los dos es ' y el otro es 1~ Y. los 98 res111111:, tienen un valor de 5. de todos modos el rango incluyente sera igual a 10.
1 111, do, tipos de heterogeneidad (uno en el cual JOO puntuaciones se distribuyen
11,,1111.llmentc y otro en el cual los 100 coinciden en un mismo punto) representan
h, \ 1111, muy diversos, pero no pueden distinguirse por simple inspeccin del rango,
,111, c-. con mucho, la medida ms imperfecta de variabilidad de las que se emplean
, ,111 mayor frecuencia.
1, t

Definicin: El rango excluyente es la diferencia entre la mayor


y la menor puntuacin de un grupo.

1)1 VARI/\IJll

O. AMPLITUD
EL PERCENTIL

ENTRE
10 Y 90

1 medida de variabilidad es D, la amplitud entre el percentil 10 Y el 90 de un


de puntuaciones. Trumao Kelly, estadstico educacional, la defini como
111111t1

1111

Por ejemplo, el rango excluyente de las puntuaciones O, 2, 3, 3, 5 y 8 es 8 - O


8 y el de las puntuaciones -0,2, 0,4, 0,8 y 1,6 es de 1,6 - ( -0,2) = J ,8.

Definicin: El rango incluyente es la diferencia entre el limite


superior real del intervalo que abarca la mayor
puntuacin, y el limite inferior real del intervalo
que abarca la puntuacin menor.
Sean, por ejemplo, las siguientes estaturas de seis muchachos, en pulgadas:
59", 61 ", 65" y 66". La estatura real del ms bajo de los chicos se halla entre 58,5"
y 59,5", siendo el limite inferior real 58,5" y el superior r.eal 59,5". Es asi cmo
el rango incluyente es igual a 66,5" - 58,5" = 8" lo cual es una unidad mayor
que 66 - 59 (vase Fig. 5.1 ).
El rango excluyente es la distancia entre la menor y la mayor puntuacin informada en un grupo, excluyendo. con un buen margen de seguridad, alguna puntuacin situada por encama o por debajo de las puntuaciones extremas informadas
(para las definiciones de puntuaciones reales e informadas, vase la Sec. 2.3).
El rango incluyente incluye a todas las puntuaciones reales o informadas.
En el futuro, si no mencionamos si el rango es excluyente o incluyente, ser
porque nos referiremos a cualquiera de los dos. Aunque el significado del rango
como medida de variabilidad sea completamente claro, presenta algunos inconvenientes, en razn de que solamente dos puntuaciones exactas de un grupo son
las que lo determinan, ignorando as, todas las dems puntuaciones, a excepcin

ll'lll

(192l):

(5.1)

1 11 razn de que son ms numerosas las puntuaciones que influyen directamente


'""" ella, D es un poco ms estable que el rango, y es ms fcil.de calcular que otras
1111 tluln, de variabilidad que se presentarn ms adelante. San embargo, nmguna
ll , '" ventajas ha sido lo suficientemente convincente como para hacer de D una
111, ,lula de variabilidad popular, y de hecho, rara vez se emplea.

ti

EL RANGO

111 l,1 Scc, 3.2 consideraron los tres cuartiles de una distribucin de puntuaciones:
rl punto de la escala por debajo del cual se halla el 25 % de las puntuaciones,
V (111 mediana) y Q3, el punto por encima del cual se halla el 25 % de las puntua-

1 a di tancia entre el primer y el tercer cuartil (o sea, Q3 - QJ se llama


,,,m11 mtercuartil, y la mitad de dicha distancia se denomina rango semiintercuarti/.
s, Q va a denotar el rango semiintercuartil, tenemos que:
1111111,

a .. nnldn:

Altura en pulgadas

FIG. 5.1 Ilustracin del rango incluyente


y excluyente,

El rango semiintercuartil Q, es la distancia media entre


el primer y tercer cuartil, o sea

Q=

Rango 1ncluyen1e 8

65

SEMIINTERCUARTIL

Q.

(5.2)

() e, una medida de variabilidad til y de fcil cmputo. Para proi>?sito.s _dcs


es definitivamente
superior al rango, excepto en c~anto a simplicidad
1ks , ,~ ulo,
ms probable que los patrones de heterogeneidad de dos grupos
tk 1111111u.1c1ones se asemejen entre si. si tienen un Q comn.
l'urn rcconvrruir tas puntuaciones llmne que abarcan el 50 " de todo el grupo,
l'lll'il' recurrir a Q. siempre y cuando I:\\ dictrihucionc scun uproxhundnmcntc

lt

ll'llvo,

78

MI' IOl)OS ESTAOISTICOS

APLICADOS

A LAS C'II N< IAS SOCIALT:.S

simtricas respecto de la media o mediana. Si 250 puntuaciones se distribuyen


de modo aproximadamente simtrico respecto de una mediana de 63 y su rango
intercuartil es de 11, entonces se sabe que el 50 % de ellos (125) se hallarn entre
Md - Q = 63 - 11 = 52
y
Md+ Q

= 63 +

11

25

;:;

.,:,
u
.,
..:
e

79

lOAI)

Al sumar todas estas puntuaciones, cabe preguntarse s tal suma refleja la vaoriginal, cosa que no es as, puesto que dichas sumas siempre sern iguales

l 1 1l 1b11

, l crn:

(X, - X.)

,. 1

= O.

Para evitar este obstculo, cada puntuacin de desva-

, hlll puede elevarse al cuadrado, y estos resultados sumarse. Por tanto, para una
1 , ,~ de puntuaciones dadas, una medida del tipo de

= 74.

Si la dis~bucin es muy asimtrica respecto de la mediana, podra darse que


hasta~ 70 % de !as puntuaciones se hallen dentro del rango Md - Q a Md + Q.
En Ja F1g. 5.2 se ilustran casos de simetra y asimetra, as como el empleo de Q.

..

~11 IIIIIAS l)ll VARIAl.111

(X, -

1-1

.X.)2

- X.)2

e, necesario elevar a1 cuadrado las puntuaciones de desviacin para hacerles

11111lc1 sus signos, puesto que si se suman sin tener en cuenta el signo (es decir,
1,11111ndolos segn su valor absoluto), obtendramos lo que se conoce como des ,,1111S11 media, que se calculara en la Sec. 5.9. El valor de la expresin anterior tam1,1111 depende del nmero de puntuaciones consideradas, ya que a mayor tamao
,1, 11, mayor la suma, lo cual constituye una limitacin para efectos de comparar la
, ,u uihilidad de dos grupos que difieren en cuanto aJ nmero de puntuaciones. Sin
, 111li11rgo, lo anterior puede evitarse dividiendo la expresin por n - l, con lo cual
II ollrnrla una medida de variabilidad llamada varianza que se denota por s; y
lh 111 la frmula siguiente:
n

t
Sz

FIG. 5.2 Interpretacin


de Q. Exactamente el 50 % de las puntuaciones
se hallan entre Md - Q y Md + Q en la distribucin simtrica de la izquierda
52,S % de las puntuaciones se hallan entre Md - Q y Md + Q en la distribucin un tanto asimtrica de la derecha.

+ ... + (Xn

ulta cuando hay gran heterogeneidad y baja cuando hay homogeneidad.

11111

N,,

XY1 = (X1 -

(X, - .x:'.)2

'=-1=-----

(5.3)

n-1

h1 razn de que todava no hemos desarrollado los conceptos necesarios para

explicacin adecuada, no podemos responder por el momento por qu divipor n - 1 y no por n. En la Sec. 12.4 podrn considerarse las razones de
,,111 eleccin.
I w, siguientes datos sirven para ilustrar el clculo de la varianza de un grupo
,h 111~1,; puntuaciones:
111111

1lh1111~

5.5

LA VARIANZA

Hasta ahora no hemos estudiado sino el rango semiintercuartil Q, el rango y D =


P,o como medidas de dispersin, heterogeneidad o variacin. A medida
que el grupo de pu~tuaciones a partir del cuaJ se calcula, muestra mayor dispersin
(menor homogeneidad), cada una de estas medidas aumenta en valor. Tmese
nota de que, a1 iguaJ que la mediana y la moda, estas medidas no incluyen en su
clculo todas las puntuaciones individuales. A continuacin, estudiaremos una
cuar~~ m_edi?~ de variacin, para cuyo clculo se requiere operar con cada puntuacon individual, taJ como sucede con la media.
Las_ puntuaciones de desviacin del tipo de X, - X .. indican que a mayor heterogeneidad _en el grupo, mayor desviacin respecto de la media. Caso de que todas
las pun~ua~1ones ~ean 9, hallaramos que su media es 9 y, por tanto, la puntuacin
de desviacin sena 9 - 9 = O; as pues, en un grupo absolutamente homogneo
todas 18:5. puntuaciones de desviacin sern iguales a cero. Sin embargo, sera de
gran utilidad hallar alguna combinacin de puntuaciones de desviacin.
P90 -

Puntuacin Puntuacin - Media


1

3
3

4
1

(Puntuacin - Media?

1 - 2 = -1
1
3-2=
1
3-2=
O- 2 = -2
4-2=
2
1 - 2 = -1

4
4
1
12

12

.,.2..

12
6

12

2,4

IG

MI

rooos

ISTAOISTICOS

Al'LICADOS

A LAS CII NC'IAl> SOCIALES

Sea un segundo grupo de seis puntuaciones con igual media (2), pero ms heterogneo. Los clculos para hallar la varianza son los siguientes:
X

X-X.

o
o
o
o

2 x,

1-1

(X- X)

0-2 = -2
0-2 = -2

12

X . =-=2
6

.
2 (X, -

..f.)t

,-1

48
6-1

16
16
48

'
,

s;

s! =

s;

(X, - X.)1
,;..;;;_"""1

n-l

2 (X - 2x.x, + X.'> = ,_,


2 X~ - 2X.,_,2 X, + ,_,2 X'.
,-1
ti

ft

"

n-l

Teniendo en cuenta que E X=

2" X -

"

n-l

nX., la expresin anterior puede escribirse as:

2nX.t

"
IX;
-

+ nX.

.,-

ix~ - (ix,) /n

,_,

,_,

(5.4)

n-1

11

l X - (i- x,)
11(11 -

1)

2 -

(i xr = 36 -

12

s! = 6 -

11

= 36

36

122
-

-1-

16

2.11 =
,_.

- 24
12

=5 =

144
36 - -

12

2,4

Cuando uno o ms de los posibles valores de una variable se presenta ms de


vez en un grupo de puntuaciones, el clculo de se simplifica, como en el caso
,h la media (vase Sec. 4.7). En la anterior ilustracin, el 3 aparece dos veces y la
111111idad que contribuy a la suma total de las puntuaciones CE X) fue 3 + 3 =
t l), y la que contribuy a la suma total del cuadrado CE ~2) por los dos '.<tr~s
lue 9 + 9 = 2(9). Si la frecuencia de X1 en un grupo es J,, dicho valor contribuir
t. \ veces al resultado de la suma total de los puntajes al cuadrado. En consecuencia,
1 '
11,11 u hallar L X2, no es necesario elevar al cuadrado todos los valores de X,, puesto

s;

PARADIGMA DEL CALCULO DE LA VARIANZA CUANDO SE PRESE.NTAN LAS MISMAS PUNTUACIONES


EN VARIAS OCASIONES

t'wuuartones
l

6
6
6

',
,

10
10

11
11

8 11

9 IS
9

18

Clculos

Recuento de
frecuencias

X
2
3

6
8
9
10

11
2

,-1

4
1
= 12

,.

2x

111111

,11/11/11(1(('.I

Tambin se pueden multiplicar ambos miembros de la Ec. 5.4 por un nmero


imaginario n/11 = 1 de modo que la frmula resultante de s; no abarca la media:

s! =

IAIIA 5.1

Como el cuadrado de la media es tambin el cuadrado de la suma de todas las


puntuaciones por el cuadrado de 11, tenemos que

2 $

1
9

nX.2

~-~'--------~
-~n~- --n-1
1

x,
8

En los ejemplos anteriores, el clculo de


fue fcil, porque tanto las puntuaciones como la media son enteros. Pero si, por ejemplo, la media fuera 17,697.
sera una ardua labor, por lo cual necesitamos de alguna manipulacin algebraica
para calcular
de modo ms expedito.

..

3
3

48

S2=--=-=96

Clculos finales

CALCULO DE LA
VARIANZA s2

4
4
4

O- 2 = -2
6-2=
6-2=
n
2 (X, - X.) =

b.6

Ilustraremos el clculo des; por medio de la Ec. (5.4), basndonos en las seis puniuaciones del ejemplo anterior: 1, 3, 3, O, 4, l.

0-2 = -2

6
6
= 12

81

MI l)ll)AS 1)1- VARIA81Lll)AU

IS
18

4 1
9 2
25 4
36 3
64 2
81 2
100 2
121 3
225
324
21

J.X,

tntermedlos
/X

2
6
20
18
16
18
20
33
IS
18
166

4
18
100
108
128
162
200
363
225
324
1632

/,X,'

Clculos finales

!
,-1 x, =- L /,X, .... 166.
10

1-1

! x: = I r,x: ~ 1632.
X~ - <IX,)'
= 1632
s' - 319,81

20

- 1312,19..,
- IS,991.

319,81.

13

(Puntuacin
de desviacin)2

) - Media
-4=

l
l
l
4

-1

-4=
-4=
l
-4 = -2
::
-4 = 2
-4= -1
iones=
O

4
l
12

:r

'']p

12

=5

= 2,4

:in se le suma 2, s~ no cambia; en general,


das las puntuaciones de un grupo, tanto la
manecen constantes:

' ! [X, + e - (!
1-1
n

-=

n - 1
n

lle

tu

1-1

+e-

1-1

.Y.)'

(X1 -

n - 1

. / x 2)

-4=

4
4
4
16

16

-2

4
48

_ 48 _
l

s!.

(Desviaciones de
las puntuaciones+

-4=

48

se multiplica por 2?

.:-,.,_ 4 = -2
-4 = 2
-4=
2
-4 = -4

,':"-

X. - e) 2

n-1

icin

. ,.

(X1

X1/n) - (nc/n)]2

9 )6

14

M1'10UUS

E lA01i.,1CQS

APLICADOS A LAll {IINI

IA'i SO(IAt.l:.S

Tngase en cuenta tambin que 9,6 es igual a (22) (2,4). En general, la varianza
ser igual a c2.s; siempre que las puntuaciones del grupo se multipliquen por una
constante c.

I [ex, - (e i x,jn)]

i [ex, - (i cx,jn)]

i=I

-1

i-1

i-1

n-1

-1

n-1
n

! c (X, ,_,

[e(X, - X.)]2

n- 1

X.)2

ni

r.11 l)tl)A,

VAklAUII IOAI)

I tuno vimos en la Sec. 4.8, la suma de dichas


11n e~ la mnima descripcin de la cantidad total

desviaciones positivas y negativas


de variabilidad en el grupo de punruuciones, ya que su resultado siempre ser cero. Si se consideran las desviaciones
111mo di tancias de las puntuaciones respecto de la
sin tener en cuenta el signo,
111 suma de estas distancias indica la variabilidad de las puntuaciones.
l.u distancia de cada X; respecto de
se baila mediante el conocido procedimrcnto del valor absoluto del nmero; el valor absoluto de 4,65 se denota por 14,651
y l'' igual a 4,65, y asimismo cualquier valor absoluto de un nmero positivo, es
, ,1 mismo nmero positivo, y el de cualquier nmero negativo se halla cambiando
d ,1j!no menos por el ms:
3 I = 3; I - J ,69 I = 1,69 y finalmente, IO = O.

X.,

X.

1-

n - 1
En el Cap. 4, se calcul la media de dos grupos de 'puntuaciones reunidas en una
sola serie, prom~iando simplemente las medias de ambos grupos.(vase Sec. 4.9),
pero para la varianza, el caso es ms complicado, puesto que ya se vio que tanto
las varianzas como las medias de los grupos dependen de la combinacin de las
p_untuaciones de los grupos a y b; ntese que si el grupo a comprende las puntuacienes 3, 3, 3 y 3 y el b, 6, 6, 6, 6, la varianza combinada de los grupos a y b (3, 3,
3, 3, 6, 6, 6, 6) no ser cero, a pesar de que s! = s; = O.
Sea a y b dos grupos separados de puntuaciones:

Grupo a
Tamao del grupo
Media
Varianza

J)s; + (nb - l)s!

01 ro modo de considerar el proceso de la toma de los valores absolutos sera


,lh rendo que
=
o sea, que el valor absoluto de un nmero es la raz
, 11111linda positiva del cuadrado de dicho nmero (claro que para hallar el valor
11lt oluto de un nmero, sera muy torpe seguir este razonamiento).
I a distancia entre la puntuacin X1 y la media se da por
y el promedio
111 "'" ,, distancias de las puntuaciones respecto de su media se denomina desuia-

p,

lal

IX, - X.I

media o D.M..

n,.

IX, - X.1

X.,.

MD

Sz

La varianza de un grupo de puntuaciones n0


de los dos grupos es:

l = [(n., -

151 = 5,
101 =0,
l-51 = 5.

, ,,,,

Grupo b

+ naCX... n + nb - 1

nb resultantes de la reunin

X..}2 + nb(X.& - X..)2]

='---

1----

I u frrnula anterior no es la ms sencilla para efectos de clculo, y en la Ta-

hl" , 2 se muestra una ilustracin del clculo de la D.M. Esta medida se emplea

ve, en tanto que medida de variabilidad, aunque es fcil de calcular y su lgica


1ul1y1H:cn1c no es complicada; pero una de las razones de su escaso empleo es que la
1111,1

(5.6)

IAIIA U

donde:

x.. - nX + nbx.b
n,,

5.9

LA DESVIACION

+ nb

10
12
13
10
IS

MEDIA

n:edia _(o promedio) es una medida de variabilidad adicional que,

aunqu: ~lg~ ma fc,! d~ calcular que la desviacin tpica, es menos empleada.


X, - X md,~ _la desv10c1~11 de cada puntuacin. respecto de la media del grupo.
Esta II desviacione describen hasta qu punto varan las puntuaciones originales.

X-X.

runtuociones

lt

La desrlacin

PARADIGMA DEL CALCULO DE LA DESVIACION MEDIA

~X,
I I

V,

10 12 1310 IS -

IX- X.1

12"" -2
12,,.
o
12.,.
l
12 - -2
3
12 -

1
2
3

Clculos finales

MD ...

!
8

IX,-X.1
n

=--160

'

,IX,
_. -X.1-8
n

60
12

N11 ,1111f1111d11

el

,1gn<1

mgl,

lf.n.

(11111111t/11111111111)

0.:011 ;1/1/ (/11

11wdlt11111), N. dtI I

MLIOUOS 1 !.fAOISI

reos Al>LI Al)OS A LAS t II NI IA\ SO( IAI

I..S

teoria no est tan estructurada como la de la varianza, por ejemplo. El csiadistjco


matemtico encuentra ciertas dificultades en la toma de valores absolutos para
derivar algunas frmulas. Sin embargo, la desviacin media se discuti y defini
en razn del papel que tomar ms adelante aJ abordar un nuevo enfoque sobre las
pruebas o contrastes de hiptesis respecto de la variabilidad de poblaciones.

5.10

PUNTUACIONES
O ESTANDAR

TIPICAS

A menudo es necesario describir la posicin de las desviaciones respecto de la media


de puntuaciones de un grupo en unidades de desviacin tipica. Por ejemplo, si la
media de determinado grupo de 100 puntuaciones es de 18,75 y la desviacin tpica
de 2,60, no podr apreciarse por simple inspeccin, la posicin relativa de determinada persona, dentro del conjunto. Para hacer esto se necesita una serie de clculos. Como 20, que es la puntuacin de la persona en cuestin, est a 1,25 unidades
(20 - 18, 75 = 1,25) por encima de la media, entonces dicha distancia se da en
unidades de desviacin tipica (1,25/2,60 = 0,48). As, su puntuacin se halla a
0,48 desviaciones tpicas de la media.
Sea una puntuacin X1 de un grupo de 100, cas en el cual la desviacin respecto
de la media en trminos de unidades de desviacin. tipica est dada por

x, -

llp,cu las 190 puntuaciones originales era de 2,60, la desviacin tipica de, X/2,60
1/2.60)2,60 = l. Por tanto, los 100 valores de

l'~ (

~ _ 18,75 = X - 18,75
2,60
2,60
2,60
ucncn una desviacin tpica de 1. En resumen, las 100 puntuaciones X, cuya media
y desviacin tpica son, respectivamente, 18, 75 y 2,60 tienen a su vez una media y
111111 desviacin tpica de O y l, una vez que sufren la transformacin mediante (X I K, 75)/2.60.
Fodo grupo den puntuaciones con media X. y desviacin tpicas" puede transliu 11111r:1C en una serie diferente cuya medida ser O y su desviacin tpica 1; es as
, umo la puntuacin transformada da cuenta, inmediatamente, de la desviacin
11111,tinal respecto de la media, medida en unidades de desviacin tpica. La transluunacin se termina restando X. de la puntuacin X y dividiendo la diferencia
11111 s.,.. El grupo resultante se conoce como serie de puntuaciones z:

2,60

. .

2,60

Ya se sabe que esta constante -18,75/2,60 no altera la desviacin tpica de X,


pero la constante multiplicativa 1/2.60 s influye sobre la desviacin tpica del con
junto de puntuaciones. Al multiplicar todas las puntuaciones cuya desviacin
tpica es s" por una constante e, se obtiene un nuevo grupo cX cuya desviacin
tpica es es". El valor absoluto de 1/2.60 es simplemente 1/2,60 y como la desviacin

X.

X,Sz

Es posible confirmar que dichas puntuaciones z tienen una medida de O y una


\ uuunza (as como una desviacin tpica) de 1:

i.=

Las 100 puntuaciones originales pueden transformarse y calcularse con dicha


frmula.
La media de los 100 valores de X - 18,75 es igual a la media de las 100 puntuaciones X originales menos 18, 75, puesto que al restar una constante de cada puntuacin, se le resta dicha constan re a la media. Pero como la media de X es 18, 75,
X. - 18,75 seria igual a cero; entonces, (X - 18,75)/2,60 tambin debera tener
una media de cero, puesto que al multiplicar una variable cuya media es cero por
una constante. se obtiene una variable cuya media es cero veces la constante.
Para calcular la desviacin tipica de (X - 18,75)/2,60, lo primero que se hace
es exponer la puntuacin tipificada del siguiente modo:
1

18,75
2,60

(_1_)X, _ 18 75

17

MI 1)11)/\S 1)11 VAIUAllll lt}AD

s!=

[2" (X, - X.)]/s, = -1I" (X, 1

" (z, 2
1

i.)2

~[t

s.,

..:.1

n-1

(X, - ,\')']

n - 1

X.)=~

ns.,

(O)=

o.

I" z = I" (X, - X.}2/s:

=-1 __

n-1

ns.,

n-1

(~)s!
= 1.
s,,.

Adems de ser un medio conveniente para informar la posicin relativa de la


uacin de una persona respecto de la media en unidades tpicas, las puntua, 11111cs = constituyen un paso hacia la transformacin de un grupo de puntuacio1u~ \' a una escala arbitraria con media y '1esviacin tpica ms conveniente. Por
tlrn1plo. para algunos fines, puede darse que las puntuaciones z no sean las ms
11111,radas, como en el caso de que resulten valores negativos, lo cual sera eviden1,111l111e muy dispendioso, puesto que se tendran muchos decimales en el grupo
di' nuntuaciones z. Pero si stos se transforman a su vez, pueden eliminarse estos
,-.,, m,los escollos.
Corno la media es cero y la desviacin tlpica I en los n nmeros de puntuacio1111111

MI 101)0\

1 SIAl)l\ll('OS

1\l'l l(.'Al)OS A LAS t II M IA"I SOtlAI

rs

ncs z, sabemos que cz (resultado de multiplicar cada puntuacin z por la constante


e) tendra una desviacin tpica de [e] y cz + d tendra una media de
cI

+ d = ~(O) + d = d.

t eurcndo

Sea un grupo de 250 puntuaciones X, cuya media es 79,65 y cuya desviacin


tpica es 5, 71, y supongamos que se desean hallar las puntuaciones transformadas
de modo que su media sea 50 y su desviacin tpica sea JO. Entonces, se transforman
primero las puntuaciones originales a puntuaciones z; a continuacin se calcula,
para cada una de las 250 puntuaciones z ya determinadas, 102 + 50, y el grupo
resultante tendr as una media de 50 y una desviacin tpica de 10. Un individuo
cuya puntuacin transformada sea de 59, se sita a (59 - 50)/10 = 9/10 unidades
de desviacin tpica por encima de la media de las 250 puntuaciones; adems,
sabemos que la puntuacin X de dicho individuo es, aproximadamente, 79,65 +
0,9(5,71) = 85. A simple vista puede apreciarse que la puntuacin transformada
de 59 es ms informativa que la X de 85.
En ciencias sociales y educacin existen muchas escalas de medida (arbitrarias)
de gran popularidad, mediante las cuales puede colocarse un grupo de puntuaciones
a lo largo de dicha escala, es decir, que se les puede asignar una media y desviacin
tpica dada, con slo que e sea la desviacin tpica y d la media adecuada en la expresin cz + d. Las puntuaciones de las pruebas de inteligencia con frecuencia se transforman a escalas cuya media y desviacin tpica son, respectivamente, 100 y 15 o 16.
Las puntuaciones T, resultantes de sumarle lOz + 50, tienen amplia aplicacin.
En la Fig. 6.5 se muestran tas y otras escalas de gran empleo.

X.

en cuenta que:
(X, -

s..,
1111111~1:,

. - x,-s,,.

X.)3 _
-

[(X, -

X.)] _

s..,

- z..,,

la medida de sesgo se convertira en

..

Asimetra

!z!,

= {:!__ = z ..

(5.8)

z puntuaelevadas a la tercera potencia. (Esta medida de sesgo se denota, en estatll,111 , matemtica, por
se le debe a Karl Pearson y sus propiedades han
,11111 muy cstudiadas.l
~11pongamos que se desea medir
asimetra de las dos distribuciones de la
I IM t 1. La media de las puntuaciones del grupo A es aproximadamente 16; una
A'II pues, las medidas de la asimetra no es sino el promedio de las

, 1111w,

.jp;;

'

20
5.11

ASIMETRIA

O SESGO

El grado de asimetra de las distribucin de frecuencias constituye uno de sus


caracteres de mayor importancia. En la prctica casi nunca se encuentran polgonos de frecuencias o hi togramas completamente simtricos, por lo cual, el grado
en el cual la distribucin es asimtrica constituye su sesgo. Estudiando el poligono
o el histograma se descubrirn la naturaleza y extensin de la asimetra, pero a
veces no es posible o conveniente este tipo de observaciones. Por consiguiente, se
han diseado diversos estadgrafos cortos que miden el tipo y grado de asimetra
de un grupo dado de puntuaciones.
Para calcular la asimetra de un grupo de puntuaciones, la mejor frmula es la
siguiente:

Asimetra

!" (X, - X.)~/n


= ' --.;;..1----s!

(5.7)

Como se vio en la Sec. 5.1 O, es sta una medida prctica para denotar la distancia
dirccia.a la cual se halla una puntuacin de la media del grupo en trminos de unidade de de viacin tpica. =:e o sea,

FIG. S.3

Dos distribuciones asim~tricas de frecuencias.

,,.., trunsformadas las puntuaciones a la escala z, se apreciar que hay algunas


n111y superiores a la media (en razn de que la puntuacin ms alta es 22 y la menor
,. 1 \) en cuanto a su valor absoluto, as como algunas muy inferiores a ella. Ahora
t11C'11, como el signo algebraico de un nmero no varia cuando se le eleva al cubo
1 }) 1 8, en la distribucin A, el resultado de sumar estas terceras potencias
llrnr un menor efecto sobre el resultado final que el de sumar las segundas potencias.
1 , decir, que I: =3J" contribuye menos que I: z3Jn en la suma final. Por consiguiente,
,t vulor de I: z3Jn en la Ec. (5.8) seria alto y positivo, caso en el cual se dice que lu
1IM11bucin tiene una asimetra positiva. Las puntuaciones de una distribucin
11y11 u-amctrla es positiva son superiores a la media.

IO

MI 101)()5

l!SlAl>ll>I

ICO

Arl IC'Al)OS

A LA, ( 11 NI IA\ soc 1/\I as

La asimetra de la Fig. 5.3 es negativa. El valor de :E z3Jnde la distribucin B


es negativo. El estudiante puede darnos crdito por el momento antes de poder
manejar la prueba de lo anterior. Puede apreciarse, adems, que la asimetra de
la distribucin A es ms marcada que la de B, que es negativa.
En la Ec. (5.8), el valor de la asimetra es cero, puesto que no hay sesgo alguno.
Una asimetra perfecta de cero implica que toda puntuacin z negativa se aparece
con una z positiva de igual valor. Sin embargo, como los cubos de las puntuaciones negativas son a su vez negativos, la suma de los cubos de cada par de puntuaciones z positivas y negativas es cero.
Desafortunadamente, incluso para distribuciones no muy numerosas, ste es
un clculo muy dispendioso. La asimetra se mide de modo ms expedito con base
en que las puntuaciones extremas afectan ms la media que la mediana. En el captulo de medidas de tendencia central. vimos que en una distribucin unimodal
con asimetra positiva, la media es mayor que la mediana, la cual, a su vez, es mayor
que la moda. En distribuciones de asimetra negativa, la media es menor que la
mediana, que, a su vez, es menor que la moda. Esto sugiere que la posicin de la
media con relacin a la mediana puede determinar la asimetra de la distribucin,
lo cual sucede para grupos de puntuaciones relativamente numerosas, es decir,
cuyos n son de 50 o ms. La frmula que recurre a estos factores se define del siguiente modo:
Asimetra=

MI 1)11)/\S

FIG. S.4 Curvas escarpada, plana y


mesocrtica (A, By C, respectivamente).

... mcho). El escarpado o grado de curtosis de la tercera curva (C) es el patrn


111n el cual se compara la curtosis de otras curvas. La Ces una curva normal acerca
de la cual se hablar mucho en el Cap. 6 y en cuanto a curtosis, es mesocrtica
(mncso significa intermedio).
A continuacin explicaremos cmo medir estadsticamente la curtosis de
11110 curva. Debemos sealar antes, empero, que el concepto de curtosis solamente
, aplica a distribuciones unirnodales y se refiere al empinamiento de la curva en
111 proximidad de una nica moda. (Si la distribucin tiene dos modas, podra
hublarse de la curtosis de la curva en la proximidad de cada moda.)
La frmula que define la medida ms corriente de curtosis es la siguiente:

Curtosis =

J(X. - Md)

s,

Dicho en palabras, la asimetra de una distribucin puede medirse tomando


la diferencia entre la media y la mediana multiplicada por tres y dividiendo este
resultado por la desviacin pica. Los valores de la Ec. (5.9) generalmente van
de - 3 a + 3, y si la distribucin es simtrica, la Ec. (5.9) dar cero. La medida
d~ ~im~tria de dicha ecuacin se emplea para comparar diversos sesgos entre
distribuciones, en razn de que la divisin por s" ha independizado dicha medida
de variabilidad de la distribucin a la cual pertenece.

91

1)1 VAIUAllll 11)/\D

Vemos que (X1

(5.10)

s'z

(X, -

s,,

X.)]' _ ,
-Z:,,

lo cual queda claro que la frmula siguiente da una medida de curtosis:

Curtosis =
5.12

X.)4/n

f.)4/s! es sencillamente:
[

11111

2" (X,

1-----1-----

"
Iz!,
!.:..!_

= z.".

(5.11)

CURTOSIS

Ya se vio cmo describir las tres propiedades o rasgos de los grupos de puntales,
a saber: tendencia central, variabilidad y simetra, pero existe una cuarta propiedad que complementa las dems y ofrece gran inters: para saber cmo es de escarpado o _plano un polgono de frecuencias, se recurre al concepto de curtosis, palabra griega que se refiere a la pendiente de una curva. (Karl Pearson tiene el mrito
de haber formalizado el concepto de curtosis en estadstica, proponiendo un mtodo
para medirla.)
En la Fig. 5.4 se muestran tres curvas diferentes en cuanto a su escarpado o curtosis. La primera (A) es muy empinada y se llama leptocrtica, ~a segunda (B) es
relativamente plana y se denomina platicrttca (ambos son prefijos griegos, el primero de los cuale significa empinado o estrecho y el segundo, plano o

tAIIA 5.3 RELACIONES ENTRE El VALOR OEL INOICE DE CURTDSIS CON LA 1ESCABROSIDAD1 DE LA DISTRIBUCIDN DE
FRECUENCIAS

Naturalezo de la
dlstribucln
N1111m1I, como. por ejemplo, curva C en la
l 111 S.4
1 111v11 escabrosa, por ejemplo, curva A en
h, H. S.4
1 111v11 plano. por ejemplo. curvo B en lo
1111
S.4

Descripcln de la
escabrosidad

Valor del Indice de


curtosis (Ec. 5.11)

Mcsocrtica

Lcptocrtica

Mayor que 3
(puede ser muy grande)
Menor de 3
(puede ser cero o m:ls)

Platierticn

9Z

MIHOOOS ~STAl)IS'rlCOS

A1>LfCAl)OS A LAS

lllNl IAS SOCIAL~S

Es decir, que la curtosis se mide promediando la cuarta potencia de los pontajes z. En la Tabla 5.3 se exponen las relaciones entre la magnitud del estadigrafo
de la curtosis, con lo escarpado de la distribucin a partir de la cual se calcul la
primera.

MI I tlll \~ 111 VAl<IAOll ll')AI)

1 11ll 11lur s!
1' 11111~

y.,.

para las siguientes notas arregladas en distribucin de frecuencias no agru-

PROBLEMAS Y EJERCICIOS

l.

Calcular el rango incluyente, la varianza, la desviacin tpica y la desviacin media del


siguiente grupo de puntuaciones:

102
106
111
112

112

114
115
115

116

l'l11~r1cncia:

119
120
122

(Sugerencia: para simplificar los clculos, restar primero 100 de todas las puntuaciones
con lo cual ninguna medida de variabilidad cambiar su valor.)
2.

150-159
140-149
130-139
120-129
110-119
100-109
90-99
80-89
70-79
60-69
S0-59

Frecuencias

7
9
12
17
21
12
8
6
1
2

so

29
17
9
3
2

La mediana del grupo anterior es 109,5. Determinar la proporcin de puntuaciones situada


en el ra~go hal~ado sumando y restando Q a la mediana, o sea, calcular Ja proporcin de
puntuaciones situadas entre 189,5 Q.

Frecuencia

6,9
6,8
6,7
6,6
6,5
6,4
6,3
6,2
6,1
6,0

2
4
5

9
14
10
6

3
2
1

l1Hlfl't11 cul de las siguientes distribuciones probablemente dar lugar a una asimetra ms
1111,111vu o negativa:
II
hludcs de estudiantes universitarios de los Estados Unidos.
h N,imero de nios en las familias norteamericanas.
I
l'ohlocin urbana estadounidense.
,1 !'dudes de mortalidad de las mujeres en Estados Unidos.

Frecuencias
acumuladas
100
9S
88
79
67

Pumuacin

restar 6,0 de cada una de las I O puntuaciones con objeto de simplificar los

Hallar el rango semiintercuartil de las puntuaciones de CI de la siguiente distribucin de


frecuencias agrupadas:

Intervalos de
puntuaciones

93

Grupo A

Grupo B

13
11
10
9
7

28
26
25
24
22

1 v1111111vas de ambos grupos son iguales; si se renen ambos grupos en una sola serie,
\11111111111
serlu menor, mayor o igual a 5?

11111!111

,1, ,o llrm~

y Ju desviacin tpica respectivas de 290 estudiantes que tomaron una prueba


fueron 32,50 y 4,80. Hallar las puntuaciones z a continuacin:
Puntuaciones de

la pr11eba X

a.

b.

c.
d.

28
36
45
20

Puntuaciones z

-0,94

94

7.

MlIOOOS

liSrADISTICOS APLICAl>OS A 1 /\',

II NI IAS SOCIAi iS

A 40 estudiantes de primer curso de francs se les administraron dos pruebas de vocabulario.


Las medias y desviaciones tpicas de ambas pruebas y las puntuaciones directas obtenidas
por los estudiantes A y B fueron los siguientes:

x.
Prueba 1
Prueba 2
a.
b.
c.
d.

54,10
21,25

14,28
3,52

Puntajes de A

Puntajes de 8

45
30

60
21

6
LA DISTRIBUCION
NORMAL

Cul estudiante tiene una puntuacin directa ms alta en ambas pruebas?


Calcular los puntajes z de ambos estudiantes en cada prueba.
Cul de los dos estudiantes tiene la mayor puntuacin total en ambas pruebas, en
trminos de puntuaciones z?
Cul de los dos estudiantes domina mejor el vocabulario francs? (Esta no es una
pregunta fcil de responder; intntese solamente apreciar los problemas que implica.)
n

8.

Probar que

l zf = 11 -

l.

1-1

INTRODUCCION

p11,ilntc capitulo debe interrumpir necesariamente la continuidad del texto,


,1111 debe permanecer aislado y no es integrable directamente a las estadsticas
II ulludas hasta el momento; en efecto, trataremos de aumentar nuestros coh11 euros sobre tcnicas basadas en conceptos esenciales cuyos detaJles ornitin111; u causa de su complejidad, precio que se paga por tratar de dominar los
h11t11~ superiores de la estadstica sin dominar sus bases fundamentales. Obviallh'. c-pcramos que esta presentacin, un tanto audaz, valga la pena.

HISTORIA DE LA
OISTRIBUCION NORMAL
~, 1w1a exposicin del descubrimiento y estudio de la distribucin normal que
111,~1111111 a continuacin no corresponde a su importancia. Incluso el estudiante

111lci11 en matemticas encontrar el recuento de Heleo Walker sobre la hislu1l11 1k In distribucin normal (Walker, l929, Cap. IJ) informativo y fructlfero.
l 11 11 r-.iHIO xvu, en Europa. un grupo de matemticos emprendieron unas inW-1111111 iones privadas que se incorporaran a la teora de probabilidades. (Vase
111 111.) liMo:. estudios. hechos por hombres como Blaise Pascal (1623-1662)
y l'h111 de Fcrm11t (1601-1665), se realizaron a solicitud del Caballero de Mere,
.,,. ~1

9!i

También podría gustarte