Estadistica para Psicologia PDF
Estadistica para Psicologia PDF
Estadistica para Psicologia PDF
Elaine N . A ron
ESTADISTICA
PARA PSICOLOGÍA
ïarson
Educación
■ ■ ISBN: 987-9460-66-9
Traducido de: Statistics for Psychology, Second Edition by Arthur Aron and Elaine N. Aron, Copyright 1999- Todos
los Derechos Reservados, Publicado con el acuerdo del editor original, PRENTICE HALL, INC., Editorial de Peatson
Education Company.
ISBN; 0-13-914078-6
ISBN: 987-9460-66-9
Este libro no puede ser reproducido total ni parcialmente en ninguna forma, ni por ningún medio o procedimiento, sea repro-
gráfico, fotocopia, microfilmación, mimeográíko o cualquier orco sistema mecánico, {bioquímico, electrónico, informático,
magnético, electroóptico, etcétera. Cualquier reproducción sin el permiso previo por escrito de la editorial viola derechos reser
vados, es ilegal y constituye un delito.
3 C orrelación 68
Variables independientes o predictoras y variables dependientes.............. ....................... 70
Cómo graficar correlaciones: diagrama de dispersión ...................................................... 71
Patrones de correlación............................................................................................................ 73
Cálculo de un índice del grado de correlación lineal:
coeficiente de correlación de Pearson...................................................................................... 79
Cuadro 3-2; Galton, un caballero g en ia l....................................................... 82
Integración de los distintos pasos. Otros ejemplos................................................................. 85
Prueba de la significación estadística del coeficiente de correlación................................ ' 91
Cuadro 3-2; Correlación ilusoria: cuando estamos completamente seguros
de que si es grande, es gordo... y estamos completamente equivocados....... ...... 91
Cuestiones relacionadas con la interpretación del coeficiente de correlación .................. 93
Controversias y desarrollos recientes: ¿qué es una gran correlación?.............................. 96
Coeficientes de correlación según se describen en publicaciones científicas ................. 98
Resumen.............................................................................................................................. 100
Términos clav e........................................................................................................................ 101
Ejercicios .................................................................................................................... *...... 101
Apéndice I del capítulo: fórmula de cálculo
optativa del coeficiente de correlación........................................................................... 105
Apéndice II del capítulo: pruebas de hipótesis y
potencia del coeficiente de correlación ..................... ............,................................ . 105
4 P redicción 108
Terminología relacionada con la predicción bivariada...................................................... 109
Modelo de predicción bivariada con puntuaciones Z ........ ............................................... 110
Predicción bivariada con puntuaciones originales............................................................ 112
Línea de regresión......................... *.................................. ................................................. 114
Error y reducción proporcional de error........ ,................................................................... 117
Otro ejemplo de predicción bivariada................................................................................. 122
Extensión a regresión y correlación m últiples.................................................................. 126
Cuadro 4-1: Predicción clínica versus predicción estadística..................................... 132
Controversias y limitaciones.......................................... .................................................... 135
Los modelos de predicción según se describen en publicaciones científicas................... 136
Resumen.............................................................................................................................. 138
Términos clav e.................................................................................................................... 139
Ejercicios .................................................................... 139
l corazón de la primera edición de este libro fue escrito, durante un verano, en un pe
E
queño departamento de París cerca de Place Saint Ferdinand, y diseñado en los cafés
de la zona y durante las caminatas por el Bois de Boulogne. Treinta años de experien
cia en la enseñanza, la investigación y la redacción avalan esta obra. Creemos que el
libro que logramos es tan diferente de los libros convencionales de estadística como
París lo es de Calcuta; es más, incluso consideramos que resultará práctico y estimulante para la
sufrida comunidad de profesores de estadística.
El método que da forma al texto se ha ido desarrollando durante tres décadas de enseñanza
exitosa, no sólo porque los alumnos continuamente calificaban al curso como uno de los temas
más importantes e interesantes de la especialización (y estamos hablando de un curso de estadís
tica), sino también en el sentido de que nos encontramos años después con alumnos que nos di
cen: “Yo estaba a años luz de los otros graduados gracias a su libro” o “aun cuando en la
actualidad no realizo investigaciones, su curso realmente me ha ayudado en la lectura de las pu
blicaciones científicas relacionadas con mi especialidad”.
El reconocimiento a la primera edición ha sido sobrecogedor. Hemos recibido un gran núme
ro de e-mails y cartas de profesores (¡e incluso de alumnos!) agradeciéndonos desde todo el mun
do de habla inglesa. Por supuesto, nos emocionó también la crítica entusiasta del Contemporary
Psychology* (Bourgeois 1997).
En la segunda edición hemos intentado mantener los aspectos del libro que fueron especial
mente reconocidos, a la ve2 que trabajamos sobre el mismo para incluir aquellos otros aspectos
surgidos de la respuesta de la gente, de nuestras propias experiencias, y de los avances y cambios en
la materia. Sin embargo, antes de comenzar con la segunda edición quisiéramos reiterar algunos
xvü
comentarios realizados en la primera sobre la historia de ios textos de esta especialidad y sobre
aquellas cosas que hemos cambiado.
MANTENGÁMONOS EN CONTACTO
Es nuestro objetivo colaborar en todo lo que sea posible para que tenga éxito con su curso.
Si usted tuviera alguna duda o sugerencia, por favor escríbanos o envíenos un e-mail
([email protected] es la dirección de ambos). Si, Dios no lo permita, usted encon
trara un error en algún lugar del libro, prometemos que a) lo corregiremos en la siguiente edición,
b) enviaremos los detalles a todos aquellos en la red y c) incluiremos su nombre en nuestros agra
decimientos en el prefacio de la próxima edición.
AGRADECIMIENTOS
Ante todo, queremos agradecer a nuestros alumnos de todos estos años por haber dado forma a
nuestro método de enseñanza, premiándonos con su valoración por las cosas que hemos hecho
bien al igual que con sus diversas formas de anular lo que no hemos hecho tan bien.
Por habernos impulsado a iniciar este proyecto, queremos agradecer a nuestro amigo Bryan
Strong, quien en primer lugar nos alentó para que lo emprendiéramos, y a Brete Harrison, quien
guió el proyecto durante su desarrollo inicial. Agradecemos también la colaboración y apoyo de
nuestro amigo John Touhey, quien leyó varios de los primeros borradores de capítulos. Los revi
sores del libro en diversas etapas han sido sumamente útiles identificando falencias en la lógica y
la pedagogía, y sus elogios generosos nos dieron ímpetu cuando, ocasionalmente, nos sentíamos
perdidos en la inmensidad del proyecto. Queremos agradecer a Paul C. Amrbein, Universidad de
Nueva México; James V. Couch, Universidad James Madison; Livia M. D’Andrea, Universidad
de Nevada, Reno; Susan E, Dutch, Universidad Estatal de Westfield; Peter C. HUI, Universidad de
Grove City; J. Robert Newman, Universidad del Estado de California, Long Beach; Michael L.
Frank, Universidad Estatal de. Stockton; Martin A. Johnson, Universidad del Estado Occidental
de Missouri; Carel Pandey, Universidad L. A. Pierce; Roger Bakeman, Universidad del Estado de
Georgia; Jeffrey S. Berman, Universidad del Estado de Memphis; y Michael J. Scozzaro, Univer
sidad suny en Buffalo.
RECONOCIMIENTOS
CO-1, PhotoDisc, Inc.; CO-2, David Young-Wolff/PhotoEdit; CÜ-3, Leonard Lee Rué, IH/Photo
Researchers; CO-4, Secretaría de Turismo de Nueva México; CO-5, H., Fouque/Photo Resear
chers, Inc.; CO-6, Leu Rue, Jr./Photo Researchers; CO-7, Grant Heilman Photography; CO-8,
PhotoDisc, Inc.; CO-9, U.S. Secretaría de Agricultura; CO-10, Chip Henderson Photography;
CO-11, Tom Hollyman/Photo Researchers, Inc.; CO-12, Bill Bachman/Photo Researchers, Inc.;
CO-13, Okoniewski/The Image Works; CO-14, Barry L. Runk/Grant Heilman Photography;
CO-15, Michael Newman/PhotoEdit; CO-16, Matura/Gamma-Liaison, Inc.; CO-17, Simon
Fraser/Science Photo Library.
Los datos de las páginas 99,278,279,308,309,340,341,410,449,450 y 496 se basan en las ta
blas de Cohen, J. (1988), Análisis del poder estadístico para las ciencias del comportamiento
[Statistical Power Analysis fo r the Behavioral Sciences] (2a Ed,). Copyright © 1988 por Law
rence Erlbaum Associates, Inc. Reimpreso con autorización.
Introducción para el alumno
COMENTARIO FINAL
Aunque cueste creerlo, nos encanta enseñar estadística. Una y otra vez hemos vivido la mara
villosa experiencia de que se nos acerquen alumnos rebosantes de alegría a decimos: “Profe
sor Aron, saqué un 90 en este examen, ¡no lo puedo creer! ¡Yo, un 90 en un examen de
estadística!” O el alumno que nos confiesa: “Realmente es entretenido. No se lo diga a nadie,
pero en verdad me divierte la estadística”, ¡nada menos! Esperamos que a usted le ocurra algo
parecido en este curso.
Arthur Aron
Eiaine N. Aron
► Las dos ramas de la metodología Formas de las distr1— -----J~
estadística. frecuencias.
>■'. tablas de frecuencias. Controversias y limitaciones.
!► ¿Cómo crear tina tabla de ■>. Tablas de frecuencias, histogramas y
frecuencias? polígonos de frecuencias según se
Tabla de frecuencias agrupadas. describen en publicaciones científicas.
Histogramas, Resumen.
Polígonos de frecuencias. Términos clave.
Ejercicios,
Q
se asemeja a otros estudiantes de psicología que hemos conocido: eligió cursar esta
materia porque le fascinan las personas, sus comportamientos visibles, y tal vez
también su vida interior e incluso la propia. Algunos lectores son altamente científi-
■eos; otros más intuitivos. A algunos les gusta la matemática, a otros no tanto; y al
gunos hasta le temen. Cualquiera sea la categoría en la que se encuentre el lector, es
bienvenido y puede estar seguro de que si le presta especial atención a nuestro libro (tal vez un
poco más que a la mayoría de los libros de texto), realmente aprenderá estadística. El método uti
lizado en este libro resultó de gran utilidad en la enseñanza de la materia a todo tipo de alumnos,
incluso a aquellos que previamente habían cursado estadística con resultados insatisfactorios. Es
tamos seguros de que con nuestro libro y la ayuda de un profesor aprenderá bien la estadística.
Lo más importante es que el lector sepa que no importa por qué razón estudia psicología. Este
curso no pretende ser una pérdida de tiempo. La utilidad de esta materia radica en la necesidad de
comprender la estadística para leerlos trabajos realizados por otros psicólogos; también para reali
zar sus propias investigaciones y para pulir tanto su capacidad de razonamiento como su intuición,
¿Qué es realmente la estadística? Es una herramienta que ha evolucionado a partir de un proceso
básico de pensamiento que todo psicólogo, todo ser humano, emplea: observamos algo; nos pre
guntamos cuál es su significado o cuál es su causa; aplicamos nuestra capacidad de discernimiento
o nuestra intuición; volvemos a observar, pero ahora en detalle, o bien intentamos realizar algunos
pequeños cambios en el proceso para probar nuestra intuición. Entonces nos enfrentamos al eterno
problema: ¿Se confirmó o no nuestro presentimiento? ¿Cuáles son las posibilidades de que lo que
hemos observado en esta segunda oportunidad suceda una y otra vez, de tal forma que podamos
anunciar el resultado de nuestro razonamiento al mundo como algo probablemente cierto?
En otras palabras, ia estadística es un método de búsqueda de la verdad. O al menos puede in
dicamos las probabilidades de que nuestro presentimiento sea verdadero en este momento y en
este lugar, con este tipo de personas. Esa búsqueda de la verdad, o al menos de la probabilidad fu
tura, es la esencia de la psicología, de la ciencia y de la evolución humana. Pensemos en las pri
meras hipótesis: ¿Qué harán los mamuts la próxima primavera?; ¿qué sucederá si como esta raíz?
Es fácil ver cómo han sobrevivido aquellos que han acertado, y el propio lector es uno de ellos. La
estadística es una forma de búsqueda de precisión y verdad.
Los psicólogos utilizan métodos estadísticos para dar sentido a los números que reúnen al in
vestigar. El problema de cómo diseñar una investigación adecuada es todo un tema en sí mismo,
el cual resumiremos en el apéndice A. No obstante, en este libro nos limitamos a tratar los méto
dos estadísticos que dan sentido a los datos recolectados durante una investigación.
TABLAS DE FRECUENCIAS
Comencemos con un ejemplo. Durante la primera semana del curso, Aron, París y Aron (1995),
como parte de un estudio más amplio, repartieron un cuestionario a 151 alumnos en una clase de
introducción a la estadística. Una de las preguntas era la siguiente: “¿Qué grado de estrés has ex-
---------------------------------- perimentado en las últimas dos semanas y media, en una escala del
Tabla. 1-1, _ Oal 10, enlaqueO indicaparanadaestresadof y lO tanestresado
eii*” *cada valo^defa escala corao es posible?” Las puntuaciones dadas por 151 estudiantes
de medición de estrés. fueron las siguientes.
P u n t u a c ió n F r e c u e n c ia 4 . 7 . 7 . 7 , 8, 8, 7 , 8, 9 , 4, 7, 3, ó, 9, 10, 5, 7, 1 0 , 6, 8 , 7 , 8 , 7 , 8 , 7 , 4 , 5,
1 0 , 1 0 , 0 , 9, 8, 3, 7 , 9 , 7 , 9 , 5 , 8 , 5 , 0 , 4 , ó, 6, 7 , 5 , 3 , 2 , 8, 5 , 1 0 , 9 , 1 0 ,
10 14
6 , 4 , 8 , 8 , 8 , 4 , 8 , 7 , 3 , 8 , 8 , 8 , 8 , 7 , 9 , 7 , 5 , 6 , 3 , 4 , 8 , 7 , 5 , 7 , 3 , 3 , 6 , 5,
9 15
7 . 5 . 7 . 8 . 8 . 7 , 10, 5 , 4 , 3 , 7 , 6 , 3 , 9 , 7 , 8 , 5 , 7 , 9 , 9 , 3 , 1 , 8 , 6 , 6 , 4 , 8 , 5 ,
8 26
7
10, 4, 8, 1 0 , 5 , 5 , 4 , 9 , 4 , 7 , 7 , 7 , 6, ó, 4 , 4 , 4 , 9 , 7 , 1 0 , 4 , 7 , 5, 10, 7, 9,
31
Ó 13 2.7, 5,9,10, 3 , 7 , 2 , 5 , 9 , 8 , 1 0 , 1 0 , 6 , 8 , 3
5 ■ 18
4 16
El sólo hecho de leer todas estas clasificaciones llevaría un tiempo
3 12 considerable. Al examinar rápidamente los datos obtenemos una
2 3 idea de la tendencia general, pero difícilmente sea un método pre
I 1 ciso. Una solución es confeccionar una tabla que muestre cuántos
0 2 alumnos eligieron cáda uno de los once valores de estas puntua
Fuente: Aron, Paris & Aron ciones (0,1, 2 y siguientes, hasta 10). Es precisamente lo que he
(1995). mos hecho en la tabla 1-1. Este tipo de tabla se denomina tabla de
frecuencia, porque muestra con qué frecuencia (cuántas veces)
ocurre cada puntuación. Una tabla de frecuencias hace que el patrón numérico se comprenda
claramente y a simple vista. En este ejemplo, podemos ver que la mayoría de los alumnos se atri
buyeron un nivel de estrés en alrededor de 7 u 8 puntos, y que muy pocos lo hicieron por debajo
de esos valores.
V C u a e tr d -i^ l. ;. *.
Trivialidades im portantes pará estu d ian tes d e estadística
\\ J r con espíritu p o é tic o .
l,La mayoría de. los expertos en estadística siguen el procedimiento aquí recomendado, ordenando los valores desde el
mayor, en lá parte superior, hasta el menor, en la parte inferior. Sin embargo, en las publicaciones científicas es más
probable que las rabias de frecuencias contengan el número menor en la parte superior y el mayor en la parte inferior.
F igura 1-1. Construcción de
una tabla de frecuencias, uti
PUNTUACIONES FRECUENCIA lizando los datos de; Aron,
10 -- ■ París, & Aron (1995).
9 ' 7,8,9, 4, 7, 3, 6, 9, TO', 5,
8 ■ ■, 7, 10, 6, 8, 78, 7, 8, 7, 4, 5, ' 10,10.0,9,,
7 i ' 8,3,7,9,7,9,5,8,5,0,4,6, 6,7,5,3,2,
6 \ 8,5/10,9,10,6,4,8,8,8,4,8,7,3,8,8,
75:7 M ,.7; 9,7,5,0,3, 4, 8, 7, 3, 7, 3, 3, 6,
4 O 5, 7, 5, 7, 8, 8, 7, 10, 5, 4, 3, 7, 6, 3, 9, 7,
• 3 8,5,7,9.9,3,1,8,6,6,4,-8,5,10,4,8,
' 2 10,'5,5,4,9,4,7,7, 7, 6, 6, 4, 4, 4, 9, 7,
1 10, 4,7,5,10,7,9,2,7,5,9,10,3,7,2,
0 5,‘9,8,10,10,6,8,3, ‘
48-/ 31- . ' 15-/ 48,15, 33, 3, 21, 19, 17,16,44,25, 30,3, 5,9, 35,32,26,
.'4 7 -// 3 0 -//-: 1 4 -/// .
46’- , , 2 9 -//// 1 3 -// 1 3 ,1 4 ,1 4 ,47,47,29, 18,1 1 ,5 ,1 9 ,2 4 ,1 7 ,6 ,2 5 , 8,18,29,
'45-' - - ' 2 8 - /.' /.
'44 ¡ 7 : , ’ - 27 - / ■
• .1 2 -/ 1, 18, 22, 3 ,2 2 ,2 9 ,2 , 6,10, 29, 10, 21, 38, 41,16,17, 8,
M i-////
26 7 / 7 r - . : . i o ' . m i l 40, 8, 10, 18, 7, 4, 4, 8, 11, 3, 23, 10, 19, 21, 13, 12, 10,
’4 2 - . 2 5 - // /'■ ' ■ L 9 - » / . •
41-/ \ ',24,-7/
4,17, 11,21, 9 , 8,7 , 5 ,3 ,2 2 ,1 4 ,2 5 , 4,11, 10,18, 1,28,
;- 8r-W 2/
4 0 :/', . 1 -//;» ; 2 7 ,1 9 ,2 4 ,3 5 ,9 ,3 0 ,8 ,2 6
39--, 1 ..2 2 7 /7 »■■■;■
3 8 -/-" M í ' ; - / / » ■■’7 ' 5-->)/
.37- - '2 0 - , - . ' ,: ■ 4 - //7/
36 r - » 9 - / / / / - ■ .% 'y tfU . F igura 1-2, Construcción de una tabla
'35,-7/ ' 1 8 - M « ' 7 ;- » - / M M
de frecuencias del número de interac
34- - ■ 1 7 -////' '-Y '-» - 7
3 3-/ J ó - / » : ; 7 7 '. . Ó 7 7 . '7 '
ciones sociales mantenidas por estu
3^ - z i . ; v’•(: ¡l •: •;:r;;4-; diantes durante una semana.
(Fuente: McLaughlin-Vólpe et al. 1998).
Sigamos ahora los tres pasos indicados para la creación de una tabla de frecuencias.
1. Preparar una lista de cada valor posible a lo largo del margen izquierdo de la página,, co
menzando con el mayor y finalizando con el menor. En este estudio en particular, la mayor canti
dad de interacciones podría ser cualquier numero. Sin embargo, el mayor número obtenido en ei
grupo analizado es 48, por lo tanto, podemos utilizarlo como el mayor valor posible. Y la menor
cantidad posible de interacciones es 0. Teniendo en cuenta lo anterior, el primer paso a seguir es
hacer una lista de esos valores. (Sería buena idea utilizar varias columnas para poder incluir todos
los registros en una sola página).
2. Revisar los registros uno por uno, haciendo una marca por cada uno junto al valor corres
pondiente en la lista. La figura 1-2 muestra el resultado de este paso.
3. Preparar una tabla prolija que indique cuántas veces ocurre cada uno de los valores de la
lista. La tabla 1-2 es la tabla de frecuencias definitiva.
T a b la d e fr e c u e n c i a s d e i n ú m e r o d e in t e r a c c io n e s s o c ia l e s m a n t e n id a s p o r 9 4 e s t u d ia n t e s u n iv e r s it a r io s
d u ra n te u n a se m a n a .
O b s e r v a c io n e s F r e c u e n c ia s O b s e r v a c io n e s F r e c u e n c ia s O b s e r v a c io n e s F recue
48 1 31 0 15 1
47 2 30 2 14 3
46 0 29 4 13 2
45 0 28 1 12 1
44 1 27 1 11 4
43 0 26 2 10 6
42 0 25 3 9 3
41 1 24 2 8 6
40 Î 23 1 7 2
39 0 22 3 6 2
38 1 21 4 5 3
37 0 20 0 4 4
36 0 19 4 3 5
35 2 18 5 2 1
34 Û 17 4 1 ." 2
33 1 ló 2 0 0
32' 1
In terv a lo s d e d a s e F r e c u e n c ia
4 5 -4 9 ,9 3
4 0 -4 4 ,9 3
3 5 -3 9 ,9 3
3 0 -3 4 ,9 4
2 5 -2 9 ,9 11
2 0 -2 4 ,9 10
1 5 -1 9 ,9 16
1 0 -1 4 ,9 16
5 - 9,9 16
0 - 4,9 12
A través de una tabla de frecuencias agrupadas se puede, brindar información de forma aún más
directa que mediante una tabla de frecuencias común. Cabe destacar, sin embargo, que la facili
dad de comprensión que brinda una tabla de frecuencias agrupadas se logra a costa de perder cier
ta información, como por ejemplo, el detalle de las frecuencias dentro de cada intervalo.
A continuación, se describen los pasos que se deben seguir para construir una tabla de fre
cuencias agrupadas utilizando los datos contenidos en la lista.
1. Restar el valor menor al mayor para saber cuál es la amplitud de la serie de valores. El va
lor mayor (2,99) menos el menor (2,50) da 0,49.
2. Dividir la amplitud por varios tamaños de intervalo posibles hasta encontrar, después de re
dondear, una cantidad razonable de intervalos. Cuando la amplitud es pequeña, es necesario tener
en cuenta tamaños de intervalo representados por decimales. Sin embargo, aun utilizando deci
males, es conveniente utilizar sólo tamaños de intervalos que sean números comunes y regulares.
Así, en este ejemplo, podríamos tomar un tamaño de intervalo de 0,1, lo cual daría como resulta
do 5 intervalos, pero sería aún más adecuado utilizar el tamaño 0,05, para obtener 10 intervalos.
3. Realizar una lista de los intervalos ordenándolos de mayor a menor. En este caso, los inter
valos deberían comenzar con 2,95-2,99 y continuar hasta 2,50-2,54.
4. Proceder del mismo modo que con una tabla de frecuencias común. La tabla 1-5 muestra el
resultado.
T a b la 1 -5 .
T a b la d e f r e c u e n c i a s a g r u p a d a s c o r r e s p o n d i e n t e a u n e s t u d i o r e a l i z a d o a 1 0 0 a l u m n o s s e c u n d a r i o s ,
p a r a m e d i r e i t i e m p o p r o m e d i o d e le c tu r a d e o r a c i o n e s a m b i g u a s ( e n s e g u n d o s ) .
T ie m p o d e le c tu r a F r e c u e n c ia
2 ,9 5 - 2 ,9 9 9
2 ,9 0 - 2 ,9 4 7
2 ,8 5 - 2 ,8 9 20
2 ,8 0 - 2 ,8 4 n
2 ,7 5 - 2 ,7 9 10
2 , 7 0 - 2 ,7 4 Í0
2 , 6 5 - 2 ,6 9 4
2 ,6 0 - 2 ,6 4 8
2 , 5 5 - 2 ,5 9 10
2 , 5 0 - 2 ,5 4 11
HISTOGRAMAS
Los gráficos constituyen otro medio adecuado para facilitar la comprensión de una cantidad im
portante de registros. “Una imagen vale más que mil palabras”, y a veces más que mil números.
Una manera de graficar la información de una tabla de frecuencias es con un gráfico de barras es
pecial denominado histograma. En un histograma, la altura de cada barra representa la frecuen
cia que le corresponde al intervalo de acuerdo con la tabla de frecuencias. Además, las barras
están ubicadas una al lado de la otra, sin espacios entre ellas. Los histogramas se parecen al con
torno de una ciudad en el horizonte. La figura 1-3 muestra dos histogramas basados en el ejemplo
de medición del estrés (uno representa la tabla de frecuencias clásica y el otro la tabla de frecuen
cias agrupadas).
Intecvalo
45 -49,9
.40-44,9
35-39,9'::
30 - 34,9'
■ '.2 5 -2 9 ,9 . ■
■" 20 -2 4 ,9 •
'■ '..li-.19,9 :
1 0 a 4 ‘,9
. ’ 5-9,9 '
0 - 4 ,9 .
Figura 1-4. Histograma que representa el número de interacciones sociales vividas durante una semana por 94 estu
diantes universitarios, basado en frecuencias agrupadas. (Fuente: McLaughlin- Volpe et al., 1998).
Figura 1-5. Histograma que representa
Tiempo el tiempo promedio de lectura de ora
de'lectura ■■ Frecuencia ciones ambiguas por parte de 100 alum
2,95-2,99 9 nos secundarios, basados en frecuencias
2,90 - 2,94 .■ 7 é agrupadas {datos ficticios),
2,8S~2,89 20 '• ■
2,80 ~2,84 ii
2,75-2,79 10 ■
2,70 -2,74 , : : 10 ’’
2,65 - 2 , 6 9 \ 4 /'7l
2,60 - 2 ,6 4 8 ^
2 .5 5 - 2 ,5 9 ,■ 10 ' ■
2;50'-2;54, .' U -"Vi
POLIGONOS DE FRECUENCIAS
Existe otro método utilizado comunmente para mostrar gráficamente la información contenida
en una tabla de frecuencias. Este tipo de gráfico, denominado polígono de frecuencias, es bási
camente la versión del histograma representado con un gráfico de Eneas. En lugar de barras, la
frecuencia de cada intervalo se indica a través de la altura de una línea que se desliza por la pági
na, creando una especie de contorno de montañas. La figura 1-6 muestra los polígonos de fre
cuencias creados a partir de las tablas de frecuencias comunes y agrupadas correspondientes al
ejemplo de medición del estrés.
F igura 1-6. Polígonos de frecuencias basados en (a) una tabla de frecuencias y (b) una tabla de frecuencias agrupadas,
construidas con los datos de Aron, París & Aron (1995).
Otro ejemplo de polígonos de frecuencias
La figura 1-7 muestra los cinco pasos necesarios para construir un polígono de frecuencias, utili
zando la tabla de frecuencias agrupadas correspondiente al ejemplo sobre interacciones sociales
de varios alumnos.
■■'i A -:'í i;A .'-'’.'-'A -A :, A A' , A' A -'-'-.A . Ó ■_ ® ‘ " a ...‘; ; Aí; . ■ A - ,..À .:'r : A ; ' ' : 'A ' . ; 'A V ; • A '; ' i
: l?,5 v n ,5 422,5;.27>5::32^:;37;5,.42,5;4 Z 5 .; 5 Z 5 Y ; /^ ,S .;; 2 ; S J ^ ¿ { 2 , 5 ü 7 j 5 ^
.v.;:■;■V
S-:;=/:-■;g - i V;:f■'.!Cantíjîà*ïd* interacciones sociales ' V. ;¡- • Cantidad de ¡riteracciones sociales' •¡ ;
:2,475 2,525 2,575 2,625 2,675 2.725 2,775 2.825 2,p?5 2,925 2,975 3,025-
' Tiem po de lectura <$eg.)
Figura 1-10. Ejemplos ficticios de distribuciones que no son unimodaies. (a) Distribución bimodal que indi-
cajas posibles frecuencias en diferentes niveles de calidad del trabajo realizado por empleados que llama
ron la atención de gerentes de mayor nivel, (b) Distribución rectangular que muestra las posibles
frecuencias de la cantidad de alumnos en los diferentes grados de la escuela primaria.
Figura 1-11. E jem p lo s d e p o líg o n o s d e frecu en cias de d istrib u cion es (a) prácticam ente sim étrica s, (b ) a si
m étricas h a cia la derecha (p o sitiv a m en te asim étricas) y (c ) asim étricas hacia la izquierda (n egativam en te
asim étricas).
El término curtosis se refiere al grado en el que la forma de una distribución difiere de la curva nor
mal, principalmente con respecto ai hecho de que las colas sean más espesas o delgadas que las de
la curva normal (DeCarlo, 1997). El término curtosis proviene de la palabra griega kyrtos, que sig
nifica “curva”. La línea oscura de la figura l-14b indica una distribución cúrtica con colas más es
pesas que las de la curva normal. La figura l-14c presenta un ejemplo extremo de distribución
curtica, una distribución sin colas. (Una distribución rectangular sería un caso aún más extremo).
Además de la diferencia en el espesor de las colas con respecto a la curva normal, las distri
buciones con colas espesas por lo general son más empinadas que la curva normal (véase figura
l-14b), y aquéllas con colas más delgadas o sin colas, por lo general son más chatas que la-curva
normal (véase figura 3-14c).
Las distribuciones con colas espesas se ven como si a la curva normal se la pellizcara en la
mitad, y parte de ella se elevara formando un pico agudo y el resto se extendiera para formar espe
sas colas. Las distribuciones con colas delgadas (o sin colas), se ven como si se tirara hacia fuera
el centro de la distribución y se absorbieran las colas y el pico. De todos modos, aun cuando
usualmente la elevación o chatura de una distribución esté relacionada con ía curtosis, lo más im
portante es el espesor de las colas.
CONTROVERSIAS Y LIMITACIONES______________________
La controversia más importante con respecto a ia utilización de tablas de frecuencias, histogra-
ma$ y polígonos de frecuencias no se genera entre los psicólogos, sino entre el público en general.
La utilización y el uso incorrecto de estos procedimientos descriptivos por parte de los medios pa
rece haber creado escepticismo con respecto a la confiabilidad de la estadística en general y de las
tablas y cuadros estadísticos en particular ¡Quién no ha escuchado decir que “la estadística mien
te” ! En realidad, las personas pueden mentir a través de la estadística, y así lo hacen. Es tan senci
llo como mentir con palabras, pero las mentiras dichas con números son seguramente más
difíciles de reconocer. En esta sección destacamos dos maneras a través de las cuales las tablas de
frecuencias y los gráficos equivalentes pueden ser usados en forma errónea, y mostramos cómo
reconocer esos usos incorrectos. (Gran parte del material está basado en la excelente y entreteni
da exposición de estos temas). (Tufte, 1983)
Figura 1-15. R ep resen tación e n g a ñ o sa d e una distri
b u ción d e frecu en cias a causa d e lo s d istin to s tam a
ños de intervalos, (F u e n te : N e w Y o r k T im e s, 8 de
agosto, 1978, p. D - l . © 1978 por la N e w Y o rk T im e s
C o m p a n y . R eim p reso con autorización).
, 0.5- -2J ■. « 8,5 ■ 10,5 , 0.5 . 2,5 ' '4 J ,'' 6^ “ . 8 J í l O J . - '
; ' Ó) ; : Estris ‘ (c) ' , Esiífa
De tanto en tanto, alguien intenta argumen susíancialmente, y aún más en aquellos lu
tar que al ser los hombres blancos quienes i gares en los que se han mejorado la actitud
tienden u lograrlos mayores éxitos en ma y las oportunidades. Esta sugiere que..las /
temática, las ^mujeres y las;personas de co diferencias no eran genéticas sino que.esta- .
lor son inherentemente menos .capaces én . •ban determinadas culturahnente. (Baker &
ese campo (y en la estadística). Planteamos • Jones, 1993; Hyde, 199.3) En una revisión
este tema porque seguramente. el alumno , de las. investigaciones realizadas sobre el y
ha oído hablar de tales actitudes y no que " tema, Hyde (1993) descubrió que en la se-
remos que eHaainfluyan sutilmente en n in -; cundaria los vaiories aun ,se. desempeñan
gunp .de/ellosy. especialmente en los que n o .. mejor que las mujeres en la solución de
son hombres biaricós. problemas complejos y en el ¿ at (Scholas- i
i... Con respecto a los sexos, existía cierta ,. tic Amplitude Test, Examen de aptitud esco-
brecha entre ellos que sugería .que las mu- -i lar) por diversas razones (es como el hecho '
jeres eran menos capaces paira íámatemáti- ’ de qué los varones continúen tomando ‘cur- i
ca, pero la ' rhismá se h a ! estrechado sos de matemática). Sin embargo, éstas di- i
lerendas no se encontraban en oíros indi e n la m a te r ia y m e n o s r e c u r s o s p a r a la e n - d
cadores de capacidad matemática. Algunos s e ñ a n z a d e la m a te m á tic a y la c ie n c ia . L a
han descubierto que los varones tienen me fa lt a d e e s t u d ia n te s d o c to r a d o s d e n tro d e
jor razonamiento espacial, pero este aspec e s t a s c o m u n id a d e s p r o b a b le m e n te p e r p e
to aún:no ha sido comprendido o medido tú e la d e s v e n ta ja . T o d o d e m u e s tr a q u e e l
adecuadamente, y es probable que no se p r o b le m a r e a l n o s o n lo s g e n e s s in o la s a c -
deba a una diferencia genética. titu d e s q u e h a n fo m e n ta d o la s d e s ig u a ld a
Es verdad qué, en general, los que mejor d e s e n la e d u c a c ió n .
se han desempeñado en el campo de la mate ¿Qué se .puede hacer al respecto? Un
mática han sido hombres. Pero aun así, las caminó es combatir de la mejor manera po
diferencias, son leves, y las mujeres no son sible la idea de que la matemática es “natu-
las más propensas a tener los peores desem raímente” más .complicada para uno que ;;
peños, como ocurriría si existieran diferen ; para otro.. Si lo es, probablemente sqdeba a .
cias genéticas. Más que nunca, las mujeres q u é e l a l u m n o h a t e n i d o . m e n o s c o n t a c t o '.
están obteniendo doctorados en matemática, ■] c o n e l l a y c o n l ö s n ú m e r o s e n g e n e r a l , a l
aunque también es el campo con el mayor .' h a b e r s i d o d e s a l e n t a d o a a s is t ir ; a c u r s o s . ;.
índice de deserción femenina. Tai vez una de avanzados de matemática o debido a que '
las razones sea que, si bien las mujeres no V nò Ha recibido una buena enseñanza en la
consideran la matemática un campo “para • m a te r ia . P o n e r s e a l d ía p u e d e s e r . d if íc il,
hombres”, lqs hombres definitivamente sí lo p e r o e l h e c h o d é te n e r , q u q e s f o r z a r s e m á s
consideran de ese modo, (Hyde et al., 1990) n o s ig n ific a n a d a c o n r e s p e c to a la p o te n -,
Coa esa actitud, es posible que los hombres d a lid a d p ara, a p r e n d e r e s ta d ís tic a .
dedípadps.a la matemática no incentiven a P a r a c a m b i a r l a s i d e a s . e q u i v o c a d á s q u e ,-y
sus alumnas o colegas femeninas. No obs •p u d i é r a m o s t e p e r s o b r e n u e s t r a s > p r o p i a s .
tante, cambiar ese tipo de actitud sólo és c a p a c i d a d e s ,, p u e d e s e r ú t i l r e c o n o c e r q u e -
cuestión de tiempo.. . e x i s t e p n a c r e e n q i a e n r ó n e a y s i n v a lo r , a m -
V En lo que respecta al desempeño feme . p li a n iie n t e d i f u n d i d a , . q u e'; s 0 s .tié r íe ...q u e . l a
nino en estadística, chequeamos las califi- c a p a c i d a d 'm a t e m á t i c a e s in n a t a ,, a l g o q u e
: caciones en nuestras. propias clases de s e t i e n e o n o ( p o r l o t a n t o , l a c o n c l u s i ó n ...
introducción y realmente río encontramos más f r e c u e n t e e á q u e n o t i e n e s e n t i d o e s t u
ninguna diferencia confiable relacionada diar una m a t e r i a s i n o e x i s t e l a m e n o r espéV
con el sexo. Tampoco Buck (1985) encon . r a n z a de l l e g a r à .d o r n in a r la ) . N o existe d
tró dicha diferencia en un análisis de trece ^ prueba alguna déla existencia d e Upa c a p a - d
semestres dé cursos de estadística para, cidad innata y, sin e m b a r g o ^ sí existe g r a n . .
alumnos universitarios no graduados, prin cantidad de e v i d e n c i a :que indica que los : :
cipiantes y avanzados. distintos rendimientos se deben al esfuerzo ;' ;
En cuanto a los grupos étnicos, sí exis realizado. ; :
ten. diferencias de desempeño, pero ningu Tobías (1987). cita un estudio compara-
na que no pueda ser explicada a través de ■tivo entre estudiantes asiáticos y nortéame- ■
las diferentes' oportunidades de cada gru ricanos en un examen internacional áe
po, En1particular, la gente de color no es matemática. Los estudiantes nórteamericá-
alentada con frecuencia a estudiar mate , nos fueron ' superados / por; completo, pero: ■
mática de alto nivel. Y lo que es peor, las aún más importante fue el motivo de ese re
escuelas a las que asisten por lo general sultado: las entrevistas revelaron que los '
cuentan con menos cursos avanzados' de estudiantes asiáticos consideraban que la
matemática, menos profesores calificados capacidad matemática estaba distribuida en
forma bastante pareja entre las personas, y mismo, sino que cada mujer y cada persona
pensaban que las diferencias de desempeño de color que curse estádística, o cualquier.:
eran el resultado del mayor esfuerzo. Los. otro curso de matemática a escala universi-
alumnos norteamericanos insistían con que tana, es en realidad ún modelo para aquellós
la capacidad para la matemática es un ta que vendrán después. •v
lento raro e innato. ' Consideremos, las pal ^bras. pronuncia- .
La matemática casi nunca resulta fácil das por .el .ex presidente de la Asociación '
para nadie. Y casi toda persona puede ápren- Americana de Matemática: • ..
■der incluso el más complejo de los concep L a p a r a d o j a d e ñ u e s t r o s t ie m p o s es=
tos matemáticos, si es perseverante y si;los q u e' a lá v e z q u e l a m a t e m á t ic a es- c a
conceptos le son bien enseñados. Si para al d a v e z m á s p o d e r o s a , s o lí* í ó s p o d e r -
gunas personas la matemática es más sen r o s o s p a r e c e n b e n e fic ia r s e ^ c o n ' é l l á . •
cilla que. para ,otros; sólo se debe a. que al . L a c a p a c id a d d e p e n s a r , m a t e m á t ic a - .
gunos tienen mayor práctica y experiencia .j m e n te ^ e n u n s e n t id o a m p liò ,:- es' a b s ó - ¡ :
con los números. Pensar que uno ha naci ■ lu t a m e n t e c r u c i a l p a r a el- 4esarroi.ro!' ’. : /■'.
do con menor capacidad para aprender mate . e n p r á c t ic a m e n t e t o d a s l a s c a r r e r a s .i '
mática y estadística crea una preocupación L a c o n f ia n z a é h e l r n a h e j o .d e ín f o r - 'f ; ; .
adicional que es necesario descartar ahora m a c ió n , e l e s c e p t i c i s m ó ;é h e í; án a lisis:- .
mismo. Como mencionamos antes, sencilla : d e a rg u m e n to s-, la p e r s e y é r a h c i a : :
mente no existe prueba alguna que indique p e n etra r.' p r o b le m a s :■-c o m p le j o s
■diferencias inherentes, y las diferencias de : .- cajjacidatd-.de; ¡ M m ú n f c a ^ ó n v s o b w ' ; É ^ ¿ ^ .
: desempeño que en efecto existen no necesa- : ó ;, m a s té c n ic o s e n fo f m á ó r á jfo é ^ ':
riamente predicen algo acerca de uno. Cada . s o n la s a r te s f a c u lt a t iv a s q u e . o f r e c e ii. ■
uno es un individuo, con su propia capaci la s nuevas d e n < ^ m á t é i á M ^ f ( S ú é á i i y
dad y determinación. Si un alumno necesita . ■ ■198Í7,;pfxviii>v : CC;•' d :' Y.'vf-
trabajar con más esfuerzo para aprobar esta N o d e b e m o s d e ja r d é a p r e n d e r e s t a s ; “ a r te s
materia, seguramente- se sentirá más satisfe-: fa c u lta tiv a s ” s ó lo p o r q u e a lg u ie n - ¿ o s h iz o :
cho cuando1lo logre. Y vale la pehá;recordar; c r e e r q ú e n o p o d r í a m ó s o ñ o q u è m a f n ò s . .' ^
que uno no lo está haciendo sólo por uno a p r e n d e r l a s . •f f f.f.;
Tabla 1-6.
F r e c u e n c ia s c o n q u e s e c o n fir m a r o n lo s e n u n c ia d o s s o b r e la p r o b a b ilid a d d e q u e e i c a n d id a to
a s ig n a d o fu e r a c o n tr a ta d o : e x p e r im e n to 1.
F r e c u e n c ia
(n = 31)
Fuente: Sanbonmatsu, D. M., Posavac, S.S., & Stasney, R. (1997), tab. 2. "Opiniones subjetivas implícitas en la sobres-
timación de probabilidades”. R e v is ta C ientífica ¿le P s ic o lo g ía S o c ia l E x p erim en ta l [J o u rn a l q f E x p erim en ta l S o cia l
P s y c k o b g y ] 3 3 ,2 7 6 -2 9 6 . Copyright, 1997, por Academic Press, Reimpreso con autorización.
como bebedores por diversión a aquéllos que informaban haber bebido al menos una vez durante
las dos semanas previas a la encuesta (cuatro copas de bebida alcohólica seguidas en el caso de las
mujeres y cinco en el caso de los hombres). La figura 1-17 reproduce la tabla que elaboraron. Úni
camente una facultad presentó sólo un 1-5% de bebedores por diversión. Sin embargo, bastantes
facultades presentaron un 30-50% de estos bebedores. ¡Seis facultades presentaron un 66 -70% de
alumnos considerados bebedores por diversión!
Tabla 1-7.
C u r so s r e q u e r id o s c o m o c o n d ic ió n p r e v ia p o r p r o g r a m a s p a r a g r a d u a d o s q u e e x ig e n c u r s o s
e s p e c ífic o s d e p s ic o lo g ía (n = 1 .5 5 4 ).
Fuente: Norcross, J. C., Hanych, J. M „ & Terranova, R. D. (1996), tab. 4 , Postgrado de Psicología, 1992-1993. A m e ri
c a n P sy ch o lo g ist, 5 1, 631-643, Copyright, 1996, por la Asociación Americana de Psicología [American Psychological
Association]. Reimpreso con autorización.
Figura 1-17. D istrib u ción d e facu ltad es seg ú n porcen taje d e b eb ed ores por d iversión . (F u e n te : W ech sler,
H ., D avenport, A ., D o w d a ll, G ., M o ey k en s, B ., & C a stillo, S . (7 d e d iciem b re d e 1 9 9 4 ), tab. 1. “ C o n se
c u e n c ia s para la sa lu d y e l co m p o rta m ien to p rovocad as por e l h áb ito d e beber p or d iversión durante la ép o
c a universitaria: un e stu d io n a cio n a l d e alu m n o s d e 140 cam p u s u n iversitarios” , J A M A , 2 7 2 ,1 6 7 4 ) .
Los histogramas y los polígonos de frecuencias sólo en raras ocasiones se publican en artícu
los de investigación. Es más probable que se vean breves comentarios sobre la forma de la distri
bución de los registros recolectados durante el estudio, especialmente si la distribución se desvía
de lo normal Speed y Gangestad (1997) aportan una típica descripción, como la mencionada en
sus comentarios, sobre un grupo de variables que analizaron; “Estas variables no estaban distri
buidas en forma normal (eran positivamente asimétricas)”, (p. 930)
Resumen
Los psicólogos utilizan procedimientos de estadística descriptiva para describir, es decir, pa
ra resumir y hacer fácilmente comprensibles un grupo de números obtenidos a partir de una
investigación.
Un valor es un número o categoría; una variable es una característica que puede tener diferen
tes valores; una observación es el valor particular correspondiente a una persona en una variable.
Con una variable numérica, los valores nos transmiten el grado o cantidad de lo que se mide. Hay
dos clases principales de variables numéricas: en el caso de las variables intervalares, los valores
representan cantidades iguales de lo que se mide; en el caso de las variables ordinales, los valores
sólo representan posiciones relativas. En el caso de las variables nominales, los valores son cate
gorías o nombres.
Una tabla de frecuencias organiza los números en una tabla en la que cada uno de los valores
posibles aparecen en una lista a lo largo del margen izquierdo, ordenado de mayor a menor, junto
con la cantidad de observaciones que corresponden a cada valor.
Cuando hay una gran cantidad de valores diferentes es más útil construir una tabla de fre
cuencias agrupadas, que es igual a una tabla de frecuencias común, sólo que las frecuencias se
atribuyen a intervalos que incluyen una serie de valores. El tamaño de los intervalos debe elegirse
de tal modo que (a) la cantidad total de intervalos sea de entre 5 y 15; (b) sea un número común,
simple, y (c) el límite inferior de cada intervalo sea múltiplo del tamaño del intervalo.
El patrón de las frecuencias puede representarse con un histograma, es decir, una especie de
gráfico en el que la altura de cada barra es la frecuencia para un valor o intervalo determinado, y
en el que no existen espacios entre las barras. Los polígonos de frecuencias son otra alternativa de
los histogramas; en ellos, una línea conecta puntos, es decir, la altura de cada uno de los cuales re
presenta la frecuencia de un valor o intervalo determinado.
La forma general del histograma o polígono de frecuencias puede ser unimodal (con un solo
pico), bimodal, multimodal (que incluye al bimodal), o rectangular (sin picos); puede ser simé
trica o asimétrica (con una larga cola) hacia la derecha o hacia la izquierda; y con respecto a la
curva normal con forma de campana, puede presentar curtosis (con colas que son muy anchas o
muy angostas).
A veces se puede distorsionar la representación gráfica de información para el público en ge
neral, de tal manera que a simple vista resulte engañosa, como por ejemplo, utilizando intervalos
que no son iguales o exagerando las proporciones.
Las tablas de frecuencias, los histogramas y los polígonos de frecuencias rara vez aparecen
en publicaciones científicas. Cuando aparecen, por lo general lo hacen en formatos no tradiciona
les o presentando frecuencias (o porcentajes) para varias categorías, más que para los diferentes
valores numéricos de una variable.
Términos clave
- Bimodaí. Histogramas. - Variable ordinal.
- Efecto techo. Estadística inferencial. - Rectangular.
- Estadística descriptiva. intervalo. - Valor observado
- íntervalar. Curtosis. u observación.
- Efecto piso. Niveles de medición. - Asimétrico.
- Distribución de frecuencias. Multimodal. - Simétrico.
- Polígono de frecuencias. Variable nominal. - Unimodal.
- Tabla de frecuencias. Curva normal. - Valor.
- Tabla de frecuencias agrupadas. Variable numérica. -Variable.
Ejercicios
Los ejercicios implican la realización de cálculos o tabulaciones. La mayoría de los problemas
estadísticos reales se resuelven por computadora, pero aun así, es conveniente realizar estos ejer
cicios manualmente para incorporar el método de trabajo.
Para adquirir práctica en la utilización de una computadora, para resolver problemas estadís
ticos, se puede utilizar la sección de computación de cada capítulo, publicada en la Guía de estu
dio y libro de tareas de computación para el alumno / Student’s Study Guide and Computer
WorkbookJ que acompaña este libro.
Todos los datos de esta sección son ficticios (a menos que se especifique lo contrario). Las
respuestas a los ejercicios de la serie I se encuentran al final del libro.
► Medía. ► Resumen,
► Medidas alternativas de la tendencia. ► Términos clave.
■ / central. ■- • ^ Ejercicios.
► Varianza y desvío estándar. ► Apéndice del capítulo: fórmulas
► Puntuaciones Z. _ optativas para el cálculo de la
► Controversias y limitaciones: la tiranía varianza y el desvío estándar.
_• v de la media.:••V ■.•’¿V> )VV( V\ ■ V. . V: •-.:j. V:
► la media y el desvío estándar según se
i describen en publicaciones científicas.
C
cilmente comprensibles un grupo de observaciones. Hemos visto algunas formas de
lograr esa comprensión a través de tablas y gráficos. Es este capítulo, considerare
mos las principales técnicas estadísticas para describir un grupo de observaciones
utilizando ciertos números. Estos números son: la media, la varianza, el desvío es
tándar y las puntuaciones Z. La media es el promedio. La varianza y el desvío estándar describen
el grado de variación de las observaciones. Una puntuación Z describe la desviación de una ob
servación en particular respecto del promedio.
MEDIA
Comúnmente, el mejor número para describir un grupo de observaciones es el promedio normal,
es decir, la suma de todas las observaciones dividida por la cantidad de observaciones. En estadís
tica, ese promedio se denomina media. A veces se dice que el promedio o media de un grupo de
registros muestra la tendencia central o el valor típico o representativo de un grupo de observa
ciones. Más adelante Veremos que existen otras formas, además de la media, para describir la ten
dencia central de un grupo de observaciones.
Supongamos que una psicoterapeuta observó cuántas sesiones habían tardado sus últimos 10
pacientes en completar una terapia breve. Las cantidades de sesiones eran las siguientes:
7,8,8,7, 3,1,6,9,3,8
La media de las 10 observaciones anteriores es 6 (la suma de 60 sesiones dividida por 10 pa
cientes), Es decir, en promedio, los últimos 10 pacientes de la terapeuta habían asistido a 6 sesio
nes. Así, la información referida a los 10 pacientes se resume sólo en este número.
A muchos estudiantes les resulta útil visualizar la media como una especie de punto de equilibrio de la
distribución de observaciones. Intentemos visualizar una tabla en equilibrio sobre un tronco, como un
Figura 2-1. Media de ia distribución de cantidad de se
siones de terapia realizadas según un ejemplo ficticio,
ilustrada a través de una analogía con cubos apoyados
encima de una tabla en equilibrio sobre un tronco.
sube y baja rudimentario. Imaginemos pilas de cubos distribuidos a lo largo de la tabla según los valo
res que representan, es decir, un cubo para cada observación de la distribución. (La figura resultante es
similar a un histograma construido con cubos). La medía sería el punto de la tabla donde el peso de los
cubos se equilibra perfectamente. La figura 2-1 representa lo antedicho utilizando e! ejemplo de la
cantidad de sesiones a las que asistieron los 10 pacientes de nuestra terapeuta imaginaria.
La figura 2-2 muestra algunos otros ejemplos. Cabe destacar, que ni siquiera es necesario que
haya un cubo exactamente en el punto de equilibrio. Es decir, la media no necesariamente debe
corresponder a una observación real en la distribución. La media es simplemente el promedio de
las observaciones, el punto de equilibrio. La media incluso podría ser un número cuya aparición
en la distribución fuera imposible, como en el caso de una media representada por un número de
cimal cuando todos los números en la distribución deben ser números enteros (2,3 niños, por
ejemplo), Otra característica es que los cubos pueden estar muy separados o muy juntos y que no
necesiten estar distribuidos en forma pareja. En cualquiera de esos casos, aun es posible encontrar
un punto de equilibrio. (Cabe mencionar que esta analogía, que utiliza cubos en equilibrio encima
de una tabla apoyada sobre un tronco, funcionaría en la realidad sólo si la tabla no tuviera peso).
JX (2- 1)
M=
N
Figura 2-2. Medias de varias distribuciones ficticias ilustradas utilizando la analogía de los cubos apoyados
encima de una tabla en equilibrio sobre un tronco.
M es un símbolo que representa la media. (Más adelante aprenderemos otro símbolo para repre
sentar la media, la letra griega ¡i, “mu”, que se utiliza en circunstancias particulares. También es
bastante utilizado un tercer símbolo, X, a veces denominado X-raya).
X, la letra griega mayúscula “sigma,” es el símbolo que representa la “suma de”; significa
“suma de todas las cantidades siguientes”. Es el símbolo aritmético especial más comúnmente
utilizado en estadística.
La X se refiere a las observaciones en la distribución de la variable X. Podríamos haber elegi
do cualquier otra letra. Sin embargo, cuando existe sólo una distribución, generalmente se la de
nomina X. En capítulos posteriores veremos situaciones en las que se analizan dos distribuciones
al mismo tiempo. En ese caso, se utiliza una segunda letra, generalmente la Y. Otra alternativa es
utilizar subíndices, como por ejemplo X l y X2. En el caso de un tratamiento matemático más for
mal de la estadística, ios símbolos utilizados en varias fórmulas son aún más complejos. Es preci
samente esa complejidad la que permite que las fórmulas representen casos complicados sin
confusión. Sin embargo, los libros de estadística para psicólogos, aun los textos más avanzados,
utilizan símbolos simples. La forma más simple rara vez crea ambigüedad en las fórmulas esta
dísticas que utilizan los psicólogos.
XX significa “la suma de X”. índica que se deben sumar todos los valores observados de la dis
tribución de la variable X. Supongamos que X se refiere a la cantidad de sesiones de terapia en la dis
tribución de nuestro ejemplo. XX sería igual a 60, la suma de 7 + 8 + 8 + 7 + 3 4 -1 + 0 + 9 + 3 + 8.
N es un número. Se utiliza en estadística para indicar la cantidad de observaciones de una dis
tribución. En nuestro ejemplo existen 10 observaciones, por lo tanto, N es igual a 10.
Resumiendo, la fórmula indica dividir la suma de todas las observaciones de la distribución
de la variable X por la cantidad total de observaciones M En nuestro ejemplo, significa que debe
mos dividir 60 por 10. La fórmula sería la siguiente;
XX 60
M= =6
N 10
XX 975
M= = 6,46
M 151
La fórmula nos indica que la puntuación promedio de estrés en la escala de 10 puntos fue de 6,46
(redondeando). Esta cifra se encuentra claramente por encima del punto medio de la escala. El
ejemplo también puede representarse gráficamente. Consideremos otra vez el histograma como
una pila de cubos encima de una tabla, y la media 6,46 como el punto en el que la tabla se equili
bra sobre el fulcro que tiene debajo, (véase figura 2-3). Este único número simplifica enorme
mente la información délas 151 puntuaciones de estrés.
De modo similar, analicemos el ejemplo de las interacciones sociales de los alumnos
(McLaughlin-Volpe et al., 1998). Las cantidades de interacciones de ios 94 alumnos durante una
semana fueron las siguientes:
48,15,33,3,21,19,17,16,44,25,30,3, 5,9,35,32,26,13,14,14,47,47,29,18,11, 5,19,24,17,
6,25,8,18,29,1,18,22,3,22,29,2,6,10,29,10,21,38, 41,16,17, 8,40,8,10,18, 7,4,4, 8, 11,
3,23,10,19,21,13,12,10,4,17,11,21, 9 , 8,7, 5, 3,22, 14,25,4,11,10, 18,1, 28,27, 19, 24, 35,
9,30,8,26
La tabla de frecuencias, la tabla de frecuencias agrupadas, el histograma y el polígono de frecuen
cias que construimos en el capítulo 1 simplificaron considerablemente la visualización de los da
tos. Pero incluso, después de todo ese proceso también sería útil obtener un resumen de un sólo
número. Por lo tanto, podemos calcular la media en la forma usual. En este caso:
1.635
= 17,40
94
Es decir, si sumamos las cantidades de interacciones de los 94 alumnos, la “suma de X ' da 1.635.
Al dividir este número por la cantidad de observaciones, obtenemos una media de interacciones
de 17,40. La figura 2-4 gráfica este caso.
M = 755
N 100
La figura 2-5 representa este caso gráficamente.
• / * ¥ Media ¿ 7 .
5 6 • 7. ; 8 9 10 •-
sa de que las mujeres prefieran tener sólo una pareja estable, debido a que una mujer sólo puede
tener una pequeña cantidad de hijos durante su vida, y es más probable que los genes de la mujer
sobrevivan si esos pocos hijos son bien cuidados. Los hombres, sin embargo, pueden tener una
gran cantidad de hijos durante su vida; por eso, según la misma teoría, para ellos lo mejor es una
postura semejante al disparo de escopeta. Si tienen muchas parejas es más probable que sus genes
sobrevivan. Coherentemente con esta presunción, los psicólogos evolucionistas descubrieron que
los hombres expresaban necesitar muchas más parejas que las mujeres.
Otros teóricos (p.ej., Milier & Fishkin, 1998), sin embargo, han cuestionado esta visión. Sos
tienen que hombres y mujeres preferirían aproximadamente la misma cantidad de parejas debido
a que los individuos que tienen una predisposición básica a buscar un lazo íntimo fuerte son los
que tienen las mayores probabilidades de sobrevivir a la niñez, y que este deseo de lazos fuertes
perdura (y tiene otros beneficios) en la etapa adulta. Los mismos investigadores también pregun
taron a mujeres y hombres cuántas parejas necesitaban, y ios resultados mostraron la misma dife
rencia en cuanto a las medias; los hombres necesitaban un promedio de 64,32 y las mujeres un
promedio de 2,79. Sin embargo, la escena cambia drásticamente si observamos la mediana o la
moda (véase tabla 2-1). La figura 2-9, tomada directamente de la publicación preparada por los
investigadores, nos explica la situación. La mayoría de las mujeres y los hombres desean sólo una
pareja; unos pocos desean más de una, y síganos desean muchas más. La gran diferencia reside
en que hay muchos más hombres dentro del pequeño grupo que desea muchas más parejas. (Los
valores observados más extremos estaban tan alejados -los hombres que deseaban más de 100 pa
rejas-, que ios investigadores ni siquiera los incluyeron al calcular las medias).
Por lo tanto, ¿cuál de las dos teorías es la correcta? Tal vez uno podría sostener cualquiera de
las dos formas para analizar esta información. La verdad es que concentrarse sólo en la media, en
este caso, desfigura drásticamente la realidad de la distribución.
Tabla 2-1.
Respuestas de 106 hombres y 160 mujeres a la pregunta: “¿Cuántas parejas desearía tener en los
próximos 30 años?”
M ed ia M ed ia n a M od a
M ujeres 2,8 1 1
Hom bres 64,3 1 1
Sin embargo, a menos que existan valores extremos, los psicólogos casi siempre utilizan la media
como medida de la tendencia central. En realidad, la media cumple la función de piedra angular
para la mayoría de las otras técnicas estadísticas.
Varianza
La varianza de un grupo de observaciones indica la dispersión de esos valores alrededor de la
medía. Para ser más precisos, la varianza es el promedio de los cuadrados de la diferencia entre
cada observación y la media. A continuación, detallamos los pasos para calcular la varianza;
1 Esta sección está dedicada a la varianza y al desvío estándar com o indicadores de dispersión. Existe otra forma de des
cribir la dispersión de un grupo de observaciones, la am plitud, e l registro mayor menos el registro menor. Supongamos
que en una clase en particular el registro más alto en un examen parcial es 98 y el menor es 60; la amplitud es 38 (es de
cir 98 - 6 0 = 38). La amplitud rara vez es utilizada por investigadores psicológicos ya que se trata de un medio muy bur
do de describir la dispersión. Es burdo debido a que no tiene en cuenta la distancia entre las observaciones dentro de la
distribución.
Figura 2 -1 0 .
E jem p lo s d e d istrib u cio n es c o n (a) la m ism a m ed ia con d iferen tes grados d e d isp e r sió n y (b)
diferentes m ed ias co n e l m ism o grado d e d ispersión .
1. Restar la media a cada observación para obtener el desvío de cada una de ellos. El desvío
indica la distancia entre la observación en cuestión y la media.
2. Elevar cada uno de los desvíos al cuadrado (multiplicar cada uno de ellos por sí mismo). Se
obtiene así el desvío cuadrático de cada registro.
3. Sumar los desvíos cuadráticos. El total logrado con este cálculo se denomina suma de los
cuadrados.
4. Dividir la suma de los cuadrados por la cantidad de desvíos cuadráticos (es decir, por la
cantidad de observaciones), Se obtiene así el promedio o media de desvíos cuadráticos, es decir,
la varianza.
Aunque este procedimiento pueda parecer un poco extraño o difícil de recordar al principio,
en verdad funciona muy bien. Supongamos que una distribución es más dispersa que otra. La dis
tribución con mayor dispersión presenta una varianza mayor porque la misma dispersión hace
que los desvíos sean mayores. Si los desvíos son mayores, los desvíos cuadráticos también lo son
y, por lo tanto, también la varianza.
En el ejemplo de la clase en la que todos tenían 38 años de edad, la varianza sería exactamen
te 0. Es decir, no habría varianza. (En términos numéricos, el desvío de cada persona sería
38 *- 38 - 0; 0 al cuadrado es 0. El promedio de 0 es 0). Por el contrario, la clase con la mitad de
los alumnos de 18 años de edad y la otra mitad de 58 años de edad tendría una varianza bastante
alta, es decir, 400. (Los alumnos de 18 años de edad tendrían cada uno un desvío de 18 - 38 =-20,
Los alumnos de 58 años de edad tendrían desvíos de 58 - 38 = 20. En ambos casos, los desvíos
cuadráticos, tanto -20 al cuadrado como 20 al cuadrado, darían como resultado 400. Y, cuando to
dos ios números son 400, el promedio es 400).
La varianza es importante en muchos otros procedimientos estadísticos (incluso en la mayoría de
los temas tratados en la segunda mitad de este libro). Sin embargo, la varianza se utiliza sólo ocasio
nalmente como estadística descriptiva, debido a que está basada en desvíos cuadráticos, y los desvíos
cuadráticos no transmiten claramente la dispersión de las observaciones. Son verdaderos
desvíos o son no cuadráticos. Por ejemplo, queda claro que una clase con una varianza de 400 pre
senta una distribución mucho más dispersa que otra cuya varianza es 200. Sin embargo, el número
400 no refleja con claridad la variación real entre las edades, ninguna de las cuales se acerca a 400.2
Desvío estándar
La estadística más ampliamente utilizada para describir la dispersión de una distribución es el
desvío estándar. El desvío estándar es la raíz cuadrada positiva de la varianza: para encontrar
el desvío estándar, primero es necesario calcular la varianza y luego sacar su raíz cuadrada. Si la
varianza de una distribución es 400, el desvío estándar es 20; si la varianza es 9, el desvío estándar
es 3, y si la varianza es 100, el desvío estándar es 10.
La varianza se basa en los desvíos de la medía, al cuadrado. Por lo tanto, su raíz cuadrada, el
desvío estándar, se basa en la distancia simple, no elevada al cuadrado, de la media. Sin entrar en
detalles, el desvío estándar es e! promedio de las diferencias entre las observaciones y la media.
Por ejemplo, analicemos una clase donde las edades presentan un desvío estándar de 20 años. Esto
nos indicaría que las edades se dispersan, en promedio, aproximadamente 20 años en cada dirección
a partir de la media. Conocer el desvío estándar ofrece una idea general del grado de dispersión.
Daremos otro ejemplo. La distribución de la cantidad de hijos por familia en un país en par
ticular podría tener una media de 4 y un desvío estándar de L Significaría que, por cada familia
con exactamente cuatro hijos (desvío 0 de la media), bien podríamos encontrar una con seis o dos
hijos (desvío de 2 hijos de la media). Sin embargo, podría no funcionar de esa forma. Podría ser
que la mitad de las familias tuvieran exactamente 5 y la otra mitad exactamente 3. O podría ser
que la mayoría tuviera 4, pero unas pocas no tuvieran ninguno y otras pocas tuvieran 8 (véase fi
gura 2- 11). No obstante, conocer el desvío estándar brinda una noción general del grado de dis
persión, aun cuando no indique la forma precisa de distribución.
El desvío estándar no es exactamente el promedio de las diferencias entre las observaciones
y la media. Para ser precisos, el desvío estándar es la raíz cuadrada del promedio de los desvíos
cuadráticos de la media, Elevar los desvíos al cuadrado, promediarlos, y luego calcular la raíz
cuadrada, da un resultado ligeramente diferente al simple promedio de los desvíos de los registros
con respecto a la media, Aun así, el resultado de este procedimiento tiene ventajas técnicas que
superan la ligera desventaja de dar sólo una descripción aproximada de la variación promedio con
respecto a la media (véase nota al pie N° 2).
2 El alumno seguramente se estará preguntando por qué ios estadísticos no trabajan sólo con los desvíos, simplemente
haciendo que todos ios desvíos sean positivos, y utilizando sus promedios. En realidad, en el pasado, ese era ei procedi
miento. El promedio de los desvíos (tratando a todos los desvíos com o positivos) se denomina desvío prom edio o des
vío m edio, En efecto, algunos psicólogos han hecho resurgir esta cuestión observando algunas ventajas sutiles del
desvío promedio (Catanzaro &TayIor, 1996), Sin embargo, a pesar de su simplicidad conceptual y de cálculo, ei desvío
promedio no funciona muy bien como parte de procedimientos estadísticos más complejos, debido a que resulta difícil
realizar manipulaciones algebraicas con una fórmula que ignora los signos de algunos de sus números.
F ig u r a 2 -1 1 . R ep resen ta ció n gráfica d e varias p o sib le s d istrib u cion es d e un e je m p lo fic tic io d e c o m p o s i
c ió n fa m ilia r e n e l q u e la m e d ia e s 4 y e l d e sv ío estándar e s 1.
SD2 ~ (2-2)
M
SD2 es el símbolo de varianza. (Más adelante aprenderemos sus otros símbolos, S1 y o 1, la letra
griega “sigma” minúscula al cuadrado. Los diferentes símbolos corresponden a diferentes cir
cunstancias en las que se utiliza la varianza y, en algunos casos, incluso a cálculos ligeramente di
ferentes).
SD es la abreviatura de desvío estándar; recalca que la varianza es el desvío estándar ele
vado al cuadrado. La parte superior de la fórmula describe la suma de los desvíos cuadráticos.
X se refiere a cada observación en la distribución. M es la media. Por lo tanto, X - M es la ob
servación menos la inedia, es decir, el desvío. El índice sobrescrito 2 indica que se debe elevar
el desvío a! cuadrado. Finalmente, el signo de suma (X) indica que se deben sumar todos los
desvíos cuadráticos.
La suma de los cuadrados es un cálculo importante en muchos procedimientos estadísticos;
por lo tanto, tiene su propio símbolo, SS. Por esta razón, algunas veces la fórmula de la varianza
se escribe utilizando este símbolo en el numerador, en lugar de £ (X - M)2:
SD 2 = — (2-3)
N
Ya sea que se utilice el símbolo simplificado SS o la descripción completa de la suma de cuadra
dos, la parte inferior de la fórmula es simplemente N, la cantidad de observaciones. Es decir, la
fórmula indica dividir la suma de cuadrados por la cantidad de desvíos cuadráticos (la cantidad de
observaciones en la distribución).
El desvío estándar es la raíz cuadrada de la varianza. De modo tal que si se conoce la varian
za, la fórmula es simplemente:
sd ~ 4 si ? (2"4)
La fórmula del desvío estándar comenzando desde el principio es la raíz cuadrada del cálculo de
la varianza:
cn = fi(X -M )2 (2-5)
N
( 2- 6)
primeras y últimas observaciones para ahorrar espacio). En términos aproximados, el tiempo pro
medio que tarda un participante en leer una oración ambigua varía 0,142 segundos de la media de
2,755 segundos. La figura 2-Í3 representa los datos mencionados.
T abla 2 -3.
Cálculo de la varianza y el desvío estándar de la cantidad de interacciones sociales vividas por 94
estudiantes universitarios durante una semana.
C antidad de - m ed ia d e S3 D e sv ío
interacciones in tera ccion es D esv ío cu a d r á tic o
48 1 7 ,40 3 0 ,6 0 9 3 6 ,3 6
15 17,40 - 2 ,4 0 5,76
33 17,40 15,60 2 4 3 ,3 6
3 17,40 - 1 4 ,4 0 2 0 7 ,3 6
21 17,40 3,60 12,96
35 17,40 17,60 3 0 9 ,7 6
9 17,40 - 8 ,4 0 7 0 ,5 6
30 17,40 12,60 158,76
8 17,40 - 9 ,4 0 8 8,36
26 17,40 73,96.
2: 0,00 12,406,44
X (X -M )2 12.406,44
Varianza = S D 2 * - 1 3 1 ,9 8
N 94
T a b la 2 -4 .
C á lc u lo d e la v a r ia n z a y el d e s v ío e s tá n d a r e n u n e s t u d io fic tic io d e l tie m p o d e le c tu r a d e o r a c io n e s
a m b ig u a s .
V alor M ed ia D e sv ío
(tiem p o de lectu ra ) - (tiem p o d e lectu ra ) = D esvío c u a d r á tic o
2 ,7 2 2 ,7 5 5 - 0 ,0 3 5 0 ,0 0 1 2
2 ,8 4 2 ,7 5 5 0 ,0 8 5 0 ,0 0 7 2
2 ,6 3 2 ,7 5 5 - 0 ,1 2 5 0 ,0 1 5 6
2 ,5 1 2 ,7 5 5 - 0 ,2 4 5 0 ,0 6 0 0
2 ,5 4 2 ,7 5 5 - 0 ,2 1 5 0 ,0 4 6 2
2 ,9 8 2 ,7 5 5 0 ,2 2 5 0 ,0 5 0 6
2 ,5 2 2 ,7 5 5 - 0 ,2 3 5 0 ,0 5 5 2
2 ,6 6 2 ,7 5 5 - 0 ,0 9 5 0 ,0 0 9 0
2 ,7 4 2 ,7 5 5 - 0 ,0 1 5 0 ,0 0 0 2
2 ,7 3 2 ,7 5 5 - 0 ,0 2 5 0 ,0 0 0 6
2 ,8 8 2 ,7 5 5 0 ,1 2 5 0 ,0 1 5 6
2 ,8 5 2 ,7 5 5 0 .0 9 5 0 .0 0 9 0
X : 0 ,0 0 0 2 ,0 3 3 0
2 ( X ~ M ) 2 _ SS 2 ,0 3 3
Varianza - S D 2 - _ — = 0 ,0 2 0 3
100
D e sv ío estándar = S D = = V O 0203 = 0 ,142
F igura 2-13. Descripciones gráficas del
desvío estándar como la distancia a lo
largo de la base de un histograma, utili
zando el ejemplo referido al tiempo ne
cesario (en segundos) para leer oraciones
ambiguas (datos ficticios).
PUNTUACIONES Z
Hasta aquí hemos aprendido a describir una distribución de observaciones en función de la media
y la varianza. En esta sección, aprenderemos cómo describir una observación en particular según
el lugar que ocupe dentro del grupo de observaciones en conjunto. Es decir, aprenderemos a des
cribir una observación según la misma se encuentre sobre o debajo del promedio y según a qué
distancia hacia abajo o por encima del mismo esté ubicada.
Supongamos que nos informan que alguien llamado Alan tomó 9 sesiones con la psicotera-
peuta (la misma a la cual nos hemos referido en este capítulo). Supongamos también que desco
nocíamos la cantidad de sesiones tomadas por oíros pacientes con la misma terapeuta. En ese
caso, seria difícil decir si Alan asistió a muchas o pocas sesiones en relación con otros pacientes.
Sin embargo, supongamos que sí sabemos que la media es ó y el desvío estándar es 2,57. Con
esos datos, queda claro que Alan asistió a una cantidad de sesiones superior al promedio. También
podemos ver que la cantidad de sesiones en las que Alan se excedió del promedio (3 sesiones
más) era un poco más alta que la cantidad de sesiones en que los pacientes de la terapeuta general
mente varían con respecto al promedio. La figura 2-14 muestra el caso gráficamente.
Otros ejemplos
En la práctica, las puntuaciones Z tienen muchos usos. También son parte importante de muchos
de los procedimientos estadísticos que aprenderemos en lo que resta del libro. Es importante fa
miliarizarse con ellos.
Analicemos otro ejemplo. Supongamos que un psicólogo especializado en el desarrollo ob
servó a un niño de tres años, llamado Peter, en una situación estándar de laboratorio, mientras ju
gaba con otros niños de su edad. Durante la observación, el psicólogo controló la cantidad de
veces que Peter hablaba con los otros niños. El resultado, luego de varias observaciones, fue que
Peter habló con los otros niños aproximadamente 8 veces por hora de juego. Sin ningún patrón de
comparación, sería difícil sacar alguna conclusión a partir de esta información. Supongamos, sin
embargo, que se sabía, por investigaciones previas, que en similares condiciones la cantidad me
dia de veces que los niños hablan por hora de juego es 12, con un desvío estándar de 4. Con esa
información, ahora podemos ver que Peter habló con menos frecuencia que oíros niños en gene
ral, pero no con una frecuencia extremadamente menor. Peter tendría una puntuación Z de --1 (si
M = 12 y SD - 4, una observación de 8 está 1 SD por debajo de la M). Supongamos que observa
mos conversar a Ian con otros niños 20 veces en una hora. Quedaría claro que Tan es inusualmen
te locuaz, con una puntuación Z de + 2 . Ian no sólo hablaría más que el promedio, sino dos veces
más de lo que los niños tienden a desviarse del promedio. (Véase figura 2-1 ó).
Figura 2-16. C antidad da v e c e s por hora qu e d os n iñ os con versan , expresada e n p u n tu acion es brutas y pun
tu a cio n es Z (d atos fic ticio s).
Z « —~ (2-7)
SD
Por ejemplo, si aplicamos la fórmula al ejemplo del niño con un registro de 100 en la prueba de
capacidad lingüística,, la fórmula sería la siguiente:
g __ X - M _ 100 - 82 _ 18 _ ^
SD 6 6 ”
X = (ZXSD) + M (2-8)
Por ejemplo, si un niño presenta una puntuación Z de -1,5 en la prueba de capacidad lingüísti
ca, quiere decir que se encuentra 1,5 desvíos estándar por debajo de la media. Dado que el des
vío estándar en este caso es de ó puntos brutos, el niño está 9 puntos brutos por debajo de la
media. La media es 82. Por lo tanto, 9 puntos por debajo de ella es 73. Utilizando la fórmula,
tendríamos:
ív ¡0 ~
„ 2 (X -A í)2 SS 10 ^
SD2 ^
N N 10
S£> = Vl= 1
8 Si no hubiera errores de redondeo, el resultado sería igual a 10.
CONTROVERSIAS Y LIMITACIONES:
LA TIRANÍA DE LA MEDIA
Aun cuando el uso de la estadística en psicología es tan generalizado que pareciera ser la única
herramienta o el único lenguaje de esta disciplina, siempre ha existido una corriente en desacuer
do con el método puramente numérico. Es nuestra intención informar al lector, a lo largo del li
bro, sobre las controversias que existen en el campo de ía psicología con respecto a la estadística.
Consideramos que un buen tema para comenzar a hacerlo es precisamente el debate referido al
abuso de las estadísticas.
El “padre de la psicología”, Wihelm Wundt, pensaba que los experimentos y las estadísticas
debían limitarse a temas tales como la percepción y la memoria, una opinión que rara vez se men
ciona. El método apropiado para las otras áreas de la psicología era el análisis y 1a interpretación
del significado, procedimientos que prescinden de los números (McLeod, 1996).
El conductismo se describe con frecuencia como la escuela de psicología históricamente más
dedicada a mantener este campo dentro de un ámbito estrictamente científico. El conductismo se
inició alrededor del año 1913, con el rechazo por el estudio de los estados interiores del individuo
debido a la imposibilidad de observarlos objetivamente. Pero el más ardiente portavoz del con
ductismo, B. F. Skinner, se oponía rotundamente a la estadística. Skinner llegó incluso a decir:
“Preferiría ver a un graduado en psicología asistir a un curso de físico-química que de estadística.
E incluiría (presumiblemente antes que la estadística) otras ciencias, incluso poesía, música y ar
te” (Evans, 1976, p. 93),
¿Por qué Skinner se oponía tan rotundamente a la estadística? Él sostenía que observar el com
portamiento es la mejor forma de comprenderlo, y se refería a la observación de casos individuales.
Hacía notar constantemente los datos que se perdían por promediar los resultados de varios casos.
Por ejemplo, Skinner (1956) mencionaba el ejemplo de tres ratones que comían en exceso: uno na
turalmente obeso, otro envenenado con oro y otro cuyo hipotálamo había sido alterado. Cada uno
presentaba una curva de aprendizaje diferente (patrón de velocidad de aprendizaje) en relación con
la destreza necesaria para presionar una barra y alcanzar el alimento; esto revelaba muchos aspec
tos acerca de los hábitos alimenticios ocasionados por cada una de las distintas enfermedades. Si se
hubieran sumado o unificado estadísticamente las curvas de aprendizaje, el resultado no hubiera re
presentado los hábitos alimenticios reales de ningún ratón real. Según el mismo Skinner, “estas tres
curvas Individuales contienen más información de la que podría haber sido generada por medidas
que requirieran un tratamiento estadístico; sin embargo, las mismas serán analizadas con descon
fianza por muchos psicólogos porque representan casos individuales”, (p. 232)
Diferente fue el pedido de precaución emitido por la psicología humanística, cuyos comien
zos datan de la década de 1950 como “tercera fuerza” en contraposición al conductismo y a la
principal alternativa del momento, el psicoanálisis freudiano. El tema central de la psicología hu
manística establecía que la conciencia humana debía ser estudiada íntegramente, como un todo,
exactamente como es experimentada por el individuo. No es posible explicar-totalmente la expe
riencia humana reduciéndola a números (así como tampoco es posible explicarla reduciéndola a
palabras). La experiencia de un individuo es compleja y única.
En el área de la psicología clínica y del estudio de la personalidad, a menudo se han levanta
do voces para argumentar que puede aprenderse mucho más sobre aquello que es realmente im
portante en psicología a partir del análisis profundo de una persona, que respecto de promedios
entre varias de ellas. Es decir, el método ideográfico contra el nomo té tico, para utilizar los térmi
nos que Gordon Allport tomó de Wiihelm Windelband (véase Hilgard, 1987). Y la base filosófica
del análisis profundo de los individuos puede encontrarse en la fenomenología, que nació en Eu
ropa después de la Primera Guerra Mundial (véase Husserl, 1970).
La fenomenología es una posición filosófica opuesta al positivismo lógico. El positivismo ló
gico sostiene que existe una realidad objetiva a ser conocida. Es la posición filosófica que susten
ta tradicionalmente los esfuerzos científicos. Se considera que la ciencia puede descubrir esa
realidad objetiva o verdadera dado que utiliza experimentos que cualquiera puede observar o re
petir para obtener los mismos resultados. Los fenomenólogos sostienen, sin embargo, que inclu
so estas reiteradas observaciones son en realidad hechos particulares realizados en forma
consciente. Uno no puede saber si lo que entiende por “verde” o “la rata presionó la barra siete ve
ces” es lo que cualquier otro entiende por esas mismas palabras. Según los fenomenólogos, no
existe una realidad objetiva de la cual todos podamos estar seguros.
En la actualidad, el principal desafío para la estadística proviene del fuerte renacimiento del
interés en los métodos “cualitativos” de investigación. Ha habido una creciente preocupación en
tre algunos psicólogos con respecto a que, luego de cien años de investigación estadística cuanti
tativa, la psicología ha producido lo que ellos consideran conocimientos de muy poca utilidad
social (Jessor, 1996). Esperan que, analizando cuidadosamente como un todo a unos pocos seres
humanos en su contexto se puedan obtener mejores resultados
Highlen y Finley (1996) describen cinco posibles posiciones filosóficas que acompañan la in
vestigación cualitativa. La primera adopta el positivismo lógico y busca una realidad objetiva a
través de métodos cualitativos. También existe el pospositivismo, que sostiene la existencia de
una realidad verdadera pero que nunca conoceremos completamente. No obstante, esforzándonos
podemos acercamos a ella. La visión dei constructivismo subraya la existencia de múltiples rea
lidades. Cada uno de nosotros construye un significado a partir de la experiencia, y la psicología
debería intentar comprender algunos de esos significados. La visión crítica también niega cual
quier realidad objetiva. Sostiene que toda ciencia sirve al propósito de alguien, y el propósito co
rrecto es la liberación de los más débiles a través de, por ejemplo, el feminismo o el neomarxis-
mo. Finalmente, la visión postestructural persigne el objetivo de desafiar toda realidad social
mente establecida, la cual es considerada el producto de quienquiera que detente el poder. Si el
alumno aún no ha considerado este tema, aconsejamos averiguar y leer al respecto para comenzar
a formar una opinión propia.
Cualquiera sea ia posición filosófica subyacente, los métodos cualitativos incluyen análisis
de casos, etnografía, fenomenología, interaccionismo simbólico, análisis de sistemas e “investi
gación de la acción1’ (Híghlen & Fíniey, 1996). Estos métodos se desarrollaron principalmente en
antropología, en donde el conducdsmo y el positivismo lógico nunca tuvieron la influencia que
lograron en la psicología. Los métodos cualitativos usualmente implican largas entrevistas u ob
servaciones de unos pocos individuos; mientras se realizan las entrevistas, el investigador alta
mente capacitado decide qué aspectos merecen ser recordados, registrados y analizados por
medio de otras preguntas y observaciones. Según esta postura, la mente del investigador es la he
rramienta principal, ya que sólo esa mente puede localizar las relaciones importantes entre las
muchas categorías de hechos que surgen de las palabras de quien responde.
Algunos psicólogos (p. ej., Kenney, 1995; McCracken, 1988) sostienen que los métodos
cuantitativos y cualitativos pueden y deben complementarse. Primero deberíamos descubrir las
categorías importantes a través de un enfoque cualitativo, y luego determinar su incidencia en una
población mayor a través de métodos cuantitativos. Este grupo de psicólogos sostiene que, con
frecuencia, los investigadores cuantitativos deciden apresuradamente cuáles son las categorías
importantes sin explorar primero la experiencia humana con respecto a ellas, a través de entrevis
tas de preguntas abiertas u observaciones.
También resultan de interés las opiniones muy originales del psiquiatra Cari Jung sobre lo
que él llamaba “el estado de ánimo estadístico”. Tal como lo expresara la analista jungiana Mane
Louise von Franz (1979), “tenemos un estado de ánimo estadístico cuando caminamos por una
calle y observamos los cientos de rostros inexpresivos y comenzamos a sentimos disminuidos”.
Nos sentimos simplemente uno más de la multitud, comunes. O bien, cuando estamos enamora
dos, sentimos que la otra persona es única y maravillosa; no obstante, cuando nuestro estado de
ánimo es estadístico, nos damos cuenta de que la otra persona es común, igual a muchas otras.
Von Franz señala, sin embargo, que si sucediera una catástrofe, cada persona respondería de
forma única. En la vida existe al menos tanta irregularidad como regularidad.
El hecho de que esta mesa no levite sino que permanezca donde está sólo se debe a que los miles y
miles y miles de millones de electrones que la forman tienden a comportarse de ese modo estadís
ticamente. Pero cada electrón por sí mismo podría comportarse de modo diferente, (p, rv-17)
Según Franz, el estado de ánimo estadístico es dañino para el amor y la vida. Para contrarres
tarlo, “se necesita un acto de lealtad para con nuestros propios sentimientos” (p. rv-18). Los senti
mientos “hacen que la vida, al igual que las relaciones y los actos parezcan únicos y les dan un
valor definido” (pp. iv-18-rv-19). En particular, sentir la importancia de nuestras acciones indivi
duales hace menos posibles las inmoralidades, como por ejemplo la guerra y el homicidio. No po
demos contar los muertos como si fueran números sino que debemos tratarlos como personas,
con emociones y objetivos, como nosotros mismos,.
Para resumir, podemos decir que siempre han existido buenas razones para limitar nuestro
pensamiento estadístico a su propio territorio, y dejar que nuestro corazón gobierne libremente
los otros.
LA MEDIA Y EL DESVÍO ESTÁNDAR
SEGÚN SE DESCRIBEN EN PUBLICACIONES CIENTÍFICAS
En ias publicaciones científicas normalmente se hace referencia a la media y al desvío estándar.
Aunque la varianza y las puntuaciones Z son extremadamente importantes como pasos de procedi
mientos avanzados que aprenderemos más adelante, rara vez son mencionadas en las publicaciones.
En algunas oportunidades, la media y el desvío estándar son incluidos en el texto de una pu
blicación. Por ejemplo, nuestra psicoterapeuta ficticia podría escribir: “La cantidad media de se
siones tomadas por los últimos 10 pacientes fue 6,0 (SD ~ 2,57).”
En ias tablas, frecuentemente se hace referencia a la media o al desvío estándar, en especial
cuando se involucran varios grupos o cuando los participantes en la investigación son analizados
en varias condiciones diferentes. Por ejemplo, Orbach y sus colegas (1997), en un estudio realiza
do en Israel, compararon un grupo de pacientes suicidas de un hospital para enfermos con proble
mas mentales (individuos que habían realizado intentos serios de suicidio), pacientes no suicidas
de un hospital para enfermos con problemas mentales con diagnosis similares, y un grupo de con
trol (voluntarios de la comunidad). El objetivo del estudio era probar la teoría de que los suicidas
tienen mayor tolerancia al dolor físico; que su más alto umbral de dolor hace que para ellos sea
más sencillo realizar los dolorosos actos que implica un suicidio. Los investigadores realizaron
jas pruebas de rutina para medir el umbral de dolor y otras sensaciones, y entregaron varios cues
tionarios a los tres grupos. La tabla 2-6, reproducción de la que aparece en su artículo, refleja la
media de cada grupo en todas las mediciones.
Tabla 2-6.
M edias y desvíos estándar de medidas de dolor, tendencias suicidas, disociación y medidas emocio
nales del grupo de estudio.
Nota: Altos índices de atracción hacia ia vida y repulsión a la muerte representan bajas tendencias suicidas; bajos índi
ces de repulsión a la muerte y atracción hacia la vida representan altas tendencias suicidas.
Fuente: Orbach, I. et al. (1997), tab. 1. “Umbral y tolerancia al dolor físico en adolescentes suicidas y no suicidas”. R e
vista C ien tífica de P sic o lo g ía d e A se so ra m ie n to y C lín ica {J o u rn a l o f C o n su ltin g a n d C lin ic a l P sych o lo g yj , 65,
6 4 6-652. Copyright, 1997, por la A sociación Americana de Psicología (American Psychological Association]. Reim
preso con autorización.
Como podemos observar en la tabla, coincídentemente con las predicciones de los investiga
dores, el grupo suicida presentaba un umbral más alto de dolor que los otros dos grupos y difería
de éstos también en varias otras medidas. (Cabe destacar especialmente la gran diferencia entre el
grupo suicida y los otros dos grupos en cuanto a la “desesperanza'’)- Por supuesto, tal como lo in
dican los desvíos estándar, hay mucha superposición entre los grupos con respecto a estas medi
ciones. Es decir, aunque teniendo en cuenta el promedio, el grupo suicida presenta un mayor
umbral de dolor; existen muchos pacientes suicidas con umbrales de dolor menores a los de los
otros grupos, y muchos individuos no suicidas con mayor umbral de dolor.
La tabla 2-7 (tomada de Norcross et al., 1996) presenta un ejemplo particularmente interesan
te. No muestra desvíos estándar pero sí medias y medianas. Por ejemplo, en 1992, la media de as
pirantes a doctorados de asesoramiento psicológico era 120,2, pero la mediana era sólo 110. Esto
sugiere que existían ciertos programas con una gran cantidad de aspirantes que tomaban asimétri
ca la distribución. De hecho, podemos ver en la tabla que en casi todos los casos, y tanto para so
licitudes como para inscripciones, las medias son usualmente mayores que las medianas. (Es
probable que resulte asombrosa la competitividad que presenta el ingreso a un doctorado en mu
chas de las áreas de la psicología. Según nuestra experiencia, uno de los factores con bastante in
fluencia en este aspecto, es haber tenido éxito en los cursos sobre estadística).
Tabla 2-7.
Estadística de solicitudes e inscripciones por área y año: Doctorados.
Solicitudes Inscripciones
N ” de programas M M dn M M dn
Programa 1973a 1979a 1992 1973a 1979a 1992 1973a 1979s 1992 1992 1992
Clínica 105 i 30 225 314.4 252,6 191,1 290 234 168 12,0 8
Cognitiva 47 24,6 22 2,6 2
Comunitaria 4 2 5 90,5 24,4 60 23 3,2 2
Asesoramiento 29 43 62 133,4 90,9 120,2 120 84 no 7,3 6
Desarrollo 56 72 97 54,1 38,9 27,6 41 30 24 2,8 2
Educacional 23 28 30 67,8 39,7 20,0 34 26. 12 6,0 4
Experimental y general 118 127 78 56,2 33,2 31,3 42 25 26 4,4 3
Salud 7 40.7 30 4,4 5
índustriai/organizacional 20 25 49 39,9 54,7 66,2 37 48 70 4,9 4
Personalidad 23 1S 10 42,5 24,7 12,3 33 17 6 1,0 1
Percepcion/psicofísica 15 8,3 6 1,4 1
Fisíología/biopsicología 40 43 76 33,2 29,3 20,0 29 24 20 3,9 2
Escolar 30 39 56 78,5 54,0 31,3 53 34 32 5,4 5
Social 58 72 59 46,7 30,9 47,1 40 24 37 3,3 3
Otras 47 37 273 61,6 74,1 26,6 27 25 15 3,3 2
Total 566 645 1,089 106,1 85,2 69,4 31 5,6 4
N ota: L os años académicos corresponden a las ediciones de postrado de psicología de 1975-1976,1981-1982, y 1994
respectivamente.
“Fuente: Stoup y Benjamín (1982).
Fuente: Norcross, J. C., Hanych, J. M-, &Terranova, R. D. (1996), tab. 7. Postgrado de Psicología: 1992-1993. P s ic ó lo
g o A m e ric a n o [A m erica n P s y ch o lo g ist), 51, 631-643. Copyright 1996, por la A sociación Americana de Psicología
[American Psychological Association]. Reimpreso con autorización.
Resumen
La media es un promedio común, es decir, la suma de las observaciones dividida por la cantidad
de ellas. Expresado en símbolos, M - I XIN.
Otras formas alternativas menos comunes de descripción de la tendencia central de una distri
bución son la moda (el valor más común) y la mediana (el valor del registro medio después de or
denar todas las observaciones de menor a mayor).
La variación de un grupo de observaciones puede ser descripta a través de la varíanza, es de
cir, el promedio de los desvíos cuadráticos de cada observación con respecto a la media. Expresa
do en símbolos; SD2 =Z(X - M)2/N. La suma de los desvíos cuadráticos también se simboliza
como SS. Por lo tanto SD2 = SS/N,
El desvío estándar es la raíz cuadrada de la varianza. Expresado en símbolos: SD = "VSD2.
Para explicarlo en forma más clara, es aproximadamente el promedio de las diferencias entre las
observaciones y la media.
Una puntuación Z indica a cuántos desvíos estándar por encima o por debajo de la media se
encuentra una puntuación bruta. Entre otras cosas, las puntuaciones Z sirven para comparar ob
servaciones de variables que tienen diferentes escalas.
Siempre ha habido psicólogos que advirtieron los riesgos que implica el uso de la metodolo
gía estadística, ya que en el proceso.de resumir los datos en un promedio se pierde información
sobre cada caso individual.
Las publicaciones científicas generalmente hacen referencia a la media y al desvío estándar,
tanto en el texto como en las tablas. En cambio, rara vez se refieren a la varianza y a las puntua
ciones Z.
Términos clave
- Tendencia central. - Moda. - Suma de cuadrados (SS).
- Fórmulas de cálculo. - N. - Varianza (SD2).
- Fórmulas de definición. - Puntuaciones brutas. - Puntuaciones Z.
- Desvío. - Desvío cuadrático. -Z.
- Media (M). - Desvío estándar (SD).
- Mediana. - Puntuaciones estándar.
Observemos que EX2 implica que se eleva al cuadrado cada observación y luego se suman esos
cuadrados. Por otro lado, (EX)2 implica que primero se suman todas las observaciones y luego se
eleva esa suma al cuadrado.
La fórmula de cálculo del desvío estándar es la raíz cuadrada de la fórmula de cálculo de la
varianza;
EX2 ~(XX)2/1V
SD =
N
La tabla 2-8 muestra el cálculo de la varianza y el desvío estándar de la información corres
pondiente a nuestro ejemplo sobre sesiones de terapia, utilizando la fórmula de cálculo. Compare
este cálculo con el que aparece en la tabla 2-2, que se basa en la misma información pero utiliza la
fórmula de definición.
Tabla 2.8.
Cálculo de la varianza y ei desvío estándar correspondiente al ejemplo sobre sesiones de terapia,
utilizando las fórmulas de cálculo.
2 :6 0 426
cho y para la altura respectivamente. Los diagramas de dispersión son cuadrados, con una rela
ción 1 a 1 para los ejes horizontales y verticales).
En la figura 3-1, el eje horizontal comienza con el valor 1 (el menor puntaje posible en la es
cala de intimidad, que es un promedio de varias preguntas contestadas cada una de ellas con refe
rencia a una escala del 1 al 9). El eje vertical comienza con 19, que es la menor puntuación
posible de la escala de idealización (esta escala incluye 19 ítems, clasificados del 1 al 9. El punta
je total de la escala es la suma de los 19 ítems). El valor más alto en el eje horizontal es 9,0, la má
xima puntuación posible en la escala de intimidad. El valor más alto en el eje vertical es 171, la
mayor puntuación posible en la escala de idealización.
3, Marcar un punto por el par de observaciones de cada persona. Ubicar el lugar en el eje ho
rizontal que corresponde al valor observado de la persona en la variable predictora, Luego mover
se hacía arriba hasta llegar a la altura en el eje vertical que corresponde al valor observado de la
misma persona con respecto a esa variable, y marcar un punto bien claro.
Si en un mismo lugar coinciden dos casos, se puede escribir el número 2 en ese lugar o mar
car un segundo punto lo más cerca posible del primero, si es posible tocándolo, pero dejando en
claro que en realidad hay 2 puntos en el mismo lugar.
Ejemplo
Supongamos que una empresa está pensando aumentar la cantidad de personal bajo el mando de
cada uno de sus gerentes de piso. Sin embargo, la empresa está preocupada por el estrés que ésto
podría provocar a sus gerentes. La empresa supone que cuantas más personas supervise un geren
te, mayor será el estrés sufrido por él. Para analizar la situación, un psicólogo laboral sugiere es
tudiar a cinco gerentes seleccionados al azar de entre todos los gerentes de piso de la empresa.
(En la práctica, debería utilizarse un grupo mucho mayor, pero aquí utilizaremos sólo cinco casos
para simplificar el ejemplo). Se entrega a cada uno de los cinco gerentes un cuestionario de medi
ción de estrés en el cual los posibles registros van de 0 (estrés nulo) a 10 (estrés extremo). Los re
sultados podrían ser como los que indica la tabla 3-1.
1. Dibujar los ejes y determinar qué variable representa cada uno de ellos. La empresa está in
teresada en el efecto causado en el nivel de estrés por la cantidad de empleados supervisados. Por
lo tanto, consideramos la cantidad de empleados supervisados como la variable predictora y ubi
camos esa información en el eje horizontal; el nivel de estrés es la variable dependiente y, por lo
tanto, debe ubicarse en el eje vertical. (Véase figura 3-2a).
2. Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
ejes. Para el eje horizontal, supongamos que en esta empresa no se permite a ningún gerente su
pervisar más de 12 empleados. Por lo tanto, el eje horizontal va de 0 a 12. Eíeje vertical va de 0 a
10, que son los límites del cuestionario de medición de estrés. (Véase figura 3-2b).
3. Marcar un punto por el par de observaciones de cada persona. En el caso del primer geren
te, la cantidad de empleados supervisados es ó. Localizamos el número ó en el eje horizontal.
Luego, subimos hasta alcanzar el nivel del número 7 en el eje vertical (el nivel de estrés del pri
mer gerente). Marcamos un punto en ese lugar (véase figura 3-2c). Seguimos el mismo procedi
miento con cada uno de ios cuatro gerentes restantes. El resultado debería ser el que muestra la
figura 3-2d.
PATRONES DE CORRELACIÓN
Hasta ahora hemos considerado aquellas situaciones en las que los valores altos coinciden con los
altos, los bajos con los bajos y los medianos con los medianos. A ese tipo de situación se la deno
mina correlación positiva. Debido a que el patrón que muestra el diagrama de dispersión se
aproxima a una línea recta, es también un ejemplo de correlación lineal.
Por ejemplo, en el diagrama de dispersión de la figura 3-1 se podría dibujar una recta que
muestre la tendencia general de los puntos, tal como lo hemos hecho en la figura 3-3. Del mismo
modo, se podría dibujar una recta en nuestro segundo ejemplo, como lo muestra la figura 3-4.
(Una de las razones por las que estos casos de correlaciones lineales se denominan “positivas” se
debe a que, en geometría, la pendiente de una recta es positiva cuando observarnos que la recta se
eleva a medida que desplazamos nuestra mirada desde la izquierda hacia la derecha del gráfico.
En el capítulo 4, aprenderemos reglas precisas para trazar tales rectas y determinar su pendiente).
T a b la 3 - 1 .
E m p l e a d o s s u p e r v i s a d o s y n iv e l d e e s t r é s ( d a t o s f i c t i c io s ) .
6 7
8 8
3 i
10 . $
8 6
, (^tidadde em|Meà^«ipêryi$«d<». .
F ig u r a 3 -2 , C ó m o hacer un diagram a de dispersión , (a) S e determ inan los e je s, la variable pred ictora (e m
p le a d o s su p erv isa d o s) se ub ica en e l e je horizontal y la variable d ep en d ien te (n iv el d e estrés) en. e l e je verti
cal. (b ) S e m arca la serie v a lo res so b re lo s ejes, (c ) S e m arca el pu nto determ inad o por e l par d e valores
o b serv a d o s co rresp o n d ien tes al prim er gerente, (d ) S e m arca un punto d on d e s e cruza p or cad a par d e v a lo
res o b serv a d o s d e lo s c in c o gerentes.
Correlaciones negativas
A veces, la relación entre las variables no es positiva. Por el contrario, los valores altos coinciden
con ios bajos y los bajos con los altos. A esto se denomina correlación negativa. Por ejemplo, en
un estudio de las relaciones amorosas entre estudiantes (Aron & Fraley, 1998), ios investigadores
descubrieron que cuanto más lejos de su pareja vive una persona (en función de los minutos de
viaje), menos cantidad de actividades comparte con su pareja. El diagrama de dispersión de la fi
gura 3-5 representa gráficamente este patrón de correlación.
Incluimos una recta en la figura para remarcar la tendencia general de los puntos; así, podemos
observar que a medida que la recta avanza hacia la derecha, también se dirige hacia abajo. Es de
cir. cuantas más son las horas de viaje, menos actividades se realizan en pareja.
F ig u r a 3 -3 . D iagram a d e d isp ersió n de la figura 3-1 c o n un a recta q u e in d ica la ten d en cia general. (F u e n te :
A ron & Fraley, 19 9 8 ).
Una investigación realizada por Bardsley y Rhodes (1996), dos psicólogos especializados en
organizaciones empresariales, ilustra también una correlación negativa. A través de un estudio
realizado con 174 obreros, descubrieron que el hecho de llegar tarde a trabajar tenía una corre
lación lineal negativa con la satisfacción laboral. Cuanto mayor era el grado de satisfacción la-
F ig u r a 3 -5 . D ia g ra m a de d isp ersió n c o n una recta q u e in d ic a la ten d en cia gen eral d e una correlación n e g a
tiva entre d o s variables: d ista n cia en m in u to s d e v ia je y cantid ad d e activid ad es d iferen tes q u e e l p artici
pante realiza co n su pareja. (F u e n te : A ron & F raley, 1 9 9 8 ).
boral de los obreros, menos frecuentemente llegaban tarde. En otras palabras, cuanto menor era
el nivel de satisfacción de los obreros, con más frecuencia llegaban tarde a trabajar.
Correlaciones curvilíneas
En algunos casos, la relación entre dos variables no sigue una línea recta positiva o negativa, sino
un patrón más complejo denominado correlación curvilínea. Por ejemplo, se sabe que hasta de
terminado nivel, una mayor ansiedad fisiológica hace que uno se desempeñe mejor en cualquier
tarea (como por ejemplo, una prueba de matemática). A partir de ese nivel, una mayor ansiedad
fisiológica hace que el rendimiento empeore. Es decir, desde estar casi dormido hasta un nivel
moderado de ansiedad, la efectividad aumenta. Al superar ese nivel moderado, el aumento de la
ansiedad puede “acelerar” demasiado a un individuo, impidiéndole tener un buen rendimiento.
Este patrón curvilíneo en particular está representado en la figura 3-6, en donde se observa que
sería imposible dibujar una línea recta para describirlo. La figura 3-7 muestra algunos otros ejem
plos de relaciones curvilíneas.
A través del método usual de cálculo de la correlación (método que aprenderemos en este ca
pítulo) obtenemos el grado de correlación lineal. Si el verdadero patrón de asociación es curvilí
neo, calcular la correlación con el método usual podría dar como resultado muy poca correlación
o una correlación nula. Por eso es muy importante observar los diagramas de dispersión para des
cubrir estas relaciones más interesantes, antes de realizar correlaciones automáticamente con el
método usual, suponiendo que la tínica relación posible sea una línea recta.
F ig u r a 3 -6 . E jem p lo d e relación
curvilínea: d e sem p e ñ a en una tarea
y ansiedad.
F ig u r a 3 -9 . D iagram a de
dispersión en e l que se en
contró un a le v e co rrela
c ió n lin e a l p o sitiv a entre
las d o s variab les.
CÁLCULO DE UN ÍNDICE DEL GRADO
DE CORRELACIÓN LINEAL:
COEFICIENTE DE CORRELACIÓN DE PEARSON
Al observar un diagrama de dispersión obtenemos un indicio aproximado del tipo y grado de rela
ción entre dos variables. Sin embargo, observar el gráfico no es un método muy preciso. Es nece
sario obtener un número que represente el grado exacto de correlación.
Grado de correlación
El grado de correlación indica en qué medida existe un patrón claro de alguna relación en par
ticular entre dos variables. Por ejemplo, vimos que existe una correlación lineal positiva cuan
do los valores altos coinciden con los valores altos, los medios con los medios y los bajos con
los bajos. Por lo tanto, el grado de una correlación de este tipo determina cuántos valores altos
coinciden con otros también altos, y así sucesivamente. Del mismo modo, el grado de correla
ción lineal negativa indica cuántos valores altos de una variable coinciden con valores bajos de
la otra, y así sucesivamente. En cuanto a los diagramas de dispersión, un alto grado de correla
ción lineal significa que todos los puntos se encuentran muy cerca de una línea recta (la recta
que se inclina hacia arriba o hacia abajo según la correlación lineal sea positiva o negativa).
Una correlación lineal perfecta es aquella en la que todos los puntos están ubicados exactamen
te sobre la línea recta.
El coeficiente de correlación
El promedio de los productos cruzados de puntuaciones Z es, entonces, un excelente modo
de calcular el grado de correlación lineal. Se lo denomina coeficiente de correlación. Tam
bién se lo llama coeficiente de correlación de Pearson (o, para ser muy tradicionales, coefi
ciente de correlación producto-m om ento de Pearson), Lleva el nombre de Karl Pearson (a
quien presentaremos en el cuadro Í4-1). Pearson, junto con Francis Galton (véase cuadro 3-1),
desempeñó un papel fundamental en el desarrollo del coeficiente de correlación. El coefi
ciente de correlación se representa con la letra r, que es la forma abreviada de regresión, un
concepto muy relacionado con la correlación (que veremos en el capítulo 4). También es im
portante saber que en algunas publicaciones científicas se hace referencia a los coeficientes
de correlación como correlaciones de orden cero (veremos las razones para este nombre en
el capítulo 17).
La figura 3-10 muestra diagramas de dispersión e indica el coeficiente de correlación de va
rios ejemplos.
F igura 3-10. D iagram as d e d isp ersió n y c o e fic ie n te s d e correlación d e d iversos e je m p lo s c o n d iferen tes gra
d o s d e co rrela ció n lin eal.
Figura 3-10. {continuación)
La exposición precedente puede resumirse en unos pocos símbolos, ia fórmala del coeficiente de
correlación:
r = ,ggx.gx, (3-1)
N
r es el coeficiente de correlación, Zx es la puntuación Z de cada persona en la variable X, Zy es la
puntuación Z de cada persona en la variable Y. ZxZy es igual al producto Zx por Zy (el producto
cruzado de puntuaciones 2 ) de cada persona, y 2 ZxZy es la suma de los productos cruzados de to
das las personas incluidas en el estudio. N es la cantidad de personas que participan en el estudio.
Uniendo todos los datos, 2ZxZy dividida por ÍV, es el promedio de los productos cruzados de pun
tuaciones 2 .
Ejemplo
Intentemos aplicar los pasos enumerados ai ejemplo del nivel de estrés de los gerentes.
1. Convertir todas las observaciones en puntuaciones Z. Comenzando con la cantidad de em
pleados supervisados, la media es 7 (la suma, que es igual a 35, dividida por 5 gerentes) y el des
vío estándar es 2,37 (la suma de los desvíos cuadráticos, 28, dividida por 5 gerentes, es igual a
una varianza de 5,6, cuya raíz cuadrada es 2,37). En el caso del primer gerente, entonces, un valor
observado de 6 es una unidad por debajo de la media 7, y 1 dividido 2,37 es 0,42. Por lo tanto, la
puntuación Z del primer gerente referido a la cantidad de empleados supervisados se ubica a 0,42
desvíos estándares por debajo de la media o, lo que es igual, presenta una puntuación Z de - 0,42.
Calculamos el resto de las puntuaciones Z del mismo modo y las ordenamos en las columnas co
rrespondientes de la tabla 3-2.
2 . Calcular el producto cruzado de las puntuaciones Z de cada persona. En el caso del primer
gerente, multiplicamos - 0,42 por 0,38: el resultado es -0,16. La ultima columna de la tabla 3-2
muestra los productos cruzados de iodos los gerentes.
3. Sumarlos productos cruzados de puntuaciones Z. Como lo indica la tabla 3-2, el total es 4,38.
4. Dividir el resultado del paso anterior por la cantidad de personas incluidas en el estudio, es
decir, 4,38 dividido 5 (la cantidad de gerentes incluidos en el estudio). El resultado es 0,876. Este
es el coeficiente de correlación que, redondeado, es igual a 0,88. Aplicando la fórmula del coefi
ciente de correlación,
5 2 ^ 4 3 8
N 5
Dado que el coeficiente de correlación calculado es positivo y cercano a 1, es decir, el mayor va
lor posible, podemos afirmar que estamos frente a una correlación lineal fuertemente positiva.
T a b la 3 - 2 .
C á lc u lo d e l c o e fic ie n te d e c o r r e la c ió n p a r a e l e je m p lo d e l n iv e l d e e s t r é s d e lo s g e r e n te s
( d a t o s fic tic io s ).
X X -M (X - M f zx Y Y -M ¡T -M )2 Zy ZxZy
6 -1 1 - 0 ,4 2 7 1 1 0,38 - 0 ,1 6
I--.V-M.; 0 ,4 2 A : 8 l ; . r .-2 ( S o I B M •0 ,3 2 ' ;
3 -4 16 -1 ,6 9 1 -5 25 - 1 ,9 2 3 ,2 4
.10 ;V; "3' ■' 1,27 .8 " : '2- .. - 4 7 r i ; ó
8 1 1 0 ,4 2 6 0 0 0 ,0 0 0 ,0 0
a 35 SS = 28 2 = 30 SS - 3 4 2 Z x Z r = 4 ,3 8
=7 SD3 = 5 ,6 0 M = 6 S D * = 6 ,8 0 r - 0,88
SD * 2 ,3 7 SD = 2,61
Combinando los distintos procedimientos tratados en este capítulo, los pasos a seguir son los siguientes:
1. Construir un diagrama de dispersión.
a ) D ib u ja r l o s e j e s y d e te r m in a r q u é v a r ia b le v a e n c a d a u n o d e e llo s .
b) Determinar ia serie de valores que se van a utilizar para cada variable y marcarla en
los ejes.
c) Marcar un punto por el par de observaciones de cada persona.
2. Determinar si el patrón es claramente curvilíneo. Si lo es, no se calcula el coeficiente de co
rrelación (o si se lo calcula, debe tenerse en cuenta que sólo se está describiendo el grado
de relación lineal).
3. Estimar la dirección y el grado de correlación lineal.
4. Calcular el coeficiente de correlación.
a) Convertir todas las observaciones en puntuaciones Z.
c) Calcular el producto cruzado de las puntuaciones Z de cada persona.
d) Sumar los productos cruzados de puntuaciones Z.
e) Dividir el resultado por la cantidad de personas incluidas en el estudio.
5. Controlar el signo y el tamaño del coeficiente de correlación calculado, comparándolo con
la estimación visual realizada a partir del diagrama de dispersión.
Ejemplo
Supongamos que una persona que investiga el funcionamiento de la memoria realiza un experi
mento para comprobar la teoría de que la cantidad de exposiciones a una palabra aumenta las pro
babilidades de que sea recordada. Dos individuos son elegidos al azar para observar una lista de
10 palabras una sola vez, otros dos individuos observan la lista dos veces, y así sucesivamente,
hasta llegar a ocho exposiciones de cada palabra, y 16 participantes en total. La tabla 3-3 indica
los resultados de este experimento ficticio. (Un estudio real de este tipo probablemente daría un
resultado más curvilíneo debido a que, en esta clase de investigaciones, cuanto mayor sea la can
tidad de exposiciones, menor será el aumento relativo de palabras recordadas).
1. Construir un diagrama de dispersión.
a) Trazar los ejes y determinar qué variable deberá marcarse en cada uno de ellos. Según el
diseño del experimento, la cantidad de exposiciones es la variable independiente, por lo
que estará ubicada en el eje horizontal. La cantidad de palabras recordadas es la variable
dependiente, por lo que estará ubicada en el eje vertical (véase figura 3-1 la).
b) Determinar la serie de valores que se van a utilizar para cada variable, y luego marcarla
en los ejes. En el estudio que estamos analizando, la-cantidad de exposiciones varía de 1
a 8, pero comenzaremos con 0 para cumplir con las reglas convencionales. La cantidad
de palabras recordadas no puede ser menor que 0 ni mayor que 10, cantidad total de pa
labras en la lista (véase figura 3-1 Ib).
T a b la 3 - 3 .
Efecto del número de exposiciones en la cantidad de palabras recordadas.
c) Marcar los puntos determinados por el par de observaciones de cada persona. El primer
punto se ubica con coordenada 1 según el eje horizontal, y 4 según el eje vertical. Mar
cando cada uno de los punios, de este mismo modo, completamos el diagrama de disper
sión (véase figura 3- i 1c).
2. Determinar sí el diagrama es claramente curvilíneo. Parece existir una fuerte tendencia lineal.
3. Estimar la dirección y el grado de correlación lineal. Los puntos van hacia arriba y hacia la
derecha, y la mayoría de ellos están ubicados muy cerca de una línea recta imaginaria. Por
lo tanto, aparentemente se trata de una correlación lineal positiva bastante fuerte.
4. Calcular el coeficiente de correlación.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de exposi
ciones es 4,50, con un desvío estándar de 2,29. Por lo tanto, la primera observación, que
es igual a I, se ubica 3,5 unidades por debajo de la media, lo que implica 1,53 desvíos
estándares debajo de la media, o sea Z = -1,53. Utilizando el mismo procedimiento para
todas las otras observaciones se obtienen las puntuaciones Z que aparecen en las colum
nas correspondientes de la tabla 3-4. (La tabla no indica los pasos para el cómputo del
desvío y del desvío cuadrático utilizados para calcular el desvío estándar).
b) Calcular el producto cruzado de las puntuaciones Z de cada persona. Por ejemplo, el pri
mer producto cruzado es -1,53 por -0,74, lo que da un resultado de +1,13. Todos los
productos cruzados aparecen en la columna ubicada a la derecha en la tabla 3-4.
c) Sumar los productos cruzados de las puntuaciones Z. El total es 10,80.
d) Dividir el resultado por la cantidad de personas. El resultado de dividir la suma de los
productos cruzados de puntuaciones Z, 10,80, por la cantidad de personas, 16, es 0,68,
que es el coeficiente de correlación. Es decir, r = 0,68.
5. Controlar el signo y el tamaño del coeficiente de correlación calculado comparándolo con
, la estimación realizada a partir del diagrama de dispersión. El resultado calculado de +0,68
es, como esperábamos, una correlación lineal positiva bastante marcada.
C orreteeíoa 87
10 '
9
8
7
6
■5
■*•.
.3
2
■i-
. - ..... ......................................... ; :
8'
S B illílíi!
■ r
i. -■ •-•• : 4
. " v.‘ . •. .'^.•■:■:■■'■i ' .-Viváívii
'0 1 2 -3 4‘-„5 6 7 8
. ‘ :
•. •• Exposiciones. \ \r
" (c) ■■y-?•'•• -S
"vi;"
Figura 3-11. Pasos que se deben seguir para confeccionar un diagrama de dispersión según ios datos de la
tabla 3-3. (a) Establecer los ejes, la variable independiente (cantidad de exposiciones) en el eje horizontal,
la variable dependiente (cantidad de palabras recordadas) en el eje vertical; (b) determinar la serie de valo
res, y marcarlos en los ejes; (c) ubicar un punto por cada par de observaciones de cada uno de los 16 parti
cipantes (datos ficticios).
Otro Ejemplo
Supongamos que una psicóloga educacional averiguó la cantidad promedio de alumnos por clase
y los promedios de calificaciones en las pruebas de nivel de cinco escuelas primarias de determi
nado distrito escolar. La tabla 3-5 muestra los datos. La pregunta formulada por la psicóloga es:
¿Cuál es la relación entre estas dos variables?
1. Construir un diagrama de dispersión.
a) Dibujar los ejes y determinar en cuál se ubica cada variable. Dado que resulta razonable
pensar que la cantidad de alumnos por clase afecta las calificaciones en las pruebas de
nivel, y no al revés, podemos trazar en la parte inferior el eje correspondiente a la canti
dad de alumnos por clase.
Tabla 3-4.
Cálculo d d coeficiente de correlación del efecto producido por el número de exposiciones en la
cantidad de palabras recordadas (datos ficticios).
X Zx Y Zy 2xZ y
1 Ì -1 ,5 3 4 - 0 ,7 4 1,13
2 : 1 -1 ,5 3 3. -1 ,2 1 1,85
3 2 - 2 ,0 9 3 -1 ,2 1 1,32
4 2 -1 ,0 9 .5 - 0 ,2 6 0 ,2 8
5 3 -0 ,6 5 6 0,21 -0 ,1 4
Ó 3 - 0 ,6 5 4 - 0 ,7 4 0,48
7 4 - 0 ,2 2 4 - 0 ,7 4 0 ,1 6
— 8 •; ; 4 ' - 0 ,2 2 ... • 6 ■ 0,21 -0 ,0 5
9 5 0 ,2 2 5 -0 ,2 6 - 0 ,0 6
■ 10 V : 5 r ., 0 ,2 2 .. .. 7 --, 0,68 - '■ 0,15 .■..■-■V:
11 6 0,65 2 —1,68 - 1 ,0 9
-, 12 0,65 . v V - L , 9 ■ 1,62 ^ i ,ü5
13 7 1,09 Ö 0,21 0,23
. V 14 ■ ■ 7 •' 1,09 V - i,i5 ■
. .;..c -L ■ 1,25
15 8 1,53' 9 1,62 2,48
■ 16 . .8 1,53 . '.v, . v . 8;. 1,15 ■ 1,76
£: 72 89 10,80
M: 4,5 0 5.56 r = 0,68
S D ~ i % m 6 = 2,29 ^ 7 2 /1 6 2,12
Determinar la serie de valores que se van a utilizar para cada variable y marcarla en los
b)
ejes. Presumiremos que las calificaciones en las pruebas de nivel van de 0 a 100. La can
tidad de alumnos por clase debe ser por lo menos de 1 (y seguramente la política de la
junta escolar exige que sean más). No conocíamos el máximo, así que supusimos que
podía ser 50.
c) Marcar un punto por cada par de observaciones obtenidas de las personas (en este caso,
de las escuelas). La figura 3-12 muestra el diagrama de dispersión completo.
2. Determinar si el diagrama muestra claramente una correlación curvilínea. En términos ge
nerales, la correlación parece mantener un patrón lineal (aunque con tan pocos puntos es
difícil de decir).
Tabla 3-5.
Promedios de cantidad de alumnos por clase y de calificaciones en las pruebas de nivel en cinco
escuelas primarias (datos ficticios).
M ain Street 25 80
Casat 14 98
Haría ad 33 50
Shady Grove 28 82
Jefferson 20 90
Figura 3-12. Último paso en la confección de un dia
grama de dispersión con la información contenida en
la tabla 3-5: se ha dibujado un punto por cada par de
observaciones de las cinco escuelas (datos ficticios),
^ :'15 SS;--4$43|5ap
3. Estimar la dirección y el grado de correlación lineal. Los pumos tienen una dirección mar
cada hacía abajo y hacia la derecha, indicando una fuerte correlación lineal negativa.
4. Calcular el coeficiente de correlación.
a) Convertir todas las observaciones en puntuaciones Z. La media de la cantidad de alum- ■
nos por cíase es 24 y el desvío estándar es 6,54. La puntuación Z de la cantidad de alum
nos de la primera ciase, 25, es igual a (25 - 24)/6,54 - 0,15. Todas las puntuaciones Z
aparecen en la columna correspondiente de la tabla 3-6.
b) Calcular los productos cruzados de las puntuaciones Z de cada persona (en este caso,
de cada escuela). El primer producto cruzado es 0,15 x 0, que es igual a 0. El segundo
es -1,53 x 1,10, que es igual a -1,68. Todos los productos cruzados de las puntuaciones
Z aparecen en ía columna de la derecha de la tabla 3-6.
c) Sumar los productos cruzados de las puntuaciones Z. El total es -4,52.
d) Dividir el total por la cantidad de personas (en este caso, escuelas). La suma (-4,52) divi
dida por 5 es igual a -0,90. Es decir, r - -0,90.
5. Controlar el signo y el tamaño deí coeficiente de correlación calculado, comparándolo con
la estimación realizada a partir del diagrama de dispersión. Un coeficiente de 4),90 con
cuerda perfectamente con la estimación original que indicaba una fuerte correlación lineal
negativa.
Tabla 3-6.
Cálculo del coeficiente de correlación entre las cantidades promedio de alum nos por cíase y de
calificaciones en ias pruebas de rendimiento en cinco escuelas prim arias (datos ficticios).
E s c u e la T a m a ñ o d e la d a s e C a lific a c ió n e n la p r u e b a p r o d u cto C ru za d o
d e r e n d im ie n to
X Zx Y Zy Z*Zr
M ain Street 25 0,15 80 0,00 0 ,0 0
Casat 14 4 ,5 3 98 u o “ 1,68
Harland 33 1,38 50 -1 ,8 4 “ 2,53
Shady Grove 28 0,61 82 0,12 0,08
Jefferson 20 -0 ,6 1 90 - 0,61 “ 0,38
2: 120 400 - 4 0 ,5 2
M: 24 80 r = - 0 ,9 0
S D - ^Í2Í4/5 = 6,5 4 T l 328/5 - 16,30
PRUEBA DE LA SIGNIFICACIÓN ESTADÍSTICA
DEL COEFICIENTE DE CORRELACIÓN
Por sí mismo, el coeficiente de correlación es un estadístico descriptivo. Describe el grado y la di
rección de la correlación lineal de determinado grupo de personas analizadas. Sin embargo, cuan
do realizamos una investigación en el campo de la psicología, por lo general estamos más
interesados en una serie de observaciones en cuanto representan a una población mayor que no se
ha analizado directamente. Por ejemplo, el psicólogo laboral entregó los cuestionarios sobre es
trés sólo a cinco gerentes de la empresa, pero con la intención de considerarlos típicos represen
tantes de los otros gerentes de esa misma empresa. (En la práctica se necesitaría un grupo con
muchas más de cinco personas para lograr ese objetivo. Hemos utilizado cantidades pequeñas de
personas en nuestros ejemplos para que sean más fáciles de comprender).
El problema, sin embargo, es que analizando sólo algunas de las personas es posible elegir
por casualidad aquellas en las cuales los valores altos coinciden con los altos y los bajos con los
bajos, aun cuando, habiendo estudiado a todas las personas, no hubiera existido correlación algu
na. Decimos que una correlación es significativa si no resulta verosímil que hubiésemos podido
obtener una correlación de esa magnitud y si, en realidad, en el grupo completo no hubiera corre
lación alguna. Específicamente, determinamos si esa verosimilitud es menor que algún bajo gra
do de probabilidad (p), como un 5% ó un 1%. Si esa verosimilitud es tan baja, decimos que la
correlación es “estadísticamente significativa” con “p < 0,05” ó llp < 0 ,01.“
El método y la lógica para determinar la significación estadística es el tema central de es
te libro a partir del capítulo 5. Estañamos adelantando temas si intentáramos explicarlos ahora.
De todos modos, para cuando hayamos completado los capítulos siguientes, la lógica y los de
talles quedarán bien claros. (El apéndice II de este capítulo contiene la información necesaria
para aplicar estos conocimientos a la correlación, pero en realidad no será muy útil hasta des
pués de haber completado el capítulo 9). Sólo mencionamos el tema aquí para dar una idea ge
neral de lo que significa, en caso de que al leer alguna publicación científica que informe sobre
coeficientes de correlación se haga referencia a la significación estadística “p < 0,05,” o a algu
na frase similar.
1J-' 4 4 Cuadro 3 -2 .
e m u u u , U U 9 U 1 y a . ; x nu a i i u u : i e > i a i H u a t u m u i c L d i i i c m c s t
Causalidad y correlación
Si dos variables presentan una correlación lineal significativa, normalmente suponemos que exis
te algo que las correlaciona. Sin embargo, la dirección de causalidad (justamente, qué es la cau
sa de qué) no puede determinarse solamente a partir de la correlación. En toda correlación entre
dos variables X e Y, existen tres posibles direcciones de causalidad: X podría ser la causa de Y, Y la
de L, o algún tercer factor podría ser la causa de ambas, X e Y. También es posible (y a menudo
probable) que exista más de una dirección de causalidad.
Tomemos el ejemplo del estrés de los gerentes. El estudio comenzó con la noción implícita de
que supervisar un mayor número de personas (X) causa un aumento del nivel de estrés (Y). El re
sultado del estudio fue una marcada correlación positiva entre X e Y, que ciertamente coincide
con la idea de que X es la causa de Y. Sin embargo, también coincide de la misma forma con la
idea de que Y es la causa de X . (Tal vez los gerentes que parecen sufrir de estrés sean considerados
muy trabajadores y ese sea el motivo por el cual sus superiores asignen mayor cantidad de perso
nas a su cargo). También es posible que la correlación sea el resultado de algún tercer factor que
cause que X e Y se desarrollen de manera conjunta. Por ejemplo, algunos sectores de la fábrica
podrían necesitar más personal y también generar más estrés. Es decir, determinado sector de la
fábrica causa estrés y requiere de muchos empleados para supervisar.
Existe bastante confusión acerca de este asunto de la correlación y la causalidad. El tema
se complica al existir dos usos de la palabra correlación. Algunas veces se utiliza para descri
bir un procedimiento estadístico (como lo hemos hecho en este capítulo), y otras veces se utili
za para describir un tipo de diseño de investigación en el que se miden dos variables en un
grupo de personas, sin realizar una asignación aleatoria de sujetos a determinados valores de
una de las variables (véase el apéndice A). Comúnmente, los diseños de investigación correla
ciónales son analizados estadísticamente utilizando el coeficiente de correlación, y los diseños
de investigación experimentales se analizan utilizando procedimientos que veremos en los ca
pítulos 9 al 13.
Sin embargo, existen excepciones. En este mismo capítulo utilizamos un ejemplo en el que
los participantes eran asignados al azar en determinada cantidad de exposiciones y luego se me
día la cantidad de palabras recordadas. A partir de los datos obtenidos, calculamos un coeficiente
de correlación. No obstante, en el estudio no se utilizó un diseño de investigación correlaciona];
fue un verdadero experimento, ya que los participantes eran asignados al azar a diferentes valores
de la variable independiente. Por sí mismo, el coeficiente de correlación que calculamos no nos
indicó nada acerca de la causalidad. Aun así, quedó claro, por el diseño de investigación, que la
única dirección causal posible es que la cantidad de exposiciones haya causado la diferencia en la
cantidad recordada.
Figura 3-13. E jem p lo d e restricción d el ra n g o com parand o d os d iagram as d e d isp ersión : (a) c u an d o s e
m uestra la serie d e va lo res c o m p le ta (grado e sc o la r y c o n o c im ie n to s sob re g eo g ra fía ) y (b ) cu a n d o se
restringe la s er ie d e v a lo res (a lo s prim eros tres grados).
los que se enseña poca geografía). El diagrama de dispersión (véase figura 3-13b) reflejaría muy
poca, o casi ninguna correlación (la correlación calculada sería cercana a 0) y, sin embargo, el in
vestigador estaría incurriendo en error si llegara a la conclusión de que el grado no está relaciona
do con los conocimientos sobre geografía en ninguno de los grados escolares.
El problema en este caso es que la-correlación.está basada en una serie de observaciones que
incluyen sólo un rango limitado de los valores posibles de una de las variables. (En este ejemplo
existe un rango limitado de grados escolares). Es erróneo pensar en la correlación como si se apli
cara a todo el rango de valores que podría tener la variable. Esta situación se denomina restric
ción del rango.
Es fácil cometer estos errores al interpretar correlaciones, las cuales incluso aparecen oca
sionalmente en publicaciones científicas y se oyen con frecuencia aún mayor en discusiones in
formales sobre resultados de investigaciones. Por ejemplo, en el área de los negocios, a veces se
intenta determinar si las pruebas de aptitud laboral reflejan lo exitosas que resultan ser en sus
funciones las personas contratadas. Por lo general, la relación es baja, porque no se tiene en
cuenta que se contratan sólo a las personas que tuvieron buenos resultados en las pruebas. Los
estudios que miden ei éxito en el empleo incluyen sólo eí subgrupo que presenta los registros al
tos. La figura 3-14 gráfica este ejemplo.
:.;;vgS;y:y:; y ,y 5 0 ; :r y m:
‘ ■ Puntuación en ia prueba .' Puntuación en la prueba •'
T a b ie a 3 -7 .
T a b la p r e s e n ta d a a 3 0 p s ic ó lo g o s p a r a e s tim a r r.
X Y
Î 1
2 10 f
3 2
4 9 «£
5 5
6 4 jU
7 6 Áv
8 3
9 11
10 8
11 7
12
12 4
Fuente: Oakes (1982).
opina el lector? La intuición de los investigadores británicos (que como grupo están, al menos,
tan bien capacitados en estadística como los psicólogos de cualquier lugar del mundo) indicaba
desde -0,20 a +0,60, con una media de 0,24. Si el lector lo desea puede calcular la verdadera co
rrelación. ¡Es de 0,50! Es decir, que en forma abstracta los psicólogos dan a una correlación de
0,50 un grado mucho más alto de correlación del que le otorgan cuando observan los datos reales
(datos que, aun con una r - 0,50, sólo se veían como de 0,24).
Oakes dio a otro grupo de treinta investigadores sólo la columna de X, y les pidió que comple
taran la columna de Y con números tales que reflejaran una correlación de 0,50 (nuevamente, só
lo utilizando su intuición y sin realizar ningún cálculo). Cuando Oakes calculó las correlaciones
i que representaban ios números indicados por los investigadores, el promedio resultó ser de
* Para calcular la correlación entre tener un ataque cardíaco y tomar aspirinas, tendríamos que convertir las dos varia
bles en números. Por ejemplo, podríamos representar el hecho de tener un ataque cardíaco con l , y no tenerlo con 0; de
forma similar, podríamos considerar que estar en el grupo que consume aspirinas es igual a 1, y estar en ei grupo place
bo ¡guai a 0. N o tiene importancia cuál de los dos números utilicemos para cada uno de los dos valores de cada variable.
Cualesquiera sean los dos números utilizados, ei resultado será el mismo después de convertirlos en puntuaciones Z. La
única diferencia que puede surgir en relación con ios números utilizados es que, según a q u é valor se aplique el número
mayor, esto determinará que la correlación sea positiva o negativa.
T a b la 3 -8 .
E fe c to s d e la a s p ir in a en lo s a ta q u e s c a r d ía c o s .
C o n d ició n A u se n c ia de im P r e se n c ia de im
im no fa ta l im fatal
Aspirina 99 5
Placebo 171 18
N ota: ím = infarto de miocardio. Fuente: Com isión Directiva del Grupo M édico de investigación Sobre Estudios
Sanitarios [Steering Committee o f the Physicians Health Study Research Group] (1988).
Tabla 3-9.
Correlaciones de Pearson entre las costumbres alimenticias de hombres y de mujeres.
S u b -e sc a la 1 2 3 4 5
M ujeres (n = 9 ,182)
1, Evitar las grasas — 0 ,42* 0,16* 0,14* 0,11*
2, Consum ir fibras — 0,15* 0,12* 0,09*
3. C om er fru tas diariamente — 0,05* 0.00
4. Limitar las carnes roj as -- 0,12*
5. Limitar la sai
H om bres (« = 7 .3 0 4 )
1. Evitar las grasas — 0,41* 0,13* 0,12* 0,10*
2. C om er fibras — 0,13* 0,11* 0,08*
3. C om er frutas diariamente — 0,02* 0,01*
4. Limitar las carnes rojas — 0,07*
5, Limitar la sal _
*p< 0,001.
Fuente: Wardie, J„ et ai. (1997), tab, 2. “Prácticas alimenticias saludables de alumnos europeos. " P sico lo g ía sa n ita r ia ” ,
16, 443-450, Copyright, 1997, por la Asociación Americana de Psicología (American Psychological Association].
Reimpreso con autorización.
RESUMEN
Un diagrama de dispersión muestra la relación entre dos variables. En ei eje horizontal se ubican
los valores de ia variable independiente o predictora, ordenados de menor a mayor. En el eje ver
tical se ubican los valores de la variable dependiente, ordenados de menor a mayor. Cada par de
valores correspondientes a un individuo se marca con un punto.
Cuando en términos generales los puntos del diagrama de dispersión siguen una línea recta,
hablamos de una correlación lineal. En una correlación lineal positiva, la recta va hacia arriba y
hacia la derecha (es decir, los valores bajos coinciden con los bajos y los altos con los altos). En
una correlación lineal negativa, la recta va hacia abajo y hacia la derecha (es decir, los valores ba
jos coinciden con los altos y los altos con los bajos). En una correlación curvilínea, los puntos si
guen un patrón distinto de una simple línea recta. Existe correlación nula cuando los puntos no
siguen ningún tipo de patrón sistemático.
El coeficiente de correlación (r) indica el grado de correlación lineal. Es el promedio de los
productos cruzados de puntuaciones Z Cuando existe una fuerte correlación lineal positiva, el
coeficiente de correlación es altamente positivo debido a que las puntuaciones Z positivas se mul
tiplican por positivas y las puntuaciones Z negativas por negativas. Cuando existe una fuerte co
rrelación lineal negativa, el coeficiente de correlación es altamente negativo debido a que las
puntuaciones Z positivas se multiplican por negativas y las puntuaciones Z negativas por positi
vas. Cuando no existe correlación lineal, el coeficiente de correlación es 0, debido a que las pun
tuaciones Z positivas son multiplicadas a veces por puntuaciones Z positivas, y otras por
puntuaciones Z negativas, mientras que las puntuaciones Z negativas son multiplicadas a veces
por puntuaciones Z negativas, y otras por puntuaciones Z positivas. Por lo tanto, los productos
cruzados positivos y negativos se cancelan entre sí.
El máximo valor positivo posible d e r e s + l , r = +l , y ocurre cuando existe una correlación li
neal positiva perfecta. El máximo valor negativo posible de r es -1, r = -1, y ocurre cuando existe
una correlación lineal negativa perfecta.
Una correlación generalmente está basada en valores observados de determinado grupo que
pretende representar a un grupo más amplio. Cuando ios resultados de los procedimientos esta
dísticos (que aprenderemos más adelante) no son coherentes con la idea de que la correlación en
ese grupo más amplio es 0 , decimos que la correlación es estadísticamente significativa.
Las comparaciones del grado de correlación lineal se consideran más precisas si se realizan
con el cuadrado del coeficiente de correlación (r1), llamado reducción proporcional del error.
La correlación no muestra la dirección de causalidad. Si dos variables, X e y, están correla
cionadas, esto podría ser porque X está causando Y, Y está causando X, o un tercer factor está cau
sando X e Y.
Un coeficiente de correlación puede representar la verdadera correlación por debajo de su ni
vel verdadero si se basa en las observaciones de un grupo de estudio cuyo rango de valores es res
tringido, o cuyos valores se basan en medidas poco confiables.
Muchos psicólogos sostienen que el coeficiente de correlación es una sobrestimación de la
importancia de la asociación entre dos variables. En efecto, los estudios realizados sugieren que
los psicólogos tienden a considerar cualquier coeficiente de correlación en particular como repre
sentante de un mayor grado de asociación del que realmente existe. Sin embargo, las pequeñas
correlaciones pueden tener importancia práctica (que puede ser demostrada a través del tamaño
del efecto a una exposición dicotómica, el cual describe la relación entre dos variables con dos
valores cada una, y examinando la tabla 2 x 2 resultante). Las pequeñas correlaciones también
pueden ser muy efectivas para demostrar ia importancia de una relación cuando un estudio de
muestra que la correlación se mantiene aun bajo lo que parecerían condiciones poco probables.
Las publicaciones científicas generalmente presentan resultados correlaciónales tanto en sus
textos, con el valor r (y algunas veces con el nivel de significación), como en tablas especiales
(matrices de correlación) que ilustran las correlaciones entre diversas variables.
Términos clave
- Corrección por atenuación. - Variable dependiente. - Correlación positiva.
- Correlación. - Dirección de causalidad. - Variable predictora.
- Coeficiente de correlación (r). - Variable independiente. - Reducción proporcional
- Matriz de correlación. - Correlación lineal. del error (r2).
- Producto cruzado de puntuaciones Z. - Correlación negativa. - Restricción de rango.
- Correlación curvilínea. - Correlación nula. - Diagrama de dispersión.
- Grado de correlación. - Correlación perfecta. - Significación estadística.
SERIE 1
Realice las siguientes tareas para los ejer 2, Un instructor preguntó a cinco alumnos
cicios 1 y 2; a) Confeccione un diagrama de cuántas horas habían estudiado para un exa
dispersión con las puntuaciones originales; b) men. A continuación se detalla la cantidad de
describa con palabras el patrón general de co horas de estudio y sus calificaciones.
de depresión de las mujeres en la primera y
H o r a s d e estu d io C a lifica ció n en la p ru eb a
en la segunda entrevista.
0 52 Explique los resultados de las medidas co
10 95
mo si estuviera escribiendo para una persona
ó 83
8 71
que nunca ha asistido a un curso de estadística.
6 64 Específicamente, a) explique qué significa un
coeficiente de correlación, utilizando una de
3, En un estudio realizado a personas que
las correlaciones como ejemplo; b) analice la
recién se conocían, se midió el nivel de extra tabla y Juego comente los patrones de los re
versión de uno de los integrantes de la pareja y sultados, indicando las variables que presentan
el aprecio del otro integrante de la pareja por el una correlación relativamente fuerte y las que
primero. Estos son los resultados: no, y c) comente las limitaciones que deben te
nerse en cuenta al sacar conclusiones sobre
E x tr a v er sió n d e u n o A p recio p o r causalidad sobre la base de esta información,
de los in teg r a n tes ese in teg ra n te utilizando como ejemplo una correlación espe
P u n tu a c ió n P u n tu a c ió n P u n tu a c ió n P u n tu a c ió n cífica (nombre al menos una dirección de cau
o r ig in a l Z o r ig in a l Z salidad alternativa posible y explique por qué
18 0,37 8 1,10 esa alternativa es posible).
17 0,17 9 1,47 5. Para cada una de las siguientes situacio
20 0 ,8 0 6 0,37 nes, indique por qué el coeficiente de correla
8 - 1 ,7 2 1 -1 ,4 7
13 - 0 ,6 7 7 0 ,74
ción podría ser una estimación distorsionada
24 1,63 1 -1 ,4 7 de la correlación real (y qué clase de distorsión
11 - 1 ,0 9 3 -0 ,7 4 esperaría):
12 -0 ,8 8 5 0 ,0 0 a) Puntuaciones en dos cuestionarios de
18 0,38 7 0 ,74 medición de personalidad están correlacionados.
21 1,00 3 -0 ,7 4
b) La calidad de vida y la felicidad de un
En este ejercicio damos las puntuaciones Z pa grupo de millonarios están correlacionadas.
ra ahorrar tiempo de cálculo, a) Construya un 6 . La siguiente información ha sido pre
diagrama de dispersión de las puntuaciones parada de forma tal que las series de datos B
originales; b) describa con palabras el patrón hasta D sean versiones levemente modificadas
de la serie A. Confeccione diagramas de dis
general de la asociación, si existe, y c) calcule
persión y calcule los coeficientes de correla
el coeficiente de correlación.
ción de cada serie de datos (sólo damos la
4. Chapman, Hobfoll y Ritter (1997) en
solución de las seríes A y B).
trevistaron dos veces durante el embarazo a
68 mujeres de una zona céntrica y superpo
S e r ie A S e r ie B S e r ie C S e r ie D
blada de una ciudad y a sus maridos (o no
vios); la primera vez, entre el tercer y sexto X Y X Y X Y X Y
mes de embarazo, y la siguiente vez, entre el i 1 1 l 1 5 1 1
sexto y el noveno mes de embarazo. La tabla 2 2 2 2 2 2 2 4
3 3 3 3 3 3 3 3
3-10 muestra las correlaciones entre varias de
4 4 4 5 4 4 4 2
las medidas. Lo más importante en esta tabla
5 5 5 4 5 1 5 5
es la correlación entre lo que las mujeres in
formaban sobre su propio estrés, lo que los 7. Un investigador está interesado en ave
hombres informaban sobre el estrés de sus riguar si un nuevo medicamento produce algún
compañeras, la percepción de las mujeres so efecto en caso de resfrío. Ocho personas son
bre el apoyo brindado por sus parejas en la analizadas: cuatro toman el medicamento y
primera y en la segunda entrevista y el nivel cuatro no (las que lo toman son calificadas con
un l t las que no, con un 0) y luego se registra si que nunca asistió a un curso de estadística (pe
se resfrían (calificación 1) o no (calificación ro que sí comprende qué es la media, el desvío
0). A continuación aparecen cuatro resultados estándar y las puntuaciones Z), y e) indique
posibles. Calcule el coeficiente de correlación tres direcciones de causalidad lógicamen
en cada caso (sólo damos la solución para las te posibles, explicando en cada caso si es una
posibilidades A y B). dirección razonable de la correlación según las
variables involucradas (y ¿por qué?).
P o s ib ilid a d P o s ib ilid a d P o s ib ilid a d P o s ib ilid a d 1. Se entrega a cuatro individuos una prue
A B C D
ba de habilidad manual (los valores altos signi
Toma Se Toma Se Toma S e Toma S e fican mayor habilidad) y una prueba de ansiedad
M ed. resfría M ed. resfría M e d , resfría M ed. resfría
(los valores altos implican mayor ansiedad).
0 1 0 1 0 1 0 1
0 1 0 i 0 1 0 1 Los valores observados de los cuatro individuos
0 1 0 1 0 0 0 1 son los siguientes:
0 1 0 0 0 0 0 0
1 0 3 1 1 1 1 0
1 0 1 0 1 1 1 0 P erso n a H a b ilid a d A n s ie d a d
1 0 1 0 1 0 1 0 1 1 10
1 0 1 0 í 0 1 0
2 1 8
3 2 4
4 4 ~2
SERIE II
Realice lo siguiente en los ejercicios 1 y 2 : a)
construya un diagrama de dispersión de las 2. Se controla de cerca a cuatro niños pe
puntuaciones originales; b) describa con pala queños durante un periodo de varias semanas
bras el patrón general de correlación, si existe; para medir qué cantidad de programas de tele
c) calcule el coeficiente de correlación; d) ex visión violenta miran y la medida de su com
plique la lógica de lo que ha hecho, escribien portamiento violento hacia sus compañeros de
do como si estuviera haciéndolo para alguien juego. Los resultados fueron los siguientes:
T a b la 3 - 1 0 .
C o r r e l a c i o n e s d e o r d e n c e r o d e l a s v a r i a b l e s d e l e s t u d io .
Variable 1 2 3 4 5 6 7 S
I. Estrés informado por mujeres _
8. Origen étnico de las mujeres -0,19 -0,09 -0,16 —0,14 0,11 0,13 - 0,02 —
9, Estado civil de las mujeres -0,18 0,01 0,12 0,24* -0,04 - 0,20 0,05 -0,34**
10. Paridad 0,19 0,13 - 0,11 -0,17 OJO 0,16 0,26* 0,31*
*p < 0,05; **p < 0,Q t’, ***£< 0,001.
Fuente: Chapman, H, A., Hobfoll, S. B., & Ritter, C. (1997), tab. 2. “El hecho de que el compañero subestime el estrés
sufrido por ellas provoca angustia en las mujeres: estudio sobre mujeres embarazadas de zonas céntricas y superpobla
das de la ciudad”. P e r i ó d ic o s o b r e P s ic o lo g ía S o c ia l y d e P e r s o n a lid a d { J o u r n a l o f P e r s o n a l i t y a n d S o c ia l P s y c h o l o g y ] ,
73, 418-425. Copyright, 1997, por la Asociación Americana de Psicología [American Psychoíogical Association],
Reimpreso con autorización.
C a n tid a d d e C alificación R e g istro s en
N ú m ero C a n tid a d sem a n a l a ccio n es N iñ o p o r p rolijid ad p r u e b a d e n ív
d e có d ig o (h o ra s) de T V v io len ta s o agresivas
X zx X Zy
d e lo s n iñ o s vio len ta s h a c ia c o m p a ñ ero s
Janet 18 “ 0 ,5 2 60 - 0 ,6 6
G 3368 14 9 Gareth 24 1,43 58 -1 ,0 9
R 8 904 8 ó Grove 14 “ 1,82 70 1,47
C 9890 6 Ì Kevin 19 “ 0 ,2 0 58 - 1 ,0 9
L 87 2 2 12 8 Joshua 20 0,13 66 0,62
N ic o le 23 1,11 68 1,04
En los ejercicios 3 y 4, a) construya un diagra Susan 20 0,13 65 0 ,4 0
22 0,78 68 1,04
ma de dispersión de las puntuaciones origina D rew
M arie 15 “ 1,50 56 -1 ,5 1
les; b) describa con palabras el patrón general Chad 21 0 ,4 6 62 - 0 ,2 3
de correlación, si existe, y c) calcule el coefi
ciente de correlación. En los dos ejercicios da 5. Como parte de un estudio más amplio,
mos las puntuaciones Z para ahorrarle tiempo. Speed y Gangestad (1997) obtuvieron califi
3. Supongamos que el Museo de Louvre caciones y nominaciones sobre diversas carac
terísticas de 66 hombres de una fraternidad,
está interesado en la relación entre la antigüe
otorgadas por sus compañeros de fraternidad. El
dad de una pintura y el interés del publico en siguiente párrafo fue tomado de la sección de re
esa pintura. Durante una semana se controla la sultados del estudio:
cantidad de personas que se detienen a obser
var a cada una de las ÍO pinturas elegidas ai L a popularidad romántica de los hombres e s
taba significativam ente correlacionada con
azar. Los resultados son los siguientes:
varias características: mejor vestimenta (r =
0,48), mayor atractivo físico ( r = 0,47), más
C an tid ad sociabilidad (r « 0,47), más confianza en sí
A n tig ü ed a d d e p erso n a s m ism o ( r ~ 0,44), m ejor líder (r = 0,38), más
T ítu lo a p ro x im a d a q u e se detien en divertido ( r - 0,37), más satisfecho ( r ~ 0,32)
d e la p in tu r a (a ñ o s) a o b serv a rla y m as independiente ( r = 0 ,2 8 ). Sin embargo,
inesperadamente, e l potencial de los hombres
X z* X Zy
en relación con e l éxito financiero no estaba
El Entierro 465 1.39 68 -0 ,6 9 significativam ente correlacionado con su po
M ys Mar Ste Catherine 515 1,71 71 “ 0,59
pularidad romántica (r - 0,10). (p. 931).
Las Bañistas 240 - 0 ,0 9 123 1,19
E l T oilette 107 “ 0,96 Explique los resultados como si estuviera escri
112 0 ,8 2
Retrato de Castiglione 376 0,80 biendo para una persona que nunca ha asistido
48 -1 ,3 8
Carlos I de Inglaterra 355 0,67 84 “ 0 ,1 4
a un curso de estadística. Específicamente, a)
Crispin y Scapiti 140 -0 ,7 5 66 - 0 ,7 6
explique qué significa un coeficiente de corre
D esnudo al Sol 115 “ 0,91 148 2,05
lación utilizando una de las correlaciones como
E l B alcón 122 -0 ,8 6 71 “ 0,59
E l Circo 99 -1 ,0 1
ejemplo; b) explique, qué significa “significati
91 0 ,1 0
vamente" y “no significativamente", en gene
ral, refiriéndose al menos a un ejemplo especí
fico y c) especule sobre el significado del pa
4. Un maestro de escuela creyó notar que
trón de los resultados, teniendo en cuenta el te
los alumnos que se vestían más prolijamente
ma de la dirección de causalidad.
eran, en líneas generales, mejores estudiantes. 6 . Seleccione arbitrariamente ocho nom
Para probar está idea, el maestro hizo que un bres personales completos, de ocho hojas dife
amigo calificara a cada uno de los alumnos rentes de la guía telefónica. Confeccione un
según su prolijidad en el vestir. A continua-, diagrama de dispersión y calcule el coeficiente
ción detallamos las calificaciones por proliji de correlación entre la cantidad de letras en el
dad, junto con las calificaciones de los alumnos primer nombre y en el apellido. Describa el re
en una prueba estandarizada de rendimiento sultado con palabras y sugiera una posible in
escolar. terpretación de sus resultados.
APÉNDICE I DEL CAPÍTULO: FÓRMULA DE CÁLCULO OPTATIVA DEL
COEFICIENTE DE CORRELACIÓN
Los pasos para calcular un coeficiente de correlación pueden combinarse en una sola fórmula pa
ra realizar cálculos a mano (o con una calculadora) en un estudio con gran cantidad de participan
tes. Comúnmente, los pasos para calcular una correlación son: calcular a) las puntuaciones Z de
cada puntuación original, b) los productos cruzados de las puntuaciones Z y c) el promedio de los
productos cruzados de las puntuaciones Z. (El alumno habrá notado, ai realizarlos ejercicios, que
calcular las puntuaciones Z es particularmente tedioso cuando se trabaja a mano, especialmente si
primero es necesario calcular las medias y los desvíos estándares). Con un poco de manipulación
algebraica, la fórmula puede transformarse en la que se indica a continuación, (Aunque parezca
terrible, resulta realmente más sencilla para aplicar en un estudio rea] con grandes cantidades de
participantes que si tuvieran que calcularse los resultados a mano).
jv s x r-(x x )(x r)
r
(3-2)
Cuando se utiliza este procedimiento resulta útil organizar los datos en un cuadro de cinco colum
nas, formado por las columnas X, X2, 7, Y2, y los productos cruzados de XY. Cabe destacar que no
se mencionan las puntuaciones Z, y que los productos cruzados se calculan directamente sobre la
base de puntuaciones originales. Además, tal como lo recordamos en el apéndice del capítulo 2,
IX 2 se logra tomando cada valor X y elevándolo al cuadrado, y luego sumando estos cuadrados;
por el contrario, (YX)2 se logra sumando todos los valores X (sin elevar al cuadrado ninguno de
ellos), y luego elevando el total al cuadrado.
La tabla 3-11 muestra el cálculo correspondiente al ejemplo del estrés de los gerentes utili
zando esta fórmula. Compárela con la tabla 3-2.
(3-3)
Tabla 3-11.
C ó m p u to s d e l c o e fic ie n te d e c o r r e la c ió n d e l e s tu d io s o b r e e l e str é s d e lo s g e r e n te s , r e a liz a d o s c o n la
fó r m u la d e c á lc u lo (d a to s fic tic io s ).
w xxr- ( 2 X )(X y)
U Ñ Z X * - (XXX ] [V iv x r - ( X f ) 1 ]
(5X 237) ■
- (35X 30)
1.185 - 1.050
r ~ ------------------------------------------------------------------------------
(V 1.365 - 1 .2 2 5 }
(7 W )C fÜ 0 ) ” ( 11,83 ) ( 1 3 3 )4 ) “ 154,26
Además, queremos destacar que las pruebas de significación de una correlación, como por ejem
plo una prueba t, pueden ser de una o dos colas. Una prueba de una cola significa que el investiga
dor ha predicho el signo (positivo o negativo) de la correlación2.
Los supuestos de las pruebas de significación de un coeficiente de correlación son algo com
plejos. Comúnmente, ambas variables deberían estar normalmente distribuidas. Además, la dis
tribución de cada variable, condicionada por cada valor de la otra variable, debería tener
aproximadamente la misma varianza. Sin embargo, como ocurre con la prueba t y el análisis de
varianza, los incumplimientos moderados de estos supuestos no son fatales.
A continuación presentamos un ejemplo utilizando el estudio del estrés de los gerentes. Su
pondremos que los investigadores predijeron una correlación positiva entre la cantidad de em
pleados supervisados y el estrés, la que será probada a nivel 0,05.
1. Reformule el problema en forma de hipótesis de investigación e hipótesis nula acerca de
las poblaciones. Las poblaciones de interés son las siguientes:
Población 1; gerentes como los analizados en este estudio.
Población 2: gerentes para los cuales no existe correlación entre cantidad de empleados su
pervisados y estrés.
2 Dunlap y Myers (1997) encuentran un modo más corto de descubrir la significación de un coeficiente de correlación.
Sucede que e l r necesario para una significación de nivel 0,05 (dos colas) es muy aproximado a 2 fyN . Por ejemplo, pa
ra N ~ 5, necesitaríamos una correlación de 0,89 (2/^/5”= 2/2,24 = 0,89). Dunlop y Myers también nos brindan una ma
nera más corta para lograr una aproximación a la cantidad de participantes necesarios para un poder de entre un 80% y
90%. El tamaño de muestra necesario es simplemente 8 dividido r2. Por ejemplo, utilizando esta fórmula, para r - 0,10,
la cantidad de participantes necesaria es 8 /0 ,102, es decir, 800.
La hipótesis nula establece que las dos poblaciones tienen la misma correlación. La hipótesis de
investigación establece que la población 1 tiene una correlación mayor que la población 2. (Es de
cir, la predicción es que la correlación de la población es mayor a 0).
2. Determine las características de la distribución comparativa. Suponiendo que se cumplen
•los supuestos (en la práctica, con sólo cinco casos sería difícil de determinar), la distribución
comparativa es una distribución t con gl = 3. (Es decir, gl = N - 2 = 5 - 2 = 3).
3. Determine el punto crítico en la distribución comparativa, en el cual la hipótesis nula debe
ría ser rechazada. La tabla í (tabla B-2 del apéndice B) muestra que para una prueba de una cola a
nivel 0,05, con 3 grados de libertad, necesitamos una t de al menos 2,353.
4. Determine el valor del estadístico de prueba. Calculamos una correlación de r ~ 0,88 y
iV= 5. Aplicando la fórmula para encontrar el t equivalente, obtenemos:
T a b la 3 - 1 3 .
C a n tid a d a p r o x im a d a d e p a r tic ip a n te s n e c e
Tabla 3-12. s a r i o s p a r a lo g r a r u n 8 0 % d e p o t e n c i a e n u n
P o te n c ia a p r o x im a d a d e e st u d io s q u e u t iliz a n e l e s t u d io q u e u t iliz a e l c o e f ic ie n te d e c o r r e la
c o e f i c i e n t e d e c o r r e l a c i ó n (r ) p a r a p r u e b a s d e h i p ó c i ó n (r ) p a r a p r o b a r u n a h i p ó t e s i s c o n n i v e l
t e s is c o n n iv e l d e s i g n i f i c a c i ó n d e 0 ,0 5 . d e s i g n i f i c a c i ó n d e 0 ,0 5 .
T a m a ñ o d el efecto T a m a ñ o d e l e fe c to
Pequeño M e d ia n o G ran de P equeño M e d ia n o G ra n d e
(r ~ 0 ,1 0 ) (r = 0 ,3 0 ) ( r ss 0 ,5 0 ) ( r := 0 ,1 0 ) (r -0 ,3 0 ) ( r = 0 ,5 0
D o s colas D o s colas 783 85 28
Total N: 10 0 ,0 6 0,13 0,33 U na cola 617 68 22
20 0,07 0,25 0 ,6 4
30 0,08 0,37 0,83
40 0,09 0 ,4 8 0 ,9 2
50 0,11 0 ,5 7 0,97
100 0,17 0,86 1
U na cola
Total N ; 10 0,08 0 ,2 2 0,4 6
20 0,11 0 ,3 7 0,75
30 0,13 0,50 0,9 0
40 0,15 0,6 0 0,9 6
50 0,1 7 0,69 0,98
100 0,26 0,9 2
aCasi 1,00.
► Terminología relacionada con la ► Extensión a regresión y correlación
■ predicción bivariada.
► Modelo de predicción bivariada con
puntuaciones Z.
► Predicción bivariada con puntuaciones describen en publicaciones científicas,
originarias. ■
' ^ Resumen. .
■,■>: La recta de regresión. ^ Términos clave. . .
>: Eírror y reducción proporcional dei ^ Ejercicios^ :
error. ■: ".(A.v
► Otro ejemplo de predicción bivariada.
E
las principales aplicaciones prácticas de los métodos estadísticos: realizar prediccio
nes. Normalmente, se recurre a psicólogos de distintas especialidades para solicitar
opiniones fundamentadas (y precisas) sobre temas tales como, por ejemplo, cuál es la
probabilidad de que el aspirante a un empleo se desempeñe correctamente si se lo con
trata, cuánto puede ayudar un programa de lectura a un determinado alumno de tercer grado o cuáles
son las probabilidades de que un convicto con posibilidad de salir en libertad condicional cometa un
crimen si se lo libera. Aprender los intrincados detalles de la predicción estadística también ayudará a
profundizar la comprensión de otros contenidos de la materia, y preparará al alumno para temas fun
damentales en cursos de estadística más avanzados.
A lo largo del capítulo analizaremos los procedimientos para realizar predicciones referidas a
una variable (como el promedio de calificaciones universitarias), sobre la base de información re
lacionada con otra variable (como por ejemplo, las calificaciones s a t ) . Luego veremos cómo esti
mar la precisión esperada de las predicciones que realizamos utilizando estos procedimientos.
Finalmente, presentaremos situaciones en las que se realizan predicciones referidas a una va
riable (como el g p a ) que se basan en información relacionada con otras dos ó más variables (co
mo por ejemplo las calificaciones s a t y el g p a del colegio secundario).
la variable que ayuda a realizar la predicción (como por ejemplo las calificaciones s a t ) se deno
mina Variable predictora. (Lavariable predictora recibe con frecuencia, el nombre de variajble
inde'péjídien'te, especialmente si se la considera causa de la otra variable), 'ti# variable para la
cual se realizan las predicciones (como por ejemplo el g p a universitario) generalmente se deno
mina variable dependiente. (La variable dependiente en una predicción recibe el nombre técnico
de variable triterio; pero este nombre es poco común en la mayoría de las áreas de investigación
psicológica). Üsüálmente se rotula la variable de predicción con una X y la variable dependiente
con una Y. Es decir, se utiliza el valor observado de una persona en X para predecir el valor Y. (La
tabla 4-1 resume las distintas denominaciones de las variables).
Ya nos hemos referido a estos dos tipos de variables en nuestra exposición sobre correlación
en el capítulo 3. Sin embargo, en ese contexto había relativamente muy poca diferencia con res
pecto a cuál era cuál, ya que sólo nos interesaba el grado de relación entre ambas. En el contexto
de las predicciones, sin embargo, es esencial estar seguro respecto de qué variable se están reali
zando las predicciones y cuál se está utilizando como ayuda para realizarlas.
Tabla 4-1.
D e n o m i n a c i ó n d e l a s d o s v a r i a b l e s e n l a p r e d i c c i ó n b iv a r i a d a .
V a r ia b le a p a r t ir d e la V a r ia b le q u e
c u a l s e p r e d ic e s e p r e d ic e
Ejemplo
Analicemos nuevamente el ejemplo del nivel de estrés de los gerentes presentado en el capítulo 3.
En ese ejemplo, la correlación entre la cantidad de empleados supervisados y el nivel de es
trés de los gerentes era 0,88; es decir, r = 0,88. Por lo tanto, B ~ 0,88, y el modelo para predecir la
puntuación Z del nivel de estrés de un gerente es multiplicar 0,88 por la puntuación Z correspon
diente a la cantidad de empleados que supervisará el gerente. Supongamos que un nuevo gerente
fuera a supervisar a 10 empleados. Esto representaría una puntuación Z de empleados supervisa
dos igual a +1,27. (Cambiamos la puntuación original ele 10 a puntuación Z utilizando el procedi
miento aprendido en el capítulo 2: Z = [X - M]íSD). Así, predeciríamos la puntuación Z del nivel
de estrés de este nuevo gerente multiplicando 0,88 por 1,27. El resultado es 1,12, lo que significa
qué se puede predecir que un gerente que supervisa 10 empleados tendrá un nivel de estrés apenas
mayor a 1 desvío estándar por sobre la media. Según la fórmula:
Por el contrario, supongamos que el nuevo gerente supervisará sólo a 3 empleados. En ese caso,
el modelo predeciría una puntuación Z del nivel de estrés igual a 0,88 x (—1,69) (la puntuación Z
correspondiente si la cantidad supervisada fuera 3), lo que da un resultado de - 1,49. Es decir:
A] realizar los tres pasos indicados anteriormente, se debe poner especial atención en utilizar la
media y el desvío estándar de la variable correspondiente al pasar de puntuaciones originales a
puntuaciones Z y de puntuaciones Z a puntuaciones originales. En el paso 1, se trabaja sólo con el
valor, la media y el desvío estándar de la variable predictora (A). En el paso 3, se trabaja sólo con
el valor, la media y el desvío estándar de la variable dependiente (E).
:Y = a + (b)(X) (4-2)
Esta fórmula hace hincapié en dos términos que aún no hemos analizado, b y a. b es el coeficien
te de regresión para puntuaciones originales, es similar a J5, el coeficiente de regresión estan
darizado, excepto que b se utiliza sólo con puntuaciones originales y no es igual al coeficiente de
correlación, a es la constante de regresión, se agrega al valor predicho en la variable dependien
te de puntuaciones originales, para tomar en cuenta las medias de las distribuciones de puntuacio
nes originales. (Trabajando con puntuaciones Z, no es necesario utilizar la constante de regresión
debido a que las medias de las puntuaciones Z de las variables siempre son iguales a 0).
El coeficiente de regresión para puntuaciones originales (b) y la constante de regresión (a)
pueden calcularse directamente conociendo las medias y los desvíos estándares de las dos varia
bles, y beta (que en el caso de las predicciones bivariadas es r):
SDy
»=0) (4-3)
V SDX
a = M Y -{b)(M x ) (4-4)
Según nuestro ejemplo del estrés sufrido por los gerentes, r = Mx = l> SDX = 2,37, My - 6, y SDy=2,61.
Entonces,
Si supervisa a 3 personas:
(Como puede observarse, teniendo en cuenta los redondeos, los resultados coinciden con los cálcu
los realizados utilizando el método de tres pasos, que implica conversión de original a Z, predic
ción, conversión de Z a original).
De un modo más general, analicemos el significado de b y a según lo ilustra el siguiente
ejemplo: el coeficiente de regresión para puntuaciones originales (b) de 0,97 significa qué cada
aumento de una persona supervisada está ligado a un aumento de 0,97 puntos sobre el valor que
se predice para el nivel de estrés de los gerentes. Si se supervisan dos personas, se multiplica 0,97
por 2; si son tres, 0,97 por 3.
La constante de regresión (a) de -0,79 significa que, además, se ajusta la predicción restando
0,79 puntos a la escala de estrés, cualquiera sea la cantidad de empleados. Justamente se trata de
una constante porque siempre se utiliza el mismo valor.
La constante de regresión de -0,79 también indica que si X es Ó, el registro de estrés será de
-0,79. (Sin embargo, en este caso X es la cantidad de empleados supervisados, y resulta improba
ble que un gerente no supervise a ningún empleado, lo cual es un hecho afortunado, ya que tam
bién es improbable que alguien pudiera tener menos de 0 estrés).
LA RECTA DE REGRESIÓN
Un modelo de predicción puede visualizarse como una recta en un gráfico, en el que el eje hori
zontal representa los valores de la variable predictora y eí eje vertical representa los valores pré-
dichos de la variable dependiente. (El gráfico se dibuja del mismo modo que los diagramas de
dispersión aprendidos en el capítulo 3). La recta a la que nos referíamos se llama recta de regre
sión, y representa la relación entre los valores de la variable predictora y los valores predíchos en
la variable dependiente. La figura 4-1 gráfica la recta de regresión correspondiente al ejemplo de
los empleados supervisados (variable predictora) y el nivel de estrés de los gerentes (variable de
pendiente). Siguiendo la recta de regresión se puede encontrar el nivel de estrés predicho a partir
de cualquiera de las cantidades de empleados supervisados. Las líneas punteadas indican las pre
dicciones calculadas para los gerentes que supervisaban 3 y 10 personas.
Figura 4-2. Pasos que se debes seguir para trazar una recta de regresión utilizando el ejemplo del nivel de
estrés de los gerentes, a) Se dibujan y rotulan los ejes; b) se marca el punto cuyas coordenadas son un valor
de la variable predictora (2) y el correspondiente valor predicho calculado para la variable dependiente
(1,15); c) se marca un punto cuyas coordenadas son otro valor de la variable de predicción (8) y su corres
pondiente valor predicho calculado para la variable dependiente (6,97), y d) se dibuja una recta que pase
por los dos puntos marcados. El gráfico también indica que por cada unidad de incremento de X, la recta se
eleva 0,97 unidades.
4. Dibujar la recta que pasa por los dos puntos marcados. La figura 4-2d muestra la recta.
Se puede controlar la precisión de la línea trazada calculando cualquier otro tercer punto. Un
punto fácil de localizar es el punto donde X ~ 0. Cuando X ~ 0, el valor predicho de Y es la cons
tante de regresión (a). (Cuando X - 0, (b)(X) = 0; por lo tanto, lo único que queda de la fórmula de
regresión es a). Frecuentemente, el diagrama de dispersión se realiza de forma tal que el eje verti
cal esté ubicado donde X = 0. En ese caso, el punto en el que la línea de regresión corta el eje ver
tical es el punto donde el valor predicho en Y es igual a a. Por esta razón, la constante de regresión
a veces también se denomina ordenada al origen (la ordenada del punto donde la recta de regre
sión intersecta o corta al eje Y).
Para mayor control, en cuanto a la precisión de la recta trazada, es posible verificar si la pen
diente coincide con b, es decir, cuánto se eleva la recta por cada unidad de incremento de la varia
ble predictora. La figura 4-2d muestra con líneas punteadas que la pendiente es 0,97: por cada
unidad de incremento de X, la recta se eleva 0,97 unidades.
Error2 (4-5)
Utilizar errores cuadráticos soluciona el problema de que algunos errores sean números positivos
(la predicción fue menos que la observación) y otros sean números negativos (la predicción supe
ró a la observación). Si no se elevan los errores al cuadrado, cuando finalmente se sumen, los
errores positivos y negativos se cancelarán entre sí. (La misma situación se planteó en el capítulo
2 cuando trabajamos con desvíos con respecto a la media).
Los errores y errores cuadráticos correspondientes a los gerentes dei ejemplo aparecen en las
últimas dos columnas de la tabla 4-3
Tabia 4-3.
Cálculo del error y del error cuadrático utilizando puntuaciones originales del ejemplo del nivel de
estrés sufrido por los gerentes (datos ficticios).
E m p le a d o s
S u p e r v is a d o s N iv e l d e E s t r é s E rror E rr o r *
O b serva d o P r e d ic h o
X Y Y Y -Y (Y -Ÿ Y
6 7 5,03 1,97 3,88
8 8 6,97 * 1,03 1,06
3 1 2 ,1 2 - 1 ,1 2 1,25
10 8 8,91 -0 ,9 1 0,83
8 6 6,97 - 0 ,9 7 0 .9 4
Sum a = 7 ,9 6
lores correspondientes a la cantidad de empleados supervisados se encuentran a lo largo de la
recta de regresión. Por lo tanto, el error correspondiente a cualquier gerente en particular está
dado por la distancia vertical entre el punto correspondiente al valor observado de ese gerente y
la recta de regresión. Se han dibujado líneas de puntos para indicar el error en cada caso.
Tabla 4-4.
Cálculo de la reducción proporcional del error en el ejemplo del nivel de estrés de los gerentes
(datos ficticios).
Observación Predicción utilizando la media Utilizando el modelo de predicción
Y M e d ia E rror E rro r1 Y E rro r E rro r1
7 6 í 1 5,03 1,97 3,88
8 6 2 4 ó , 97 1,03 1,06
1 6 -5 25 2 ,1 2 -1 ,1 2 1,25
8 6 2 4 8,91 - 0,91 0,83
6 6 0 0 6,97 - 0,97 0,94
^To«< a 34 ^ Etíür* 7,96
S S ' ~ S S Pfrne 3 4 - 7 ,9 ó 26,04
R educción proporcional del error = ~ ~ ~ ------- § ssc = —— ------ = — = 0,77
^*Totaf 34 j4______
Interpretación gráfica de la reducción proporcional del error
Supongamos que se predijera la media para cada valor. En un gráfico, la línea que represente es
tas predicciones (todas referidas a la media) sería una recta horizontal. No importa cuál sea el va
lor de la variable de predicción, la predicción en la variable dependiente es la misma, la media.
La figura 4-4 representa el diagrama de dispersión del ejemplo del nivel de estrés de los ge
rentes. También ilustra la recta de regresión calculada con el modelo de predicción y la recta hori
zontal de la predicción utilizando la media. Se puede observar que, en la mayoría de los casos, la
recta de regresión está más cerca del punto que la recta horizontal. Es decir, la recta basada en el
modelo de predicción, generalmente está más cerca de los puntos que la recta basada en la predic
ción por la media. La reducción proporcional del error puede considerarse como la medida en la
que la precisión de la recta de regresión es mayor que la precisión de la recta horizontal1.
1 Existe otra forma menos co m ú n de medir la precisión del modelo de predicción, denominada error estándar de esti
mación. índica, aproximadamente, la distancia promedio entre los puntos y la línea de regresión. Expresado con pala
bras, es la raíz cuadrada deí promedio de los errores cuadráticos, en símbolos ^ I S S ^ Z J Ñ ). (El error estándar de
estimación, com o indicador de la variación de ios valores con respecto a lo que se esperaría aplicando la norma de pre
dicción, es un método paralelo a utilizar el desvío estándar com o indicador del desvío típico de los valores con respec
to a la media). Sin embargo, el error estándar de estimación rara vez se menciona en los artículos de investigación
psicológica. Por lo tanto, en este libro no nos concentramos en ese concepto. N o se debe confundir el error estándar de
estimación con lo que a menudo se denomina simplemente “error estándar” (técnicamente este último es el “error es
tándar del coeficiente de correlación” o el “error estándar del coeficiente de regresión"), que está relacionado con la
significación estadística, y que trataremos en el capítulo 7.
Al utilizar puntuaciones Z, el modelo de predicción consistirá en multiplicar beta, que es 0,68
(igual a r), por la puntuación Z correspondiente a la cantidad de exposiciones.
Supongamos que una persona sea expuesta siete veces a cada palabra. Siete es igual a una puntua
ción Z de 1,09. Entonces se podría predecir que la puntuación Z de esa persona en la variable "pa
labras recordadas” sería de 0,68 por 1,09. El resultado es una puntuación Z predicha de 0,74 para
las palabras recordadas, Supongamos que otra persona observará cada palabra sólo cuatro veces
(una puntuación Z de -0,22 para las 4 exposiciones). En este caso, se predeciría una puntuación Z
de -0,15 para las palabras recordadas. Es decir, 0,68 x -0,22 = -0,15. Los dos ejemplos se repre
sentan por medio de las siguientes fórmulas:
Para Z* = 1,09: ZK= (0) (Z*) = (0,68) (1,09) = 0,74
Para Z* = -0,22: Zy = (0) (Zx) - (0,68) (-0,22) = 0,15
Sin embargo, cabe recordar que existen dos métodos. Primero, se puede proceder como acabamos
de hacerlo. Se puede convertir la puntuación original de la variable de predicción en puntuación
Z, realizar la predicción y luego convertir la puntuación Z predicha de la variable dependiente en
una puntuación original. En cuanto al resultado del primer ejemplo, una puntuación Z predicha de
0,74 para las palabras recordadas es equivalente a una puntuación original de 7,2 palabras recor
dadas. (La media de 5,6 más el producto de Z de 0,74 por el desvío estándar de 2,1). Similarmen
te, una puntuación Z predicha de -0,15 es equivalente a una puntuación original de 5,3 palabras,
Es decir, 5,6 + (2,1 x [-0,15]) =» 5,3.
Otra alternativa sería utilizar el modelo de predicción con puntuaciones originales para aho
rrar algunos pasos. En ese caso, el cálculo sería el siguiente:
Tabla 4-5.
Medías y desvíos estándares del experimento acerca del efecto de la cantidad de exposiciones sobre
la cantidad de palabras recordadas (datos ficticios).
Cantidad de exposiciones Cantidad recordada
(variable predictora) (variable dependiente)
M ean 4,5 5,6
Standard deviation 2,29 2,1
Correlation r=0,68
Si una persona accede a cuatro exposiciones:
(Los resultados concuerdan con las cifras más redondeadas que calculamos utilizando el método
de transformación de puntuaciones originales a Z, predicción, y transformación de Z a puntuacio
nes originales).
La figura 4-5 es un gráfico que representa las dos variables y la recta de regresión correspon
diente a la fórmula de predicción, junto con las líneas punteadas, que indican las dos predicciones
aquí calculadas.
¿Qué podemos decir sobre la precisión de la predicción? La tabla 4-6 muestra, para cada par
ticipante que intervino en el experimento, el valor observado, el valor que se hubiera predicho uti
lizando el modelo de predicción, los errores (diferencias) y ios errores cuadráticos.
En este ejemplo, ía suma de los errores cuadráticos, al predecir utilizando el modelo de pre
dicción (l$'¿'Error), es de 39,65. Para calcular la reducción proporcional del error, también se necesi
ta la suma del error cuadrático al predecir utilizando la media (SSTotal), El resultado es 0,72. (Si el
alumno lo desea puede controlar el resultado calculándolo por sí mismo). Cabe recordar que, pa
ra obtener SSTotal, primero se debe calcular cada valor menos la media para obtener el error. Lue
go se eleva al cuadrado cada uno de esos errores y se suman. Por ejemplo, en el caso del primer
participante, el error cuadrático al predecir utilizando la media es el valor 4 menos la medía de
5,6, lo que da un error de - 1,6 y un error cuadrático de 2,56).
En este ejemplo, utilizar la norma de predicción reduce el error cuadrático casi a la mitad, de
72 a 39,65. Para ser precisos, al dividirla reducción de 32,35 por el &STo{aJ de 72, resulta en una re
ducción proporcional del error de 0,45 (ó 45%). El mismo es representado mediante la fórmula:
Reducción proporcional del error =
óÓTotai -^Error „ 72-39,65 _ 32,35 _ Q^
SÓTota! 72 72 “ ’
Finalmente, la figura 4-6 muestra el diagrama de dispersión con la correspondiente recta de regresión.
Tabla 4-6.
Valores observados y predlchos y errores en el experimento que indagan el efecto de la cantidad de
exposiciones sobre la cantidad de palabras recordadas (datos ficticios).
Cantidad de Cantidad de
Sujeto exposiciones palabras recordadas Error Error3
X Y Y
1 1 4 3,4 0,6 0,36
2 1 3 3,4 -0,4 0,16
3 2 3 4,0 1,0 1,00
4 2 5 4,0 1,0 1,00
5 3 6 4,6 1,4 1,96
6 3 4 4,6 -0,6 0,36
7 4 4 5,3 -1,3 1,69
8 4 6 5,3 0,7 0,49
9 5 5 5,9 -0,9 0,81
10 5 7 5,9 1,1 1,21
11 6 2 6,5 -4,5 20,25
12 6 9 6,5 2,5 6,25
13 7 6 7,1 -1,1 1,21
14 7 8 7,1 0,9 0,81
15 8 9 7,8 -1,3 1,69
16 8 8 7,8 0,2 0,40
^Brror = 39,65
2 También existen procedimientos que permiten utilizar más de una variable dependiente. Por ejemplo, podría ser
necesario averiguar' en qué medida la variable predietora “cantidad de empleados" supervisados es adecuada, tanto
para d nivel de estrés com o para la cantidad de ausentismo, Los procedimientos que involucran más de una variable
dependiente se denominan de "estadística multivariada” y son bastante avanzados. En el capítulo 17 se presentan
algunos ejemplos.
. cantidad de empleados supervisados es X v el nivel de mido es X2 y la cantidad de plazos que se
deben cumplir por mes es Xy
Zy - (0.51XZ*,) +(0,UXZ*2)+(0,33)(Z*,)
Supongamos que se intenta predecir el nivel de estrés de un nuevo gerente que tenía una puntua
ción Z de 1,27 correspondiente a la cantidad de empleados para supervisar (una cantidad bastante,
alta), una puntuación Z de -1,81 con respecto al ruido en las condiciones de trabajo (un bajo nivel
de ruido) y una puntuación Z de 0,94 en relación con la cantidad de plazos que se deben cumplir
por mes (una cantidad un poco alta de vencimientos). Para encontrar la puntuación Z predicha del
nivel de estrés, se debe multiplicar 0,51 por la puntuación Z de empleados supervisados, 0,11 por
la puntuación Z de nivel de ruido y 0,33 por la puntuación Z de los vencimientos. Luego, se deben
sumar los resultados.
Zy = (0,51 }(i,27) + (0,n)(™l,81) + (0,33}( 0,94) = 0,65 +-0,20+0,31= 0,76
Por lo tanto, para un gerente que trabaja en esas condiciones se predeciría una puntuación Z de ni
vel de estrés de 0,76. Es decir, un nivel de estrés de aproximadamente tres cuartas partes de un
desvío estándar por sobre ia media.
Relación entre los coeficientes beta de la regresión múltiple y las correlaciones comunes
Existe una diferencia particularmente importante entre la regresión múltiple y la predicción cuan
do se utiliza sólo una variable de predicción. En la regresión bivariada, (3= r. En la regresión múl
tiple, en general [3 no es igual a r. Es decir, el beta de una variable predictora en particular no es
igual a la correlación común de esa variable predictora con la variable dependiente.' En la mayoría
de los casos, beta será menor (más cercana a 0) que r.
La razón de esta discrepancia es que las variables predictoras generalmente están correlacio
nadas entre sí. Por lo tanto, parte de aquello que hace de una variable predictora un exitoso medio
de predicción de la variable dependiente se superpone con lo que hace a las otras variables pre
dictoras exitosas para predecir la variable dependiente. Por lo tanto, las correlaciones de cada va
riable predictora con la variable dependiente son, en cierta medida, redundantes, ya que lo que
contiene cada variable de predicción se superpone con lo que contienen las otras variables predic
toras. Sin embargo, e§t;o no sucede con los beta. En Ja regresión múltiple, beta se calcula de modo
que pueda ser la contribución única y distintiva de la variable predictora a la predicción de la va
riable dependiente; Los coeficientes beta excluyen cualquier superposición con otras variables de
predicción.3
Analicemos el ejemplo del nivel de estrés de los gerentes. Cuando realizamos la predicción
utilizando sólo la cantidad de empleados supervisados, beta era igual al coeficiente de correlación
3 Técnicamente, la contribución única a la reducción proporcional del error de una variable predictora, en e l contexto de
las otras variables de predicción, es un cálculo estadístico denominado correlación s e m ip a r m l cuadrática (ir 1), un
número que ocasionalmente aparece en artículos de investigación. Sin embargo, es más común que ios investigadores
de aspectos psicológicos informen sólo las betas y luego hablen de ellas com o indicadores aproximados de la contribu
ción única de una variable. Siempre que se tenga en cuenta que son "aproximados”, esto resulta razonable, ya que beta
y sr2 están estrechamente relacionadas. Una beta alta generalmente corresponde a una sr2 alta, el signo (positivo o ne
gativo) de una beta es siempre el mismo que el de una sr3, y la significación de una beta es siempre la misma que la de
.sr2. En todo caso, debido a este uso común (y además porque tratar adecuadamente el tema de sr2 excede el alcance de
un texto introductorio), nuestra exposición adopta esta interpretación amplia de beta com o indicador de la contribución
única de una variable a la predicción.
de 0,88. Ahora bien, en el ejemplo con regresión múltiple, el beta de empleados supervisados es de
sólo 0,51. Beta es menor debido a que parte de lo que hace que la cantidad de empleados supervi
sados pueda predecir el nivel de estrés se superpone con aquello que hace que el ruido y ia canti
dad de vencimientos predigan el estrés. (Por ejemplo, parte de lo que hace que la cantidad de
personas supervisadas prediga el estrés es que esa cantidad de personas supervisadas aumenta el
nivel de ruido).
Supongamos que un posible gerente iba a supervisar a 8 personas, con un muy alto nivel de ruido
de 85 decíbeles y con 4 vencimientos por mes (ei cual es mayor que el promedio de 3). El nivel de
estrés esperado sería bastante alto:
Predicción 129
T a b la 4 - 7 .
Consumo de drogas como predictor de la delincuencia.
D r o g a co n su m id a r 3
A lcohol 0,415 -0 ,0 0 7
Tabaco 0 ,415 0 ,1 8 3
Marihuana 0,513 -0 ,0 4 6
Otras drogas ilegales 0,7 1 2 0 ,6 7 7
R = 0 ,729 \ R l = 0,531
Fuente: Watts, W,, & Wright, ¿L. (1990). "La relación entre el consumo de alcohol, tabaco, marihuana y otras drogas ile
gales con la delincuencia entre adolescentes americanos-mexicanos, negros y blancos de sexo masculino”. A d o lescen cia ,
2 5 ,1 7 1 -1 8 1 , Reimpreso con autorización.
En el caso de este joven, se predeciría un registro bastante bajo de delincuencia violenta (1,393
desvíos estándares por debajo de la media).
Supongamos que otro joven tenía exactamente el mismo patrón, pero no con respecto a dro
gas ilegales, donde presentaba un alto nivel de consumo, digamos, una puntuación Z de + 2.
^Delincuencia ~ ( ~ 0 ,0 0 7 ) ( - l ) + ( 0 ,1 8 3 ) ( 0 ) + ( - 0 , 0 4 6 ) ( l ) + ( 0 ,6 7 7 ) (2 )
= 0 ,0 0 7 + 0 ,3 6 6 + - 0 , 0 4 6 + - 1 , 3 5 4 = - 1 , 0 2 7
Aunque parezca sorprendente, para este joven también se esperaría un nivel bajo de delincuencia
violenta, ya que uno podría asociar con la delincuencia el hecho de fumar mucho. En la mayoría
de los casos, los índices altos con respecto a fumar se asocian con la delincuencia, como lo indica
el r de 0,415. Sin embargo, la gente joven que fuma generalmente también consume otras drogas
ilegales (al menos así lo indica la información correspondiente a este grupo en este entorno par
ticular), y esa parecería ser la razón por la cual, cuando se consideró separadamente el hecho de
fumar, ésta estaba más fuertemente asociado con la delincuencia.
Es el momento de hacer un paréntesis. Esperamos que el ejemplo referido a predicciones so
bre el potencial criminal de una persona, y su posible encarcelamiento, haya cambiado la percep
ción del lector. Cuando utilizamos grandes estudios para realizar predicciones sobre una sola
persona, inmediatamente percibimos el estereotipo intrínseco y las posibles injusticias. No es de
extrañarse que a menudo la gente desconfíe de la estadística. Pero ella es sólo una herramienta pa
ra analizar el futuro, como lo son la intuición o la experiencia clínica, y es tan compasiva como la
persona que la utiliza para tomar una decisión. Si una persona insensible cita números “fríos” pa
ra justificar una decisión prejuiciosa, no son los números los que son fríos. (En el cuadro 4-1 ofre
cemos un breve debate sobre el tema).
Antes de abandonar este estudio utilizado como muestra, será ilustrativo examinar el R co
rrespondiente a esta información. El R de 0,729 es mayor que el r común más alto (que era
0,712). Sin embargo, R es en realidad considerablemente menor que la suma de los valores r indi
viduales, (De hecho, la suma daría como resultado más de 1, lo cual, como mencionamos ante
riormente es, como valor de R, imposible). Finalmente, R2 es 0,531, Esto indica que si se
realizaran predicciones utilizando este modelo de regresión múltiple para cada joven del grupo
estudiado, el error cuadráíico promedio en la predicción de los valores observados de delincuen
cia sería un 53,1% menor que si se utilizara la media de los valores de delincuencia como predic
tor de los valores individuales. En términos de proporción de varianza explicada, el 53,1% de la
variación en la delincuencia de este grupo es explicada por las variables de consumo de drogas.
En 1954, Paul Meehl escribió un pequeño tadísticos tampoco son perfectos. Su. ven
e inquietante libro titulado Predicción es taja principal es la coherencia, como un
tadística versus predicción clínica. En éí apostador que dispone de un sistema para
sostenía que cuando algunos expertos, ta jugar. Los seres humanos explicamos me
les como por ejemplo psicólogos clínicos jor por qué sucedió algo después de que
(o gerentes de negocios, analistas econó sucedió, porque entonces sabemos dónde ;
micos, ingenieros o médicos, entre otros), buscar la causa. Pero debido a que las pre
utilizan los tipos de procesos cognítivos dicciones a menudo tienen serias conse
internos no especificados, a los que co cuencias, aún es desconcertante descubrir ;
múnmente llamamos “intuiciones capaci que la lógica o la intuición humana, des
tadas”, para realizar predicciones impor pués de largas entrevistas o pruebas, pue- ■.
tantes y decisivas, no son, en líneas ge dan ser tan poco eficientes comparadas ',
nerales, ni remotamente tan precisos co con una simple fórmula.
mo podría serlo cualquier otro sujeto Naturalmente, el centro de la atención .
empleando fórm ulas muy simples y di se ha enfocado en el funcionamiento de la
rectas, Por ejemplo, en el caso de la realiza cognición, el por qué de su imperfección y-
ción de un diagnóstico psiquiátrico, la qué puede hacerse para mejorarla, si es qué •
entrevista y el diagnóstico de un clínico algo puede hacerse. Su imperfección se de
supuestamente bien capacitado son me be principalmente a que las personas sue-.
nos útiles que una simple regla, como lo len realizar correlaciones ilusorias (véase.
es la del tipo utilizada en los procedi cuadro 3-2) o son demasiado confiadas: no
mientos de regresión múltiple: “Si la per llevan un registro de sus éxitos y fracasos;:
sona ya ha ingresado al hospital dos para controlar si en realidad son precisos,
veces, tiene más de 50, y aparentemente sino qué dan demasiada importancia, a. los ■
es suicida, entonces...” éxitos recordados y olvidan sus fracasos.
Durante la primera década que prosi Además, lamentablemente, el excéso de
guió al cuestionamiento por parte de Meehl confianza proviene en parte de la experíeo-
acerca de la precisión de los expertos, se cia, que en. realidad rara vez ayuda dema
realizaron considerables esfuerzos para re siado, ya que no aporta información acerca
futarlo. Pero, en general, el descubrimiento del resultado de un proceso .(los clínicos
de Meehl se ha mantenido (Dawes et al, pueden realizar cientos de diagnósticos sin
1993; Kleinmuntz, 1990): la cognición hu enterarse luego si estaban en lo cierto). Fi
mana por sí sola es, en líneas generales, nalmente, la memoria y lá cognición huma
menos precisa al realizar predicciones que na pueden no tener la capacidad de manejar,
el método estadístico de análisis de regre la información, como tampoco las opera
sión. Y se trata de predicciones importan ciones necesarias para tomar ciertas deci
tes: nos referimos a los diagnósticos, a las siones complejas.
que determinan una libertad condicional,.o Gran cantidad de investigaciones se
a decisiones comerciales y de ingeniería. han dedicado al tema de cómo “quitar el
No debemos olvidar que hablamos de sesgo” a las decisiones humanas. Se puede
predicciones, por lo cual los métodos es mostrar a ios profesionales en qué casos-la
intuición será más precisa (por ejemplo, ne más confianza en las decisiones huma
cuando se necesita un trabajo rápido y por nas, tal vez por la esperanza de quelaintui-
lo tanto no delicado, o cuando basta con un ción inspirada pueda acertar en un casó en
simple promedio) y cuándo es preferible particular. Además, las personas creen, tal
utilizaruna fórmula (cuando hay tiempo vez con razón, que los complejos patrones
para la deliberación o cuando las reglas son que presentan las situaciones reales son
más complicadas). captados mejor por los expertos más alle
También existe una cantidad considera gados y acostumbrados a esas situaciones;
ble de trabajos sobre los. distintos instru En tercer lugar, las fórmulas para la tòma
mentos de ayuda para la toma de decisiones, de decisiones no existen o no están al al
como pueden ser los programas informáti cance de las personas que las necesitan. Fi
cos que incluyen reglas para la toma de de nalmente, el costo de la creación y prueba
cisiones, aportadas por los mismos expertos! de una fórmula para la toma de decisiones
En algunos casos, expertos bien informados es, a menudo, prohibitivo. 'V
sobre la situación particular pueden agregar Aun así, la utilización de “sistemas de
más información intuitiva o subjetiva de úl
apoyo para ía toma de decisiones” está en
timo momento (Holzworth, 1996; Whitecot-
crecimiento. Por ejemplo, jugadores Exper
ton, 1996). Aunque los mecanismos de
tos de ajedrez han desarrollado sistemas de
ayuda para la toma de decisiones puedan pa
ayuda que algunas veces, pueden serjn á s
recer inflexibles, y por lo .tanto “inhuma
“inteligentes” que sus propios creadores,,
nos”, estos mecanismos y fórmulas pueden
modificarse tantas veces como, sea.necesa-,. por el simple hecho de ser completamente
rio. Lo que no debe hacerse con ninguno de! coherentes. Es así como algunos júgadores
estos mecanismos de ayuda es dejarlos de de ajedrez se sienten cómodos: utilizando
lado cada vez. que una persona tiene un pre sistemas de apoyo para la toma dé decisio
sentimiento que le indica que puede desem nes, cornei fm de mantener una línea duran
peñarse mejor sin ellos. te. ei jüegó. Es lógico esperar que médicos,
Sin embargo, habiendo resumido todo psicólogos clínicos e ingenieros también
esto, Kleinmuntz (1990) observó que en la adopten fórmulas con reglas-generadas por
mayoría de los casos en los que es necesa- ■ ellos mismos, particularmente para contra
río tomar decisiones, aún se utilizan los rrestar los efectos, del cansancio o el interés
dictámenes humanos en lugar de las fórmu emocional. Posiblemente lleve tiempo, pe
las o fórmulas combinadas, con cognición, ; ro todos tendremos que reconocer que pue
que son más acertadas. Cuando las apues de ser más humano evitar decisiones
tas son altas, como en los casos de vida o subjetivas y preocupantes cuando existen
muerte, la mayoría de las personas aún tie- sistemas de apoyo objetivos. ■
Otro ejemplo
Analicemos otro ejemplo. Terpstra y Rozell (1997) realizaron un estudio sobre la manera en que
ios directores de personal de empresas obtienen información sobre nuevos desarrollos en su cam
po. Los investigadores enviaron cuestionarios a una muestra de grandes empresas norteamerica
nas elegidas al azar. Los cuestionarios solicitaban a los gerentes de personal que indicaran en qué
medida utilizaban distintas fuentes de información, incluidas fuentes académicas (tales como ar-
tícuios de investigación), fuentes profesionales (tales como revistas profesionales de comercio) y
consultores profesionales. Los cuestionarios también indagaban sobre la rentabilidad de la em
presa durante los últimos cinco años.
La tabla 4-8 muestra los resultados, divididos por tipo de empresa. Examinemos los resulta
dos de las empresas de servicio. Eí R2 total era de 0,60, es decir, que al predecir la rentabilidad se
puede reducir un 60% del error cuadrátíco, conociendo la medida en la que se utilizan estas dis
tintas fuentes de información. Ahora veamos las correlaciones bivariadas. Queda claro que las
fuentes académicas son muy importantes. La correlación entre las fuentes académicas y la renta
bilidad era de 0,64, una correlación bastante importante. La utilización de fuentes profesionales
también estaba fuertemente relacionada con la rentabilidad, mientras que la utilización de consul
tores como fuente de información tenía una correlación con la rentabilidad de sólo el 0,23.
Pasemos ahora al coeficiente de regresión. Cabe destacar que son b y no beta, y qué'no es
tán estandarizados, aunque en su artículo los investigadores aclaran que antes de realizar el
análisis de regresión múltiple convirtieron los valores de utilización de información en puntua
ciones Z. Por lo tanto, las variables predictoras, siendo todas puntuaciones Z, están en la misma
escala. Es decir que las diferencias entre los b no se deben a que las variables predictoras estén
en diferentes escalas, sino a las diferencias entre las asociaciones particulares de cada b con la
variable dependiente.
La principal cuestión que se desprende de la tabla es que las fuentes académicas y profesio
nales presentaban las relaciones particulares más importantes con respecto a la rentabilidad.
Sin embargo, examinar las cifras referidas a consultoría resultará especialmente interesan
te con respecto a lo que significa la regresión múltiple. La consultoría presentó una correlación
bivariada positiva de 0,23 con la rentabilidad. Aun así, en el contexto de la regresión múltiple,
la relación de la consultoría con la rentabilidad es bastante negativa.4 Es decir, considerada por
sí sola, una mayor consultoría está ligada a una mayor rentabilidad. ¡Pero si tenemos en cuenta
cualquier nivel fijo de información académica y profesional, a mayor consultoría, menor renta
bilidad!
Una explicación posible para esta aparente paradoja sería que el valor positivo de la consulto-
ría se superpone con la obtención de información de otras fuentes. Tal vez las empresas interesa
das en obtener información utilizan más todas las fuentes. Por lo tanto, la correlación positiva
entre consultoría y rentabilidad se debería a que ambas son causadas por un tercer factor (interés
en la información en general). En realidad, una vez que se toma en cuenta esta tendencia general
a obtener información, la consultoría podría dañar la rentabilidad debido a que es muy costosa.
Esta es sólo una explicación posible. Lo importante es que aplicar la regresión múltiple reveló un
patrón de resultados que podría no haberse notado antes de la investigación y que debería generar
ideas con una nueva orientación.
Otro tema importante es que, al menos para el caso de las empresas de servicio, contar con un
gerente de personal que lee artículos de investigación académica puede ser muy rentable.
4 Este es un ejemplo de lo que técnicamente se denomina supresión. En el ejemplo que estamos analizando, puede con
siderarse que la asociación positiva general con la rentabilidad presenta dos aspectos: una asociación positiva y una
asociación negativa. En este caso, el aspecto positivo se superpone con las otras variables de predicción. Por lo tanto,
cuando se incluyen las otras variables de predicción eti la regresión, se “suprime” la superposición. (Es decir, su influ
encia es eliminada de la asociación única entre la consultoría y la rentabilidad, representada por beta). El resultado es
que sólo e l aspecto restante, la asociación negativa, forma parte de beta. En términos más generales, la supresión ocurre
siempre que el coeficiente de regresión de detemiinada variable de predicción es de signo opuesto a su correlación
bivariada con la variable dependiente, (Existe otro tipo de situación que también presenta supresión: cuando beta es
mayor que la correlación bivariada).
(febla 4-8.
Resaltados del análisis de regresión y correlación de ia relación entre utilización de fuentes de
información y rentabilidad en distintos tipos de empresas.
P ro d u cció n S e r v id o s V enta p or m a y o r /m e n o r F in a n ciera s
F u en te d e b r b r b r b r
in fo rm a ció n
A cadém ico - 0 ,0 9 0 ,0 4 0,7 2 * * 0,6 4 * * -0 ,0 8 -0 ,0 7 0,17 0 ,2 6
Profesional - 0 ,0 5 0 ,0 9 0 ,4 5 * * 0 ,4 9 * * 0,08 -0 ,0 1 0 ,1 0 0,23
Consultaría 0 ,2 9 ’ 0,22* - 0 ,3 6 0,23 -0 ,1 2 -0 ,1 1 0 ,1 2 0,06
R2 0 ,0 6 0 ,6 0 0 ,0 2 0 ,1 0
F 1,17 6 ,6 i* * 0,11 0,37
Nota: L os tamaños de las maestras, en el caso de empresas de producción, servidos, venta por mayor o menor y
financieras eran de 63 a 6 5 , 1 6 a 1 8 ,2 0 a 2 2 y 1 3 a l5 , respectivamente. N o se realizaron análisis en el área de transporte
o comunicación, com o tampoco en las áreas de agricultura, minería o construcción, debido a restricciones con respecto
al tamaño de las muestras.
*p < 0,10. * * p < 0 ,05.
Fuente: Teipstra, D. E., & Rozell, E. J. (1997), tab 6. “Fuentes de información para recursos humanos y su relación con
la rentabilidad institucional”. P e r ió d ic o so b re C ien cia d e l C o m p o rta m ien to A p lic a d a [J o u rn a l o f A p p lie d B eh a vio ra l
Scien ce), 3 3 ,6 6 -8 3 , Copyright, 1997, por el NTL ínstitute, Inc. Reimpreso con autorización de Sage Publícations. Inc,
CONTROVERSIAS Y LIMITACIONES
Todas las limitaciones que se plantearon al tratar el tema de la correlación (capítulo 3) se aplican
en igual o mayor medida a la regresión bivariada y múltiple. Los cálculos de regresión subesti
man el grado de posibilidad de predicción si la relación implícita es curvilínea, si el grupo estu
diado tiene un rango restringido o si las medidas no son perfectamente confiables. Es decir, en
cada uno de estos casos, R Y R%(y generalmente b y p) son menores de lo que deberían ser para
reflejar el verdadero grado de asociación de las variables de predicción con la variable dependien
te, La regresión por sí sola tampoco indica la dirección de causalidad implícita. La dirección de
causalidad depende del .diseño experimental (véase apéndice A). Es importante ser muy cuidado
so al leer artículos de investigación ya que, incluso en las publicaciones, a veces los investigado
res pasan por alto estas limitaciones cuando analizan los resultados de regresiones complejas.
Existe actualmente una controversia con respecto a la regresión múltiple que cuestiona cómo
juzgar la importancia relativa de las diferentes variables de predicción al predecir la variable de
pendiente. En cuanto a los fines de predicción exclusivamente, los coeficientes de regresión (tanto
estandarizados como de puntuaciones originales) cumplen bien esa función, pero no necesaria
mente son ideales para comprender la importancia de los diferentes elementos de predicción desde
el punto de vista teórico. Como observamos anteriormente, un coeficiente de regresión indica la
contribución particular de la variable predictora a la predicción, independientemente de los otros
predictores. Una variable puede tener aparentemente una importancia bastante diferente en rela
ción con los otros predictores, cuando se predice sólo a partir de ella, sin tener en cuenta esos otros
elementos (es decir, utilizando la correlación ordinaria entre esa variable y la variable dependien
te). Por ejemplo, en el estudio de la delincuencia y el consumo de drogas, los coeficientes beta su
gerían que el consumo de tabaco era más importante en la predicción de la delincuencia que el
consumo de marihuana, pero las correlaciones ordinarias sugerían exactamente lo contrario. iVfás
aún, si se agregaran otras variables de predicción, como el consumo de otras drogas ilegales, todo
el pairó« de coeficientes beta podría volver a cambiar. ¿Qué importancia se le atribuye entonces a
una variable de predicción que muestra tantas facetas diferentes en tantos contextos diferentes?
El problema surge en la regresión múltiple debido a que las variables predictoras están corre
lacionadas entre sí. Esta situación se denomina m u ltico lin e a lid a d , y en cierto grado casi siempre
está presente en la regresión múltiple. Por lo tanto, es sorprendente que no exista un método acor
dado sobre cómo juzgar la importancia relativa de las variables predictores. La falta de consenso
no se debe a la falta de propuestas: a lo largo de los años se han estudiado una gran cantidad de
métodos para solucionar este problema (véase Cohén & Cohén, 1983). La mayoría de los exper
tos recomiendan utilizar toda la información disponible acerca de los distintos aspectos de impor
tancia relativa. Es decir, tener en cuenta tanto las correlaciones ordinarias como los coeficientes
de regresión sin olvidar la diferencia entre lo que cada uno de estos datos indica. El coeficiente
de correlación indica la asociación general de la variable predictora con la variable dependiente,
mientras que el coeficiente de regresión indica la asociación individual de la variable predictora
con la variable dependiente, más allá de las otras variables de predicción.
Además de estas y otras controversias relacionadas con ios aspectos estadísticos, durante mu
chos años ha existido una controversia que actualmente continúa en vigencia y que se refiere a la
superioridad de la predicción estadística con respecto a métodos más intuitivos, humanistas o clí
nicos. En el cuadro 4-1 se plantea este tema.
Como observamos anteriormente, los resultados de la regresión múltiple son comunes en los
artículos de investigación, y a menudo se hace referencia a ellos en las tablas. Ya hemos visto
algunos ejemplos (tablas 4-7 y 4-8). Frecuentemente, las tablas incluirán algunos otros cálcu
los estadísticos, además de aquellos que hemos tratado. Algunos están relacionados con la
significación estadística (véase en el capítulo 3 una breve exposición sobre la significación
del coeficiente de correlación); otros serán tratados en el capítulo 17. De todos modos, es po
sible comprender casi toda la información importante incluida en esas tablas sólo con lo
aprendido aquí.
Analicemos los resultados de un estudio realizado por Jehn y Shah (1997) sobre el desempe
ño de grupos formados por tres personas que debían realizar en forma conjunta tareas físicas y de
toma de decisiones en una situación de laboratorio. Los investigadores grabaron las interacciones
en video y analizaron las cintas para estudiar varios aspectos de la interacción grupal. La tabla
4-9 muestra el coeficiente de regresión para la predicción del desempeño a partir de varias cuali
dades de interacción. Se puede observar que la comunicación positiva y la planificación presentan
coeficientes beta relativamente bajos (y negativos), mientras que el compromiso, el control y la
T a b la 4 -9 .
R e s u m e n d e l a n á lis is de r e g r e sió n c o n v a r ia b le s d e p r e d ic c ió n d e l d e s e m p e ñ o .
V ariable B SEB ß
C om unicación positiva 0 ,288 0 ,228 -0 ,1 2 7
Planificación 0 ,062 0 ,055 - 0 ,1 9 0
C om prom iso 1,340 0,134 0 ,4 3 2 *
Control 1,210 0 ,049 0,449*
C ooperación 0 ,7 8 0 0 ,1 5 4 0,376*
RESUMEN
La predicción (o regresión) bivariada se utiliza para predecir valores de una variable dependiente
sobre la base de valores de una variable predictora. La mejor norma o modelo para predecir la
puntuación Z de una persona en una variable dependiente es multiplicar un número denominado
coeficiente de regresión estandarizado (beta) por la puntuación Z de esa persona en la variable
predictora. El mejor número para utilizar como coeficiente de regresión estandarizado en la pre
dicción bivariada es el coeficiente de correlación.
También se pueden realizar predicciones con puntuaciones originales convirtiendo el valor
observado de una persona en la variable predictora en la puntuación Z correspondiente, multipli
cándolo por beta, y luego convirtiendo la resultante puntuación Z predicha de la variable depen
diente nuevamente en una puntuación bruta. Los tres pasos anteriores pueden combinarse en una
sola fórmula que permite predecir la puntuación original de una persona en la variable dependien
te, a partir, directamente, de la puntuación original de esa persona en la variable predictora. Esta
fórmula presenta dos partes principales: un coeficiente de regresión (denominado b) que se multi
plica por la puntuación original de la persona en la variable dependiente y una constante de regre
sión (denominada d) que se suma al resultado. Si en un gráfico con las dos variables se dibujan los
valores predichos, a través de esta fórmula para la variable dependiente se trazará la recta de re
gresión. La pendiente de la recta de regresión es igual al coeficiente de regresión para las puntua
ciones originales; la constante de regresión indica dónde esta recta cruza el eje vertical (es la
ordenada del punto de la recta con abscisa 0).
La exactitud de la predicción puede estimarse aplicando el modelo de predicción a los valores
en los que se basó la correlación original. La diferencia entre cada valor observado y lo que hubie
ra sido predicho para ese individuo, utilizando el modelo de predicción, se denomina error. Ele
vando estos errores al cuadrado y sumándolos obtenemos la suma de errores cuadráticos (55Error).
Luego, se compara SS-g^ con la suma de errores cuadráticos obtenida utilizando sólo la media de
la variable dependiente como valor predicho (SSTotal). La reducción del error cuadrático lograda
utilizando el modelo (SSTotal - SSErT0[L dividida por el error cuadrático al predecir utilizando la
media de la variable dependiente (&5To{aJ), se denomina reducción proporcional de error o propor
ción de la varianza explicada, que es igual al cuadrado del coeficiente de correlación.
En la regresión múltiple, se predice una variable dependiente utilizando dos o más variables
predictoras. Cada variable predictora se multiplica por su propio coeficiente de regresión, y los
resultados se suman para realizar la predicción. (Cuando se utilizan puntuaciones originales, tam
bién se suma una constante de regresión). Cada coeficiente de regresión indica la relación del pre-
dictor con la variable dependiente en el contexto de las otras variables de predicción. El
coeficiente de correlación múltiple describe el grado general de asociación entre la variable de
pendiente y las variables de predicción tomadas en su conjunto.
Las regresiones bivariada y múltiple tienen las mismas limitaciones que la correlación ordi
naria. Además, en la regresión múltiple generalmente existe una ambigüedad considerable al in
terpretar la importancia relativa de las variables predictoras.
Términos clave
- Predicción bivariada. - Reducción proporcional - Coeficiente de regresión
- Regresión bivariada. del erro^r2, R2). estandarizado (b).
- Error. - Fórmula de predicción con - Suma de los errores
- Correlación múltiple. puntuaciones originales. cuadráticos (S S Bnor).
- Coeficiente de correlación - Coeficiente de regresión para - Error cuadrático total al
múltiple (/?). puntuaciones originales (b). predecir utilizando la media
- Regresión múltiple. - Coeficiente de regresión.
- Modelo de predicción. - Constante de regresión (a).
- Proporción de varianza - Recta de regresión.
explicada (r2, R2). - Pendiente.
Ejercicios SERIE 1
1. Un psicólogo especializado en deportes, que
Los ejercicios implican la realización de cálcu trabaja con atletas de un deporte en particular,
los (con la ayuda de una calculadora). La ma ha descubierto que los valores observados en
yoría de los problemas estadísticos reales se una prueba de conocimientos sobre fisiología
resuelve por computadora. Pero aunque exista presentan una relación de 0,4 con la cantidad
la posibilidad de utilizar una computadora, es de lesiones sufridas durante el año subsiguien
conveniente realizar estos ejercicios a mano te. Ahora el psicólogo planea probar atletas
para incorporar el método de trabajo. nuevos y utilizar esta información para prede
Para adquirir práctica en la utilización de cir la cantidad de lesiones que pueden llegar a
una computadora, para resolver problemas es sufrir, a) Indique la variable predictora, la va
tadísticos, se puede utilizar la sección de compu riable dependiente y beta; b) escríba el modelo
tación de cada capítulo, publicada en la G u ía d e de predicción con puntuaciones Z, y c) indique
e s tu d io y lib r o d e ta r e a s d e c o m p u ta c ió n p a r a e l puntuaciones Z predichas para la cantidad de
a lu m n o [ S tu d e n t’s S tu d y G u id e a n d C o m p u te r lesiones que sufrirán los atletas cuyas puntua
W o r k b o o k ] que acompaña este texto. ciones Z en la prueba sobre fisiología son -2,
Todos los datos de esta sección son ficticios (a -1, 0, +1 y +2.
menos que se especifique lo contrario). 2. Determine el modelo de predicción con
Las respuestas a los ejercicios de la serie I se puntuaciones origínales para los puntos (a) a
encuentran al final del libro. (g) que aparecen a continuación. Construya
después un sólo gráfico que muestre todas las
rectas de regresión, rotulando cada una con su
letra correspondiente, (Construya un gráfico lo
suficientemente grande como para que las rec ciente-terapeuta; c) dibuje el diagrama de dis
tas queden claramente separadas). persión e incluya en él Ja recta de regresión; d)
calcule el error y el error cuadrático para cada
V a ria b le V ariable
una de las cuatro predicciones; e) encuentre la
d e p e n d ien te (K) d e p red icció n (V)
reducción proporcional del error (utilizando
M SD M SD r 55E[TOr y 55Tolal); f) halle la raíz cuadrada de la
(a) 10 2 ,0 10 2 ,0 0 ,4
20 2 ,0 10 2,0 0,4
reducción proporcional del error calculada para
(b)
(c ) 10 2 ,0 20 2 ,0 0,4 comprobar si concuerda con el coeficiente de
(d) 10 2 ,0 10 4,0 0,4 correlación, y g) explique los procedimientos
(e) 10 4 ,0 10 2,0 0 ,4 realizados a alguien que comprende qué es la
(f) 10 2 ,0 10 2,0 - 0 ,4
media, el desvío estándar, las puntuaciones 2 y
(g) 10 2 ,0 10 2,0 0,8
el coeficiente de correlación, pero que no sabe
nada más sobre estadística.
3. Un profesor ha descubierto que las notas 5. En el capítulo 3, el ejercicio 2 de la serie I
en el examen parcial predicen las notas en el fi planteaba el caso de un instructor que preguntó a
nal La fórmula de predicción con puntuacio cinco estudiantes cuántas horas habían estudia
nes originales es: do para un examen. Aquí mostramos la cantidad
Nota en el final = 40 + (0,5)(nota en el parcial) de horas de estudio y las calificaciones, junto
Calcule las notas predichas para el examen con las medias y los desvíos estándares. La co
final de cada uno de ocho alumnos, cuyas no rrelación era de 0,84 y la SST(Jtaí correspondiente
tas en el parcial fueron 30, 40, 50, 60,70, 80, a las calificaciones era de 1.110. a) Determine la
90 y 100. fórmula de predicción con puntuaciones origi
4. En el capítulo 3, serie i, ejercicio 1, des nales para predecir las calificaciones a partir de
cribimos un''estudio en el cual un investigador las horas de estudio; b) utilice la fórmula para
estaba interesado en la relación entre el grado de encontrar las calificaciones predichas para cada
empatia que lograban los psicoterapeutas y el uno de los cinco estudiantes; c) dibuje el diagra
grado de satisfacción de sus pacientes con la te ma de dispersión e incluya en él la recta de re
rapia. Como estudio piloto, se analizaron cuatro gresión; d) calcule el error y el error cuadrático
parejas de pacientes y terapeutas. Más abajo se para cada una de las cinco predicciones; e) de
detallan los resultados, incluso las medias y los termine la reducción proporcional del error (uti
desvíos estándares. El coeficiente de correlación lizando SSEmr y SSTotal); f) saque la raíz
era 0,90, y el SSTo(al correspondiente al grado de cuadrada de la reducción proporcional del error
satisfacción del paciente era 10. calculada para comprobar si concuerda con el
N úm ero E m p a tia S a tisfa cció n coeficiente de correlación, y g) explique los
d e p a reja te ra p eu ta (X) p a c ie n te ( 3 ) procedimientos realizados a alguien que com
1 7 0 ,5 8 4,58
prende qué es la media, el desvío estándar, las
2 9 4 ,58 5 ,5 8 puntuaciones Z y el coeficiente de correlación,
3 3 6 ,58 2 ,5 8 pero que no sabe nada más sobre estadística.
4 4 8 ,58 1,58
M 62 3 H o r a s de estu d io (X ) C alifica cio n es (30
SD 2 2 ,1 4 1,58 0 52
10 95
a) Determine la fórmula de predicción con 6 83
8 71
puntuaciones originales para predecir la satis 64
6
facción a partir de la empatia; b) utilice esta fór
mula para encontrar los valores de satisfacción 6 73
3,35 14,90
predichos para cada una de las cuatro parejas pa
6. Interesados en la influencia que podría
ple en el que se incluyen la enseñanza no social
ejercer el estilo con que una madre ayuda a su y el entrenamiento social como predictores de la
hijo a comprender las interacciones sociales aceptación por parte de pares. La “ecuación 2”
sobre la vida social real del niño, Mize y Pettít se refiere al modelo de regresión múltiple en el
(1997) realizaron los arreglos necesarios para que el estilo de reacción y el entrenamiento so
filmar en video a 43 madres voluntarias y a sus cial se incluyen predictores de la aceptación por
hijos de 3 a 5 años de edad, en tres sesiones in parte de los pares. Explique el significado de los
dependientes. En la sesión principal, se mos resultados de aceptación por los pares como si
traban a las madres y a los niños cintas de video
se estuviera escribiendo para una persona que
de otros niños que se comportaban de modo
comprende qué es una correlación pero que nun
hostil o se rechazaban unos a otros; después,
las madres discutían con los niños lo observado ca ha oído hablar de análisis de regresión o re
en los videos. Luego, los psicólogos clasifica gresión múltiple. (Se puede ignorar la columna
ban a cada madre según el “entrenamiento so srj, “correlación semiparcial”, véase nota al pie
cial”, como por ejemplo, el modo en el que las número 3. Todos los datos necesarios para inter
madres habían ayudado a sus hijos a compren pretar esta tabla se encuentran en las columnas
der lo que habían visto y les habían sugerido r, R2 y beta).
formas más positivas de manejar la situación. 7. a) Sobre la base de la tabla 4-10, sección
Se clasificaron los videos de las madres y los “aceptación por los pares”, escriba la ecuación
niños jugando según el “estilo de reacción” de l (una ecuación de regresión con puntuaciones
las madres, es decir, la calidez y la capacidad Z). Luego calcule la puntuación Z predicha pa
de crear armonía con los niños. Finalmente, en ra la aceptación por los pares, correspondiente
la última sesión, se clasificaron los videos de a niños cuyas madres presentan las siguientes
los niños armando crucigramas en cuanto a la puntuaciones Z.
enseñanza “no social” por parte de las madres,
es decir, el modo en que las madres ayudaban a M a d r e E n señ an za E n tr e n a m ie n to
sus hijos a desarrollar su capacidad de resolu no socia l so c ia l
A -2 0
ción de problemas. En otra etapa del estudio,
B 0 0
los investigadores realizaron preguntas a los C 2 0
niños sobre cuánto les gustaban los otros niños, D 0 -2
Utilizando esta información, pudieron obtener E 0 2
una medida general de cuánta apreciación goza F 2 2
ba cada niño, a lo que denominaron “aceptación G -1 2
por parte de sus pares”.
Los investigadores desarrollaron la hipóte
sis de que se podría predecir la aceptación de b) Escriba la ecuación 2 y calcule la pun
un niño por parte de sus pares a partir de lo tuación Z predicha para la “aceptación por los
adecuada o inadecuada que fuera la madre co pares”, correspondiente a niños cuyas madres
mo entrenadora social. También desarrollaron presentan los siguientes puntuaciones Z:
la hipótesis de que la relación entre el nivel de
M adre E stilo E n tr e n a m ie n to
entrenadora social de la madre y la aceptación social
de reacción
por parte de los pares se sostendría aun en una A -2 0
ecuación de regresión múltiple que incluyera B 0 0
entrenamiento no social, y en una ecuación de C 2 0
regresión que incluyera estilo de reacción. D 0 -2
La sección “aceptación por sus pares” de E 0 2
la tabla 4-10 muestra ios resultados. La “ecua F 2 2
G „1 -2
ción 1" se refiere al modelo de regresión múlti
T ab la 4-10.
Análisis de regresión simultáneo para la predicción de la habilidad social, la agresión y la acepta
ción por los pares, clasificados por maestros en el estudio 1.
Criterio
V ariables de predicción r R* ■
íri Beta r R2 sri Beta r R2 *r i Beta
Ecuación 1:
Enseñanza no social 0,21 0,10 0,10 0,15 0,05 0,06 -0,35* -0,23 -0,24
Entrenamiento social 0,36* 0,14 0,30 0,32 0,31* 0,10 0,28 0,29 -0,41*** 0,22** -0,32 -0,33*
Ecuación 2:
Estilo de recreación 0,34* 0,26 ' 0,27 0,25 0,18 0,18 -0,26 -0,16 -0,17
Entrenamiento social 0,36* 0,19* 0,28 0,29 0,3 F 0,13 0,25 0,26 -0,41*** 0,20* -0,36 -0,37*
SERIE 11
Variable Variable
1. Elija algo que resulte interesante pre dependiente (F) de predicción ( X )
decir y busque la información necesaria para
M SD M SD r
poder predecirlo. (Ambas deberían ser cosas (a) 0 1,0 0 1,0 0 ,3
que puedan medirse en una escala numéri (b) 5 1,0 5 1,0 0,3
ca). Luego escriba el modelo de predicción, (c) 0 5,0 0 5,0 0,3
anotando el nombre de la variable predictora (d) 0 1,0 5 5 ,0 0,3
más, estime un número para beta que tenga 3. En el capítulo 3, serie II, ejercicio 1,
sentido, teniendo en cuenta lo aprendido so cuatro individuos recibieron una prueba de
bre los valores que se están prediciendo. Fi destreza manual (valores altos significan ma
nalmente, explique por qué se eligió ese yor destreza) y una prueba de ansiedad (valores
tamaño de beta. altos significan mayor ansiedad). A continua
2. Determine el modelo de predicción con ción indicamos los valores observados, medias
puntuaciones Z y el modelo de predicción y desvíos estándares. Calcule primero la corre
con puntuaciones originales para cada uno de lación entre destreza y ansiedad (o refiérase a
los siguientes casos. Además, prepare un solo la respuesta en el capítulo 3). La SSTota[ corres
gráfico que muestre todas las rectas de regre pondiente a ansiedad era 84.
sión ( puntuaciones originales) y rotule cada a) Determine la fórmula de predicción con
una de ellas con la letra correspondiente desde puntuaciones originales para predecir la ansie
la (a) hasta la (e), y que sea lo suficientemente dad a partir de la destreza; b) utilice la fórmula
grande como para que las rectas estén clara para calcular los valores de ansiedad predi
mente separadas. chos para cada uno de los cuatro individuos es
tudiados; c) dibuje el diagrama de dispersión e dores formularon una serie de preguntas sobre
incluya en él la recta de regresión; d) calcule el eí caso. Los investigadores estaban particular
error y el error cuadrático para cada una de las mente interesados en las respuestas de 177 in
cuatro predicciones; e) calcule la reducción dividuos que creían probable que Simpson
proporcional del error (utilizando SSEmx y SS- fuera culpable y, en especial, en la creencia que
Totai); saque la raíz cuadrada de la reducción estas personas tenían respecto de la retribu
proporcional del error calculada para controlar ción: hasta qué punto estaban de acuerdo o no
si concuerda con el coeficiente de correlación, con la afirmación “el castigo debería hacer su
y g) explique lo realizado a alguien que com frir a Simpson lo que él hizo sufrir a otros”. Los
prende la media, el desvío estándar, las pun investigadores se centraron en una cantidad de
tuaciones Z y el coeficiente de correlación, posibles factores que influían sobre esas creen
pero que no sabe nada más sobre estadística. cias. Los factores incluían el “control” (cuánto
control creían ellos que Simpson tenía sobre
P e r so n a D estreza A n sied a d
sus acciones en el momento del crimen), la
1 1 10 “responsabilidad” (cuán responsable por el cri
2 i 8 men creían ellos que él era), cuánta “ira” sen
3 2 4
4 4 -2
tían hacia él, cuánta “compasión” sentían por
él, la “estabilidad" (hasta que punto creían que
M 2 5
sus acciones representaban un comportamiento
SD 1,22 4 ,5 8
estable o temporario) y la "expectativa” (si creían
4. Repita el ejercicio 3 resolviendo los que volvería a cometer un crimen de esa índole).
puntos desde (a) hasta (f), pero prediciendo es El informe decía:
ta vez la destreza a partir de la ansiedad. Luego L a tab la [4 -1 1 ] rev ela un a p o y o p arcial a
indique qué resultados son diferentes y cuáles n u estras h ip ó te sis . C o m o era d e esp erar
son iguales a los obtenidos en el ejercicio 3 s e , lo s p r e d icto res m ás im p ortan tes en
(Nota; S5Total correspondiente a destreza es 6). cu a n to al o b jetiv o d e retrib u ción (h a cer
5. Ciertos psicólogos especializados en te su frir a S im p so n ) fu eron la s d e d u c c io n e s
mas sociales que investigan temas relacionados r ela cio n a d a s c o n la resp o n sa b ilid a d y las
con la justicia penal están interesados desde e m o c io n e s m o r a le s d e ira y c o m p a sió n .
hace mucho tiempo en la influencia de varios L a esta b ilid a d y la e x p e cta tiv a fu e
factores en los sentimientos que despierta en el ron [p red ictores] r elativam en te d é b ile s .
público el castigo impuesto a los criminales.
( p .337)
Graham y sus colegas (1997) aprovecharon el
muy famoso juicio de la estrella de fútbol ame Explique estos resultados a una persona que
ricano O. J. Simpson para probar algunos te comprende qué es una correlación pero que nun
mas básicos en este campo. Durante los prime ca ha escuchado hablar sobre análisis de regre
ros días después de que Simpson fue acusado sión o regresión múltiple. (Haga referencia sólo
de haber matado a su ex esposa, los investiga a la parte de la tabla sobre retribución. La colum-
P e r so n a A B c D E F G H 1 J
Control 1 0 0 0 0 0 I 0 Ì -l
Responsabilidad 0 í 0 0 0 0 i 0 l -1
Ira 0 0 1 0 0 0 1 1 1 -1
Com pasión 0 0 0 1 0 0 0 I 1 „1
Estabilidad 0 0 0 0 1 0 0 0 1 „1
Expectativa 0 0 0 0 0 1 0 0 1 „1
ña r, qué se refiere a significación estadística de Calcule el coeficiente de correlación, deter
ios resultados, se puede ignorar). mine el modelo de predicción con puntuacio
ó. Sobre la base de la tabla 4-11 del ejerci nes origínales para predecir la altura de una
cio 5, escriba la ecuación de regresión para persona a partir de la altura de su madre y pre
predecir la retribución. Luego determine la pare un gráfico que muestre la recta de regre
puntuación Z predicha para retribución corres sión. Finalmente, sobre la base del modelo de
pondiente a las personas desde A hasta J, cuyas predicción determinado, prediga la altura de
puntuaciones Z en cada variable predictora se una persona de su mismo sexo cuya madre
detallan a continuación. mide a) 5 pies, b) 5 pies y 6 pulgadas y c) 6
7. Pregunte a cinco alumnos de su mismo pies. (Nota: Convierta las pulgadas en deci
sexo (cada uno proveniente de una familia di males de los pies o resuelva todo el problema
ferente) cuál es su altura y la de sus 'madres. utilizando pulgadas),
Tabla 4-11.
Regresiones múltiples que predicen el castigo deseado a partir de variables de imputabilidad
(estudio 1).
C astig o d esea d o ________________________________________________ ______ _ _ _
Retribución Rehabilitación Protección Disuasión
P red icto res P t P i P t P t
Control -0 ,0 5 < 1,07*** -0 ,0 5 < 1,07*** -0 ,0 3 < 1,07*** -0 ,1 5 1,90*
Responsabilidad -0 ,1 7 -2 ,0 7 * * * - 0 ,0 0 < 1,07*** -0 ,0 4 < 1,07*** - 0 ,1 9 -2 ,1 5 *
Ira - 0 ,3 0 -4 ^ 4 * * * -0 ,1 1 _ í ¡4 * * * -0 ,0 3 <1,07*** - 0 ,0 4 <i;oo*
C om pasión -0 ,3 0 -3 ,6 8 * * * - 0 ,3 9 -5 ,1 8 * * * -0 ,0 7 <1,07*** - 0 ,1 3 - 1 ,5 4 *
Estabilidad -0 ,0 1 < 1 ,0 7 * * * - 0 ,3 4 -4 ,8 5 * * * - 0 ,1 9 2 ,3 3 * * * - 0 ,0 4 < 1 ,00*
Expectativa - 0 ,1 0 -1 ,3 3 * * * -0 ,0 6 < 1,07*** -0 ,2 7 3,36*** - 0 ,0 8 - 1 ,0 4 *
R1 -0 ,2 7 * * * -0 ,3 7 * * * 0,17*** - 0 ,1 8 *
C
o la efectividad de algunos procedimientos prácticos. Por ejemplo, un psicofisiólogo
podría medir los cambios en el ritmo cardíaco desde antes hasta después de resolver
un problema difícil, y las mediciones podrían utilizarse luego para probar una teoría
que predice que el ritmo cardíaco debería cambiar después de la solución exitosa de
un problema. Un psicólogo especializado en temas sociales podría analizar la efectividad de un
programa de reuniones vecinales con el fin de fomentar la conservación del agua. Tales estudios
se realizan con un grupo determinado de personas que participan en la investigación, pero los in
vestigadores utilizan la estadística ínferencial para sacar conclusiones más generales sobre prin
cipios teóricos o procedimientos en estudio. Las conclusiones exceden el límite del grupo
determinado de personas que participan en la investigación.
En este capítulo, al igual que en los capítulos ó, 7 y 8, presentamos la estadística Ínferencial,
que establece los cimientos para la mayor parte de lo que resta del libro. El capítulo trata tres te
mas: curva normal, probabilidad y población versus muestra. Es un capítulo comparativamente
corto, el cual prepara el camino para los próximos, que son más complejos.
DISTRIBUCIÓN NORMAL
En el capítulo 1 observamos que los gráficos de muchas distribuciones de variables estudiadas
por los psicólogos (al igual que muchas otras distribuciones naturales) presentan forma de cam
pana, aproximadamente simétrica y unimodal. Estos histogramas o polígonos de frecuencias con
forma de campana se aproximan a una distribución matemática precisa e importante denominada
distribución norm al o, simplemente, curva norm al.1 (Con frecuencia también se la denomi
na distribución de Gauss, en honor ai astrónomo Karl Friedrich Gauss. Sin embargo, si su des
cubrimiento puede atribuirse a alguien, realmente debería atribuírsele a Abraham De Moivre,
véase cuadro 5-1). La figura 5-1 muestra un ejemplo de curva normal.
Figura S-l.
Una curva normal.
/W = ? 2 *
donde/(jc) es la altura de la curva enel puntox , y ir son las constantes matemáticas usuales (aproximadamente 3,14 y
2,72 respectivamente). Sin embargo, los psicólogos Investigadores casi nuncautilizanesta fórmula, ya que está inclui
daen los distintos programas paracomputadoras que realizancálculos estadísticos con curvas normales. Ycuando de
benrealizarel cálculo manualmente, cualquierinformación necesariasobre la curva normal aparece en tablas en los
libros de estadística (porejemplo, la tabla B-l en la tíUima parte de este libro).
; ~ . /y ' . ~ Cuadro 5-1.
,De Móivré, el excéntrico desconocido que inventó la curva normal.
y simétrica no garantiza que sea cercana a una curva normal; sus colas podrían ser demasiado altas
o demasiado bajas. Sin embargo, puede demostrarse matemáticamente que, a la larga, si las cir
cunstancias ocurren realmente al azar, el resultado será una perfecta curva normal. (La prueba pue
de encontrarse en algún texto de estadística matemática). Los estadísticos matemáticos llaman a
este principio el teorema del límite central. Veremos más sobre este principio en el capítulo 7.
'* N. de ia Trad.: Un “coffee h ou se " es similar a lo que nosotros llamamos “confitería” o “café”.
desvío estándar por sobre la media nos permite saber que aproximadamente el 34% de las perso
nas tienen registros Cí entre 100 (la media de los Cí) y 116 (el cí a 1 desvío estándar por encima de
la media). Dado que la curva normal es simétrica, aproximadamente un 34% de las personas tienen
un cí entre 100 y 84 (el valor ubicado a 1 desvío estándar por debajo de la media), y un 68% (34%
+ 34%) tiene un cí entre 84 y 116.
Observando la curva normal podemos observar algo más: existen muchos menos valores en
tre 1 y 2 desvíos estándar de la media que entre la media y 1 desvío estándar con respecto a ella.
Aproximadamente el 14% de los valores se ubican entre 1 y 2 desvíos estándar por sobre la media
(véase figura 5-2). De modo similar, siendo la curva normal simétrica, aproximadamente un 14%
de los valores se encuentra entre 1 y 2 desvíos estándar debajo de la media. Por lo tanto, aproxi
madamente un 14% de personas tienen cí entre 116 (1 desvío estándar sobre la media) y 132 (dos
desvíos estándar sobre la media).
Será muy útil recordar estos números: 34% y 14%. Las figuras indican el porcentaje de perso
nas por encima y por debajo de cualquier valor en particular sólo con saber la cantidad de desvíos
estándar por encima o por debajo de la media en que se encuentra dicho valor.
También es posible, a partir de un porcentaje, invertir el método y calcular la cantidad de des
víos estándar de la media a los que se encuentra determinada persona. Supongamos que nos infor
man que en determinada prueba una persona presentó un valor dentro del 2% más elevado.
Suponiendo que los valores de la prueba tienen una distribución aproximadamente normal, la per
sona debe tener un valor al menos de dos desvíos estándar por encima de la media. Esto se debe a
que del 50% de los valores ubicados por encima de la media, el 34% se encuentra entre la media y
1 desvío estándar por encima de ella; y otro 14% se encuentra entre 1 y 2 desvíos estándar sobre
la media. Eso deja un 2% (es decir, 50% - 34% -1 4 % = 2%).
De manera similar, supongamos que estamos seleccionando animales para un estudio y nece
sitamos examinar su agudeza visual. Supongamos también que la agudeza visual está normal-
Ejemplos
Analicemos algunos ejemplos utilizando valores de c i Supongamos que una persona tiene un a
de 125. ¿Qué porcentaje de personas tiene mayores valores de ci? Antes de continuar necesitamos
convertir la puntuación original en una puntuación Z, Suponiendo que la media es de 100 y el des
vío estándar de 16, un valor ct de 125 es igual a una puntuación Z de +1,56. Ahora que tenemos la
puntuación Z, el primer paso es realizar el diagrama. En la figura 5-4 hemos sombreado el área
por encima de la puntuación Z de 1,56. Ahora queremos aproximar el porcentaje utilizando la re
gla 50%-34%-I4%. Una puntuación Z de 1 tiene un 16% de valores por encima de ella (esto se
debe a que hay un 34% de valores entre ella y la media, y existe un 50% de valores en total por en
cima de la media; es decir, que queda un 16% de valores por encima de 1 desvío estándar). Como
vimos en uno de los ejemplos anteriores, por encima de una puntuación Z de 2 se ubica el 2%
de los valores; por lo tanto, por encima de una puntuación Z de 1,56 habrá entre el 16% y el 2% de
los valores.
Después de realizar el diagrama y estimar el porcentaje, estamos listos para calcularlo exacta
mente. En la tabla de áreas de la curva normal, 1,56 en la columna “Z” coincide con 44,06 en la
columna “% entre la media y Z”. Por lo tanto, el 44,06 % de las personas tiene valores de ci entre
el a medio y un a de 125 (una puntuación Z de +1,56). En una curva normal, el 50% de las per
sonas se encuentra por encima de la media. Dado que el 44,06% de las personas que se ubican por
encima de la media encuentran a su vez por debajo del a de la persona analizada, queda un res
to del 5,94% (50%-44,06%) de personas por encima del valor de la persona en cuestión. Esa es la
respuesta a nuestro problema (representado por la figura 5-4). Cabe destacar que el porcentaje
calculado se encuentra dentro del rango estimado utilizando la regla de aproximación del
50%~34%~14%.
Analicemos ahora a una persona con un ci de 95. ¿Qué porcentaje de personas presentan
mayores valores de ex que la persona analizada? Siguiendo el procedimiento acostumbrado para
convertir una puntuación original en una puntuación Z, un Cl de 95 es igual a una puntuación Z
de -0,31. La figura 5-5 muestra el diagrama para esta situación. Hemos sombreado el área de la
curva superior a una puntuación Z de -0,31. La puntuación Z que analizamos se encuentra entre
0 y -1. Una puntuación Z igual a 0 tiene un 50% de los valores por encima de sí, y una puntua
ción Z de -1 tiene un 84% de los valores por encima de sí (esto se debe a que un 34% de los va
lores se ubican entre -1 y 0 y otro 50% se ubica por encima de 0, lo que sumado da un total de
84%). Por lo tanto, entre un 50% y un 84% de los valores se ubicarán por encima de la puntua
ción Z d e -0,31.
Realicemos ahora el cálculo exacto. La tabla de áreas de la curva normal muestra que el
12,17% de los valores se encuentran entre la media y una puntuación Z de 0,31. Debido a que la
Ejemplos
Una vez más, utilizaremos en nuestros ejemplos los valores de ci. ¿Qué a necesitaría una persona
para estar dentro del 5% superior? La figura 5-6 muestra nuestro diagrama, donde se observa que
hemos sombreado ei área que representa el 5% superior. Utilizando la regla del 50%-34%~14%,
podemos adelantar que la puntuación Z correspondiente al 5% superior está entre +1 y +2. El cál
culo que realizamos fue el siguiente: del 50% que se encuentra por encima de la media, el 34% se
ubica entre la media y 1 desvío estándar, con lo cual queda un 16% superior a 1 desvío estándar.
Sin embargo, dado que hay un 14% entre 1 y 2 desvíos estándar, queda sólo un 2% superior a 2
desvíos estándar.
Con respecto a la puntuación Z exacta, primero averiguamos el porcentaje entre la media y el
lugar en el que empieza nuestra área sombreada. En este caso, si ei 50% de las personas tienen va
lores de Cí superiores a la media, al menos un 45% de las personas presentan valores de ci ubica
dos entre la persona en cuestión y la media (50% - 5% = 45%). Buscando en la columna “% entre
la media y Z” en la tabla de áreas bajo la curva normal, el valor más cercano al 45% es 44,95%
(también podríamos utilizar el 45,05%). Este porcentaje coincide con una puntuación Z de 1,64
en la columna “Z”, Tal como lo esperábamos según nuestra aproximación inicial, la respuesta se
ubica entre +1 y +2.
Para averiguar la puntuación original podemos utilizar la fórmula del capítulo 2: X =
M + (Z)(SD). Con un Cí medio de 100 y un desvío estándar de 16, llegaríamos a la conclusión de
que para estar dentro del 5% superior, una persona necesitaría un Cí de por lo menos 126,24.
Analicemos ahora qué valor de c í estaría dentro del 2,5% inferior. La figura 5-7 representa
nuestro diagrama del problema, sombreado en la paite correspondiente al 2,5% inferior. El 2%
inferior de una curva normal comienza en el segundo desvío estándar inferior a la media (igual
que el 2% superior comienza en +2). Por lo tanto, podemos estimar que nuestra respuesta estará
en algún punto cercano al -“2. En términos más precisos, el 2,5% inferior significa que, al menos,
el 47,5% de las personas presentan valores de cr ubicados entre el valor de cí que pretendemos de
terminar y la media (50% - 2,5% ~ 47,5%). En la tabla de áreas de la curva normal, el 47,5% en la
columna “% entre la media y Z” coincide con una puntuación Z de 1,96. Debido a que estamos
buscando una puntuación Z por debajo de la media, el número ubicado en la tabla se transforma
en -1,96 (un número bastante cercano a nuestra estimación de -2). Al convertir este resultado en
una puntuación original, el cí correspondiente al 2,5% inferior resulta ser un cí de 68,64.
PROBABILIDAD*lo
El objetivo de la mayor parte de las investigaciones psicológicas es probar la veracidad de una
teoría o la efectividad de un procedimiento. Pero la investigación científica de cualquier tipo só
lo puede llegar a la conclusión de que la veracidad o efectividad resultan más o menos proba
bles; no puede proporcionamos el lujo de la certeza. La probabilidad es muy importante para las
ciencias. En particular, es muy importante para la estadística inferencial, es decir, para los méto
dos utilizados por ios psicólogos para sacar conclusiones sobre teorías o procedimientos aplica
dos a partir de los resultados obtenidos en investigaciones.
La probabilidad ha sido estudiada durante siglos por matemáticos y filósofos y, sin embargo,
aún en nuestros días el tema despierta todo tipo-de controversias. Afortunadamente, sólo necesita-
Interpretaciones de la probabilidad
En estadística, generalmente definimos probabilidad como “la frecuencia relativa con que espe
ramos que suceda un determinado resultado”. Un resultado es la consecuencia de un experimen
to (o de casi cualquier situación en la que la consecuencia no se conoce de antemano, como puede
ser que una moneda caiga cara arriba o que Hueva mañana). La frecuencia indica cuántas veces
sucede determinado hecho. La frecuencia relativa es la cantidad de veces que determinado he
cho sucede en relación con la cantidad de veces que podría haber sucedido, es decir, la razón en
tre la cantidad de veces en que algo sucede y la cantidad de veces que podría haber sucedido.
(Una moneda podría caer cara arriba 8 veces en 12 tiros, con una frecuencia relativa de 8/12 ó
2/3). La frecuencia relativa esperada indica lo que esperaríamos que suceda a largo plazo si re
pitiéramos el experimento muchas veces. (En el caso de una moneda, esperaríamos que en eí lar
go plazo la moneda caiga cara hacia arriba una de cada dos veces). A esto se lo denomina
interpretación de la probabilidad como la frecuencia relativa a largo plazo.
También utilizamos la probabilidad para transmitir en qué medida estamos seguros de que su
cederá un hecho en particular. A esto se lo denomina interpretación subjetiva de probabilidad.
Supongamos que decimos que existe un 95% de probabilidad de que nuestro restaurante favorito
esté abierto esta noche. Podríamos estar aplicando una especie de interpretación de frecuencia re
lativa, lo cual implicaría que si verificáramos si ese restaurante estuvo abierto muchas veces en
días como hoy, descubriríamos que en un 95% de esos días efectivamente estuvo abierto. Sin em
bargo, lo que en realidad queremos decir es probablemente más subjetivo: en una escala del 0% ai
100%, calificaríamos nuestra confianza en que el restaurante estará abierto con un 95%. Para de
cirlo de otro modo, sentiríamos que una apuesta sería justa si se basara en que las chances de que
el restaurante va a estar abierto son del 95%,
La interpretación que uno adopte no afecta la forma de calcular las probabilidades. Presenta
mos estos conceptos aquí por dos razones. Primero, queríamos dar una idea un poco más profun
da del significado del término probabilidad, el cual ocupará un lugar destacado durante el resto
del aprendizaje de estadística, aun cuando, como sucede a menudo, este conocimiento más pro
fundo no se convierta en un dogma. En segundo lugar, es de crucial importancia familiarizarse
con ambas interpretaciones para comprender algunas de las controversias más encendidas dentro
de la estadística, una de las cuales presentaremos al final de este capítulo.
Cálculo de probabilidades
En las aplicaciones estadísticas, las probabilidades se calculan con una proporción de resul
tados exitosos, es decir, la cantidad de resultados favorables dividida por la cantidad de re
sultados posibles.
Analicemos la probabilidad de que al lanzar una moneda ésta caiga cara hacia arriba. De los
dos resultados posibles (obtener cara o cruz), existe un resultado favorable (obtener cara), es decir,
una probabilidad de 1/2 ó 0,5. Si tiramos un sólo dado, la probabilidad de sacar un 2 (o cualquier
otra cara del dado) es de 1/6 ó 0,17. Es decir, de los seis resultados posibles hay sólo un resultado
favorable en particular. La probabilidad de tirar un dado y obtener un número 3 o menor es de 3/6, ó
0,5. De seis resultados posibles existen tres resultados favorables (un 1, un 2 o un 3).
V:. Analicemos un ejemplo un poco más complicado. Supongamos que en una cíase hay 200 per
sonas, y que 30 son estudiantes avanzados. Si eligiéramos alguien de la clase ai azar, la probabili
dad de escoger un estudiante avanzado sería 30/200, ó 0,15. Es decir, de 200 resultados posibles
existen 30 resultados favorables (elegir un estudiante avanzado).
Rango de probabilidades
Las probabilidades son razones (la cantidad de resultados favorables sobre el total de resultados
posibles). Esta razón no puede ser menor que 0 ni mayor que 1. Expresada en porcentajes, va del
0% al 100%. Algo que no tiene chances de ocurrir tiene probabilidad 0 y algo que ocurrirá con
certeza tiene probabilidad 1. Cuando un hecho no puede ocurrir o es imposible, tiene probabili
dad 0, pero cuando ía probabilidad de un hecho es baja, digamos un 5% o incluso un 1%, el hecho
es improbable o poco probable, pero no imposible.
Regías de probabilidad
cionando al azar personas, cada una con un número de estos asignados, habría 10 posibilidades
(resultados favorables) de 50 (todos los resultados posibles) de seleccionar una que tuviera asig
nado un número igual a 7 ó mayor. Por lo tanto, p - 10/50 = 0,2
La distribución normal también puede considerarse como una distribución de probabilidades.
La curva normal representa a una distribución de frecuencias en la que se conoce la proporción de
valores entre dos puntuaciones Z cualesquiera. Como hemos visto, la proporción de valores entre
dos puntuaciones Z cualesquiera es la mismo que la probabilidad de seleccionar un valor entre
esas dos puntuaciones Z. Por ejemplo, la probabilidad de que un valor se encuentre entre la media
y una puntuación de +1 (1 desvío estándar por encima de la media) es de aproximadamente un
34%, es decir, p - 0,34.
F igura 5-8. D istrib u ció n d e frecu en cia s (en form a de
h isto g ra m a ) d e la s e le c c ió n d e 5 0 n ú m eros, en las
que la p robabilidad d e e le g ir e l 7 ó un núm ero m ayor
espz* 0 ,2 (1 0 /5 0 ).
0 l ■2 3 4, 5 6{ 7 8 9 10
Es probable que lo que estamos diciendo haya sido obvio desde el principio. En algún sentido, el
hecho de que la curva normal pueda representar tanto a una distribución de frecuencias como a
una distribución de probabilidades, es meramente un tema técnico. Sólo lo mencionamos para
que no haya confusiones más adelante, cuando hagamos referencia a la probabilidad de que un
valor esté en un intervalo, como el área sobre él bajo la curva normal.
MUESTRA Y POBLACIÓN
Presentaremos algunas ideas importantes utilizando el ejemplo de las habas. Supongamos que es
tamos cocinando una olla con habas y probamos una cucharada para ver si están listas. En este
ejemplo, la olla con habas es la población, la cantidad completa de elementos que nos interesan.
La cucharada es la muestra, la parte de la población sobre la cual realmente tenemos informa
ción. La figura 5-9 gráfica el ejemplo.
En la investigación psicológica, generalmente estudiamos muestras, no de habas sino de indi
viduos. Una muestra podría consistir en 50 mujeres canadienses que participan en determinado
experimento; la población que uno podría tener el propósito de reflejar serían todas las mujeres
canadienses. En un sondeo de opinión, podríamos seleccionar 1.000 personas de toda la pobla
ción con edad para votar de un determinado país y preguntarles por quién votarían. Las opiniones
de esas L000 personas conforman la muestra. Las opiniones del todo el publico votante en ese
país, respecto de quienes los encuestadores van a generalizar sus resultados, son la población
(véase figura 5-10)2.
2 Estrictamente hablando, los términos población y m uestra se refieren a una serie de valores (números o mediciones),
no a los participantes de la investigación que fueron medidos. Por lo tanto, en el primer ejemplo, la muestra está forma;
da en realidad por ios valores observados de las 50 mujeres canadienses, y no por las 50 mujeres, mientras que la pobla
ción está conformada por los valores que se obtendrían sí se midieran todas las mujeres canadienses.
F igura 5-9. P o b la c io n e s y m uestras: e n (a), toda la o lla con hab as e s la p ob lación , y la cucharada e s la m u e s
tra. E n (b), to d o e l círcu lo m a y o r e s la p o b la ció n y el círcu lo qu e se encuentra dentro de éste es la m uestra.
En (c ), e l h isto g r a m a s e refie re a la p o b la c ió n , y lo s v a lo r e s so m b r e a d o s to m a d o s e n co n ju n to fo rm a n
la m u estra .
Métodos de muestreo
Dado que existen tantas formas de seleccionar una muestra para un proyecto de investigación en
particular, en el apéndice A presentamos una exposición sobre varios de estos métodos {véase
también cuadro 5-3). Brevemente, podemos decir que en la mayoría de los casos el método ideal
para seleccionar una muestra de estudio se denomina selección aleatoria. El investigador consi
gue una lista completa de los miembros de la población y selecciona al azar una cantidad para
analizar. Un ejemplo del método de selección aleatoria sería escribir cada nombre en una pelotita
de ping pong, colocar las pelotitas en un gran recipiente, sacudirlo y vendarle ios ojos a una per
sona para que seleccione la cantidad necesaria. (En la práctica, la mayoría de los investigadores
utilizan una lista de números aleatorios generada por computadora. La manera en que las compu
tadoras o las personas pueden crear una lista de números realmente aleatorios es una cuestión in
teresante en sí misma que analizaremos en el cuadro 15-1).
Es importante distinguir la selección verdaderamente aleatoria de lo que podríamos denomi
nar selección casual, como por ejemplo, elegir a quien esté disponible o primero en la lista. Utili
zando el método de selección casual, es sorprendentemente fácil elegir accidentalmente un grupo
de personas para estudiar que sean en realidad muy diferentes a la población en su conjunto. Ana
licemos el caso de un estudio de actitud para con un profesor de estadística. Supongamos que re
colectamos la información para análisis de entre aquellos que en clase se sientan cerca de
determinado alumno. Ese análisis estaría afectado por todos los factores que influyen en la elec
ción del asiento, algunos de los cuales tienen que ver precisamente con el tema que estamos ana
lizando, como por ejemplo, en qué medida los alumnos están conformes con el profesor o con la
clase. (De modo similar, pedirle información a las personas que se sientan cerca de determinado
alumno, daría como resultado obtener opiniones más similares a las de ese alumno, de lo que re
sultarían las opiniones obtenidas por medio de una verdadera muestra aleatoria).
Desafortunadamente, en la investigación psicológica sólo es posible estudiar muestras ver
daderamente aleatorias en algunas ocasiones. La mayor parte del tiempo, de hecho, se realizan
análisis con aquellos que quieren o pueden participar de una investigación. En el mejor de los
casos, como ya observamos, el investigador intenta analizar una muestra de individuos de quie
nes no se conozca ningún dato que pueda hacerlos sistemáticamente no representativos de la po
blación que se intenta analizar. Por ejemplo, supongamos que se realiza un estudio acerca de un
proceso que puede dar diferentes resultados según las distintas edades de las personas. En ese
caso, el investigador puede intentar incluir en el análisis personas de todas las edades. Otra alter
nativa es que el investigador sea cuidadoso al sacar las conclusiones, para que estas se refieran
sólo al grupo correspondiente a la edad estudiada.
Tabla 5-1.
Parámetros poblacionales y estadísticos muéstrales.
Parámetro poblacíonal Estadístico muestral
(usualm ente descon ocid o) {C alculado a partir d e datos con ocid os)
CONTROVERSIAS Y LIMITACIONES
Aun siendo temas básicos, ios tres conceptos presentados en este capítulo, la curva normal, la
probabilidad y las muestras y poblaciones, son temas que generan bastante controversia. Analiza
remos una importante controversia en relación con cada uno de ellos.
¿La curva normal, es realmente tan normal?
Hemos mencionado que las distribuciones reales con frecuencia se aproximan mucho ai modelo
de curva normal. Es muy importante saber hasta qué punto esto es verdad, y no sólo porque la
presunción de modelo normal hace que las puntuaciones Z sean más útiles. Como veremos en ca
pítulos posteriores, la mayoría de las técnicas estadísticas que utilizan los psicólogos suponen que
sus muestras provienen de poblaciones distribuidas normalmente. El tema de en qué medida es
razonable este supuesto ha sido una fuente de debate durante mucho tiempo. La postura predomi
nante ha sido que, debido al modo en como se desarrollen las medidas psicológicas, la distribu
ción con forma de campana “está prácticamente garantizada” (Walberg, Strykowski, Rovai, &
Hung, 1984, p. 107). O, como lo expresaran Hopkins y Glass (1978), las mediciones en todas las
disciplinas resultan ser tan buenas aproximaciones a ella que uno podría pensar “¡Dios ama la
curva normal!"
Sin embargo, siempre ha existido una persistente postura crítica que plantea la pregunta de si
la naturaleza en realidad se empaqueta tan prolijamente. Micceri (1989) presentó pruebas muy
consistentes en el sentido de que muchas medidas comúnmente utilizadas en psicología no arro
jan valores normalmente distribuidos “en la naturaleza". Su estudio incluía pruebas de nivel y
capacitación (como el sat y el GítE - Gradúate Record Examination, Examen de inscripción de
graduados), y pruebas de personalidad (como el mmpi - Minnessota Multiphasic Personality
Inventory, Inventario de personalidad multifacética), Micceri obtuvo series de datos y analizó las
distribuciones de los valores de 440 medidas psicológicas y educativas que habían sido observa
das en muestras de gran tamaño. Todas sus series de datos correspondían a muestras de más de
190 individuos, y la mayoría correspondía a muestras de más de 1.000 (incluso un 14,3% corres
pondía a muestras de 5.000 a 10.293). Sin embargo, las muestras de gran tamaño no fueron muy
útiles. Ninguna de las distribuciones investigadas pudo superar todas las pruebas de normalidad
(Micceri buscaba fundamentalmente asimetrías, curtosis y “protuberancias”). Pocas medidas pre
sentaban distribuciones que siquiera se acercaban razonablemente al modelo de la curva normal.
Tampoco eran predecibles las variaciones: “Las distribuciones analizadas mostraron casi todos
los casos concebibles de contaminación” (p. 162), aunque algunos eran más comunes en cierto ti
po de pruebas. Micceri exhibe muchas razones obvias de esta anormalidad, tales como los efectos
“piso” y “techo” (véase capítulo 2).
¿Qué importancia ha tenido el hecho de que las distribuciones de estas medidas fueran tan
anormales? Según Micceri, simplemente se desconoce, y hasta que se sepa más sobre el tema,
la opinión general entre los psicólogos continuará sosteniendo las técnicas estadísticas tradi
cionales, con la matemática implícita, que se basa en el supuesto de las distribuciones norma
les de población. ¿Cuál es la razón de esta indiferencia en vista de descubrimientos como los
de Micceri? Sucede que en la mayoría de las condiciones en las que se las utiliza, las técnicas
tradicionales parecen dar resultados razonablemente exactos, aun cuando no se cumpla el re
querimiento formal de una distribución normal de población (p. ej. Sawilowsky & Blair,
1992). Este libro, en líneas generales, adopta la posición mayoritaria que favorece la utiliza
ción de técnicas tradicionales en todos los casos, excepto en los más extremos. Sin embargo,
debemos tener en cuenta que existe una minoría resonante de psicólogos que están en desa
cuerdo con esto. En el capítulo 15 presentamos algunas de las técnicas estadísticas alternati
vas que esos psicólogos favorecen (técnicas que no están sustentadas por el supuesto de la
distribución normal de las poblaciones).
Galton, uno de los pioneros más destacados en el campo de los métodos estadísticos (recor
demos el cuadro 3-1), opinó sobre la curva normal: “No conozco casi nada tan apropiado para im
presionar la imaginación [...] si los griegos hubieran sabido de ella la hubieran personificado y
divinizado. Reina con serenidad y completa humildad en medio de la salvaje confusión” (1889,
p. 66). Irónicamente, tal vez sea cierto que, al menos en psicología, realmente reina en un aisla-
miento puro y austero, sin imitaciones reales siquiera cercanas a lo perfecto,
M uestra y población
La mayoría de los procedimientos estadísticos que aprenderemos en el resto de este libro se basan
en el supuesto de que la muestra estudiada es una muestra aleatoria de la población. Como ya se
ñalamos, sin embargo, esto rara vez sucede en la investigación psicológica. Lo más frecuente es
que nuestras muestras incluyan a aquellos individuos que están disponibles para participar en un
experimento, lo cual implica que la mayoría de los estudios se realicen con alumnos universita
rios, voluntarios y animales de laboratorio que resulten convenientes y similares.
Algunos psicólogos se preocupan por este tema y han sugerido que ios investigadores necesi
tan utilizar diferentes métodos estadísticos que realicen generalizaciones referidas sólo a los tipos
de personas que en realidad están siendo utilizadas en el estudio.3 Por ejemplo, estos psicólogos
sostendrían que si nuestra muestra presenta una determinada distribución anormal, deberíamos
suponer que se pueden generalizar los resultados sólo con respecto a una población con la misma
distribución anormal. En el capítulo 1^ seguiremos analizando estas sugerencias.
Los sociólogos, en comparación con los psicólogos, están mucho más preocupados por la re-
presentatividad del grupo que estudian. Es mucho más probable que se utilicen métodos formales
de selección aleatoria y de grandes muestras en los estudios presentados en revistas especializa
das en sociología (o en revistas científicas de psicología social orientadas a la sociología), o al
menos que se trate el tema en sus publicaciones.
¿Por qué los psicólogos se sienten más cómodos utilizando muestras que no son claramente
aleatorias? La razón más importante es que están interesados principalmente en las relaciones
entre variables. Si en determinada población un aumento en X está relacionado con un aumento
en F, esa relación debería sostenerse probablemente en otras poblaciones, y debería hacerlo inclu
so si los niveles reales de X e Y son diferentes entre las poblaciones. Supongamos que un investi
gador realiza el experimento que utilizamos como ejemplo en el capítulo 3 y 4, probando la relación
entre la cantidad de veces que se expone una lista de palabras con la cantidad de palabras recorda
das. Supongamos, además, que el estudio se realiza con alumnos universitarios, y que el resultado
es que, a mayor cantidad de exposiciones, mayor cantidad de palabras recordadas. La cantidad
real de palabras recordadas de la lista bien podría ser diferente, en el caso de personas pertene
cientes a grupos sociales distintos, al de los alumnos universitarios. Por ejemplo, es probable que
expertos en ajedrez (quienes probablemente tengan la memoria altamente desarrollada) puedan
recordar más palabras; personas que acaban dé sufrir algún trastorno probablemente recuerden
menos palabras. Sin embargo, incluso en esos grupos, esperaríamos que, a mayor cantidad de ex
posiciones de la lista, más palabras fueran recordadas. Por lo tanto, es probable que la relación
entre cantidad de exposiciones y cantidad de palabras recordadas sea aproximadamente la
misma en cada población.
En sociología, la representatividad de las muestras es mucho más importante debido a que los
sociólogos están más preocupados por la media y la varianza real de una variable en determinada
sociedad. Así, un sociólogo podría estar interesado en la actitud promedio hacia las personas ma
yores en la población de un determinado país. En ese caso, es extremadamente importante la ma
nera en que se realice el muestreo.
3 Frick (en prensa) sostiene que en la mayoría de Jos casos tos investigadores psicológicos no deberían pensar siquiera
en función de muestras y poblaciones, sino que más bien deberían considerarse investigadores estudiando procesos. Un
experimento anatiza algún proceso en un grupo de individuos. Luego, el investigador evalúa la probabilidad de que el
patrón de resultados pudiera haber sido causado por factores casuales. Por ejemplo, el investigador analiza si una dife
rencia de medias entre un grupo experimental y uno de control podría haber sido causada por otros factores además de
la manipulación experimenta!. Frick sostiene que este modo de pensar es mucho más parecido a la forma real en que los
investigadores trabajan, y afirma que presenta varias ventajas en cuanto a la sutil lógica de tos procedimientos de esta
dística inductiva. Será interesante ver la reacción a la propuesta de Frick. En todo caso, seguir e l método más estándar
(tal com o se enseña en este libro) arroja exactamente los mismos resultados, lo cual es coherente con la manera en la
que la mayoría de los psicólogos comprenden el razonamiento estadístico.
CURVAS NORMALES, PROBABILIDADES, MUESTRAS
Y POBLACIONES SEGÚN SE DESCRIBEN EN PUBLICACIONES CIENTIFICAS
Los temas tratados en este capítulo se utilizan especialmente como base para comprender el
material expuesto en los capítulos siguientes, y rara vez se nombran explícitamente en publi
caciones científicas (excepto en artículos sobre métodos o cálculos estadísticos). Ocasional
mente, podremos ver que se menciona la curva normal en el contexto de la descripción de
valores de una determinada variable. (En el capítulo 15 proporcionamos más información
acerca de este tema, e incluso algunos ejemplos tomados de publicaciones reales. En ese mis
mo capítulo también analizamos circunstancias en las que los valores no siguen la distribu
ción normal).
Tampoco es común que se mencione la probabilidad de manera directa, excepto en el con
texto de la significación estadística, tema que mencionamos brevemente en el capítulo 3. En
casi cualquier publicación que tengamos la oportunidad de leer, la sección “Resultados” estará
llena de descripciones de distintos métodos relacionados con la significación estadística, se
guidas de expresiones tales como “p<0,05” ó “p<0,01". La p se refiere a probabilidad, pero,
¿probabilidad de qué? Ese es el tema principal de nuestra exposición sobre significación esta
dística en el capítulo 6.
Finalmente, sólo en algunas ocasiones encontraremos una breve mención del método utiliza
do para seleccionar la muestra de la población. Por ejemplo, Alunan, Levine, Howard y Hamilton
(1997) realizaron una encuesta telefónica sobre las actitudes del público adulto norteamericano
hacia los agricultores de tabaco. En la sección del artículo dedicada al método, explican que los
que respondieron fueron “seleccionados en forma aleatoria de una lista nacional de números tele
fónicos” (p. 117). Así, Altman et. al. especificaban tanto la lista que utilizaron para elegir la po
blación (el directorio nacional'de números telefónicos) como el método utilizado (selección
aleatoria) para obtener la muestra. Cabe destacar, sin embargo, que en tales encuestas el porcenta
je de respuesta de aquellos a quienes se llama por teléfono generalmente es muy lejano al 100%.
En el ejemplo que estamos analizando, obtuvieron entrevistas con el 47% de las personas a las
que llamaron. Por lo tanto, aunque utilizaron el método de selección aleatoria para contactar a
miembros potenciales de su muestra, la muestra propiamente dicha no fue aleatoria. La muestra
representa excesivamente cualesquiera sean las características que hacen que una persona esté
disponible y dispuesta a responder una encuesta telefónica.
RESUMEN________________________________________
En muchas de las variables analizadas en la investigación psicológica, la distribución de los valo
res presenta aproximadamente una forma de campana, simétrica y unimodal, a la que llamamos
curva normal. Dado que la forma de esta curva responde a una fórmula matemática exacta, existe
un porcentaje específico de valores entre cualesquiera dos puntos de ella.
Las cifras importantes que conviene recordar con respecto a una curva normal son: un 34%
de los valores se encuentran entre la media y 1 desvío estándar por encima de la media, y un 14%
entre 1 y 2 desvíos estándar por encima de ella.
Una tabla de áreas de la curva normal indica el porcentaje de valores entre la medía y cual
quier puntuación Z positiva en particular. Utilizando esa tabla, y sabiendo que la curva es simétri
ca y que el 50% de los valores se encuentran por encima de la media, podemos determinar el
porcentaje de valores por encima o por debajo de cualquier puntuación Z en particular. También
podemos utilizar la tabla para determinar la puntuación Z correspondiente al punto en el que co
mienza un determinado porcentaje de valores.
La mayoría de los investigadores psicológicos considera que la probabilidad de un hecho es
su frecuencia relativa esperada. Sin embargo, algunos consideran a la probabilidad como el grado
subjetivo de convencimiento de que el hecho sucederá. La probabilidad generalmente se calcula
como la razón entre la cantidad de resultados favorables y la cantidad total de resultados posibles.
Se simboliza con unap y tiene un rango de 0 (hecho imposible) a 1 (hecho cierto). El área bajo la
curva normal indica la probabilidad de que los valores se ubiquen dentro de determinado interva
lo de valores.
Una muestra es un individuo o grupo analizado, por lo general en representación de un grupo
mayor o población que no puede ser analizado en su totalidad. Lo ideal es que la muestra sea se
leccionada de la población utilizando un procedimiento estrictamente aleatorio. La media, la va-
ríanza y demás cálculos de una muestra se denominan estadísticos muéstrales. Cuando se refieren
a una población, se denominan parámetros poblacionales y se simbolizan con letras griegas( p.,
para la media, o2 para la varianza y cr para el desvío estándar).
La mayoría de las técnicas que aprenderemos en el resto del libro utilizan inferencias proba-
bilísticas para sacar conclusiones acerca de poblaciones, sobre la base de información obtenida a
partir de muestras. En este proceso, generalmente se presume que las poblaciones están normal
mente distribuidas.
Existen controversias con respecto a cada uno de los temas principales. Una de las cuestiones
se refiere a si las distribuciones normales son realmente típicas de las poblaciones de valores co
rrespondientes a las variables que estudiamos en psicología. Otro debate, planteado por defenso
res del enfoque “bayesiano” de la estadística, es si deberíamos construir explícitamente los
procedimientos estadísticos de forma tal de tener en cuenta las expectativas subjetivas iniciales
del investigador. Finalmente, se ha discutido la representatividad de las muestras utilizadas por
los psicólogos, que en líneas generales no se obtienen a través de una selección estrictamente
aleatoria, aunque existen también motivos para pensar que con respecto a los temas que estudian
la mayoría de los psicólogos, este punto no tiene gran relevancia.
Las publicaciones científicas rara vez exponen las curvas normales (excepto brevemente
cuando la distribución que se está analizando parece no ser normal) o la probabilidad (excepto en
el contexto de las pruebas de significación, descriptas al comienzo del capítulo 6). Sin embargo,
en líneas generales sí se describen los procedimientos de muestreo, especialmente cuando el estu
dio es un sondeo de datos; y se puede discutir la representatividad de una muestra cuando no hu
biera sido posible realizar un muestreo al azar.
Términos clave
- Frecuencia relativa esperada. Distribución normal. - Estadísticos muéstrales.
- Selección casual. Resultado. - Interpretación subjetiva
- Interpretación de la probabilidad Población. de probabilidad.
como la frecuencia relativa Parámetros poblacionales. -ji.
a largo plazo. Probabilidad (p). - a.
- Curva normal, Selección aleatoria.
- Tabla de áreas de la curva normal. Muestra.
a -1,5, e) mayor a 2,10, f) menor a 2,10, g) ma
Ejercicios yor a 0,45, h) menor a -1,78 y i) mayor a 1,68?
Los ejercicios implican la realización de cálcu 3. Suponiendo que se trata de una distribu
los (con la ayuda de una calculadora). La ma ción normal, a) si una persona se encuentra en
yoría de los problemas estadísticos reales se tre el 10% superior de su país en cuanto a
resuelven por computadora, pero aunque exista capacidad matemática, ¿cuál es la puntuación
la posibilidad de utilizar una computadora, es Z de esa persona? b) Si la persona se encuentra
conveniente realizar estos ejercicios manual dentro del 1%, ¿cuál sería la puntuación Z?
mente para incorporar el método de trabajo. 4. Analicemos una prueba de coordinación
Para adquirir práctica en la utilización de con distribución normal, una media de 50 y un
una computadora, para resolver problemas es desvío estándar de 10. ¿Qué valor necesitaría
tadísticos, se puede utilizar la sección de com una persona para estar entre el 5% superior?
putación de cada capítulo, publicada en la Guía Explique su respuesta a alguien que nunca ha
de estudio y libro de tareas de computación pa tomado un curso de estadística.
ra el alumno [Student’s Study Guide and Com 5. Las siguientes cantidades de individuos
puter Workbook] que acompaña este libro. de una empresa recibieron atención especial de
Todos los datos de esta sección son ficti la gerencia de personal el año pasado:*6
cios (a menos que se especifique lo contrario). D rogas/alcohol 10
Las respuestas a los ejercicios de la serie I Asesor-amiento para crisis fam iliar 20
se encuentran al final del libro. Varios 20
Total 50
Regla de ia multiplicación
La regla de la multiplicación sé aplica a situaciones que involucran más de un experimento. Per
mite calcular la probabilidad de obtener ambos de dos (o más) resultados independientes. Los
resultados independientes son tales que el acontecimiento de uno no da al otro mayor ni menor
probabilidad de suceder. Obtener cara o ceca en un tiro de moneda es un resultado independiente
de obtener cara o ceca en un segundo tiro de moneda. La probabilidad de obtener ambos de ios
dos resultados independientes es el producto de (el resultado de multiplicar) las probabilidades
individuales. Por ejemplo, en un sólo tiro de moneda, la posibilidad de obtener cara es de 0,5. En
un segundo tiro de moneda, la probabilidad de obtener cara (sin importar lo que se obtuvo en el
primer tiro) es también de 0,5. Por lo tanto, la probabilidad de obtener caras en ambos tiros de
moneda es de 0,25 (0,5 por 0,5). En dos tiros de un dado, la probabilidad de obtener un 5 en am
bos tiros es igual a 1/36, es decir, la probabilidad de obtener un 5 en el primer tiro (1/6), multipli
cada por la probabilidad de obtener un 5 en el segundo tiro (1/6). De modo similar, en una prueba
de selección múltiple con cuatro opciones para cada ítem, la probabilidad de adivinar dos res
puestas correctas es de 1/16, es decir, la probabilidad de adivinar una respuesta correcta (1/4)
multiplicada por la posibilidad de adivinar la otra respuesta correcta (1/4),
Expresado por una fórmula:
E
rencia entre una muestra y una población. En este capítulo, presentamos el tema
crucial de la prueba de hipótesis. La prueba de hipótesis es un procedimiento sis
temático para determinar si los resultados de un experimento a través del cual se
analiza una muestra, sustentan una teoría o innovación práctica determinada que
se aplica a una población, La prueba de hipótesis es el tema central de todos los capítulos res
tantes de este libro, como lo es también en la mayoría de las investigaciones científicas. Casi
todos las publicaciones de investigación psicológica utilizan la prueba de hipótesis.
Es nuestro deber advertir que, para la mayoría de los alumnos, la parte más difícil del curso es.
el manejo de la lógica básica de este capítulo y de los dos siguientes. Este capítulo, en particular,
requiere cierta gimnasia mental. Aun cuando se comprendan todos los razonamientos.la primera
vez, es recomendable realizar una revisión completa. La prueba de hipótesis involucra un grupo
de ideas que, contempladas separadamente, no tienen mucho sentido. Por lo tanto, en este capítu
lo aprenderemos una cantidad comparativamente grande de ideas al mismo tiempo. Mirando el
lado positivo, una vez que hayamos incorporado bien los temas de este capítulo y de los dos si
guientes, estaremos acostumbrados a este tipo de material, y el resto del curso resultará sencillo.
Al mismo tiempo, hemos desarrollado esta introducción a la prueba de hipótesis de la mane
ra más sencilla posible, y dejamos para los capítulos posteriores todo aquello que podía poster
garse. Por ejemplo, las investigaciones psicológicas reales casi siempre involucran muestras
compuestas por muchos -a veces muchísimos- individuos. Sin embargo, para simplificar las co
sas, todos los ejemplos de este capítulo se refieren a estudios en los que la muestra está formada
por un sólo individuo. Pára lograrlo, hemos tenido que crear algunos ejemplos bastante extra
ños, por eso es conveniente que el alumno recuerde simplemente que estamos construyendo los
cimientos que, en el capítulo 9, lo prepararán para comprender la prueba de hipótesis tal como se
realiza en la realidad.
Este es el primer ejemplo ficticio y, necesariamente, extraño. Durante varios años se ha desarro
llado un gran proyecto de investigación. En el contexto del proyecto, se ha administrado a bebés
recién nacidos una vitamina especial, y luego se ha controlado su desarrollo durante los primeros
dos años de vida. Hasta ahora, la vitamina no ha acelerado el desarrollo de los bebés. La distribu
ción de la edad en la que éstos y todos los bebés comienzan a caminar está representada por la fi
gura 6-1. En ella observamos que la media es 14 meses, el desvío estándar es de 3 meses, y las
edades siguen una curva normal. Mirando la curva podemos observar que menos del 2% de los
bebés comienzan a caminar antes de los 8 meses de edad (estos bebés se encuentran 2 desvíos es
tándar por debajo de la media de edad para comenzar a caminar). (La distribución qué analiza
mos, si bien es ficticia, en realidad es bastante similar a la distribución que los psicólogos han
probado en el caso de bebés europeos, aunque esa distribución real es levemente asimétrica hacia
la derecha; Bindley, Filliozat, Kíackenberg, Nicolet-Meísteri & Sand, 1966).
Uno de los investigadores del proyecto ha tenido una idea. Sobre la base de algunas nuevas
teorías, razona que si la vitamina que toman los bebés estuviera más refinada, su efecto podría
ser notablemente mayor, y que los bebés que tomaran la versión con alto grado de refinamiento
deberían comenzar a caminar mucho antes que los otros bebés. (Supondremos que el proceso de
purificación no podía de ningún modo hacer que la vitamina fuera dañina para los bebés). Sin
embargo, refinar la vitamina de este modo eleva en gran medida el costo'de cada dosis; por lo
tanto, el equipo de investigación decide probar el procedimiento con dosis suficientes para un
sólo bebé. Entonces, se selecciona al azar un bebé del proyecto para suministrarle la versión al
tamente refinada de la vitamina, y se realiza un seguimiento de su progreso junto con el de todos
los otros bebés deí mismo proyecto. ¿Qué tipo de resultado llevaría a los investigadores a sacar
la conclusión de que la vitamina altamente purificada hace que los bebés caminen a más tempra
na edad?
Lo que acabamos de describir es el ejemplo de un problema que se resuelve a través de la
prueba de hipótesis. Los investigadores pretenden sacar una conclusión acerca de si la vitamina
purificada hace que los bebés en general caminen antes de lo esperado. La conclusión referida a
los bebés en general, sin embargo, se basará en los resultados obtenidos, estudiando sólo una
muestra. (En este extraño ejemplo, la muestra es un sólo bebé).
Figura 6-1. Distribución de edades en que los bebés comienzan a caminar (datos ficticios).
Existe un método estándar para encarar un problema de prueba de hipótesis. El investigador utili
zará el siguiente razonamiento: comúnmente, las chances de que un bebé comience a caminar a
los 8 meses de edad o antes serían menores al 2%. Por lo tanto, caminar a ios 8 meses es altamen
te inverosímil ¿Pero qué sucede si el bebé que estamos estudiando comienza a caminar a los 8
meses? Sí esto sucede, podremos rechazar la idea de que la vitamina especialmente purificada
no produce ningún efecto. Si rechazamos la idea de que la vitamina especialmente purificada no
produce ningún efecto, debemos aceptar la idea de que sí produce un efecto. (La lógica de este
ejemplo es crucial para todos los siguientes temas del libro. Tal vez sea conveniente volver a leer
este párrafo).
En primer lugar, los investigadores han comprendido qué tendría que suceder para poder sa
car la conclusión de que el procedimiento de purificación especial marca una diferencia. Habien
do comprendido esto previamente, los investigadores pueden entonces continuar con la
realización de su estudio. En este caso, realizar el estudio significa suministrar la vitamina espe
cialmente purificada a un determinado bebé y observar a qué edad ese bebé comienza a caminar.
Si el resultado del estudio muestra que el bebé comienza a caminar antes de los 8 meses, entonces
concluirán que es inverosímil que la vitamina especialmente purificada no provoque una diferen
cia. Si es inverosímil que la vitamina especialmente purificada no provoque una diferencia, en
tonces la conclusión es que probablemente sí la provoque.
Este tipo de razonamiento al revés, contrario a lo que uno predice, es el corazón de la estadís
tica inferencial en psicología. Es algo así como una doble negación. Uno de los fundamentos de
este método es que podemos determinar directamente la probabilidad de obtener un resultado ex
perimental determinado sí la situación de que no se produzca diferencia es verdadera. En el ejem
plo de la vitamina purificada, los investigadores saben cuáles son las probabilidades de que los
bebés caminen a diferentes edades si la vitamina especialmente purificada no produce ningún
efecto. Es la probabilidad de que un bebé camine a distintas edades lo que ya conocemos por ana
lizar bebés en general, es decir, bebés que no han recibido vitamina especialmente purificada.
(Supongamos que la vitamina especialmente purificada no produce ningún efecto. En ese caso,-la
edad en la que los bebés comienzan a caminar es la misma, reciban o no la vitamina especialmen
te purificada. Por lo tanto, la distribución es la que aparece en la figura 6-1, basada en las edades
en las que los bebés en general comienzan a caminar).
Sin esta reconocidamente tortuosa manera de enfocar el problema, en la mayoría de los casos
no habría modo de probar una hipótesis. En casi todas las investigaciones psicológicas, ya sea con
experimentos, encuestas u otro método, sacamos conclusiones evaluando la probabilidad de obte
ner nuestros resultados de investigación si fuera verdad lo contrario a lo que estamos prediciendo.
Es decir, generalmente predecimos algún tipo de efecto pero evaluamos si existe tal efecto obser
vando si es inverosímil la hipótesis de que ese efecto no exista.
* En este caso hemos simplificado ei tema. La hipótesis de investigación implica que una población caminará antes que
ia otra, Por lo tanto, lo contrario implica que e l otro grupo caminará o bien al mismo tiempo o después. A sí, lo
contrario a la hipótesis de investigación, en este caso incluye tanto la falta de diferencia com o una diferencia en direc
ción contraria a la predicha. En términos de símbolos, si nuestra hipótesis de investigación es jq c p j, entonces su
opuesto es p,j > ¡Xj (el símbolo 5 significa “mayor o igual a”). Presentamos este tema con mayor detalle más adelante
en este capítulo. Por ahora, para simplificar el aprendizaje, algunas veces consideraremos que la hipótesis nula implica
que las dos poblaciones son esencialmente iguales, y otras veces consideraremos que implica que una población es
igual u opuesta a la hipótesis de investigación.
Una vez que hemos planteado la situación en términos de elección entre una hipótesis de investi
gación y una hipótesis nula, el siguiente paso es analizar cómo podríamos utilizar la información
que obtenemos sobre una muestra para realizar esta elección. La pregunta que planteamos es la
siguiente: dado un determinado resultado muestra! (en este caso, una observación), ¿qué probabi
lidad teníamos de obtener ese resultado si la hipótesis nula fuera verdadera?
Para responder esta pregunta, debemos saber cómo sería la situación si la hipótesis nula fuera
verdadera. Es decir, necesitamos conocer los detalles de la distribución de la población de la cual
proviene la muestra si la hipótesis nula fuera verdadera. Si conocemos la distribución de la pobla
ción de la que proviene nuestra muestra, y sabemos que se trata de una distribución normal, nos
encontramos en una buena posición: podemos determinar directamente la probabilidad de obte
ner cualquier valor determinado de esa distribución utilizando una tabla de áreas bajo la curva
normal.
¿Cómo podemos conocer los detalles de la población de la cual proviene nuestra muestra si
la hipótesis nula es verdadera? Esto es posible porque, si la hipótesis nula es verdadera, ambas
poblaciones son iguales. Generalmente conocemos una de las poblaciones (población 2); por lo
tanto, si la hipótesis nula es verdadera y las dos poblaciones son iguales, también conocemos la
otra población (población 1). En nuestro ejemplo, si la hipótesis nula es verdadera, ambas pobla
ciones siguen la curva normal, y presentan una media de 14 meses y un desvío estándar de 3 me
ses (véase figura 6-1).
En este libro llamaremos a la distribución correspondiente a la situación en la que la hipótesis
nula es verdadera, es decir, la distribución con la que comparamos la muestra, distribución com
parativa. (La distribución comparativa a veces es denominada "modelo estadístico”, y en la ma
yoría de los casos también coincide con lo que se denomina una “distribución muestraí”, una. idea
que expondremos en el capítulo 7). Es decir, en el proceso de la prueba de hipótesis, comparamos
los valores observados en la muestra con esta distribución. Realizamos la comparación calculan
do la probabilidad de obtener un valor tan extremo como el de nuestra muestra en esa distribución
comparativa. En el ejemplo que estamos tratando, la distribución comparativa es igual a la distri
bución de valores de la población 2, la población a la que no se le ha aplicado el procedimiento
experimental.
Figura 6-2. Distribución de la edad en la que los bebés comienzan a caminar (datos ficticios).
investigadores rechazan la hipótesis nula si la probabilidad de obtener un resultado tan extremo
(si la hipótesis nula fuera verdadera) es menor al 5%. Esta probabilidad generalmente se escribe
como “p<0,05’\ No obstante, en algunas áreas de investigación, o cuando los investigadores quie
ren ser especialmente cautelosos, utilizan un corte dei 1% (p<0,01).
A estos porcentajes se los denomina niveles convencionales de significación. Se describen
como nivel de significación 0,05 ó nivel de significación 0,01. Cuando el valor muestral es tán ex
tremo que ios investigadores rechazan la hipótesis nula, se dice que el resultado es estadística
mente significativo.
Los estudios acerca de la vitamina purificada y la felicidad son ejemplos que involucran hipótesis
direccionales. En cada caso, los investigadores estaban interesados en una dirección específica del
efecto. Es importante observar que cuando un investigador propone una hipótesis direccional, la
hipótesis nula correspondiente es, también, en cierto sentido direccional. Si la hipótesis de investi
gación establece que obtener 1 millón de dólares hará más feliz a una persona, la hipótesis nula es-
F ig u r a 6-S . D is tr ib u c ió n d e v a lo r e s d e l n iv e l d e f e lic id a d c o n e l 5 % s u p e r io r s o m b r e a d o y la u b ic a c ió n d e l
m illo n a r io q u e c o n fo r m a la m u e s tr a (d a to s f ic t i c io s ) .
tablece que el dinero no producirá ningún efecto o hará menos feliz a esa persona, (Expresado en
símbolos, si la hipótesis de investigación es ¡x3 > jx2, entonces la hipótesis nula será < ¡ji2). Por
lo tanto, como ya hemos observado, en la figura 6-5, por ejemplo, para rechazar la hipótesis nula la
muestra debía arrojar un valor que se ubicara dentro del 5% superior, el extremo o cola superior de
la distribución comparativa. (A los fines de rechazar la hipótesis nula, un valor ubicado en la otra
cola sería considerado del mismo modo que un valor ubicado en el medio dé la distribución). Por
esta razón, la prueba de una hipótesis direccional se denomina prueba de una cola.
Sin embargo, a veces una hipótesis de investigación implica simplemente que una población será
diferente de la otra, sin especificar si la diferencia la marcarán valores más altos o más bajos. Por
ejemplo, un psicólogo especializado en organizaciones empresariales puede estar interesado en el
impacto provocado en la productividad por un programa de capacitación en relaciones sociales.
Es posible que el programa mejore la productividad al hacer más placentero el ambiente de traba
jo. Pero también es posible que perjudique la productividad por incentivar a las personas a que
practiquen relaciones sociales en lugar de trabajar. En este caso, la hipótesis de investigación im
plicaría que el programa de relaciones sociales cambie el nivel de productividad. La hipótesis nu
la implicaría que el programa no afecte la productividad en ningún sentido. Es decir, expresado en
símbolos, la hipótesis de investigación sería jj, j ^ p,2, y la hipótesis nula sería p.t - jx2.
Siempre que una hipótesis de .investigación establezca una diferencia, sin indicar la dirección
de esa diferencia, se la denomina hipótesis no direccional. Para probar la significación de una hi
pótesis no direccional, uno debe analizar si un valor es extremo en cualquiera de las dos colas de
la distribución comparativa. Por lo tanto, a esta prueba se la denomina prueba de dos colas.
Las pruebas de dos colas presentan una complicación especial. Supongamos que el investigador
selecciona un nivel de significación del 5%. En una prueba de una cola, el investigador rechaza la
hipótesis nula si la oservación muestral se ubica dentro de uno de los extremos que contiene el 5%
de la distribución comparativa. En una prueba de dos colas, podría suponerse que el investigador
utilizaría el 5% superior cuando el valor es extremo en dirección hacia arriba, y el 5% inferior
cuando el valor es extremo en dirección hacia abajo. Sin embargo, si el investigador hiciera esto,
existiría un total del 10% de la distribución comparativa dentro del cual la hipótesis nula podría
ser rechazada. El nivel de significación en realidad sería del 10%, porcentaje que la mayoría de
los investigadores consideraría muy peligroso. (Es decir, con un 10% de nivel de significación,
uno podría rechazar la hipótesis nula con mucha facilidad aun cuando ésta fuera verdadera).
Existe una solución para este problema. Al realizar una prueba de dos colas, se divide el por
centaje de significación entre las dos colas. Con un nivel de significación del 5%, se rechazaría la
hipótesis nula sólo si la muestra fuera tan extrema que se ubicara dentro del 2 1/2 % superior o
dentro del 2 1/2 % inferior. De este modo, la posibilidad total de que la hipótesis nula sea verda
dera, determinada con anterioridad a la realización del estudio, se mantiene en un total del 5%.
Es importante señalar que al utilizar una prueba de dos colas; las puntuaciones Z de corte pa
ra un nivel del 5% son +1,96 y -1,96. En el caso de una prueba de una cola, el corte no era tan ex
tremo, +1,64 y -1,64, pero sólo se tem'a en cuenta un lado de la distribución. La figura 6-6a
representa esas situaciones. Utilizando un nivel de significación del 1%, una prueba de dos colas.
(0,5% en cada cola) presenta cortes de +2,58 y -2,58, mientras que los cortes en una prueba de
una cola serían de +2,33 ó -2,33 (véase figura 6~6b).
¿Cuándo u tilizar pruebas de una o dos colas?
Resulta más fácil rechazar la hipótesis nula con una prueba de una cola que con una prueba de dos
colas, ya que el valor de la muestra no necesita ser tan extremo para que el resultado experimental
sea significativo. Sin embargo, esto tiene su costo, ya que con las pruebas de una cola, si el resul
tado es extremo en la dirección opuesta a la esperada, no puede considerarse significativo y no
importa cuán extremo haya sido ese resultado.
En principio, se planifica una prueba de una cola cuando se trabaja con una hipótesis clara
mente direccional, y de dos colas cuando se trabaja con una hipótesis claramente no direccional.
En la práctica, la decisión no resulta tan simple. Incluso cuando una teoría predice claramente un
resultado determinado, a veces descubrimos que el resultado es justamente el opuesto de lo que
esperábamos, y en ocasiones ese resultado opuesto puede ser realmente más interesante. (¿Qué
hubiera sucedido si, como ocurre en todos los cuentos de hadas sobre genios y peces que conce
den deseos, recibir 1 millón de dólares y cumplir casi todos sus deseos hubiera hecho de ese indi
viduo una persona infeliz? El resultado hubiera sido realmente muy interesante). Utilizando las
pruebas de una cola corremos el riesgo de tener que ignorar resultados posiblemente importantes.
Debido a estas consideraciones, la utilización de las pruebas de una cola es discutida, aun
cuando la hipótesis sea claramente direccional. Para mayor seguridad, muchos investigadores uti
lizan pruebas de dos colas tanto para hipótesis direccionales como no direccionales. Si el resulta
do de la prueba de dos colas es significativo, entonces el investigador analiza el patrón de los
datos hallados-para determinar la dirección del resultado, considerando ai estudio significativo en
esa dirección.2 Cabe mencionar que, en la práctica, este es un procedimiento conservador, por el
hecho de que siendo los puntos de corte más extremos para una prueba de dos colas, es menos ve
rosímil que una prueba de dos colas dé un resultado significativo. Por lo tanto, si se obtiene un re
sultado significativo con una prueba de dos colas, uno puede estar más seguro de sus
conclusiones. De hecho, en la mayoría de las publicaciones científcas psicológicas, a menos que
el investigador indique específicamente que utilizó una prueba de una cola, en líneas generales se
supone que utilizó una prueba de dos colas.
No obstante, cabe recordar que, por lo general, la conclusión final no es afectada realmente
por el hecho de que el investigador utilice una prueba de una o dos colas. Según nuestra experien
cia, usualmente los resultados de las investigaciones o son tan extremos que serían considerados
significativos a través de cualquier estándar razonable, o están tan lejos de serlo que no serían
considerados significativos a través de ningún procedimiento.
¿Qué sucede cuando un resultado arroja conclusiones menos precisas? La decisión del inves
tigador en cuanto a las pruebas de una o dos colas adquiere mayor importancia. En ese caso, el in
vestigador intentará utilizar el método que arroje la conclusión más exacta y menos controvertida,
ya que la idea es dejar que hasta donde sea posible, la naturaleza, y no la decisión del investiga
dor, determine la conclusión. Más aún, cuando un resultado no es completamente claro en uno u
otro sentido, la mayoría de los investigadores se sentirían incómodos al sacar conclusiones defini
tivas sin realizar otros estudios.
2 Leventhal y Huynh (1996) sostienen que este procedimiento en realidad es incorrecto. Sí uno está probando una
hipótesis no direccional, sólo debería sacar conclusiones no direccionales. Sugieren que un mejor procedimiento sería
utilizar una “prueba direccional de dos colas", que en realidad son dos pruebas simultáneas de una cola (una en cada
dirección), Así, si un investigador quisiera establecer un nivel de significación total de 0,05, utilizaría una prueba direc
cional de dos colas, en la que cada una de las dos subdivisiones de una cola utilizaría el nivel 0,025. En cuanto a decidir
si un resultado es significativo o no, el método de Leventhal y Huynh produce un resultado idéntico al de la prueba de
uso más-común, no direccional de dos colas. El razonamiento de Leventhal y Huynh sobre las pruebas de dos colas
parece más lógico (además de tener otras ventajas técnicas). Sin embargo, debido a que los investigadores aún no han
adoptado ese método (y dado que el resultado es el mismo), en este libro utilizamos el método m is tradicional.
Ejem pio de prueba de hipótesis utilizando una prueba de dos colas
Aquí presentamos otro ejemplo ficticio, pero esta vez utilizando una prueba de dos colas. Un gru
po de psicólogos clínicos de un centro residencial de tratamiento psiquiátrico creen haber desa
rrollado un nuevo tipo de terapia que aliviará, en mayor grado que la terapia que se está utilizando
en ese momento, la depresión de los pacientes. Sin embargo, como sucede con cualquier trata
miento, no se puede descartar la posibilidad de que provoque peores resultados en algún paciente.
Por lo tanto, los investigadores probarán una hipótesis no direccional.
Los psicólogos procederán de la siguiente manera: seleccionarán al azar un paciente que re
cién ingrese para suministrarle la nueva terapia en lugar de la usual. (Por supuesto que en un estu-
Fígura 6 - 6 . Comparación de puntos de corte según el nivel d e Significación p a r a pruebas de una y dos colas:
(a) nivel de significación 0,05; (b) nivel de significación 0,01, (Las pruebas de una cola en estos ejem plos
suponen que se predecía un valor alto).
dio real se seleccionaría más de un paciente, pero supongamos que una sola persona ha sido capa
citada para realizar la nueva terapia y que tiene tiempo para tratar sólo a un paciente). La depre
sión del paciente se medirá con una escala de depresión estándar que se aplica automáticamente a
todos los pacientes después de 4 semanas. Esa escala ha sido aplicada a los pacientes durante un
largo tiempo en este centro de tratamiento. Por lo tanto, es posible determinar por adelantado “en
aquellos pacientes que recibieron la terapia usual” la distribución de los valores del nivel de de
presión a las 4 semanas. En nuestro ejemplo ficticio, esa distribución sigue una curva normal con
una medía de 69,5 y un desvía estándar de 14,1. (Las cifras mencionadas se aproximan a los valo
res de depresión obtenidos en una encuesta nacional de 75,000 pacientes psiquiátricos a los que
se Ies suministró el m m p i , una prueba estándar ampliamente utilizada; Dahlstrom, Larbar, &
Dahlstrom, 1986). La figura 6-7 muestra esta distribución.
El procedimiento de prueba de hipótesis se realiza, entonces, de la siguiente manera:
1. Replantear el problema en función de hipótesis de investigación e hipótesis nula de la
poblaciones. Las dos poblaciones de interés son:
Población X: pacientes con diagnóstico de depresión que recibieron la nueva terapia.
Población 2: pacientes con diagnóstico de depresión que recibieron la terapia estándar.
La hipótesis de investigación supone que, al medir la depresión 4 semanas después dei ingre
so, los pacientes que reciben la nueva terapia (población 1) tendrán un valor diferente al de los pa
cientes que reciben la terapia actual (población 2). En símbolos, ia hipótesis de investigación es
M x ;£ M2. L o contrarío a la hipótesis de investigación, la hipótesis nula, supone que los pacientes
que reciben la nueva terapia tendrán el mismo nivel de depresión que los pacientes que reciben la
terapia usual. (Es decir, el nivel de depresión medido después de 4 semanas será el mismo para la
población 1 y 2). En símbolos, la hipótesis nula es: jl^ = |i¿.
F ig u r a 6 -7 . D is tr ib u c ió n d e io s v a lo r e s d e la e s c a la d e d e p r e s ió n m m p i a 4 s e m a n a s d e l in g r e s o , c o r r e s p o n
d ie n t e s a p a c ie n t e s p s iq u iá tr ic o s a lo s q u e s e l e s d ia g n o s t ic ó d e p r e s ió n y q u e r e c ib e n la ter a p ia e s t á n d a r (d a
to s f ic t i c io s ) .
Nivel de depresión: 4! ,3-' 55,4 69,5 83,6 97,7 <■
Pimíiiadán Z: -2 *~l .:o + 1-' -VI ,
: .. •
::: Depresión de! paciente ■
que conforma la muestra = 41
. ‘ Z jb - 2,02
Figura 6-8. Distribución de los valores de la escala de depresión m m h con el 2 1 /2 % superior e inferior
sombreado, el cual indica la ubicación del paciente que conforma la muestra y que recibió la nueva terapia,
(datos ficticios).
Dado que se trata, hasta ahora, de la más enérgica e importante controversia surgida en años con res
pecto a la estadística aplicada a la psicología, trataremos los distintos temas relacionados con ella al
menos en tres diferentes oportunidades. En este capítulo, nos concentraremos en algunos desafíos
básicos para la prueba de hipótesis. En los capítulos 7 y 8 tocaremos otros temas relacionados con
aspectos de la prueba de hipótesis que enseñaremos en esos capítulos.
Antes de exponer esta controversia, queremos asegurar al alumno que no está aprendiendo la
prueba de hipótesis inútilmente. No importa lo que suceda en el futuro, ya que es absolutamente
necesario comprender la prueba de hipótesis para poder encontrar el sentido de todas las publica
ciones científicas publicadas en el pasado. Más aún, a pesar de la vehemente controversia que ha
surgido en los últimos años, es sumamente extraño ver nuevas publicaciones que no utilicen la
prueba de significación, por lo que resulta dudoso que ocurra algún cambio importante en un futu
ro cercano. Finalmente, aun si se abandonara por completo la prueba de hipótesis, las alternativas
(que involcucran procedimientos que enseñaremos en los capítulos 7 y 8) requieren la compren
sión de prácticamente toda la lógica y de todos los procedimientos que tratamos aquí.
¿Cuál es entonces la gran controversia? Algunos puntos del debate están relacionados con su
tiles temas de lógica. Por ejemplo, una postura plantea si tiene sentido preocuparse por rechazar
la hipótesis nula cuando es extremadamente improbable que resulte verdadera una hipótesis que
supone que no se produce ningún tipo de efecto. Tratamos este tema brevemente en el cuadro 6-1.
Otro de los temas está relacionado con los fundamentos de la prueba de hipótesis en relación
con las poblaciones y las muestras, debido a que en la mayoría de los experimentos las muestras
que utilizamos de la población definible no son seleccionadas de manera aleatoria. En el capítulo
5 tratamos algunos puntos relacionados con este tema. Finalmente, algunos han cuestionado lo
adecuado de llegar a la conclusión de que si la información es inconsistente con la hipótesis nula,
esto debe ser considerado como evidencia de la hipótesis de investigación. Esta controversia es
bastante técnica, pero nuestra propia opinión es que lo que estamos haciendo es razonable, con
forme a recientes consideraciones sobre estos temas, (véase, p. ej. Cortina & Dunlop, 1997).
De todos modos, la queja más considerada contraías pruebas de significación, y que ha obte
nido el acuerdo prácticamente universal, es que las pruebas están mal utilizadas. De hecho, los
opositores de las pruebas de significación sostienen que aun si no existieran otros inconvenientes
con respecto a las pruebas, éstas deberían ser prohibidas, simplemente por ser utilizadas con tan
ta frecuencia de un modo tan inadecuado. Son dos los casos de pruebas que se utilizan inadecua
damente, Una podemos analizarla ahora, la otra deberá esperar hasta que hayamos tratado un
tema que enseñaremos en el capítulo 8.
Uno de los principales usos inapropiados de las pruebas es la tendencia de los investigadores
a decidir que, si un resultado no es significativo, queda demostrado que la hipótesis nula es verda
dera, Repetidamente hemos subrayado que cuando no se rechaza la hipótesis nula, los resultados
no son concluyentes. El error de llegar a la conclusión de que la hipótesis nula es verdadera, debi
do a la imposibilidad de rechazarla, es extremadamente serio, ya que pueden considerarse falsos
importantes métodos y teorías sólo porque determinado estudio no logró resultados lo suficiente
mente fuertes. (Como veremos en el capítulo 8, es bastante fácil que una hipótesis de investiga
ción verdadera no resulte signiñcativa sólo porque el estudio se realizó con pocas personas o
porque las medidas no eran muy precisas. De hecho, Hunter (1997) sostiene que en aproximada
mente el 60% de los estudios psicológicos es probable que obtengamos resultados no significati
vos aun cuando la hipótesis de investigación sea realmente verdadera).
¿Cuál es entonces la solución? El consenso general parece determinar que deberíamos man
tener las pruebas de significación, pero preparando mejor a nuestros alumnos para que no las uti
licen de manera inadecuada (a esto se debe que se haya hecho tanto hincapié en esos temas a lo
largo del libro), es decir que deberíamos cuidamos de no perder una herramienta valiosa sólo por
que no se ía utilice en manera adecuada. Con el fin de tratar esta controversia, la a p a estableció un
comité formado por eminentes psicólogos renombrados por su experiencia en estadística. En el
informe provisorio del Cuerpo de trabajo sobre inferencia estadística [Task Force on Statistical
Inference] de la a p a (1996), llegaron a la siguiente conclusión:
Respaldamos una política de inclusión que admita en el arsenal del científico de investigación
cualquier procedimiento que apropiadamente arroje algo de luz sobre el fenómeno de interés. En
este sentido, el Cuerpo de Trabajo no respalda ninguna acción que pueda ser interpretada como
prohibición del uso de la prueba de significación de la hipótesis nula o de los valores p en investi
gaciones y publicaciones psicológicas, (p. 2)
RESUMEN
La idea básica de una prueba de hipótesis es analizar la probabilidad de que el resultado de un es
tudio pudiera haber sucedido aun si ía situación real implicase que el procedimiento experimental
no produjo ninguna diferencia. Si la probabilidad es baja, se rechaza el escenario de la no diferen
cia, y se sostiene la teoría a partir de ía cual surgió el procedimiento experimental La expectativa
de una diferencia es la hipótesis de investigación, y la situación imaginaria en la que no existe
ninguna diferencia se denomina hipótesis nula. Cuando un resultado fuera muy inverosímil, si la
hipótesis nula fuera verdadera; entonces se rechaza la hipótesis nula y se sostiene la hipótesis de
Tabla 6-1.
Valores medios de variables observadas en clase, relacionadas con la motivación según la situación
socioeconómica.
C o n d ic ió n P riv ile g ia d o s
so cio e c o n ó m ica b a ja
investigación. Si los resultados obtenidos no son muy extremos, se dice que el estudio no fue con
cluyente.
Los psicólogos usuaimente consideran un resultado como muy extremo si presenta menos de
un 5% de posibilidades, aunque algunas veces se utiliza un corte más riguroso, del 1%. Estos por
centajes pueden aplicarse a la probabilidad de que un resultado sea extremo en una dirección pre
dicha (prueba direccional o de una cola), o a la probabilidad de que sea extremo en cualquiera de
las dos direcciones posibles (prueba no direccional o de dos colas). Para aplicar una política más
conservadora, los psicólogos utilizan con frecuencia las pruebas de dos colas aun cuando ya ten
gan una predicción específica.
El proceso de prueba de hipótesis involucra cinco pasos:
1. Replantear el problema en función de la hipótesis de investigación e hipótesis nula de las
poblaciones.
2. Determinar las características de la distribución comparativa.
3. Determinar el punto muestra! de corte en la distribución comparativa, a partir del cual de
bería rechazarse la hipótesis nula.
4. Determinar el valor muestral en la distribución comparativa.
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hipótesis nula.
Una gran controversia ha surgido recientemente con respecto a las pruebas de significación.
Los críticos han planteado cuestiones sobre la lógica básica de estas pruebas. Sin embargo, la
principal crítica plantea que, con mucha frecuencia, las pruebas son mal utilizadas. Una manera
que tienen ios investigadores para utilizar inadecuadamente las pruebas es interpretando que el no
rechazo de la hipótesis nula implica sostenerla.
En general, las publicaciones científicas informan los resultados de la prueba de hipótesis in
dicando si fueron o no significativas y mostrando el nivel de corte de la probabilidad (general
mente del 5% ó 1%) según el cual fue tomada la decisión.
Términos Clave
Distribución comparativa. - Hipótesis direccional. - Prueba de una cola.
Niveles convencionales de - Prueba de hipótesis. - Hipótesis de investigación.
significación (p<O,O5,.p<O,01). - Hipótesis no direccional. - Estadísticamente significativo.
Punto muestral de corte . - hipótesis nula. - Prueba de dos colas.
Ejercicios
Los ejercicios implican la realización de cálcu 2. Lea atentamente los tres puntos que
los (con la ayuda de una calculadora). La ma aparecen a continuación y, a) indique cuáles
yoría de los problemas estadísticos reales se son las dos poblaciones que se comparan, b)
resuelven por computadora, pero aunque exis establezca la hipótesis de investigación, c) es
ta la posibilidad de utilizarla, es conveniente tablezca la hipótesis nula y d) determine si se
realizar estos ejercicios manualmente para in debería utilizar una prueba de una o dos colas y
corporar el método de trabajo. por qué.
Para adquirir práctica en la utilización de i) Los niños canadienses hijos de bibliot
una computadora, para resolver problemas es carios ¿tienen una mayor habilidad para la lec
tadísticos, se puede utilizar la sección de com tura que los niños canadienses en general?
putación de cada capítulo, publicada en la n) El nivel de ingreso de los residentes de
Guía de estudio y libro de tareas de computa determinada ciudad ¿es diferente del nivel
ción para el alumno [Student's Study Guide de ingresos de los habitantes de la región?
and Computer WorkbookJ que acompaña este m) Las personas que han sufrido la expe
libro. riencia de un terremoto ¿tienen más o menos
Todos los datos de esta sección son ficti
confianza en sí mismas que la población en ge
cios (a menos que se especifique lo contrario).
neral?
Las respuestas a los ejercicios de la serie I
3. Basándose en ia información obtenida
se encuentran al final del libro.
de cada uno de los siguientes estudios, deter
mine si se rechaza o no ia hipótesis nula. En
SERIE I cada caso, determine: a) la puntuación Z de cor
1, te en la distribución comparativa, a partir de
Defina ios siguientes términos utilizan
do sus propias palabras: a) hipótesis de investi la que debería rechazarse la hipótesis nula; b) la
gación, b) hipótesis nula, c) procedimiento de puntuación Z muestral en la distribución compa
prueba de hipótesis, d) distribución comparati rativa, y c) su conclusión. (Suponga que to
va, e) nivel de significación 0,05, y f) prueba das las poblaciones están normalmente dis
de una cola. tribuidas).
mayor. El psicólogo propone la teoría de que
Registro Colas una persona se recuperará más rápido de la
Estudio Población muestra! p de la prueba operación si los amigos y la familia están en
M' CF
la habitación con el paciente durante las prime
A 10 2 14 0,05 1 (predicción alta) ras 48 horas siguientes a la operación. Se sabe
B 10 2 14 0,05 2 (en este ejemplo ficticio) que el tiempo de re
C 10 2 14 0,01 1 ( predicción alta) cuperación está distribuido normalmente con
D 10 2 14 0,01 2
4
una media de 12 días y un desvío estándar de 5
E 10 14 0,05 1 ( predicción alta)
F 10 1 14 0,01 2 días. El procedimiento se prueba con un pa
G 10 2 16 0,01 2 ciente seleccionado al azar, que se recupera en
H 12 2 16 0,01 2 18 días. Utilizando el nivel de significación
I 12 2 8 0,05 1 { predicción baja) 0,01, ¿qué conclusión debería sacar el investi
gador? Resuelva este problema utilizando ex
plícitamente los cinco pasos de la prueba de
4, Una psicóloga interesada en ios sentidos hipótesis. Luego explique su respuesta a al
del gusto y del olfato ha realizado una serie ex guien que nunca ha asistido a un curso de esta
tensiva de estudios en los que hace probar a dística (pero que está familiarizado con los
alumnos universitarios 20 tipos de alimentos conceptos de media, desvío estándar y puntua
diferentes (damasco, chocolate, cereza, café, ciones Z).
ajo, y otros). Cada alimento se suministra en 6. Robins y John (1997) realizaron un es
forma de gota que se vierte spbre la lengua. De tudio sobre el narcisismo (egolatría), en el que
toda la población de alumnos de la universi se comparaban individuos que habían tenido
dad, la cantidad media que los alumnos pueden valores altos con individuos que habían obteni
identificar correctamente entre estos 20 ali do valores bajos (con ítems tales como: “Si yo
mentos es 14, con un desvío estándar de 4. (Su gobernara el mundo, éste sería un lugar me
pongamos que todos los alumnos de esa jor”). También realizaban algunas otras pre
facultad son examinados como parte de una in guntas, incluyendo un ítem en el que se
vestigación médica al comienzo de cada año). preguntaba a los participantes cuántas veces se
La psicóloga tiene razones para creer que la miraban al espejo en un día típico. Al informar
precisión de las personas, en esta prueba, está sobre los resultados, los investigadores obser
más relacionada con el olfato que con el gusto. varon:
Por lo tanto, establece procedimientos especia “ ... tal c o m o s e hab ía predicho, lo s in d ivi
d u o s c o n un a lto grado d e n arcisism o in
les que impiden utilizar el sentido del olfato
form aron q u e s e m iraban a l e sp e jo c o n
durante la prueba. Luego, la psicóloga prueba m ás fr e cu en cia q u e lo s in d iv id u o s c o n un
el procedimiento en un alumno seleccionado al bajo n iv e l d e n a rcisism o (A is = 5 ,7 vs
azar. El alumno identifica correctamente sólo 5 4 ,8 ).., p<Q ,05" (p. 39).
alimentos. Utilizando el nivel de significación Explique este resultado a una persona que nunca
0,05, ¿qué conclusión debería sacar la investi ha asistido a un curso de estadística. (Concéntre
gadora? Resuelva este problema utilizando ex se en el significado del resultado en cuanto a
plícitamente los cinco pasos de la prueba de la lógica general de la prueba de hipótesis y a la
hipótesis. Luego explique su respuesta a al significación estadística).
guien que nunca ha asistido a un curso de esta
dística (pero que está familiarizado con los
conceptos de media, desvío estándar y puntua SERIE II
ciones Z). L Enumere los pasos del proceso de prue
5. Un psicólogo está trabajando con perso ba de hipótesis y explique el procedimiento y
nas que han tenido un tipo particular de cirugía los.fundamentos de cada uno.
2. Para cada uno de los puntos que se deta 4. Un investigador ha descubierto que cier
llan a continuación, a) indique cuáles son las tos sonidos hacen a las ratas mucho más agre
dos poblaciones que se comparan, b) determine sivas, y predice que los sonidos también dis
la hipótesis de investigación, c) determine la hi minuirán sus desempeños en cuanto a tareas de
pótesis nula y d) explique si se debería utilizar aprendizaje. Supongamos que se sabe que una
una prueba de una o dos colas y por qué. rata promedio, ordinaria, puede aprender a co
0 En un experimento, se dan instruccionesrrer correctamente en un determinado laberin
a los participantes para que resuelvan un pro to en 18 pruebas, con un desvío estándar de 6.
blema concentrándose en los detalles. ¿Es di El investigador, entonces, prueba una rata or
ferente la velocidad con 3a que resuelven el dinaria en el laberinto, pero haciéndole escu
problema las personas que han recibido tales char el sonido. La rata necesita 38 intentos
instrucciones, en comparación con las perso para aprender el laberinto. Utilizando el nivel
nas a las que no se les ha dado ninguna instruc 0,05, ¿qué conclusión debería sacar el investi
gador? Resuelva este problema utilizando ex
ción especial?
plícitamente ios cinco pasos de la prueba de
li) A partir de informes antropológicos en
hipótesis. Luego explique su respuesta a al
los que se registra la condición social de la
guien que nunca ha asistido a un curso de es
mujer en una escala de 10 puntos, se conocen
tadística (pero que está familiarizado con los
la media y el desvío estándar en muchas cultu conceptos de media, desvío estándar y puntua
ras. Se descubre una nueva cultura en la que ción Z).
existe una organización familiar inusual. Tam 5. Un psicólogo especializado en temas de
bién se clasifica la condición social de la mu familia ha desarrollado un elaborado progra
jer en esta cultura. ¿Las culturas con una or- ma de capacitación para contribuir a la adapta
organización familiar inusual brindan a la mujer ción de hombres sin hijos casados con mujeres
una condición social más elevada que ia$ cul con hijos adolescentes. Supongamos que se
turas en general? sabe, a partir de investigaciones previas, que
m) ¿Las personas que viven en grandes estos hombres, un mes después de mudarse,
ciudades sufren más enfermedades relaciona con la nueva esposa y sus hijos, sufren un ni
das con el estrés que las personas en general? vel de estrés de 85 con un desvío estándar de
3. A partir de la información correspon 15. Como experimento piloto, se prueba el
diente a cada uno de ios siguientes estudios, programa de capacitación en un hombre selec
determine si se rechaza o no la hipótesis nula. cionado al azar de entre todos aquellos en de
En cada caso, establezca a) la puntuación Z de terminada ciudad que, durante el mes anterior,
corte en la distribución comparativa a partir de se habían casado con una mujer con un hijo
la cual debería rechazarse la hipótesis nula; b) adolescente. Después del programa de capaci
la puntuación Z muestral en la distribución tación, el nivel de estrés de ese hombre es 60.
comparativa, y c) su conclusión. (Suponga que Utilizando el nivel 0,05, ¿qué conclusión de
todas las poblaciones están normalmente dis bería sacar el investigador? Resuelva este pro
tribuidas). blema utilizando explícitamente los cinco
pasos de la prueba de hipótesis. Luego expli
O bservación C olas que su respuesta a alguien que nunca ha asisti
E studio Población m uestra! p de la p r u e b a do a un curso de estadística (pero que está
H- cr familiarizado con los conceptos de media,
A 100,0 10,0 8 0 0,05 1 (predicción baja) desvío estándar y puntuación Z).
B 74,3 11,8 80 0,01 2 ó. En una publicación acerca de las campa
C 1 6 ,9 L2 80 0,0 5 1 (predicción baja) ñas en contra del tabaco, realizado en Massa-
D 88,1 12,7 80 0,05 2
chussetts en 1993 y 1995, Siegel y Biener
(1997) exponen los resultados de una encuesta explique qué significa el resultado a una perso
sobre e l consumo de tabaco y las distintas acti na que nunca ha asistido a un curso de estadísti
tudes. La tabla 6-2 muestra ios resultados de ca. (Concéntrese en el significado del resultado
esta encuesta. Concentrándose sólo en la pri en cuanto a la lógica general de la prueba de hi
mera línea (porcentaje que fuma > 25 por día), pótesis y a la significación estadística).
Tabla 6-2.
Algunos indicadores dei cambio en ei consumo de tabaco, exposición ai e t s 3 , y actitudes del público
hacia las políticas de control deí tabaco, Massachussetts, 1993-1995.
1993 1995
C o m p o r ta m ie n to d e fu m a d o res a d u lto s
Porcentaje que fuma > 25 cigarrillos diarios 24 10*
Porcentaje que fum a < 1 5 cigarrillos diarios 31 49*
Porcentaje que fuma antes de tra n scu rrid o s 3 0 m inutos de despertarse 54 41
E x p o sició n a l h u m o d e ta b a co en el a m b ien te
Porcentaje de trabajadores que inform an sobre 53 65*
un lugar de trabajo en e l que no se fuma
M edia de horas de exposición al ets en el trabajo 4,2 2,3'
durante la sem ana anterior
Porcentaje de hogares en los que está prohibido fumar 41 51*
A c titu d e s h a c ia las p o lític a s de co n tro l del ta b a co
Porcentaje que apoya un m ayor aum ento de im puestos al tabaco 78 81
asignando lo s fondos al control del tabaco
Porcentaje que cree que la exposición al ets es perjudicial 90 84
Porcentaje que apoya la prohibición 54 64*
de las máquinas expendedoras
Porcentaje que apoya la prohibición del patrocinio de deportes 59 53*
y eventos culturales por parte de las com pañías d e tabaco
E
como ejemplos estudios en los que la muestra estaba formada por un sólo individuo.
Sin embargo, cómo señalamos anteriormente, en la práctica, la investigación psico
lógica usualmente utiliza muestras integradas por muchos individuos. En este capí
tulo nos basamos en lo aprendido hasta ahora y analizamos la prueba de hipótesis
con muestras de más de un individuo, lo cual requiere, principalmente, analizar con cierto detalle
lo que denominamos distribución de medias.
LA DISTRIBUCIÓN DE MEDIAS
La prueba de hipótesis en condiciones normales de investigación, cuando se analiza una muestra
formada por muchos individuos, es exactamente igual a lo que hemos aprendido en el capítulo 6,
con una importante excepción. Cuando hay más de una persona en la muestra surge un problema
específico en eí paso 2, al determinar las características de la distribución comparativa. Él proble
ma es que el valor muestral que nos interesa es la media del grupo de valores. Las distribuciones
comparativas que hemos estado analizando hasta ahora han sido distribuciones poblacionales de
valores individuales (por ejemplo, las edades en que cada bebé en particular comienza a caminar
o la población de valores individuales a partir de un cuestionario para medir el nivel de felicidad).
Comparar la media de una muestra de, digamos, 50 individuos con una distribución de valores in
dividuales constituye una comparación desigual, como comparar manzanas y naranjas. En cam
bio, cuando lo que nos interesa es la media de una muestra de 50, necesitamos una distribución
comparativa formada por medias de muestras de 50 valores. A esta distribución comparativa la
denominaremos distribución de medias.
Para expresarlo más formalmente, una distribución de medias es una distribución formada
por las medias de cada una de las numerosas muestras del mismo tamaño seleccionadas al azar
entre la misma población de individuos. (Los estadísticos también llaman a esta distribución de
medias una “distribución en el muestreo de la media”; sin embargo, en este libro utilizamos el
término distribución de medias para que quede claro que estamos hablando de poblaciones y no
de muestras o distribuciones de frecuencias de una muestra).
La distribución de medias es la distribución comparativa adecuada cuando la muestra está
formada por más de una persona. Por eso, en la mayoría de las investigaciones resulta necesario
determinar las características de esa distribución para poder realizar el paso 2 del procedimien
to de prueba de hipótesis.
' -M= 4 ,6 Z .
SD2. - 0,39.
5 0 = 0,62.
' Gr á do' , \
0
L 2 '■3 .4, .5 6 7 8 .9
'■ Grado'. F ig u r a 7 -2 . D istrib u ción de m ed ia s d e tres
m uestras aleatorias de lo s grados a lo s qu e
perten ecen dos e sc o la r e s, extraídas de una
Figura 7 -1 . D istrib u ción d e l grado d e 9 0 .0 0 0 p o b la ció n conform ad a por lo s grados a los qu e
e sc o la r e s (d atos fic ticio s). concurren 9 0 .0 0 0 e sc o la r e s (d atos fic ticio s).
una. La figura 7~3b representa el histograma de la distribución de medias después de seleccionar
20 muestras aleatorias de dos registros cada una. Después de seleccionar 100 muestras aleatorias,
el histograma de la distribución de medias podría verse como la figura 7-3c; después de 1.000, co
mo la figura 7-3d. (En realidad, en lugar de utilizar 90.000 pelotitas de ping pong y un recipiente
gigante, creamos los histogramas de la figura 7-3 por medio de una computadora que realizó las
selecciones aleatorias).
Figura 7-3. Distribuciones de medias de muestras aleatorias de dos pelotitas cada una, extraídas de una
población de 90.000 pelotitas, de las cuales, cada 10.000, llevaban uno de los números del 1 al 9. Las casti
dades de medias muéstrales que incluye cada distribución son (a) 10 medias muéstrales, (b) 20 medias
muéstrales, (c) 100 medias muéstrales y (d) 1.000 medias muéstrales. (El muestreo real fue simulado por
computadora).
En la práctica, los investigadores casi nunca tienen la oportunidad de seleccionar muchas
muestras diferentes de una población. Lleva mucho trabajo poder lograr una sola muestra y estu
diar a la gente que la conforma. Sin embargo, afortunadamente podemos determinar las caracte
rísticas de una distribución de muestras en forma directa utilizando algunas reglas simples, sin
necesidad de seleccionar siquiera una sola muestra. La única información que necesitamos es: a)
características de la distribución de ia población de individuos y b) tamaño de cada muestra. (Por
ahora no nos preocuparemos por cómo podríamos conocer las características de la población de
individuos). El trabajoso método de construir una distribución de medias en la forma que acaba
mos de hacerlo y el método conciso que aprenderemos muy pronto, tienen el mismo resultado.
Hemos analizado el proceso de ese modo meticuloso sólo porque ésto ayuda a comprender el
concepto de una distribución de medias.
(7-1)
: En la fórmala anterior, cr2, es la varianza de la distribución de medias, cr2 es ia varianza de la
población de individuos, y N es ei tamaño de cada muestra.
En nuestro ejemplo, la varianza de la población de grados individuales era 6,61, y había
dos niños de escuela por muestra. La varianza de la distribución de medias se calcula del si
guiente modo:
6,67
= 3,34
2
Para utilizar un ejemplo diferente, supongamos que una población de individuos tuviera una va
rianza de 400, y quisiéramos saber la varianza de una distribución de medias de 25 valores obser
vados:
400
orÍ = = 16
N 25
El desvío estándar de una distribución de medias es la raíz cuadrada de la varianza de la distri
bución de medias. Se representa bajo la fórmula:
(T (7-2)
7f
En la fórmula anterior, o Mes el desvío estándar de la distribución de medias.
Algunas veces, esta fórmula se manipula algebraicamente para destacar la relación entre el
desvío estándar de la población de individuos y el desvío estándar de la distribución de medias:
a M = -Jn (7-3)
R e s u m e n d e la s r e g ía s p a r a la d e t e r m in a c ió n
d e la s c a r a c t e r ís t ic a s d e u n a d is t r ib u c i ó n d e m e d i a s
“Hemos ignorado el hecho de que una curva normal es una distribución teórica ininterrumpida. En la mayoría de los
ejemplos de la vida real, los registros se ubican en intervalos específicos, Por lo tanto, una diferencia entre una curva
normal y la distribución de medias de pelotitas de ping pong de nuestro ejemplo es que la curva normal es ininterrum
pida, Sin embargo, en la investigación psicológica, usualmente suponemos que, aun cuando nuestras mediciones se
realicen a través de intervalos específicos, el objeto implícito que estamos midiendo es continuo,
3Ya hemos analizado en el capítulo 5 el principio que establece la tendencia de la distribución de medias hacia una cur
va normal. Aunque aún no habíamos estudiado la distribución de medias, aun así utilizamos ese principio para explicar
por qué ia distribución de tantos elementos en la naturaleza siguen una curva normal, En ese capítulo lo explicamos co
mo consecuencia de las distintas influencias que se equiparan unas a otras para hacer surgir una influencia promedio
con la mayoria de ios registros cerca del centro y, unos pocos, a cada extremo. Ahora hemos explicado el mismo tema
utilizando la terminología de una distribución de medias, Pensemos en cualquier distribución de registros individuales
en la naturaleza como representativa de una situación en la que cada registro es efectivamente un promedio de una serie
aleatoria de influencias que actúan sobre ese registro individual. Analicemos la distribución del peso del canto rodado.
El peso de cada piedra representa una especie de promedio de todas las diferentes fuerzas que actuaron para que ese
canto rodado tenga un peso determinado.
Figura 7-4. Ilustración de los principios de la relación entre la distribución de medias (curvas en la parte in
ferior) y la distribución de la población de observaciones individuales (curvas en la parte superior).
E je m p lo d e d e t e r m in a c ió n d e la s c a r a c t e r ís t ic a s d e u n a d is t r ib u c ió n d e m e d ia s
Analicemos la distribución de valores de una población de alumnos que han rendido el g r e s . Su
pongamos que la distribución es aproximadamente normal con una media de 500 y un desvío es
tándar de 100. ¿Cuáles serán las características de una distribución de medias realizada con
muestras de 50 alumnos cada una, seleccionados de esa población?
1. Dado que la media de la población es 500, la media de la distribución de medias también
será 500.
2. La varianza de la distribución de medias es la varianza de la población de observaciones in
dividuales dividida por la cantidad de individuos en cada muestra. Dado que el desvío estándar de
la población de observaciones individuales es 100, la varianza de esa población es 10.000. La va
rianza de la distribución de medias es 10.000 dividido 50, es decir 200. Lo anterior se expresaba-
jo la siguiente fórmula,
„2 g ¿ 10.000
200
N 50
El desvío estándar de la distribución de medias es la raíz cuadrada de la varianza de la distribu
ción de medias: ^200= 14,14.
3. La forma de la distribución de medias será normal. Se cumplen nuestros dos requerimien
tos: la distribución de valores de la población de individuos es normal y la cantidad de individuos
en cada muestra es igual a 30 ó mayor. (Habría sido suficiente si se hubiera cumplido sólo uno de
los requerimientos).
O t r o e j e m p lo d e d e t e r m in a c ió n d e la s c a r a c t e r ís t ic a s d e u n a d is t r ib u c ió n d e m e d ia s
La Lista de Control de Adjetivos [Adjective Check List] (Gough & Heilbrun, 1983) es una prueba
de personalidad ampliamente utilizada. La prueba está formada por una lista de adjetivos tales co
mo capaz, activo, atlético, y así sucesivamente, y aquellos que realizan la prueba controlan la lis
ta para determinar si cada adjetivo puede aplicarse a sí mismo. Una de las sub-pruebas de la Lista
de Control de Adjetivos se focaliza en la agresión (adjetivos tales como agresivo, peleador, dog
mático). La prueba ha sido aplicada a gran cantidad de personas en el pasado, y se sabe que los va
lores en la escala de agresión presentan una distribución asimétrica con una media de 51 y una
varianza de 93 (redondeando). ¿Cuáles serán las características de una distribución de medias
maestrales de esta población de individuos si cada muestra contiene 10 individuos?
1. La media de la distribución- de medias será 51,1a misma que la media poblacional.
2. La varianza de la distribución de medias será 93, la varianza poblacional, dividida por 10
(tamaño de cada muestra). El resultado es 9,3. Se representa bajo la fórmula:
_ O - 93 - 9 j 3
cr;,2
M"
N 10
El desvío estándar de la distribución de medias es la raíz cuadrada de 9,3, ó lo que es lo mis
mo, 3,05.
3. La distribución de medias no será normal porque la distribución de la población de indivi
duos no es normal, y la cantidad de individuos por muestra es sólo 10. Sin embargo, como toda,
distribución de medias, tendrá tendencia a ser unimodal y más simétrica que la distribución de la
población de valores individuales.
Figura 7-5. Tres tipos de distribuciones: (a) distribución de valores de una población de individuos, (b) dis
tribución de observaciones de una determinada muestra tomada de esa población y (c) distribución de me
dias de todas las muestras posibles de un determinado tamaño, tomadas de esa distribución.
Tabla 7-1.
Comparación de tres tipos de distribuciones.
Distribución
Distribución de una muestra Distribución
poblaciona! determinada de medias
Contenido Valores de Valores de Medias de muestras
todos los individuos los individuos de tomadas al azar de la población.
de la población. unasola muestra.
Forma Podría ser Podría ser Normal, si la población
cualquier forma, cualquier es normal. Aproximadamente
a menudo normal. fonna. normal, si las muestras
contienen >: 30 observaciones
cada una.
Media P- M ~ 1X 1N,
Calculado de las
observaciones tomadas
de la muestra
Varianza tr2 S D ^ K X -M f/N , or^-o-VjV
Calculado de las
observaciones tomadas
de la muestra
Desvío cr s d =Vsd?
estándar
Volviendo ai cuadro 5-3, que trata acerca. ; muestra, El tamaño de la propia población: ":"
de sondeos y de la encuesta de Gallup, ré^- (de individuos), o la relación del. táipañó. '
cordaremós que dejamos sin responder una dé la muestra con el de- Ja población, :no! ,,
importante cuestión sobre la letra chica que influye en ésta fórmula,■ ■■ V
aparece cerca de los resultados de una en Aun así, nuestra intuición podría conti?;
cuesta,y que dice algo, así como: “Informa- - : nuar dicíéndonos que.la éantídad/néces'ariá . :
ción proveniente de un sondeo telefónico 4 ' . para representar a todo el iriméñso público: ;
1.000 adultos estadounidenses, realizado e l • de.los Estados Unidos débela sér mayóf W :‘;
4 y 5 de junio. Error de muestreo ±3%”. ; sólol-OOÓindividuos.Sinémb.argo,silopem" ■;
Dijimos que tina .duda común es pregum samos.bien, cuando la muestra es soló una j
tarse cómo se puede utilizar una cántidatj;- pequeña parte de una población muy grande^ . ,
tan pequeña, como 1.000 individuos (aún- . el tamaño absoluto de lá muestra es el único: ;'
que rara vez se utiliza una cantidad; mucho determinante de exactitud. Ése tamaño abso-? i.
menor) para predecir la opinión de todq el . luto determina el impacto dé los errores aleaA
público de los Estados Unidos.. torios de medición y selección. /
Comencemos con el tema del tamaño . ' Algunas veces: sí influye el tamaño té--...
de la muestra. De acuerdo a lo aprendido ' íatíyp de una muestra con respectó a la po-', r
en este capítulo, sabemos que cuando las blación; ésto ocurre si. la población es tari;
muestras son de gran tamaño, como lo es pequeña que,: “eliminár” ó mtérrogaf::á ál-:,-;.
una. muestra de 1.000 valores, se reduce', guríes,, aumenta- las chances de quedos res
mucho el desvío estándar de la distribu tantes seari :■entrevistados.' Pero- cuando la
ción de medias. Es decir,, la distribución' ' ■.población está formada por millones, eli- ■
de. medias muéstrales se vuelve muy alta minar a mil ó dos mil tendrá un efecto prác- :;
y estrecha,, dispersa alrededor de la media ■ ticamente nulo en las probabilidades de ■'
poblacionál. ' Por lo tanto, la media de qué sean otros. Iqs entrevistados. Una en-,
cualquier muestra de ese tamaño está muy cuesta realizada a i.000 de entre un^'xniflóni.'^i:1
cerca de la media poblacional. Para expre .de votantes, o de entre 10 ó 100 millones dé ■
sarlo de otro modo, la varianza de la dis votantes tendrá esencialmente el .misino
tribución de medias, que refleja cuánto ■ error casual. Lo importante es reducir des
: tiende a diferir cualquier media muestral víos o : errores sistemáticos, lo cual sólo .
de la media poblacional, es la varianza de . puede ^lograrse a través de una- planifica-/ .
la población dividida por el tamaño de la ción muy cuidadosa. . y .d d
no es diferente ai modo usual de convertir una puntuación original en puntuación Z. Sin embargo,
debemos ser cuidadosos para no confundimos, ya que el proceso involucra a más de una media.
Es importante recordar que estamos manejando la media muestral como si fuera una simple ob
servación individual. En otras palabras, la fórmula ordinaria (del capítulo 2) para convertir un va
lor original en puntuación Z es Z - (X - M)¡SD, En la situación que estamos tratando ahora, en
realidad estamos utilizando la siguiente fórmula:
Z“— (7-4)
vM
Por ejemplo, supongamos que la media muestral es 18 y que la distribución de medias tiene una
media de 10 y un desvío estándar de 4, La puntuación Z correspondiente a esta media muestral es
+2. Utilizando la fórmula:
(jkf-jxjtf) _ 1 8 -1 0 _ 8
Z=
<*Aí 4 4
La Figura 7-6 ilustra el cálculo anterior.
que hace que sus significados sean un poco más claros. El objetivo es establecer si el tiempo de
lectura será más rápido en estas condiciones. Por supuesto, también es posible que al proporcio
nar un contexto se demore la lectura por el hecho de hacer más complicada la situación.
También supondremos que los investigadores han realizado muchos estudios previos con es
tas oraciones ambiguas presentadas sin contexto. A partir de esa investigación supondremos que
los investigadores confían en que los tiempos de lectura de oraciones ambiguas, sin ningún con
texto de la población en general, están distribuidos de forma aproximadamente normal, con una
media de 2,75 segundos y una varíanza de 0,02 segundos (cr = 0,14 segundos). La figura 7-7a
muestra la distribución poblacional a la que nos referimos.
En el estudio que acabamos de describir se prueba a 40 individuos utilizando oraciones ambi
guas en contexto. El tiempo medio de lectura es de 2,71 segundos, (En el ejemplo que estamos
analizando conocemos la varíanza poblacional antes de realizar el estudio. En este tipo de situa
ciones, la varíanza muestral no se utiliza para nada en el proceso de prueba de hipótesis). La figu
ra 7-7c muestra la distribución muestral.3
3En realidad, este estudio sería mucho mejor si los investigadores tuvieran también otro grupo de participantes a ios
que se les asignara al azar la realización de una prueba de velocidad de lectura de oraciones ambiguas sin contexto.
Confiar en información proveniente de estudios previos es unpoco arriesgado, porque las circunstancias en las que se
realizaron las pruebas durante uno y otro estudio pueden no ser idénticas. Sin embargo, nos hemos tomado algunas li
bertades con este ejemplo para ayudamos a introducirel proceso de prueba de hipótesis de aun paso por vez. En este
ejemplo, y en los otros del capítulo, utilizamos situaciones en las que se contrasta unasola muestracon una población
“conocida”. Apartirdel capítulo 9, ampliamos el procedimiento depruebade hipótesis para adaptarlo a situaciones de
investigación más realistas, es decir, aquellas que involucranmás de ungrupo de participantes yque incluyen poblacio
nes cuyas características se desconocen.
¿Qué deberían concluir los investigadores? Sigamos los pasos de la prueba de hipótesis.
1. Replantear el problema en función de hipótesis de investigación e hipótesis nula de las
poblaciones. Las dos poblaciones son:
Población 1: participantes que leen oraciones ambiguas en contexto,
Población 2: participantes que leen oraciones ambiguas sin contexto.
La hipótesis de investigación establece que existe una diferencia en el tiempo de lectura entre
las dos poblaciones, es decir, que él tiempo de lectura en contexto será diferente al tiempo de lec
tura sin contexto: p., # La hipótesis nula establece que no existe diferencia entre el tiempo de
lectura de las dos poblaciones: pj = p 2. Cabe mencionar que las hipótesis son no direccionales, Si
bien los investigadores esperan que el tiempo de lectura con contexto sea más rápido, no pueden
descartar la posibilidad de que el contexto retarde el tiempo de lectura, resultado que además se
ría bastante interesante.
2. Determinar las características de la distribución comparativa. Si la hipótesis nula es
verdadera, la población de individuos de la cual proviene nuestra muestra no es diferente de la po
blación 2, cuya media y varianza conocemos. Lo que necesitamos calcular ahora son las caracte
rísticas de una distribución de medias de muestras con 40 valores cada una, tomadas de esa
población de individuos que conocemos.
Por lo tanto, seguimos las reglas para determinar las características de una distribución de
medias: a) la media es igual a la media poblacional, en este caso 2,75 segundos y b) la varianza
es igual a la varianza poblacional dividida por la cantidad de valores de cada muestra. Aplicando
la fórmula:
O02
0,0005
' 40 '
El desvío estándar es la raíz cuadrada del resultado anterior, 0,022. Finalmente, c) la forma de la
distribución será cercana a una curva normal porque las muestras tienen más de 30 valores cada
una. La figura 7~7b ilustra la distribución de medias.
3. Determ inar el punto muestral de corte en la distribución comparativa, a p artir del
cual debería rechazarse la hipótesis nula. Supongamos qne los investigadores decidieron utili
zar un nivel de significación del 5%. Como observamos en el paso 1, han propuesto una hipótesis
no direccional, por lo que necesitamos una prueba de dos colas. Acabamos de determinar que la
distribución comparativa es normal, por lo tanto, podemos consultar ía tabla de áreas bajo la cur
va normal para encontrar la puntuación Z que marca el 21/2% inferior y superior. La tabla nos in
dica que para rechazar la hipótesis nula a un nivel del 5%, necesitamos una puntuación Z de +1,96
ó mayor, 0 bien, de -1,96 ó menor. Las dos regiones del 2 1/2%, en las que la hipótesis nula sería
rechazada, son las que sostienen a las pequeñas áreas sombreadas (son muy difíciles de ver) en las
dos colas de la distribución de medias representada por la figura 7-7b.
4. D eterm inar el valor m uestral en la distribución comparativa. La media muestral es
de 2,71 (véase figura 7~7c). A partir del paso 2, sabemos que la distribución comparativa
(nuestra distribución de medias) tiene una media de 2,75 y un desvío estándar de 0,022, Apli
cando la fórmula:
Figura 7-8. C o n resp e c to al estu d io fic tic io b a sa d o e n e l d e sem p e ñ o en una prueba estándar d e n iv el a c a d é
m ic o , (a ) distrib u ción p o b ia cio n a l d e va lo res in d ivid u ales, (b ) distribu ción d e m e d ia s (d istrib u ción c o m p a
rativa) y (c ) distrib u ción d e la m uestra.
2.304/64, es decir, 36. El desvío estándar de la distribución de medias es la raíz cuadrada de 36, o
sea, 6. Finalmente, dado que en la muestra hay más de 30 individuos, la forma de la distribución
de inedias será aproximadamente normal. La figura 7-8b muestra la distribución de medias que
acabamos de describir.
3. Determinar el punto muestral de corte en ia distribución comparativa, a partir del
cual debería rechazarse la hipótesis nula. Una vez más, supongamos que los investigadores
adoptan el nivel de significación usual del 5%. Los investigadores que realizan este estudio tienen
una predicción claramente direccional, y realmente no están interesados en ningún efecto en di
rección contraria. (Si las instrucciones especiales no mejoran las puntuaciones de la prueba, no
serán utilizadas en el futuro. Cualquier posible resultado que muestre un efecto negativo es irrele
vante). Por lo tanto, los investigadores rechazarán la hipótesis nula si el resultado se encuentra
dentro del 5% superior de la distribución comparativa. La distribución comparativa (la distribu
ción de medias) es una distribución normal, por ende, podemos determinar el 5% superior a tra
vés de la tabla de áreas bajo la curva normal. La parte que nos interesa bajo la curva normal
comienza en una puntuación Z de +1,64, y el área sombreada de la figura 7-8b muestra ese 5% su
perior.
4. Determinar el valor maestral en la distribución comparativa. Los 64 alumnos de quinto
grado que realizaron la prueba aplicando las instrucciones especiales tenían una puntuación me
dia de 22G,'(La figura 7-8c gráfica la distribución de esa muestra). Una media de 220 se encuentra
a 3,33 desvíos estándar por encima de la media de la distribución de medias:
5, Com parar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hipótesis nu
la. Establecimos que la puntuación Z mínima necesaria para rechazar la hipótesis nula es +1,64.
La puntuación Z correspondiente a la media muestral es de +3,33. Por lo tanto, los psicólogos ex
pertos en educación pueden rechazar la hipótesis nula y concluir que se sostiene la hipótesis de
investigación. Para decirlo con otras palabras, el resultado es estadísticamente significativo al ni
vel p<0,05. El resultado puede verse reflejado en la figura 7-8b, donde se observa cuán extrema es
la media muestral en la distribución de medias (la distribución que se aplicaría si la hipótesis nula
fuera verdadera). La conclusión final es que entre alumnos de quinto grado como los analizados,
las instrucciones especiales sin duda mejoran las puntuaciones en las pruebas.
4 Según }a lógica matemática de la estadística inferencia!, debemos considerar la media poblacional com o algo fijo. Los
intervalos de confianza pueden variar, pero la media poblacional es fija. Por lo tanto, podem os decir que estamos 95%
seguros de que nuestro intervalo de confianza incluye la media poblacional. N o deberíamos decir que las chances de
que la media poblacional se encuentre dentro deí intervalo de confianza son del 95%.
^respondiente a la población que representa la muestra que estamos analizando (lo que hemos
llamado población 1), y ño en la distribución de medias correspondiente a la población con la
cual la estamos comparando (población 2). Se estima entonces que la media de la distribución
de medias es la media muestral. En cuanto a la varianza, afortunadamente, por lo general supo
nemos que la varianza de las dos poblaciones es la misma. Consecuentemente, podemos utili
zar la varianza conocida de la población dada (población 2) como base para calcular la varianza
de la distribución de medias de la población en la que estamos interesados (población 1). (La
varianza de la distribución de medias se basa sólo en la varianza de la población y en el tamaño
de la muestra. Por lo tanto, la varianza de la distribución de medias será igual para ambas po
blaciones).
2. Utilizar la tabla de áreas bajo la curva normal para encontrar las puntuaciones Z que coin
ciden con los porcentajes superiores e inferiores que nos interesan. Para un intervalo del 95% de
confianza, debemos buscar la puntuación Z que coincide con el 2,5% inferior y el 2,5% superior
. Para un intervalo del 99% de confianza, debemos buscar la puntuación Z que coincide con el
0,5% inferior y el 0,5% superior.
3. Convertir las puntuaciones Z en puntuaciones originales de la distribución de medias. Esos
son los límites de confianza superior e inferior.
F ig u r a 7 - 9 . E j e m p lo s d e in t e r v a lo s d e l
9 5 % d e c o n f ia n z a c o m p a r a d o s c o n d i s
tr ib u c io n e s d e m e d ia s b a s a d a s e n (a ) u n a
m e d ia p o b la c i o n a l c o n o c id a , ig u a l a
2 1 0 ; (b ) u n a m e d ia m u e s tr a ! ig u a l a 2 2 0 ,
y ( c ) u n a m e d ia m u e s tr a l d e 1 9 0 .
CONTROVERSIAS Y LIMITACIONES:
¿INTERVALOS DE CONFIANZA O PRUEBAS DE SIGNIFICACION?
E l a lu m n o r e c o r d a r á q u e e n e l c a p ít u lo 6 m e n c io n a m o s q u e , e n la a c tu a lid a d , e x i s t e u n e n é r g i c o
d e b a te e n tr e lo s p s ic ó lo g o s a c e r c a d e la p r u e b a d e s ig n if ic a c ió n . E n tr e lo s p r in c ip a le s te m a s
d e d e b a t e s e h a p r o p u e s t o q u e l o s p s i c ó l o g o s u t i l i c e n i o s i n t e r v a l o s d e c o n f i a n z a e n l u g a r d e la s
p r u e b a s d e s ig n ific a c ió n .
Aquellos que están a favor de reemplazar las pruebas de significación con los intervalos de
confianza (p. ej. Cohén, 1994; Hunter, 1997; Schmidt, 1996) citan varias ventajas importantes.
Primero, como observamos anteriormente, ios intervalos de confianza contienen toda la informa
ción clave de una prueba de significación,5 pero además proporcionan información adicional; la
estimación del intervalo de valores dentro del cual podemos estar bastante seguros de que se en
cuentra la verdadera media poblacional. Una segunda ventaja es que concentran la atención en la
estimación y no en la prueba de hipótesis. Algunos investigadores argumentan que el objetivo de
la ciencia es proporcionar estimaciones numéricas de efectos, no sólo decisiones en cuanto a si un
efecto es diferente de cero. Es decir, con las estimaciones (puntuales y por intervalos), tenemos
una idea clara del grado de importancia del efecto y del nivel de precisión de la estimación. Con
las pruebas de hipótesis, sabemos si el efecto puede suceder en la dirección predicha, pero no el
grado de importancia del efecto en esa dirección.
Los intervalos de confianza son particularmente valiosos cuando los resultados no son signi
ficativos (Frick, 1995), porque conocer el intervalo de confianza otorga una idea de cuán lejos de
la ausencia de efecto es probable encontrar la verdadera media. Si todo el intervalo de confianza
se encuentra cerca de la ausencia de efecto, podemos tener la certeza de que si aún existe algún
efecto verdadero, éste probablemente sea pequeño. Por ejemplo, supongamos que se estudia un
grupo de personas después de que son expuestas a un procedimiento que pretende afectar el IC.
La medía del grupo es 102, y el intervalo de confianza abarca desde 99 hasta 105. Esto daría un
resultado no significativo porque el intervalo incluye el valor 100, que es el IC medio.de la pobla
ción que no recibe el procedimiento especial Al mismo tiempo, dado que el intervalo de confian
za incluye otros números diferentes de 100, en realidad es posible que exista un efecto real, Sin
embargo, el punto clave es que si de hecho existiera un efecto real, es probable que sea muy pe
queño, ya que estamos un 95% seguros de que ese efecto no implicaría más que una disminución
de un punto o un aumento de 5 puntos. Por otro lado, supongamos que el intervalo de confianza
para este mismo estudio era de 89 a 115. Este resultado también sería no significativo (porque in
cluye el valor 100). Sin embargo, nos indicaría que el estudio es realmente no concluyente: es po
sible que haya muy poco o ningún efecto (que la media poblacional de aquellos que reciben el
procedimiento sea cercana a 100), pero también es posible que exista un-efecto substancial (que
la verdadera media poblacional de aquellos que reciben el procedimiento implique una disminu
ción de hasta 11 puntos de IC, o un aumento de hasta 15 puntos de IC).
Una tercera ventaja, sostenida por aquellos que proponen los intervalos de confianza para
reemplazar las pruebas de significación, es que existe menos probabilidad de que los investigado
res los utilicen erróneamente. Como observamos en el capítulo 6, un error generalizado en la uti
lización de las pruebas de significación es concluir que un resultado no significativo implica que
5 A lgunos de los que proponen los Intervalos de confianza para reemplazar la prueba de significación sostienen que de
beríamos ignorar el vínculo con la prueba de hipótesis. Esta es la posición más radical en contra de la prueba de signifi
cación. Es decir, estos psicólogos argumentan que todo el enfoque debería concentrarse en la estimación, y que la
prueba de significación de cualquier tipo debería ser «relevante. En el capítulo 8, veremos los fundamentos de esta po
sición, junto con los argumentos contrarios.
no existe ningún efecto. Con ios intervalos de confianza es más difícil caer en este tipo de error. Si
bien el intervalo de confianza que arroja un resultado no significativo incluirá la media esperada
correspondiente a la ausencia de efecto, también incluirá otros valores posibles. Así, nos recuerda
que la verdadera medía poblacional podría muy bien ser diferente de la media correspondiente a
la ausencia de efecto.
A pesar de estas aparentes ventajas, es extremadamente raro encontrar intervalos de confian
za en la mayoría de los diferentes tipos de publicaciones científicas psicológicas. En parte, esto
probablemente se debe a la tradición y a que la mayoría de los psicólogos han sido capacitados
para utilizar las pruebas de significación, por lo que están mucho más acostumbrados a ellas. En
una publicación científica, los intervalos de confianza también requieren una mayor descripción.
Por ejemplo, qué sucedería en el caso de que tuviéramos una tabla de resultados más amplia. Se
ría sencillo agregar un asterisco en cada número para mostrar su significación, por lo cual una ta
bla diseñada de ese modo es fácil de leer. Con los intervalos de confianza, en lugar de un
asterisco, necesitaríamos dos números extra para cada resultado (los límites de confianza superior
e inferior).
Otros psicólogos (p. ej. Abelson, 1997; Harris, 1997) indican dos razones para no abandonar
por completo las pruebas de significación a favor de los intervalos de confianza. Primero, en algu
nos procedimientos estadísticos avanzados es posible realizar pruebas de significación, pero no es
posible calcular intervalos de confianza. Segundo, del mismo modo que es posible cometer erro
res con las pruebas de significación, también es posible cometer otros tipos de errores con los in
tervalos de confianza, especialmente debido a que la mayoría de los psicólogos que realizan
investigaciones tienen menos experiencia en la utilización de estos últimos.
Finalmente, la cuestión de los intervalos de confianza, en contraposición con la significa
ción, tiene sus raíces en una mayor controversia entre estimación y prueba de hipótesis, contro
versia que trataremos en el capítulo 8. Sin embargo, para anticipar esa exposición, podemos
señalar aquí que los intervalos de confianza, por lo general, tienen mucho más sentido en situa
ciones de investigación aplicada, mientras que las pruebas de significación, con frecuencia, tie
nen mucho más sentido én investigaciones con una orientación más teórica.
Cualquiera sea el resultado de esta controversia sobre intervalos de confianza, es importante
comprenderlos, ya que podremos encontrarlos ocasionalmente al leer material relacionado con la
investigación, y es posible que en el futuro aparezcan con más asiduidad. No obstante, en la ac
tualidad no aparecen con frecuencia. Por eso, y para que la cantidad de material a aprender sea
manejable, decidimos no hacer hincapié en el tema de los intervalos de confianza en los próximos
capítulos de este libro que tratan principalmente sobre pruebas de significación en distintos tipos
de investigaciones..
Figura 7-10. E fe c to s d el tip o d e an teced en te (m a scu lin o , fe m e n in o , neutro o in d efin id o) y d el pronom bre
(él, e lla o e llo s ) en TL (T ie m p o de lectura por carácter), cu a n d o las ora cio n es se utilizaron sin referencia,
(E xp erim en to 1). {F u en te; F oertsch , J., & G em sb a ch er, M . A . (1 9 9 7 ), fig. 1, “E n busca d e la neutralidad
d el género; ¿E s e l “e llo s ” sin g u la r un sustituto co g n iíiv a m en te e fic ie n te d el “é l” gen érico?" , C ie n c ia P s i
c o l ó g i c a [ P s y c h o l o g i c a l S c ie n c e ], 8, 108. C opyright, 1 9 9 7 , por la S o c ie d a d A m erican a de P sic o lo g ía
[A m erican P s y c h o lo g ic a l S o c ie ty ]. R eim p reso c o n a u torización .]
en la que una persona se comportaba de forma más amistosa que otra, y luego les preguntaron qué
persona sería más propensa a ser amistosa en el futuro.
Así informaron Chiu et al. uno de sus descubrimientos acerca de los teóricos de entidades:
"Para ellos, si una persona resultó ser más amistosa que otra en una determinada situación, es más
probable que la misma relación se generalice a otras situaciones totalmente diferentes" (p. 23). El
sustento estadístico de esta conclusión fue descripto de la siguiente manera: “La predicción glo
bal de los ‘teóricos de entidades’ [acerca de la probabilidad de que la persona fuera amistosa] fue
significativamente mayor a 0,50 (95% IC - 0,5583 ± 0,0348)” (p. 23). Es decir que podemos te
ner un 95% de confianza de que, en la población, la probabilidad real estaría entre 0,5235 y
0,5931, todos números superiores al 0,50 que esperaríamos si los teóricos de entidades hubieran
elegido al azar. Por el contrario, Chiu et al. descubrieron que los individuos que no eran teóricos
de entidades tuvieron un nivel de predicción significativamente menor al 0,50, con un intervalo
de confianza de 0,3648 a 0,4902.
RESUMEN*6
Al estudiar una muestra de más de un individuo, la distribución comparativa en el proceso de
prueba de hipótesis es una distribución de medias de todas las muestras posibles de tamaño igual
a la cantidad de casos que se están estudiando. Podemos considerar que esa distribución descri
be cuál sería el resultado de a) tomar una gran cantidad de muestras, cada una con la misma can
tidad de unidades seleccionadas al azar de la población de individuos y, luego b) crear una
distribución de las medias de esas muestras.
La distribución de medias tiene la misma media que la población de observaciones. Sin em
bargo, tiene una varianza menor porque las medias muéstrales tienen menos probabilidad de ser
extremas que las observaciones individuales. (Los extremos de cualquier muestra tienden a
equiparse con los valores centrales o los valores extremos en dirección opuesta). Específicamen
te, la varianza de ia distribución de medias es la varianza de la población de observaciones indi
viduales dividida por la cantidad de individuos que forma cada muestra (el desvío estándar es la
raíz cuadrada de la varianza). La forma de la distribución de medias se aproxima a la curva nor
mal si a) la población de individuos sigue una curva normal o b) las muestras tienen 30 registros
cada una, o más.
Las pruebas de hipótesis que involucran una sola muestra de más de un individuo y una pobla
ción conocida se realizan de la misma forma que las pruebas de hipótesis presentadas en el capítulo
6 (donde los estudios se realizaban con un sólo individuo comparado con una población de indivi
duos). La excepción principal es que la distribución comparativa es una distribución de medias.
La mejor estimación puntual de la media poblacional es la media maestral. Podemos deter
minar una estimación por intervalo de la media poblacional basándonos en la distribución de me
dias. Cuando la distribución de medias sigue una curva normal, el intervalo del 95% de confianza
incluye todos los números, desde 1,96 desvíos estándar por debajo de la media maestral (límite
de confianza inferior) hasta 1,96 desvíos estándar por encima de la media maestral (límite supe
rior de confianza). El intervalo del 95% de confianza es un intervalo de valores acerca del cual te
nemos un 95% de seguridad de que incluye la verdadera media poblacional.
Uno de ios aspectos del debate actual acerca de las pruebas de significación plantea si los in
vestigadores deberían reemplazarlas por los intervalos de confianza. Aquellos que proponen los
intervalos de confianza sostienen que éstos brindan información adicional, se concentran en la es
timación y reducen la utilización incorrecta propia de las pruebas de significación. Sin embargo,
los intervalos de c'órifianza rara vez se utilizan en las publicaciones científicas psicológicas, en
parte, debido a la costumbre y a la falta de familiaridad coa ellos, así como también a la incomo
didad que presenta su descripción. Además, aquellos que se oponen a basarse exclusivamente en
los intervalos de confianza sostienen que ios intervalos no pueden utilizarse en algunos procedi
mientos avanzados, que la estimación no siempre es el objetivo deseado y que también los inter
valos pueden utilizarse de formas incorrectas propias de ellos.
El tipo de prueba de hipótesis descripfa en este capítulo rara vez se utiliza en la investigación
práctica (la hemos aprendido como escalón hacia otros temas). El desvío estándar de la distribu
ción de medias, con frecuencia denominado “error estándar” (SE), en ocasiones se utiliza para
describir la variabilidad esperada de las medias, particularmente en gráficos de barra en los que el
error estándar puede representarse por la longitud de un segmento ubicado sobre o debajo de la
parte superior de cada barra.
Términos clave
- intervalo de confianza (.IQ . ■Intervalo del 95% - Desvío estándar de una
- Lhmtes.de confianza. de confianza. distribución de medias (aM).
- Distribución de medias. ■Intervalo del 99% - Error estándar de la media (SE).
- Estimación por intervalos. de confianza. - Varianza de una distribución
- Media de una distribución ■Estimación puntual. de medías (o2^).
de medias (mM). •Forma de la distribución - Prueba Z.
de medias.
otencia es ia capacidad para cumplir objetivos. Por eso, una medida razonable de
P
potencia en cualquier situacfóñdádi es la probabilidad de cumplir con los objetivos
en esa determinada situación. El objetivo de un investigador que realiza un experi
mento es la obtención de un resultado significativo, siempre que la hipótesis de in
vestigación realmente sea verdadera. La potencia estadística de un estudio es la
probabilidad de que ese estudio tenga un resultado significativo si la hipótesis de investigación
es verdadera. .... ' ....
Calcular la potencia al planificar un estudio ayuda a definir la cantidad de participantes que
se van a utilizar. Además, comprender el concepto de potencia es sumamente importante para
cualquiera que lea publicaciones de investigación psicológica; por ejemplo, para comprender los
resultados experimentales que no son significativos o resultados que son significativos estadísti
camente pero no en la práctica.
En este capítulo, examinamos sistemáticamente el concepto de potencia estadística. Qué es,
cómo se calcula, qué tactores influyen en ella, y por qué es importante. Es nuestra obligación ad
vertir que, a veces, este material acerca de la potencia puede resultar particularmente difícil de
captar. Pero vale la pena aprenderlo. Por eso, recomendamos ai lector ser paciente consigo mismo
y tomarse todo el tiempo que sea necesario. Estamos seguros de que lo logrará.
Como parte del proceso de aprendizaje de la potencia, el capítulo también presenta la noción
de tamaño del efecto. Como veremos, el tamaño del efecto es un punto crucial para comprender la
potencia, y un tema de considerable importancia en sí mismo para comprender las investigacio
nes psicológicas.
¿QUÉ ES LA POTENCIA ESTADÍSTICA?__________________________________
Dijimos que ia potencia estadística de un experimento es la probabilidad de que el estudio arroje
un resultado significativo si la hipótesis de investigación es verdadera. Es importante tener en
cuenta que la potencia de un experimento implica determinada situaciénNsi la hipótesis de investi
gación es verdadera. No nos interesa lograr un resultado significativo si la hipótesis de investiga
ción es falsa.
Ahora bien, podríamos preguntamos lo siguiente:“¿Si la hipótesis de investigación es verda
dera, no dará el experimento automáticamente un resultado significativo?” La respuesta es no;
puede ocurrir que la muestra particular que fue seleccionada de la población no resulte lo sufi
cientemente extrema como para rechazar la hipótesis nula._
Ejemplo
Analicemos nuevamente el ejemplo del capítulo 7 acerca de las instrucciones especiales a alum
nos de quinto grado que están dando un examen estándar de nivel. En el proceso de prueba de hi
pótesis de este ejemplo comparamos dos poblaciones:
Población 1: alumnos de quinto grado que reciben instrucciones especiales.
Población 2: alumnos de quinto grado que no reciben instrucciones especiales.
La hipótesis de investigación establecía que la población 1 tendría puntuaciones más altas que la
población 2. -Ho ' > lA ^
La distribución superior de la figura 8-1 gráfica la situación en la que la hipótesis de inves
tigación es verdadera. La distribución inferior representa a la población 2. Dado que estamos
interesados en medias de muestras formadas por 64 individuos, ambas distribuciones son dis
tribuciones de medias,
La distribución inferior es también la distribución comparativa, es decir, la distribución de
medias que esperaríamos para ambas poblaciones si la hipótesis nula fuera verdadera. El área
sombreada en la cola derecha de la distribución inferior es el área en la cual rechazaríamos la hi
pótesis nula si, como resultado del estudio, la media muestral se encontrara bajo esa área. El área
de rechazo sombreada comienza a 209,84 (una puntuación Z de 1,64) y abarca un 5% de la distri
bución comparativa.
La distribución de medias superior es la que predicen los investigadores para la población
que recibe instrucciones especiales (población 1). En el capítulo 7, nunca hablamos de esa distri
bución, en parte porque la distribución de la población predicha es bastante imaginaria, a m enos
que la hipótesis de investigación sea verdadera. Si la hipótesis nula es verdadera, la distribución
de la población 1 sería igual a la distribución que se basa en la población 2. Es decir, si la hipóte
sis nula es verdadera, la distribución de la población 1 no estaría desplazada hacia la derecha.
No obstante, para aprender el tema de la potencia, aquí analizamos la situación en la cual la
hipótesis de investigación es verdadera. En esa situación, la media de la población 1 se encuentra
más hacia la derecha que la media de la población 2 (distribución comparativa). Es decir, en esa
situación, las puntuaciones en el examen de nivel son, en promedio, mayores en la población 1
que en la población 2. Específicamente, la distribución de medias superior (población 1 predicha)
tiene una media de 208; la media de la distribución comparativa es sólo de 200, lo que muestra
que se espera que la población que recibe las instrucciones especiales (población 1) tenga una
media 8 puntos mayor,
Supongamos ahora que los psicólogos expertos en educación realizan el experimento. Éstos
dan ¡as instrucciones especiales a un grupo de 64 alumnos de quinto grado y calculan la puntua
ción media en el examep. Supongamos que la hipótesis de investigación es verdadera. Recorde
mos que si la hipótesis de investigación es verdadera, la media del grupo de 64 alumnos de quinto
grado pertenece a una distribución semejante a la curva superior en la figura 8-1.
En este ejemplo, sin embargo, la distribución superior de medias (tomada de la predicción del
investigador sobre la población 1) se encuentra sólo levemente volcada hacia la derecha de la dis
tribución comparativa. Es decir, los psicólogos predicen sólo un pequeño aumento de los registros
(ocho puntos) a causa de las instrucciones especiales; por lo tanto, la distribución superior se en
cuentra desplazada sólo una pequeña distancia hacia la derecha en comparación con la distribu
ción inferior, que es la distribución comparativa. Lo que la figura nos indica es que cualquier
1 Ocasionalmente puedes llegar a escuchar mencionar el error Tipo III. Se trata de llegar a la conclusión de que existe
un resultado significativo en una determinada dirección cuando eí efecto real es en la dirección opuesta.
ía cuando, en realidad, no deberíamos hacerlo. A esto se lo denomina error T ip o I La probabili
dad de cometer un error Tipo I, que se denomina alfa, es el nivel de significación. Por lo tanto, en
la mayoría de los estudios, alfa es igual a 0,05.
Ai realizar investigaciones, nunca sabemos a ciencia cierta sí la hipótesis de investigación o
la hipótesis nula son verdaderas. Los resultados del procedimiento de prueba de hipótesis pueden
o no llevamos a rechazar la hipótesis nula, pero, en cualquier caso, no estamos seguros de haber
tomado la decisión correcta.
Supongamos que las instrucciones especiales, en nuestro ejemplo de los alumnos de quinto
grado, en realidad no produjeron ninguna diferencia, y que la hipótesis nula era verdadera. Su
pongamos además que al realizar el estudio, simplemente sucedió que los investigadores selec
cionaron, para recibir las nuevas instrucciones, a algunos alumnos que eran inusualmente buenos
en ese tipo de examen. Aunque es poco probable, podría suceder, y el efecto sería que los investi
gadores rechazarían la hipótesis nula y concluirían que las instrucciones especiales producen una
diferencia. Esta decisión de rechazar la hipótesis nula sería equivocada, error Tipo í. Por supues
to, los investigadores no podrían saber que cometieron un error de este tipo. La seguridad que tie
nen los investigadores es saber que la probabilidad de cometer tal error es baja (menos del 5% si
utilizamos el nivel de significación de 0,05).'
Los errores Tipo I son una gran preocupación para los investigadores psicológicos, quienes
podrían construir teorías completas y programas de investigación, para no mencionar aplicacio
nes prácticas, sobre la base de conclusiones derivadas de pruebas de hipótesis que en realidad es
tán equivocadas. Debido a que estos errores son tan preocupantes, se los denomina Tipo I.
Como ya hemos señalado, los investigadores no pueden saber cuándo han cometido un error
Tipo I; no obstante, pueden intentar realizar estudios en los que las posibilidades de cometer un
error Tipo I sean lo más pequeñas posibles. Supongamos que para determinado estqdio establece
mos el nivel de significación en ¿?<0,05, que indica que rechazaremos la hipótesis nula si existe
menos de un 5% (0,05) de probabilidad de que pudiéramos haber obtenido nuestro resultado si la
hipótesis nula fuera verdadera, AI rechazar ía hipótesis nula en esas circunstancias, estamos ad
mitiendo hasta un 5% de probabilidades de obtener nuestro resultado aun cuando la hipótesis nu
la fuera realmente verdadera. Es decir, estamos admitiendo un 5% de probabilidad de cometer un
error Tipo I; alfa es igual al 5%.
Podríamos disminuir alfa haciendo aún menos probable el rechazo de la hipótesis nula por
error. Por ejemplo, utilizar un nivel 0,001 de significación sería como contratar un seguro contra
el error Tipo I. En ese caso, habría menos de una posibilidad en mil de cometer el error Tipo I. Sin
embargo, al igual que cuando contratamos un seguro, a mayor protección, más alto es el costo.
Existe un costo que pagar por establecer un nivel de significación a un nivel demasiado extremo.
A continuación hablaremos acerca de ese costo.
Al momento de establecer los niveles de significación, protegerse contra un tipo de error aumenta
las chances de cometer el otro tipo de error. El costo de la póliza de seguros contra el error Tipo I
(establecer un nivel de significación de, digamos, 0,001) es aumentar beta, la probabilidad de co
meter el error Tipo II. (Esto ocurre porque con un nivel de significación extremo como 0,001, aun
si la hipótesis de investigación es verdadera, los resultados deben ser demasiado contundentes pa
ra ser lo suficientemente importantes como para rechazar la hipótesis nula). El costo de la póliza
de seguros contra el error Tipo H (establecer un nivel de significación de, digamos, 0,20) es au
mentar las posibilidades de cometer el error Tipo I. (Esto ocurre porque con un nivel de significa
ción como 0,20, aun si la hipótesis nula fuera verdadera, es bastante fácil obtener un resultado
significativo sólo por haber seleccionado accidentalmente una muestra que, aun antes de realizar
el estudio, tema un nivel mayor o menor que la población general).
La negociación entre estos dos temas conflictivos se resuelve usualmente por convención; a
eso se deben los niveles de significación estándar del 5% y el 1%,
Tabla 8-1.
P o s i b l e s d e c i s i o n e s c o r r e c t a s y e r r ó n e a s e n la p r u e b a d e h i p ó t e s i s .
C o n d ició n real de la
h ip ó tesis de in vestigación
(en la p r á c tic a , d esco n o cid o )
V e r d a d e ra F a lsa
■Ctf . j
p = potencia
2 Normalmente suponemos que, independientemente de que la hipótesis nula sea verdadera (es decir, si las medias
dé las dos poblaciones son iguales), las varianzas de ambas poblaciones serán iguales. Las distribuciones de medias de
ambas poblaciones también se basan en la misma cantidad de observaciones en cada muestra (en este ejemplo 64). Por
lo tanto, los desvíos estándar de estas dos distribuciones dé medias también serán iguales.
En el capítulo 7 determinamos que, utilizando un nivel de significación del 5%, con una prue
ba de una cola, para rechazar ia hipótesis nula necesitamos que la puntuación Z correspondiente a
la media muestra1sea de, al menos, 1,64. Utilizando la fórmula para convertir puntuaciones Z en
puntuaciones originales, la puntuación Z determinada corresponde a una puntuación original de
209,84, es decir, 200 + (1,64 x 6) = 209,84.
Como ya dijimos, ios investigadores predijeron una media de 208 para los alumnos de quinto
grado que reciben instrucciones especiales (población 1). El punto de corte de 209,84 está 1,84
puntos de prueba por encima de la media general de 208 de esa distribución, dando una puntua
ción Z de 0,31 (es decir, 1,84/6-0,31).
La tabla de áreas bajo la curva normal muestra que un 12% del área se encuentra entre la me
dia y una Z de 0,31. Por lo tanto, un 38% supera a la Z de 0,31. En otras palabras, un 38% de la
distribución de medias predicha para la población 1 se encuentra por encima de una puntuación Z
de 0,31 (y por lo tanto el 38% de las medias se encuentran por encima de la puntuación original
209,84),
La conclusión es la siguiente; suponiendo que la predicción de los investigadores sea correc
ta, tienen sólo un 38% de chances de que la muestra de 64 alumnos que analizaron arroje una me
dia lo suficientemente alta como para que el resultado sea significativo. Es decir, existe sólo un
38% de chances dé obtener una media mayor a 209,84, aun suponiendo que lá hipótesis de inves
tigación sea verdadera. Por lo tanto, decimos que la potencia de este experimento es del 38%, Be
ta, la probabilidad de cometer un error Tipo II, es del 62% (es decir, 100% ~ 38% = 62%).
Es importante observar que la forma en la que calculamos la potencia no tiene nada que ver
con el resultado real del estudio. De hecho, los investigadores por lo general calculan la potencia
antes de realizar el estudio.
O tro Ejemplo
Analicemos otro ejemplo ficticio. Una gran empresa está intentando decidir si adopta una nueva
política de promoción sanitaria. Conforme a esta nueva política, se evalúa a los empleados indivi
dualmente y se les brinda la capacitación y el asesoramiento necesarios con respecto a distintos
3El método descripto de cálculo de la potencia (que es el único método de cálculo de la potencia tratado en este libro)
supone que las distribuciones de medias están normalmente distribuidas.
comportamientos relacionados conia salud (ejercicio, dieta, cigarrillo, etc.). Para probar la efecti
vidad de la política, los psicólogos de la empresa planifican el siguiente estudio: se seleccionarán
ochenta empleados al azar para participar del mismo, y al finalizar el año se medirá su estado ge
neral de salud conforme a una prueba estándar. La misma empresa ha realizado pruebas extensi
vas a sus empleados, por lo que los investigadores saben que en toda la empresa (la población de
este estudio) la media en las pruebas estándar de salud es 58, el desvío estándar es 14, y los valo
res se distribuyen normalmente. Para que se justifique la realización del programa, debe producir
se una mejora de al menos 5 puntos (es decir, la media predicha es 63), Los psicólogos de la
empresa planifican utilizar un nivel de significación de 0,05.
La figura 8-3 representa gráficamente las distribuciones de medias correspondientes a las dos
poblaciones involucradas en este estudio. ¿Cuál es la potencia de este experimento?
1. Reunir la información necesaria. En este ejemplo, la media de la distribución comparativ
--f-. es 50'. La media predicha de la población que recibe el procedimiento experimental es 63. La va-
rianza de la población es 196 (es decir, 142 ~ 196), por lo tanto, la varianza de la distribución
de medias (distribución comparativa) es 2,45 (196/80 = 2,45), lo que nos da un desvío estándar de
1,57 { V Í45 = 1,57).
/(X> Determinar, en la distribución comparativa, el punto de corte para rechazar la hipótesis
nula. Con un nivel de significación del 5%, en una prueba de una cola, la puntuación Z de corte es
+1,64. Una puntuación Z de +1,64 es igual a una puntuación original de 60,57 (es decir, 58 +
[1,64 x 1,57] = 60,57). Por io tanto, en la curva inferior (distribución comparativa) de la figura
8-3,fiemos sombreado el área a la derecha del punto 60,57. Es la región alfa.
f 3 J Determinar la puntuación Z del punto de corte anterior, pero en la distribución de medias
correspondiente a la población que recibe la manipulación experimental. En esa distribución (ba
sándonos en los valores predichos para la población 1), una puntuación original de 60,57 es igual
a una puntuación.Z d e -1,55 (es decir, [60,57 - 63]/l,57 = -1,55), Por lo tanto, en la curva supe
rior de la figura 8-3, hemos sombreado el área a la derecha del punto -1,55. Esa área sombreada
indica la potencia del estudio, es el área sobre la zona en la que la media de una muestra real sería
significativa con respecto a la distribución comparativa.
4. Utilizando la tabla de áreas bajo la curva normal, determinar la probabilidad de obtener un
valor más extremo que esa puntuación Z. La tabla de áreas bajo la curva normal indica aproxima
damente un 44% entre la media y una Z de 1,55. Estamos interesados en toda el área a la derecha
de -L 5 5 , por lo tanto, existe un total del 44% entre -1,55 y la media, más el.5.0% por encima de la
media, lo que da un total de 94%, La potencia de este experimento es del 94% (beta es del 6%).
TABLAS DE POTENCIA
L o s procedim ientos que hem os descripto para e l cálcu lo de la potencia se aplican cuando estam os
frente a una población conocida y frente a una sola m uestra. E n situaciones de investigación m ás
com plejas (que analizarem os en varios de lo s capítulos siguientes), ca lcu la r la potencia es bastan
te m ás trabajoso. P o r eso, generalm ente lo s investigadores buscan la potencia de un estudio u tili
zando cuadros esp eciales, denom inados ta b la s de p o ten cia. (E sta s tablas han sido preparadas
por Cohén, 1988, y K raem er & Thiem ann, 1987, entre otros). E n io s capítulos sig u ien tes, con ca
da método tratado darem os las tablas de potencia b ásicas y verem os cóm o u tiliza rla s. E n el apén
d ice B ofrecem os un ín d ice de estas tablas bajo el nom bre de tabla B -5 .
La lógica en la que se basan estas tablas es precisam ente lo que hem os aprendido aquí, y u ti
liz a r la s tablas requiere exactam ente la m ism a inform ación que e l cálcu lo d irecto de la potencia,
D e todos m odos, e l objetivo de este cap ítulo es ayudar a com prender el concepto de potencia, y
o
4
4 Tai v ez haya resultado evidente para ei alumno que aumentamos la potencia a exactamente ei 85%, tanto al duplicar el
aumento predicho de las medias (como en la figura 8*4) o al reducir eí desvío estándar de la distribución de medías a la
mitad (com o en la figura 8-5). Pronto veremos las razones por las cuales cualquiera de estos dos cambios produce el
mismo resultado.
Al determinar la potencia antes de realizar el estudio, el tamaño del efecto se calcula sobre la ba
se de dos números. El primer número es ia predicción del investigador en cuanto a la diferencia
entre las medias de las dos poblaciones. La predicción se realiza sobre la base de determinada
(teoría, de experiencia previa en investigaciones de este tipo, o de lo que sería la menor diferencia
S&jLEfsegundo número es el desvío estándar poblacional. En los casos que hemos analizado has
ta ahora, el desvío estándar (o la varíanza) se conoce con anterioridad. (En capítulos posteriores
analizaremos modos de estimar este dato cuando no se lo conoce).
Figura 8-5, D istr ib u c io n e s d e m ed ía s d e 6 4 resultados d e e x á m e n e s b asadas e n d istrib u cion es pred ich as
(curva superior) y c o n o c id a s (curva inferior) de un estu d io fic tic io d e alu m n o s d e q u in to grad o q u e r ec ib en
in stru ccio n es e sp e c ía le s a ntes d e rendir un ex a m e n estándar para evaluar e l n iv e l. E n am b as d istrib u cion es
se ind ican las pu ntuacion es Z y lo s puntos d e corte basad os en la d istrib u ción inferior. (E l p u n to d e corte
corresp on d e a un n iv e l d e sig n ific a c ió n d e p < 0 ,0 5 , prueba d e una c o la ). E n e ste e je m p lo , la m e d ia predicha
d e la distribu ción superior e s 2 fÓ .
F igura 8-6. L as d istrib u cio n es d e m ed ia s p redichas y com parativas podrían tener p o c a su p e r p o sició n (y en
e s e c a so e í e sta d io tendría una p o ten cia alta) d e b id o a q u e (a) las d o s m e d ia s so n m u y d iferen tes o (b ) la
v a ñ a n za e s pequ eñ a. ■.... - • . , . ......................
La regla para el cálculo del tamaño del efecto es la siguiente: dividir la diferencia predicha entre
las medías por el desvío estándar poblacional. La fórmula sería la siguiente:
/ d - Hd ~tí 2
(8-D
a
sJ5n estaJEórmula? d es el símbolo del tamaño del efecto (también conocido como “d de Cohén”.
(Én capítulos posteriores veremos otras medidas del tamaño de efecto apropiadas para diferentes
situaciones, que se representan con otros símbolos). jXj es la media de la población 1 (la media
predicha para la población que recibe la manipulación experimental); p,2 es la media de la poblar
ción 2 (distribución comparativa), y cr es el desvío estándar de la población 2. Es importante tener
en cuenta que al calcular el tamaño del efecto, no utilizamos el desvío estándar de la distribución
de medias (aM). En cambio, utilizamos el desvío estándar de la población de observaciones origi
nales (cr). (Cabe mencionar también que sólo nos interesa el cr de una población, ya que en la
prueba de hipótesis generalmente suponemos que ambas poblaciones tienen el mismo desvío es
tándar. Más adelante volveremos a tratar este tema).
En el primer ejemplo do este capítulo (figuras 8-1 y 8-2), la diferencia entre las medias era 8 y
el desvío estándar de la población original de individuos, alumnos de quinto grado, era 48. Por lo
tanto, el tamaño del efecto era 8/48, es decir, 0,17. La fórmula sería la siguiente:
Analicemos ahora el ejemplo en el que la diferencia de medias era de 16 puntos de examen y el des
vío estándar poblacional también era 48 (figura 8-4). En ese caso, el tamaño del efecto es 0,33
(16/48 = 0,33), es decir, el doble del anterior. De modo similar, analicemos el ejemplo en el que la
diferencia de medias era 8 pero con una población con un desvío estándar de 24 (figura 8-5). En ese
ejemplo, el tamaño de efecto también es de 0,33 (es decir, 8/24 ~ 0,33). (La potencia en los dos ca
sos también era la misma -85%-, debido a que todos los otros aspectos del estudio eran los mismos.
Por lo tanto, si tienen el mismo tamaño del efecto, tendrán la misma potencia),
El tamaño del efecto, como hemos visto, es la diferencia de medias dividida por el desvío están
dar poblacional. Esta división estandariza la diferencia entre las medias y ubica la diferencia en
una escala adaptada al desvío estándar de la medida utilizada. Este proceso tiene el mismo tipo de
efecto que convertir una puntuación original en una puntuación Z, En ambos casos, el resultado
es una base estándar de comparación con otros valores, incluso valores de diferentes escalas. Su
pongamos que dos estudios utilizan diferentes medidas. (Por ejemplo, un grupo de investigadores
expertos en educación estudia el efecto de instrucciones especiales utilizando la “Prueba de nive
les académicos de Jones” con un ct = 48, y otro grupo de investigadores utiliza la “Prueba de lo
gros académicos de Smith” con un a = 17). Incluso en esta situación, dado que las diferencias de
medias están divididas por el desvío estándar, se puede comparar directamente el tamaño del
efecto de los dos casos.
La estandarización que proporciona el tamaño del efecto (d) es especialmente útil porque
se basa en el desvío estándar de la población de observaciones individuales (en lugar del des
vío estándar de la distribución de medias). Esto significa que podemos utilizar d para compa
rar resultados de estudios muy diferentes, incluso de aquellos que utilizan diferentes tamaños
de muestras.
En resumen, supongamos que un estudio tiene un tamaño de efecto (d) de 0,25. Esto siempre
significa que existe un cuarto de desvío estándar de diferencia entre las dos medias, independiente-
mente del tamaño de lalnúestrayde Ja .i^edWa utilizada. Si un estudio tiene una d de 0,25, y otro
unarfde 2,0(di'ferencia de 2 desvíos estándar entre las medias), sabríamos que el efecto fue mucho
mayor en el segundo estudio, aun si las medidas utilizadas y la cantidad de participantes en los dos
estudios fueran completamente diferentes. (Más. adelante en el capítulo veremos que una aplica
ción importante del tamaño del efecto se utiliza en el procedimiento denominado meta-análisis,
el cual proporciona a los investigadores una herramienta precisa y objetiva para utilizar el tamaño
del efecto, ton el fin de combinar y comparar ios resultados de distintos estudios acumulados
acerca de un tema determinado, como por ejemplo, la utilidad de determinado tipo de psicotera
pia o ia diferencia ente dos grupos de edades con respecto a una capacidad).
Las reglas de Cohén para el tamaño del efecto también son útiles para interpretar resultados de estu
dios. Nos proporcionan un parámetro para decidir acerca de la importancia del efecto de un estudio
con relación a lo que es típico en psicología.
TAMAÑO DE LA MUESTRA
El otro factor de influencia importante en la potencia, además del tamaño del efecto, es la canti
dad de personas que integran la muestra estudiada. Básicamente, a mayor cantidad de personas,
mayor potencia.
El tamaño de la muestra influye en la potencia porque, a mayor tamaño de muestra, menor es
el desvío estándar de la distribución de medias. Si las distribuciones tienen un desvío estándar me
nor, son más estrechas y, por ende, están menos superpuestas. La figura 8-9 representa gráfica
mente la situación que se plantearía en el ejemplo de alumnos de quinto grado sí el estudio
incluyera 100 alumnos en lugar de los 64 del ejemplo original (figuras 8-1 y 8-2), La potencia en
este caso es del 51% (con 64 alumnos era del 38%). Con un estudio de 500 participantes, la po
tencia es del 98% (véase figura 8-10).
Figura 8-9. D istrib u cio n es d e m edias de 1 0 0 resultados de ex á m e n e s (en lugar d e 6 4 , c o m o en las figuras 8-1
y 8 -2 ) basadas en distribu ciones predichas (superior) y con o cid a s (in ferior) d e un estu d io fic tic io rea liza d o a
a lum nos d e quinto grado qu e reciben instru ccion es e sp ec ia le s antes d e rendir un exam en estándar para la
ev a lu a ció n d e nivel. E n la s dos distribuciones se ind ican lo s pu ntos d e corte seg ú n la distribu ción inferior.
(E l pu n to d e corte corresponde a un nivel d e sig n ifica c ió n d e p < 0 ,0 5 , prueba d e una co la ). P o ten cia 51% .
Situácfófirfe v _._.
de irivestigación;
^,
b^sdá'^nlá población
,"""'""'"',K!''■,'--'iW-v
"’W ^*£:-É •'•^-V•‘Viv'
m v > : ■:■v '--^ .>y;^;:;^ v . > > : ? í ^ A n i e n c M :fevV^‘v o ; '; i ;^ ^ ; í _ ^ J í í I r v ^ ¿ í:r ^. ■^í
? : -V® Pptuaeiphe*®^
Figura 8*10. D istrib u cio n es d e m ed ia s d e 5 0 0 resu lta d o s d e e x á m e n e s, b asadas en d istrib u cion es predichas
(superior) y c o n o c id a s (in ferio r) d e un e stu d io fic tic io r ealizad o a alu m n os de q u in to grado q u e recib en
in stru ccio n es e sp e c ia le s antes d e rendir un ex a m e n están d ar d e eva lu a c ió n de n ivel. E n las d o s distribu
c io n e s s e in d ican lo s pu n tos de co rte seg ú n la d istrib u ció n inferior. (E l p u n to d e corte co rresp on d e a un
n iv e l d e sig n ifica c ió n p < 0 ,0 5 , prueba d e una co la ). P o te n c ia 99% .
No debemos confundimos. Las distribuciones de medias pueden ser estrechas (y por lo tanto estar
menos superpuestas y tener más potencia) por dos razones muy diferentes. Una razón es que las
poblaciones de individuos pueden tener desvíos estándar pequeños. Este motivo está relacionado
con el tamaño de efecto. La otra razón por la que las dos distribuciones de medias pueden ser es
trechas es que el tamaño de la muestra sea grande. Este motivo es completamente independiente
del primero. El tamaño de la muestra no tiene nada que ver con el tamaño del efecto, y tanto el
primero como el segundo influyen en la potencia. Pero como veremos pronto, estas dos influen
cias distintas sobre la potencia llevan a pasos prácticos completamente diferentes para aumentar
la potencia al planificar un estudio.
C á lcu lo del tam año de m uestra n ecesario para determ inado nivel de potencia
La razón principal por la que los investigadores calculan la potencia al planificar un estudio es pa
ra decidir cuántos participantes incluir en el mismo. Dado que el tamaño de la muestra es un fac
tor de influencia importante en la potencia, los investigadores necesitan estar seguros de tener su
ficientes participantes como para que sus estudios tengan un nivel de potencia bastante alto.
Un investigador puede calcular la cantidad necesaria de participantes revirtiendo los pasos
para el cálculo de la potencia. Comenzamos con el nivel de potencia deseado, digamos, un 80%, y
luego calculamos cuántos participantes necesitaríamos para obtener ese nivel de potencia. Supon
gamos que los psicólogos especializados en educación, quienes realizaron el ejemplo de los
alumnos de quinto grado, estuvieran planificando ese'estudio y quisieran calcular cuántos alum
nos de quinto grado necesitan analizar. Siendo la diferencia de media predicha igual a 8, y el des
vío estándar de la población conocida igual a 48, necesitarían 222 alumnos de quinto grado para
tener una potencia del 80%. En este momento no entraremos en detalles de cálculo. (Sin embar
go, el alumno tal vez quiera intentar calcular este dato por sí mismo. Sería interesante ver si pue
de llegar a la misma respuesta que nosotros utilizando los procedimientos que ha aprendido, pero
comenzando con una potencia del 80% y continuando con los pasos desde atrás hacia adelante
para obtener la cantidad necesaria de participantes). En la práctica, los investigadores utilizan ta
blas especiales que especifican cuántos participantes son necesarios en un estudio para tener un
alto nivel de potencia, según un determinado tamaño del efecto. Nosotros proporcionaremos ver
siones simplificadas de esas tablas para cada uno de los principales procedimientos de prueba de
hipótesis que veremos en los capítulos siguientes.
Hace; más .de tres décadas, Jacob Cohén ■ - considerados inexistentes). En estos estu
(1962), un psicólogo, especialista en méto- dios la potencia ni siquiera se discutía.,
: dos estadísticos, publicó un análisis) muy " Cohén calculó la potencia de los resul-
conocido actualmente de la potencia, esta :' Vtados'de esas pubhcaciones. Al rio estar fa-
dística de estudios publicados en el volú- < ■;■■■ miliarizado con muchos de los contenidos
míen de 1960 de'la Revista Científica de ;■■■ de las distintas áreas, analizó la potencia s e -.":;
Psicología Patológica y Social [Journal of ; gún tres supuestos del tamaño .def efecto:
Abnormal and Social PsyckologyJ. Cohén ■: ■pequeño, mediano y grande. Descubrió que ■
: observó que se prestaba gran importancia a . . si era pequeña, los ^estudios; publicados
, nían sólo una chance contra seis de detectar •
la significación, o también a si se había co~
algún efecto. Ninguno, tenía mayores chan- •
. metido un error Tipo I (es decir, si se había
■cés que un 50%: Si suponía un efecto me- -
rechazado equivocadamente la hipótesis .
. •dianó en:jalpqblácíón, losestudios/tenían...
nula y a partir de los resultados se había su ■ chances apenas mayores a uh 8% dé detec- ;
puesto cierto efecto que en realidad no . tar ese efecto, é incluso un cuarto de ellos A:-
existía), Pero esencialmente no se prestaba ■; ' tenía menos de una chance contra tres! .Sólo :
atención a la posibilidad de un error .Tipo II el supuesto de grandes efectos daba a los
(es decir,; si por error no sé hubiera rechaza . estudios, tal como estaban diseñados, una
do la hipótesis nula y se hubiera ignorado buena posibilidad de rechazar la hipótesis :
un efecto real debido a resultados no con . nula. Como el mismo Cohén lo expresara .,
cluyentes,.que de hecho algunas veces eran 1 “toda una generación de investigadores pó-
■dría gozar de un .empleo adecuado si se in efecto durante los años siguientes. De hecho, //
tentaran,„repetir estudios interesantes que ,1a potencia de los estudios que aparecie-
v'príginaímente utilizaron tamaños de mues- : ron en la misma revista científica que
. tras inadecuados. Lamentablemente, aque . Cohén había . analizado (ahora: llamada ■
llos qué más merecerían tales repeticiones Revista Científica de Psicología Patológica .
son los; qué seguramente, no han sido im ■ [Journal o f Abnormal Psychologyl), en V
presos”', (p. 153) : realidad había disminuido con el correr de
En la última oración, Cohén se refiere esos años, y el bajo nivel de potencia.con
.al hecho de que' muchos más estudios que tinuaba pasando inadvertido. Sólo dos de : ;;
hubieran sido apropiados para la revista sesenta y cuatro experimentos trataban el \
científica mencionada, probablemente nun tema de la potencia, y en estos dos no ¡se
ca se escribieron porque los investigadores, la había estimado. ..
obtuvieron resultados no significativos, que '■■-mMientras tanto,'en el 119¿ de los estudios •
las probabilidades claramente indicaban, . publicados en esa edición, la falta de signifL j
que estaban predestinados a obtener dado el ■/./cación era tomada como una confirmación .
bajo nivel de potencia de la mayoría de lo s; . de la hipótesis nula, tai vez en un intentó d e ..
; estudios en ese campo. Los experimentos adherñ alas admomcipnestiadipionalés que Cj
que “fallaron”, cuando en realidad sus hipó C cuestionamos en pl cuadro 6-L Sítí embargó,
tesis nunca fueron adecuadamente proba Sedlmeier y Gigerenzer déseübnéron que la
das, representaban una gran cantidad de potencia media ett ésos .estudios era sólo de
conocimiento que posiblemente se haya 0*25. Ciertamente, ;si cuando lós resultados
perdido, y que tal vez nunca se vuelva a in favorecen la hipótesis nula vamos a tratarlos’
vestigar. Y esa pérdida se debió simplemen-.: : *como xnformación vahosa én sí misma (nue- ;.
: te a la falta de interés en la potencia, en la ;/ vamente, véase cuadro. 6- I),rsólo podremos. : -
mayoría de los casos por la falta de cálculo hacerlo si la potencia es lo suficientemente '
(a través del análisis del tamaño del efecto, alta como para que, si la hipótesis de investí-
/ él nivel de significación y la potencia) del gación fuera verdadera, el ..estudió ,tuviera al.
■ tamaño óptimo de ia muestra para probar la : menos iguales chances de réfléjarlp.V •
hipótesis de la mejor manera posible. : , - ,. Esta obstinada omisión por parte de los
Después del análisis realizado por Co investigadores.esunpoco.soiprendente;;Lá :
hén, se han llevado a cabo varios análisis mayoría de las vecés implicia qué realizan !
similáres acerca de la potencia, publica todo su trabajo para nada./¡Aunque lo que :
dos en determinadas revistas científicas intenten demostrar sea ciértOy tienén pocasV: ,
(p. ej. el anáfisis de Brewer de 1972 en la ; probabilidades de lograrlo. Y aparentemen-C i
Revista i Científica Americana de Investi te la metodología en psicología es tan mo-.;
gación Educativa, [American Educational : nolítica y fija que no puede iñodificárse. •.
Research Journal] y el estudio de Chase . Sin embargo, en una publicación .en Psicó-:. ■¡
& Chase de 1976 en la Revista.Científica v logo Americano [American Psychologistfi
de Psicología Aplicada [Journal o f Applied ■' titulada “Cosas' que '■he' aprendido' (hasta:./ ’
Psychology]). Mientras tanto, en 1969 Co ahora)”, Jacob Cohén (1990) recuerda.las:
hén publicó una guía para el análisis de la décadas anteriores desde un punto:de vista
potencia en las ciencias sociales, y una ver filosófico: . '■ ,!
sión revisada apareció en 1988. Aun así, No me desespero. Recuerdo que W.:S.
. Gosset, el muchacho que trabajaba en
en una publicación dé 1989, Sedlmeiery : . una fábrica de cerveza y que publicó.
Gigerenzer observaron que las adverten modestamente su trabajo como “El ' '=
cias de: Cohén aparentemente no tuvieron estudiante”, publico la prueba t una
ígvf: antéss•< i e é t r r ^ ^ z á r á í á P ti- V: ■tó, s i.é l. a lu m n o iie g a r a a pu blicar, al-
m eráG u erra M und ial, y e sá p r u é b a no ; g o q u e c o n s id e r a r ea lm e n te b u en o , y.
■.; ./ form ó p a ite d e lo s lib ros d e esta d ística tránscuxre u n a ñ o o un a d é c a d a d d o s ,
- a p licad á'á.la p s ic ó lo g íá s m o h a sta .d es- -. y c a si n a d ie p á ^ ^ !p j^ tá r li^ a te ñ ^ ó á w '
pufes d e la S e g u n d a G uérra M undial! d e b e recordar la p ru eb a t y ten er con-!:
. E sta s c o sa s lle v a n tie m p o . P o r lo tarri fia n za , (p . 13 i l ) : '■
Figura 8-11. D istrib u cio n es de m ed ia s d e 6 4 resu ltad os d e e x á m e n e s basadas en d istrib u cion es predichas
(superior) y c o n o cid a s (in ferior) de un e stu d io fic tic io rea liza d o c o n alu m n os de quinto grado q u e recib en
in stru ccio n es e sp ec ia le s antes d e rendir un e x a m en estándar para la eva lu a ció n d e n ivel. E n la s d o s distribu
c io n e s se ind ican las^puntuaciones Z y o r ig in a le s d e corte d e la distribu ción inferior. E l p u nto d e corte c o
rrespond ien te a un n iv el d e s ig n ific a c ió n d e p < 0 ,0 1 , prueba d e una c o la (e n com p aración c o n e l p < 0 ,0 5
d e l e je m p lo o rig in a l rep resen tado por la s fig u ra s 8-1 y 8 -2 ), P o ten cia 16%.
Figura 8-12. D istrib u cio n es d e m ed ia s d e 6 4 resultados d e e x á m e n e s b asad as en d istrib u cio n es pred ich as
(cu rv a superior) y c o n o c id a s (curva inferior) d e un e stu d io fic tic io r ealizad o a alu m n o s d e q u in to grado que
recib en in stru ccio n es e sp e c ia le s antes d e rendir un e x a m e n estándar para la eva lu a c ió n d e n iv e l. E n las d o s
d istrib u cio n es s e in d ican las pu ntuacion es Z y o r ig ín a le s d e corte d e la distrib u ción inferior. L o s p u ntos d e
co rte co rresp o n d en a un n iv el d e sig n ifica c ió n d e p < 0 ,0 5 , prueba d e d o s c o la s (e n com p a r a c ió n c o n la
prueba d e u n a c o la d e l e je m p lo o rig in a l representado por la s figuras 8-1 y 8 -2 ). P o te n c ia = 26% .
C a r a c t e r ís tic a s d e l e s t u d io A u m e n t a la p o t e n c ia D is m in u y e l a p o t e n c ia
las practiquen, y otros cambios por el estilo. Una desventaja de este método es que puede ser difí
cil o costoso; o bien, puede requerir la utilización de un procedimiento experimental que no es
igual al procedimiento al cual deseamos que se apliquen los resultados del estudio.
2. D ism in u ir el desvío estánd ar poblacional. Existen al menos dos modos de disminuir el
desvío estándar poblacional de un estudio. Un método es realizar el estudio utilizando una pobla
ción menos diversa que la población que se planeó utilizar originalmente. En el ejemplo basado
en el examen 'de evaluación de nivel realizado por alumnos de quinto grado, podríamos utilizar
sólo alumnos de quinto grado de determinado sistema escolar suburbano. La desventaja es que
los resultados se aplican sólo a esa población más específica.
Otro método para disminuir el desvío estándar poblacional es utilizando condiciones y medi
das de prueba más precisas. Por ejemplo, realizar la prueba en una situación estandarizada o en un
ambiente de laboratorio controlado produce generalmente una variación general menor entre las
observaciones (lo cual tiene como resultado un menor desvío estándar). De manera similar, utili
zar pruebas con instrucciones claras y procedimientos precisos, en cuanto al modo de realizar las
respuestas, también reduce la variación. Si estos cambios resultan prácticos, son métodos exce
lentes para aumentar la potencia, aunque por lo general el estudio ya es de por sí lo más riguroso
posible.
3. Aumentar el tamaño de la muestra. El método más directo para aumentar la potencia de
un experimento es mediante el análisis de una mayor cantidad de personas. Naturalmente, si esta
mos analizando astronautas que caminaron por la luna, existe un límite para esa cantidad. Sin em
bargo, en las situaciones reales de investigación el tamaño de ia muestra es el principal método
para modificar un estudio con el fin de obtener suficiente potencia.
4. Utilizar un nivel de significación menos riguroso. Comunmente, el nivel de significa
ción debería ser bastante riguroso de manera que proteja razonablemente el estudio del error Tipo
l Normalmente, este nivel será de 0,05. Por lo tanto, es raro que se pueda hacer mucho para au
mentar la potencia en este sentido.
5. Utilizar una prueba de una cola. Utilizar una prueba de una o dos colas depende de la ló
gica de la hipótesis que se está estudiando. Por lo tanto, ai igual que con el nivel de significación,
es raro que exista gran posibilidad de elección con respecto a este factor.
6. Utilizar un procedimiento de prueba de hipótesis más sensible. Esto es adecuado si es
que existen alternativas. En eí capítulo 15 analizaremos algunas de las opciones de este tipo. Sin
embargo, por lo general el investigador comienza con el método más sensible, razón por la cual
no se puede hacer mucho más en este sentido.
La tabla 8-4 resume algunos métodos prácticos para aumentar la potencia de un experimento
planificado.
Tabla 8-4.
Resumen de métodos prácticos para aumentar la potencia de un experimento planificado.
Tamaño de m uestra (AO U tilizar un tamaño mayor. N o siem pre resulta práctico,
puede ser costoso.
Pruebas de una cola versus Utilizar pruebas de una cola. Puede no ser
pruebas de dos colas apropiado para la ló gica
d el estudio.
T a b la 8 - 5 .
P a p e l d e la s i g n if i c a c ió n y d e l t a m a ñ o d e la m u e s t r a e n la in t e r p r e t a c ió n d e r e s u lt a d o s e x p e r i m e n t a le s .
No Pequeño N o concluyente
Dado cualquier tamaño del efecto, a mayor potencia, más estrechos son los intervalos de confian
za. La razón es la siguiente: dado cualquier tamaño del efecto, cuanto mayor sea la potencia, más
estrecha será la distribución de las medias muéstrales; y cuanto más estrecha sea la distribución
de las medias muéstrales, menor será el intervalo de confianza.
Ahondemos un poco en este tema. Primero analicemos la potencia. La principal influencia en
la potencia, además del tamaño del efecto, es el tamaño de la muestra. No importa cuál sea el ta
maño del efecto. Cuando la potencia es mayor, el tamaño de la muestra es mayor. Sí el tamaño de
la muestra es mayor, la distribución de medias es más estrecha, ya que la varianza de la distribu
ción de medias es la varianza de la distribución de observaciones individuales dividida por el ta
maño de la muestra.
Analicemos ahora ios intervalos de confianza. Veamos cómo construiríamos un intervalo de
confianza del 95%. El paso principal es determinar en la distribución de medias muéstrales los
puntos correspondientes a 1,96 desvíos estándar por debajo, y 1,96 desvíos estándar por encima
de la media muestra!. En términos de las puntuaciones Z, este intervalo es siempre el mismo. Pe
ro su amplitud en puntuaciones originales depende completamente del desvío estándar de la dis
tribución de medias. Si la distribución de medias es estrecha (con una varianza y un desvío
estándar pequeños), el intervalo de confianza es estrecho.
Las implicancias son por demás interesantes. Analicemos un estudio no significativo pero
con baja potencia debido al pequeño tamaño de muestra. El intervalo de confianza será muy am
plio, incluyendo efectos cero o pequeños al igual que efectos muy grandes. Por lo tanto, los resul
tados son verdaderamente no concluyentes. Por otro lado, analicemos un estudio no significativo
pero con alta potencia debido a un gran tamaño de muestra. El intervalo de confianza será muy
estrecho, y todos los valores dentro de él representarán un efecto cero o muy pequeño. En ese ca
so, tendremos mucha más seguridad de que se sustenta algo semejante a la hipótesis nula.
Existe otro punto que vale la pena mencionar con respecto a la relación de los intervalos de
confianza con la potencia y el tamaño del efecto. ¡A veces los investigadores indican los interva
los de confianza en tomo a los tamaños del efecto! Así, podríamos encontrar un estudio infor
mando un resultado y agregando algo así como = 0,34, 95%, IC =0,21 a 0,47.” Esto es
particularmente común en un procedimiento de investigación especial que combina tamaños del
efecto de muchos estudios diferentes. Ese procedimiento, denominado meta-análisis, es tratado en
la próxima sección.
META-ANÁLISIS_______________________________________________________ ■
En la década de 1980, los resultados de las bre mt (meditación trascendental) fue de.
investigaciones sobre la meditación y la re 0,70 (lo que indica una diferencia promedio
lajación fueron objeto de considerable con de 0,70 desvíos estándar en la medida de'; .
troversia. Varías revisiones tradicionales del angustia entre aquellos que practicaban este :
material existente con respecto a estas áreas procedimiento de meditación y aquellos .
habían arrojado conclusiones contradicto que eran parte de los grupos de control).
rias en cuanto a si alguna de esas técnicas Ese tamaño del efecto eía significativamen
era beneficiosa y, de ser así, cuáles lo eran. te mayor que el tamaño-dél efecto dé cual
Eppley, Abrams y Shear (1989) decidieron quiera de los otros grupos.. EL tamaño del •'
estudiar el tema en forma sistemática,, reali efecto promedio correspondiente a 44 está-' -
zando un meta-análisis de los efectos de va dios sobre todos ios otros tipos de medita- ':
rias técnicas de relajación sobre la angustia clon fue 0,28, el de los 30 estudios sobre
crónica (es decir,' no una angustia tempora relajación progresiva fue de 0,38 y el de los
ria sino continua). 37 estudios sobre otras formas de relajación
Eppley y sus colegas eligieron la an fue de 0,40;
gustia crónica para su meta-análisis, por Pero en realidad, el meta-análisis recién
que se trata de un problema preciso rela había comenzado. Había muchas sub-varia- ,
cionado con muchos otros temas de salud bles de interés. Por ejemplo, al observar las di-
mental y, aun así, en sí mismo es un tema ferentes poblaciones de participantes, la s ..
que muestra bastante coherencia entre úna personas que habían sido seleccionadas co
prueba y otra en las que se utiliza la mis mo altamente angustiadas contribuían en
ma medida, como también entre diferen mayor grado al tamaño del efecto, y las pó- :
tes medidas. Elaciones seleccionadas en la prisión y los ;
Los investigadores recopilaron el ma individuos más jóvenes aparentemente, sa-
terial publicado siguiendo los procedimién-. ¿abanmás provecho de la mt. No se prqdü- .
tos habituales: no sólo leyeron las revistas jo ningún efecto en e l.tamaño del efecto
científicas especializadas sino también li como resultado de ia capacidad de los ins
bros y tesis doctorales no publicadas. Uno tructores, las expectativas de los. partid -:
de ios aspectos más complicados del me pautes, el hecho de que los: participantes ; .
ta-análisis es estar seguro de qite urió ha fueran voluntarios o seleccionados ál azar:
encontrado todas las investigaciónes rela para las determinadas condiciones, la pre
cionadas con el tema. • disposición (leí .experimentador (los resiil- . :
Pará concluir la investigación, Eppley . tados de la mt en realidad eran más fuertes '•
y sus colegas compararon los tamaños del cuando se eliminaban los datos del investí
efecto correspondientes a cada uno de los gador que estaba aparentemente: en: favor .
cuatro métodos principales de meditación de la mt), las distintas medidas dé angustia
y relajación que han sido estudiados en in y los diseños dé la investigación.
vestigaciones sistemáticas. El resultado fue Una clave del alto rendimiento' de la
que el tamaño del efecto (d de Cohén) pro MT parecía estar ¿n el hecho de que las téc-'
medio correspondiente a los 35 estudios so- ■ nicas que involucraban concentración pro- .
; ducían un efecto significativamente: menor,. . . sánscrito Seleccionados al azar o palabras
:, mientras que en la m t , un punto muy espe^. . inglesas seleccionadas para cada partici-y
i. ; •cíales la enseñanza de un procesó “espon- . pante ño obtuvieron los. mismos resultados >.
• táneo.'y sin esfiierzo”. Los investigadores: . .. fuertes.. : ' y'.. ,;'y,
creían que la otra diferencia podría estar en ' ; ' Cualquiera sea la. razón, los autores lle-
: . jo s manteas o sonidos,, utilizados: en la m t ; gátón a la conclusión, de que existen.“funda-
: que, según, se dice,, provienen de uña muy. . mentoá para ser optimistas en cuanto a que;
. a n t i g u a t e a d i c i ó n y ,, a d e m á s ,, s o n s e l e c c i ó n j . . a í m e n o s ' a l g u n o s p r o c e d i m i e n t o s de: t r a t á i s
■ . n a d o s : p á r á / c a d á a lú n m o ; p o r e l in s t r u c t o r ; . . . m ie n t o a c tu a le s , p ü e d e n e fe c t iv a m e n te r e d u - :
/ E x i s t e n ^ i n v e s t i g a c i o n e s q u e .m t f ic á r i- q u e 1 < » . . c i r . l a a n g u s t i a c r ó n i c a ’’, ( p . 9 7 3 j P o r l o t a n t o j
■. d i f e r e n t e s . s o n i d o s sí'' p r o d u c e n d i f e r e n t é s v ... s i e i le c to r e s p r o p e n s o a p r e o c u p a r se p o r p e -
:: e f e c t o s ; . Y t o n é s t e m e t a La n á l i s i s , l o s i m é t p - ; . v .q u e ñ á s : 'C o s á s /b o r a ^ u n e x a i ñ m ^ d e ; e s t a d í s
;. (to s d e m e d it a c ió n q u e e m p le a n s o n id o s , d e l ; ó a ,:. p u e d e t e n e r é n c u e n t a e s t o s r e ^ ú lt á d ó s .’ i :
Tabla 8-6.
Cantidad de artículos meta-analíticos publicados en varias áreas de la psicología
(hasta mediados de 1987).
Sub-disdplina Frecuencia
Educación 115
Terapiapsicológica 100
Psicología industriai/empresarial 44
Psicología social 43
Diferencias sexuales 28
Psicología aplicada a la salud 27
Salud mental 26
Personalidad 16
Psicología experimental 13
Psicología del desarrollo 8
Fuente: Cooper, H. M. & Lemks, K. M. (1991), tab. i. “Sobre el papel del meta-análisis en la psicología social y de la
personalidad.” Boletín de Psicología Social y de la Personalidad {Personality and. Social Psychology Bulletin}, 17,
2 4 5 -2 5 1 . Copyright, 1991, por la Society for Personality and Social Psychology, [Sociedad de Psicología Social y de la
Personalidad] Inc. Reimpreso con autorización de Sage Publications Inc.
CONTROVERSIAS Y LIMITACIONES: CONTINUACIÓN
DE LA CONTROVERSIA ACERCA DÉ LA SIGNIFICACIÓN ESTADÍSTICA.
TAMAÑO DEL EFECTO VERSUS SIGNIFICACIÓN ESTADÍSTICA
En los capítulos 6 y 7, abordamos el tema de la controversia que actualmente se desarrolla sobre
el valor de las pruebas de significación, incluso el argumento que sostiene que frecuentemente
son mal utilizadas. Dijimos que existían dos modos principales de utilizar inapropiadamente las
pruebas de significación que preocupan seriamente a los psicólogos, una de las cuales es que los
resultados no significativos son interpretados irreflexivamente como evidencia de que en realidad
no existe ningún efecto. En vista del material tratado en este capítulo, podemos comprender con
mayor claridad por qué este error es realmente un problema. Los resultados no significativos po
drían ser consecuencia de un efecto muy pequeño o inexistente, o bien, simplemente de un bajo
nivel de potencia del experimento.
En el capítulo 6, dijimos que pospondríamos la discusión dei otro modo de utilizar inapropia
damente las pruebas de significación hasta que hubiéramos tratado determinado material en un
capítulo posterior. Ese material era el tamaño del efecto, y ahora estamos en condiciones de anali
zar ese tema postergado. La utilización inadecuada a la cual nos referimos ocurre cuando un re
sultado significativo es interpretado irreflexivamente como un resultado “importante”; es decir,
se confunde significación con un gran tamaño del efecto.
Hablando en forma general, la significación estadística se refiere a la probabilidad de que pu
diéramos haber obtenido nuestro patrón de resultados en forma casual. Como lo explicó Frick
(1997), la significación se refiere a la fuerza de la evidencia en favor de un efecto distinto de cero.
Si nuestro resultado es significativo a nivel 0,05, tenemos una evidencia bastante buena. Si es sig
nificativo a nivel 0,01, es una evidencia aún mejor.
Sin embargo, como hemos visto en este capitulo, un resultado significativo puede no ser im
portante en el sentido de implicar un gran tamaño del efecto. Por ejemplo, si el tamaño de la
muestra fuera grande, un resultado con un pequeño tamaño del efecto podría ser estadísticamente
significativo a p < 0,001. En ese caso tendríamos mucha confianza en que el verdadero efecto es
distinto de cero, pero el tamaño de ese efecto distinto de cero aún sería muy pequeño. Llegaría
mos a la conclusión de que tenemos un efecto real pero muy leve. De modo similar, si el tamaño
de la muestra fuera lo suficientemente pequeño, un resultado con un gran tamaño del efecto po
dría no ser estadísticamente significativo en absoluto. En ese caso, la mejor estimación en cuanto
al tamaño del efecto es que la misma es grande. Pero no tendríamos ninguna certeza ni siquiera de
que ese efecto realmente existe; podría ocurrir que el efecto fuera muy pequeño o incluso en di
rección opuesta.
Una destacada psicóloga, al escribir sobre este problema (Sean, 1997), observó que ía pala
bra “significativo” es desafortunada, ya que en lenguaje ordinario significa “importante". De he
cho, ella recomendó que se cambiara el nombre por algo así como “confiable”. (Ese nuevo
nombre también presentaría problemas, dado que el término confiabilidad también tiene un signi
ficado especial en estadística). En cualquier caso, no es probable que el nombre cambie a corto
plazo. Por lo tanto, es importante que al leer o realizar investigaciones psicológicas recordemos la
diferencia entre el uso especial que se da en psicología a la palabra significación, y la forma en la
que se la utiliza en el lenguaje común.
Tal como observamos en el capítulo ó, la mayoría de los psicólogos no consideran que la uti
lización inapropiada de las pruebas de significación sea razón suficiente para dejarlas de lado.
Sostienen, en cambio, que deberíamos realizar un mayor esfuerzo para evitar tales utilizaciones
inapropiadas.
Sin embargo, este no es ei fin del problema. Muchos de aquellos que se oponen a las pruebas
de significación sostienen que, aun cuando son utilizadas apropiadamente, las pruebas de signifi
cación no reflejan el verdadero sentido de las investigaciones. Aseguran que la psicología se re
fiere fundamentalmente al tamaño del efecto, y no se trata de saber si un resultado es distinto de
cero. Ya hemos visto una versión de esta discusión en el capítulo 7, con la sugerencia de que ios
investigadores utilicen ios intervalos de confianza en lugar de las pruebas de significación. La
versión completa de esa propuesta (que no analizamos en ese momento) es que en realidad debe
ríamos informar sobre el tamaño del efecto, con un intervalo de confianza apropiado para ese ta
maño del efecto.
Además de los argumentos arriba mencionados, aquellos que proponen el uso del tamaño del
efecto sostienen que éste suministra información que puede ser comparada con otros estudios, y
utilizada para acumular información de estudios independientes como modo de investigación
acerca del progreso en determinado campo. Los tamaños del efecto son componentes cruciales
del meta-análisis, y muchos de aquellos que proponen el tamaño del efecto, de hecho, no sólo
proponen el meta-análisis sino que lo ven como la tendencia del futuro en la psicología.
Existen, sin embargo, argumentos contrarios a favor de las pruebas de significación (y en
contra del uso exclusivo del tamaño del efecto). Uno de esos argumentos establece que cuando el
tamaño de la muestra es pequeño, aún es posible obtener un gran tamaño del efecto por casuali
dad. Por lo tanto, si estamos interesados en el resultado de un determinado estudio, que utilizó una
muestra pequeña, las pruebas de significación nos protegen de tomar los resultados de ese estudio
demasiado en serio. De manera similar, existen casos en los que un tamaño del efecto muy peque
ño es, de todos modos, importante (véase el tratamiento de este tema en el capítulo 3)'. En una si
tuación de ese tipo, es crucial saber si se puede confiar en que el resultado no es casual. Aun así,
muchos de aquellos que sostienen estos argumentos están de acuerdo con qüe se ha exagerado la
importancia de la significación. La mayoría sostiene que la significación debería ser calculada e
informada siempre, pero que el tamaño del efecto también debería ser calculado y debería dársele
más importancia en la discusión de los resultados.
Existe, además, otra posición que sostiene que en algunas circunstancias los tamaños del
efecto son engañosos, por lo cual sólo deberíamos confiar en las pruebas de significación. Chow
(1988, 1996), por ejemplo, realiza una diferenciación entre las investigaciones orientadas a la
aplicación y aquellas orientadas a la teoría. En la investigación aplicada, los psicólogos están in
teresados en saber el tamaño real del efecto de un programa determinado o ei tamaño de la dife
rencia real entre dos grupos determinados. En esas circunstancias, Chow está de acuerdo con que
el tamaño del efecto es una buena idea. Sin embargo, al realizar investigaciones teóricas, Chow
sostiene que la situación es bastante diferente. Es en esas situaciones en las que el tamaño del
efecto es irrelevante y hasta engañoso.
Analicemos un experimento acerca del efecto de la familiaridad en el reconocimiento de in
formación. El objetivo de este estudio es analizar la forma básica en que la familiaridad afecta el
procesamiento de información. Un estudio podría exponer a diferentes personas a palabras cono
cidas y no conocidas, y observar cuántas milésimas de segundos íes lleva reconocerías. El tamaño
del efecto de tal estudio nos diría muy poco con respecto a la interpretación de los resultados del
estudio. La interpretación depende de toda clase de detalles sobre cómo se realizó el estudio, co
mo por ejemplo, qué grado de familiaridad o falta de familiaridad teman las palabras utilizadas,
de qué forma específica fueron presentadas las palabras, y aspectos semejantes. Lo que importa
en un estudio de este tipo, según Chow, es que a) la predicción de una diferencia en el reconoci
miento de palabras conocidas y no conocidas fuera generada a partir de la teoría, b) que los resul
tados fueran coherentes con lo predicho (según lo demuestre la significación estadística) y que
c) así se sustente la teoría.
La investigación no es fundamentalmente teórica sólo en el campo de la psicología cognitiva.
Otros ejemplos de investigación esencialmente teórica incluyen estudios experimentales acerca
de motivaciones para la atracción interpersonal, de la medida en que los cambios químicos influ
yen en los procesos nerviosos, de cómo los niños desarrollan el lenguaje, o de cómo varía la me
moria con respecto a hechos emocionales y no emocionales.
De hecho, es probable que el equilibrio actual entre la utilización de pruebas de significación
y tamaños del efecto se encuentre simplemente en lo que uno podría esperar de los temas que se
ñala Chow. En las áreas de la psicología aplicada se le está dando una importancia creciente al ta
maño del efecto, pero en áreas más teóricas de la psicología es más raro ver menciones explícitas
de la magnitud del efecto. Nuestra opinión es que incluso en investigaciones orientadas a la teo
ría, la pérdida potencial (al colocar el énfasis donde no corresponde) que implica la inclusión del
tamaño del efecto, probablemente se vea compensada por, entre otros beneficios, la utilidad para
futuros investigadores de poder contar con esa información, lo cual les daría la posibilidad de
calcular la potencia al planificar sus propios estudios.
Este estudio presentaba una potencia de aproximadamente un 90% de lograr efectos significativos (...] con
respecto a las dos variables manipuladas, si en realidad existía un gran efecto de este tipo ( d = 0,8). D e hecho,
la potencia es de aproximadamente un 90% si se trata de encontrar al menos un efecto cuasi significativo
(p < 0,10) de tamaño mediano ( d = 0,5). Por lo tanto, parece improbable que hubiéramos podido conseguir
estos resultados si de hecho existe más que un efecto pequeño...” fp. 567).
Cada vez es más común (aunque sigue siendo una excepción) que las publicaciones mencionen el
tamaño del efecto. Por ejemplo, Caspi et al. (1997) analizaron información de un estudio longitu
dinal a gran escala de una muestra de niños nacidos alrededor de 1972 en Dunedin, Nueva Zelan
da. En una de las partes del estudio, Caspi et. al. compararon a los 94 individuos de su muestra
que, a los 21 años, eran dependientes del alcohol (claramente alcohólicos), contra los 863 que no
lo eran. Los investigadores compararon estos dos grupos en cuanto a las puntuaciones obtenidas
en pruebas de personalidad a los 18 años de edad. Sin embargo, dado que el tamaño de la muestra
era tan grande, los investigadores sabían que incluso pequeñas diferencias podrían resultar esta
dísticamente significativas. Por lo tanto, al describir la planificación de su análisis, observaron:
Además de probar la hipótesis de que las diferencias entre los grupos son estadísticamente significativas, calcu
lamos los tamaños del efecto (d ) de las diferencias obtenidas donde, definiéndolas operativamente, 4 = 0 ,2 es un
tamaño del efecto pequeño, d =~0”5 es un tamañcTdei efecto mediano y d = 0,8 es una gran tamaño del efecto
(Cohén, 1 9 8 8 ^ ^ X 0 5 5 ? ----------------------“ ...................................... ......... ...............................
Es más habitual que se informe sobre el tamaño del efecto en los meta-análisis, en los que se com
binan y comparan resultados de diferentesj^ETm aeñ^ estos
es tudiosmeta-anafíticos7 me luyendo H “defcü adro Á modo de ejemplo de la forma en que es
tos estudios realmente describen los resultados en función del tamaño del efecto, analicemos un
famoso meta-análisis realizado por Shapiro y Shapiro (1983). Ellos revisaron 143 estudios sobre
los efectos de psicoterapias que utilizaban razonablemente métodos de sonido. Entre sus resulta
dos existía una comparación de la efectividad de las terapias en general en diferentes tipos de pa
cientes (a los que denominaban la “categoría objetivo”). La tabla 8-7 ilustra la cantidad de
estudios (N), el porcentaje que representa esa cantidad en relación con todos los estudios revisa
dos, el tamaño del efecto promedio y el desvío estándar de los tamaños del efecto. A partir de es
ta tabla podemos observar que los mayores beneficios de la psicoterapia se encontraron en los
estudios que se concentraban en personas con fobias, y los menores beneficios en estudios que se
concentraban en personas con angustia y depresión. Sin embargo, sobre la base de las medidas de
Cohén, aún el efecto menor era grande.
Tabla 8-7.
Categorías objetivo y tamaño de efecto.
Categorías objetivo N % Tamaño de efecto SO
A ngustia y depresión 30 7 0,67 0 ,6 2
Fobias 76 18 1,28 0 ,8 8
Problem as físico s y de hábitos 106 26 1,10 0,85
Problemas sociales y sexuales 76 18 0,95 0,75
A ngustias por el desem peño 126 30 0,80 0,71
Fuente: Shapiro, D. A. & Shapiro, D. (1983), tab. 5." Investigación comparativa de resultados de terapias: implicancias
metodológicas del meta-análisis”. R e v is ta C ie n tíf ic a d e P s i c o lo g ía d e A s e s o m m i e n t o y C lín ic a [ J o u r n a l o f C o n s u ltin g
a n d C lin ic a l P s y c h o l o g y I 5 1 ,4 2 -5 3 . Copyright, 1983, por la Asociación Americana de Psicología [American Psycho
logical Association]. Reimpreso con autorización del autor.
RESUMEN
Términos clave
-A lfa (a). —Reglas del tamaño del efecto. - Potencia estadística.
-B eta (p). - Meta-análisis. ~ Error Tipo L
- Tamaño del efecto (<á). - Tablas de potencia. - Error Tipo H.
X
(a) 90 4 91 100 0,05 1 SERIE 11
(b) 90 4 92 100 0,05 1 1. ¿Qué significa la potencia estadística de
(c) 90 2 91 100 0,05 1
(d) 90 4 91 16 0,05 1
un experimento?
(e) 90 4 91 100 0,01 1 2. Para cada uno de los siguientes estudios
(i) 90 4 91 Í0 0 0,05 2 realice un cuadro de las cuatro posibles decisio
nes correctas e incorrectas, y explique qué sig
4. Basándose en una determinada teoría
acerca de la creatividad, un psicólogo predice nificaría cada una. (Cada cuadro debería estar
que los artistas son personas más dispuestas a diseñado de manera semejante a la tabla 8-1, ■
comer riesgos que ia población en general. La pero dentro de los cuadros debe incluir el re
población general presenta una distribución sultado real utilizando los nombres de las va
normal con una media de 50 y un desvío están riables involucradas en el estudio).
dar de 12, según el cuestionario sobre riesgo a) Estadio sobre si las criaturas que nacen
que el psicólogo piensa utilizar. El psicólogo prematuramente comienzan a reconocer los
espera que los artistas tengan un valor prome rostros después de lo que lo hacen los demás
dio de 55, según ese mismo cuestionario. El niños en general.
psicólogo piensa analizar a 36 artistas y probar b) Estudio sobre si los alumnos secunda
la hipótesis a un nivel de 0,05. ¿Cuál es la po
rios que reciben programas de prevención del
tencia de este estudio? Explique su respuesta a
Hiv en sus colegios tienen mayor probabilidad
alguien que comprende la prueba de hipótesis
con medias muéstrales pero que nunca ha de practicar sexo seguro que otros alumnos se
aprendido el concepto de potencia. cundarios.
5. Usted lee un estudio en el que el resulta c) Estudio sobre si la memoria para ideas
do es apenas significativo a nivel 0,05. Des abstractas se reduce si la información se pre
pués observa el tamaño de la muestra. Si la senta en colores que distraen la atención.
muestra es muy grande (en lugar de muy pe 3. Aquí le presentamos información sobre
queña), ¿cómo debería afectar esto su interpre diferentes posibles versiones de un experi
tación de a) la probabilidad de que la hipótesis mento planificado, cada una referida a una so
nula sea realmente verdadera y b) la importan la muestra. (Se supone que el investigador
cia práctica del resultado? Explique su res puede tener cierto control sobre el desvío es
puesta a una persona que comprende la prueba tándar y la media predicha de la población
de hipótesis pero que nunca ha aprendido el
cambiando los procedimientos). Determine la
concepto de potencia.
6. ¿Cuál es el efecto “en la potencia de un potencia y el tamaño del efecto de cada una.
estudio” de cada uno de los siguientes aspectos? Después realice un diagrama de las distribu
a) Una mayor diferencia predicha entre las ciones que se superponen mostrando las áreas
medias poblacionales. que representan alfa, beta y la potencia. (Su
b) Un mayor desvío estándar poblacionaj. ponga que todas las poblaciones tienen una
c) Un mayor tamaño de muestra, distribución normal).
M ed ia N ivel
cantidad media identificada correctamente au
U na
p redicha de odós mentará a 74. El psicólogo planea probar 20
P o b la ció n N sig n ifica c ió n participantes con estas condiciones, utilizando
c o la s
el nivel 0,05. ¿Cuál es la potencia de este es
M- 2 .
a) 0 0,5 0,1 50 0,05 l tudio? Explique su respuesta a alguien que
b) 0 0,5 0,5 50 0,05 1 comprende la prueba de hipótesis con medias
c) 0 0,5 10,0 50 0,05 1 muéstrales pero que nunca ha aprendido el
d) 0 0,5 0 ,5 100 0,0 5 1
concepto de potencia.
e) 0 0,5 0,5 2 0 0 0,05 1
0 0 0 ,5 0,5 4 0 0 0 ,0 5 2
5. Usted lee un estudio que, por muy poco,
no arroja resultados significativos al nivel 0,05.
4. Es decir, el resultado no es significativo. Des
Un psicólogo está planificando un estudio
acerca del efecto de la motivación en el desem pués, observa el tamaño de la muestra. Si la
peño de un participante, en una tarea de atención muestra es muy grande (y no muy pequeña),
que involucra la identificación de ciertas letras ¿cómo afecta esto su interpretación de a) la
en una sucesión de letras que pasan a gran ve probabilidad de que la hipótesis nula sea real
locidad. El investigador sabe, por su larga ex mente verdadera y de b) la probabilidad de que
periencia, que en condiciones experimentales la hipótesis nula sea realmente falsa? Explique
ordinarias, la población de alumnos que parti sus respuestas a una persona que comprende la
cipan en esta tarea identifica, en promedio, 71 prueba de hipótesis pero que nunca ha aprendi
de las letras claves (de 100 que se presentan); do el concepto de potencia.
que el desvío estándar es 10, y que la distribu 6. Usted está planificando un estudio que,
ción es aproximadamente normal. El psicólogo de acuerdo con sus cálculos, tiene una potencia
predice que si al participante se le paga un dó bastante baja. Nombre seis alternativas de las
lar por cada letra identificada correctamente, la que dispone para aumentar la potencia.
; ■>; Introducción a ía prueba t ia prueba í Resumen,,
pa|ra una sola muestra. > Términos clave.
)► La prueba f para medias dependientes. < ; ► Ejercicios.
> :Súpuest0s de !a prLieba t : : V ► Apéndice del capítulo: Fórmulas de ¡
Tamaño del efecto y potencia de |a ¡ cálculo opcionales correspondientes
prueba t para medias dependientes. a la prueba f para medias dependientes.
ri ► Controversias y limitaciones. -
■ Las pruebas í según sé describen.
en publicaciones científicas.
esta altura, el alumno debe creer que lo sabe todo acerca de la prueba de hipótesis.
A
Sin embargo, se sorprenderá: lo que ha aprendido hasta ahora no le resultará muy
útil como psicólogo. ¿Por qué? Los procedimientos para prueba de hipótesis des-
criptos hasta ahora fueron, por supuesto, requisitos previos absolutamente necesa
rios para lo que estamos por aprender, Sin embargo, estos procedimientos
involucraban la comparación de un grupo de valores observados con una población conocida, y
cuando se realizan investigaciones reales, con frecuencia se comparan dos o más grupos de valo
res observados entre sí, sin ninguna información directa acerca de las poblaciones. Por ejemplo,
podrían utilizarse dos valores correspondientes a cada una de las diferentes personas, tales como
las puntuaciones en una prueba de angustia antes y después de la psicoterapia; o la cantidad de
palabras familiares recordadas, en comparación con las no familiares, en un experimento acerca
de la memoria. O también se podría utilizar un valor por cada una de las personas que forman dos
grupos, tales como un grupo experimental y un grupo control, en un estudio acerca del efecto de
la pérdida del sueño en la resolución de problemas.
Estos tipos de situaciones de investigación se encuentran entre las más comunes en psicolo
gía, donde la única información disponible proviene de las muestras. Nada se sabe acerca de las
poblaciones de donde provienen esas muestras. Particularmente, el investigador desconoce la va
ri anza de las poblaciones involucradas, la cual es un componente crucial en el paso 2 del proceso
de prueba de hipótesis (determinar las características de la distribución comparativa).
En este capítulo, analizamos primero la solución al problema de no conocer la varianza po-
blacional. Comenzamos con una situación de prueba de hipótesis especial, comparando la me
dia de una sola muestra con una población de ía cual conocemos la media pero no ía varianza.
Luego, después de haber aprendido cómo se maneja este inconveniente de no conocer la va
rianza poblacionaí, proseguimos con la situación en la cual directamente no hay población co
nocida, una situación en la que todo lo que tenemos son dos observaciones por cada una de las
personas de un grupo.
Los procedimientos de prueba de hipótesis que aprenderemos en este capítulo, en los que no
se conoce la varianza poblacional, son ejemplos de lo que se denominan pruebas t. Las pruebas í
a veces se denominan “t de Studenf’, porque sus principios fundamentales fueron desarrollados
originalmente por William S. Gosset, quien publicó sus artículos bajo el seudónimo de “Student
(véase cuadro 9-1).
Cuadro 9 -1 .
W illiam S. G osset, alias “ Student”:
n o era un m atem ático sino..un "hom bre práctico".
^Wütíani'S. Gosset se graduó en Oxford en ■ tro tiempo, nó tenía-idea de la yari'anza de.. .'
. 1§99 y obtuvo su diploma én matemática y •v■sU población. :v;. vv.v y ; V;;;;v :
química; En el mismo año sucedió que los . Gosset estaba a la altura de las circúns- ;
fabricantes de cerveza de Guinness, en Du- •/ íanciás, aunque en ese momento sólo él le ,
blín, Irlanda, estaban buscando científicos sabía. Para sus colegas de la.fábrica de cér- . ;
jóvenes para que, por primera vez en la his veza, era un profesor de matemática'y no. .'
toria, analizaran la fabricación dé la cerve- un dignó fabricante de cerveza. .Para sus ;
. za de manera científica. Gosset obtuvo uno ' colegas estadísticos, principalmente loé del
de esos, puestos, y no fardó en sumergirse en Laboratorio de Estadística de Datos B ioió-.
la cebada, los lúpulos y cubas para la ela- . . gicos de la Universidad de Londres;, era un •
boración de la cerveza. simple, fabricante de cerveza y no un raáter .
El problema consistía en hallar lá for- ; . máticq propiamente dicho.. En., resumen, ;.:
ma de que la calidad de la cerveza fuera. Gosset era esa clase de científico qué nó ¡
"; menos variable, y especialmente descubrir. tiene inconveniente en aplicar sus talentos ,
la causa de las malas tandas. Un científico ; a íá vida práctica.;-; ¡ :•
que se preciará de serlo recomendaría, sin • De hecho; parecía disfrutar de'esa vida;/.•;
duda, la realización, de experimentos; Pero ■real: cultivando peras, pescando, jugando
un negocio como el de lá elaboración de :: golf; construyendo botes, esquiando, án- .
cerveza no podía darse el lujo de gastar di- : dando bnbicicleta (y jugando á las bochas . '
ñero en experimentos qué incluían grandes sobre céspéd, después dé. que se quebró, la .
cantidades dé cubás¿ algunas de las cuales pierna al estrellar su auto-un Ford modelo
iban á perderse, éomo lo sabría cualquier T de dos plazas al que llamaba ‘Uacama vo- .,;
fabricante de cerveza. Por lo tanto, Gosset ladora, ~ contra ün:poste dé luz); Disfruta-
se vio forzado a analizar la probabilidad de fia especialmente de las .heriamientas sim{. .
; qué cierta especié dé cebada produjera una ■ pies que podían aplicarse a cualquier cósa;..
cerveza de pésima calidad, dado que el exv ; fórmulas simples; que podía calcular meh- ; ;
. perimentó podía consistir sólo en ¿has po¿; talmente. (^n amigo lo describía como un ,
cas tandas .de cada especie. A esté próbleina - experto carpintero* aunque afirmaba que •
se sumaba el hecho de que él no tenía la '. . Gosset realizaba casi toda su carpintería fi-; ‘ ■
menor idea de. la yáriabilidád de las espe na sólo cohun cortaplumas);
cies de cebada; tal vez algunos campos ; . De ésa. manera, Gosset; descubrió- lá •
dieran mejor cebada al ser plantadas con la distribución t e inventó la prueba í (la sihK .;
misma especie (¿suena famili.ar?):. Pobre. . ptezá misma, comparada coa la mayoría dé •
Gosset, al igual quedos psicólogos de nues-i los cálculos estadísticos), para, aquellas si- .'
tuaciones en las. ■que las muestras soh pe- , se lo pidieron. Hasta el día de. hoy, la mayo
: : quenas y se desconoce la variabilidad de. la ■ ría de los estadísticos llaman a la. distribu-,
población que se supone de un.tamaño mu- ción t la “í de Student”, ' porque Gosset
■■■^cho más grande. La mayor paite de su tra- escribía baj o el seudónimo de “Studenf,
:; bajo lo realizó en el reverso de sobres,.con ■simplemente para que la fábrica de cerveza
. muchos errores menores de aritmética que ' Guinness no tuviera que admitir púbiica-
. mente que a veces elaboraban una mala
, tuvo que corregir .luego. Como suele ocu*
tanda dé cérveza1. ■■■.
rrir, publicó su trabajo sobre “Métodos, pa-
: . ra la elaboración de cerveza” sólo.cuando R éférenciast Péíérs (1987); Stiglec (Í986); Tankard
algunos editores de las revistas científicas (1984).; . v 7
INTRODUCCIÓN A LA PRUEBA T:
PRUEBA TPARA UNA SOLA MUESTRA
Comenzaremos con la siguiente situación: tenemos los registros de una sola muestra y queremos
comparar esos datos con una población de la cual conocemos la media pero no la varianza. La
prueba de hipótesis, en este caso, se denomina prueba t para una sola muestra. (También la lla
man “prueba f de una muestra”). La prueba t para una sola muestra funciona básicamente de la
misma forma que lo aprendido en el capítulo 7. Hay sólo dos importantes cuestiones nuevas: pri
mero, ya que no conocemos la varianza poblacional, debemos estimarla. Segundo, cuando se de
be estimar la varianza de la población, la forma de la distribución comparativa es levemente
diferente a una curva normal.
Ejemplo
Supongamos que el periódico de cierta facultad informa acerca de una encuesta informal que
muestra que los estudiantes de la facultad estudian un promedio de 2,5 horas por día. Sin embar
go, uno de los alumnos considera que los estudiantes que viven en el mismo alojamiento estu
diantil que él estudian mucho más que esa cantidad de horas. Elige al azar 16 alumnos del edificio
y les pregunta cuánto estudian cada día. (Supondremos que son todos honestos y precisos). El re
sultado que obtiene es que estos 16 alumnos estudian un promedio de 3,2 horas por día. En ese
caso, ¿el alumno debería concluir que los estudiantes de su alojamiento estudian más que el pro
medio de horas que lo hacen los de la facultad? ¿O debería concluir que sus resultados son tan
cercanos a ese promedio de la facultad que la pequeña diferencia de 0,7 horas podría bien deberse
a que accidentalmente ha seleccionado 16 de los residentes más estudiosos del alojamiento estu
diantil?
El primer paso del proceso de prueba de hipótesis es replantear el problema en función de hi
pótesis sobre poblaciones. Existen dos poblaciones:
P o b la ció n 1: el tipo de estudiantes que viven en el edificio del alumno que realiza el estudio.
P o b la ció n 2: el tipo de estudiantes de la facultad en general.
La hipótesis de investigación establece que ios alumnos de la población 1 estudian más
que los alumnos de la población 2; la hipótesis nula establece que los alumnos de la población
1 no estudian más que los alumnos de la población 2. Hasta aquí el problema no es diferente al
del capítulo 7.
El segundo paso es determinar las características de la distribución comparativa. La media de
esta distribución será de 2,5, el número arrojado por la encuesta a los alumnos de la facultad en
general (población 2).
La siguiente parte del segundo paso es encontrar la varianza de la distribución de medias. En
este ejemplo nos encontramos con otro tipo de inconveniente; hasta aquí, siempre hemos cono
cido la varianza de la población de observaciones individuales. Utilizando esa varianza, luego
calculábamos la varianza de la distribución de medías. En este caso, la publicación no informó
la varianza de la cantidad de horas de estudio de la facultad en general. Entonces el alumno lla
ma al periódico. Lamentablemente, el periodista no calculó la varianza, y los resultados de la en
cuesta original ya no están disponibles. ¿Qué hacer en ese caso?
_ %(X—M) __ SC (9-1)
N- 1 ~N - 1
el desvío estándar poblacional estimado es la raíz cuadrada de la varianza poblacional estimada,
s=dF (9-2)
Volvamos al ejemplo de las horas de estudio y calculemos la varianza poblacional estimada utili
zando los 16 valores muéstrales. Primero, calculamos la suma de los desvíos cuadráticos. (Resta
mos la media muestral a cada uno de los valores, elevamos al cuadrado esos desvíos, y los
sumamos). Supongamos que realizamos este cálculo y el resultado es 9,6 (SC = 9,6). Para obtener
la varianza poblacionai estimada, dividimos esta suma de desvíos cuadráticos por la cantidad de
valores muéstrales menos 1, En la muestra hay 16 valores, entonces el tamaño de la muestra me
nos 1 es 15. El resultado es 0,64. Es decir, 9,6/15 es igual a 0,64. La fórmula es la siguiente:
tf-1 N - 1 16-1 15
Grados de libertad
El mínimo por el cual dividimos (la cantidad de valores menos 1) para calcular la varianza pobla
cionai estimada tiene un nombre especial. Se lo denomina grados de libertad, porque es la canti
dad de valores muéstrales “libres para variar”. Se trata de un concepto un poco complicado. La
idea básica es que, al calcular la varianza, primero debemos conocer la media; si conocemos la
media y todos los valores de la muestra excepto uno, con un poco de aritmética podemos calcular
aquél valor que desconocemos. (Si al alumno le agradan las aventuras matemáticas, puede inten
tarlo con algunos ejemplos para comprobar como funciona). Por lo tanto, una vez que conocemos
la media, uno de los valores de la muestra no tiene libertad de tomar cualquier valor posible. En
tonces, los grados de libertad son la cantidad de valores menos 1. Se expresa por la fórmula,
g l-N - 1 (9-3)
donde gl representa los grados de libertad. En nuestro ejemplo, gl =* 16 - 1 ~ 15. (En algunos ca
sos, que aprenderemos en capítulos posteriores, los grados de libertad se calculan de forma lige
ramente diferente, debido a que en esos casos es diferente la cantidad de valores libres para variar.
En todos los casos planteados en este capítulo, g l ~ N - 1).
La fórmula para calcular la varianza poblacionai estimada, con frecuencia, se escribe utili
zando gl en lugar de N - 1: ^
„o X(X-M )2 SC
s = ~ i r ~ = gi
(9-5)
¡i
(9-6)
Es importante tener en cuenta que cuando estamos utilizando una varianza poblacional estima
da, los símbolos para la varianza y el desvío estándar de la distribución de medias utilizan S en
lugar de o-.
En el ejemplo que estamos analizando, el tamaño de la muestra era ló, y la varianza poblacio
nal estimada que acabamos de calcular era 0,64. La varianza de la distribución de medias, sobre la
base de esa estimación, será 0,04. Es decir, 64 dividido 16 es igual a 0,04. El desvío estándar es
0,2, la raíz cuadrada de 0,04. La fórmula es la siguiente,
Cabe advertir que para encontrar la varianza de una distribución de medias siempre se divide la
varianza poblacional por el tamaño de la muestra, y esto ocurre ya sea porque conocemos la va
rianza de la población o sólo porque la estimemos. En el ejemplo que estamos analizando, dividi
mos la varianza poblacional, que habíamos estimado, por 16. Sólo cuando realizamos la
estimación de la varianza poblacional dividimos por el tamaño de la muestra menos 1. Es decir,
los grados de libertad se utilizan sólo cuando estimamos la varianza de la población de observa
ciones individuales.
Esta sutil diferencia de la forma afecta los valores extremos necesarios para rechazar la hipótesis nu
la. Para rechazar la hipótesis nula necesitamos estar en una zona extrema bajo la curva normal, co
mo por ejemplo el 5% superior. Sin embargo, si hay más valores extremos, el punto en el que
comienza el 5% superior está más alejado, hacia afuera de la curva. Por eso, es necesaria una media
muesíral más extrema para obtener significación al utilizar una distribución t que al utilizar una cur
va normal.
La medida en que la distribución t difiere de la curva normal depende precisamente de los
grados de libertad en la estimación de la varianza pobíacional. La distribución t difiere más de la cur
va normal cuando la estimación de la varianza pobíacional se basa en una muestra muy pequeña, de
modo que los grados de libertad son bajos. Por ejemplo, utilizando la curva normal, el punto de corte
para una prueba de una cola a nivel 0,05 es 1,64. En una distribución t con 7 grados de libertad (es de
cir, con un tamaño de muestra de 8), el punto de corte correspondiente al 5% en una prueba de una co
la es 1,895. Si la varianza pobíacional estimada se basa en una muestra mayor, digamos una muestra
de 25 (de modo que gl - 24), el punto de corte es 1,711. Si el tamaño de la muestra es infinito, la dis
tribución í es igual a la curva normal. (Por su puesto, si el tamaño de tu muestra fuera infinito, ¡inclui
ría toda la población0- Pero incluso con tamaños de muestra de 30 ó más, la distribución te s casi
idéntica a la curva normal.
Antes de aprender cómo encontrar realmente el punto de corte utilizando una distribución t,
volvamos primero brevemente al ejemplo de la cantidad de horas que estudian cada noche los
alumnos del edificio de dormitorios . Finalmente tenemos todo lo que necesitamos para comple
tar el segundo paso, que se refiere a las características de la distribución comparativa. Ya hemos
visto que la distribución de medias tendrá una media de 2,5 horas y un desvío estándar de 0,2. So
bre la base de lo que acabamos de analizar, ahora podemos agregar que la forma de la distribución
comparativa será una distribución i con 15 grados de libertad.1
1 Los estadísticos hacen una sutil distinción en este caso entre la distribución comparativa y la distribución de m e
dias. H em os evitado presentar esta distinción aquí y en capítulos posteriores para simplificar e l tratamiento de un te
ma que-ya es de por s í bastante complicado. Pero para aquellos que estén interesados en e l tema diremos que la
distinción puede entenderse de la siguiente manera: el procedimiento general de prueba de hipótesis, tal com o lo
presentamos en e l capítulo 7, puede describirse com o la comparación de una puntuación 2 con la m edia de 3a m ues
tra, donde Z = ( M ~ (i)/ y donde o u •= w VN, y luego ía comparación de esta puntuación Z c o n un punto Z de cor
te de la tabla de áreas de la curva normal. Describim os este proceso utilizando la distribución de inedias com o
distribución comparativa.
L o s estadísticos dirían que en realidad e s ta m o s comparando la puntuación Z, calculada con una distribución de la pun
tuación Z (que e$ simplemente una curva normal estándar). D e modo similar, en el caso de una prueba t, ios estadísticos
consideran que el procedimiento es como calcular una puntuación r (similar a una puntuación Z pero calculada utilizan
do un desvío estándar estimado), donde t = ( M - iL)IS ,¡, donde y luego comparar la puntuación t calcula
da con un punto de corte t tomado de una tabla de distribución i. Por lo tanto, de acuerdo con la lógica estadística
formal, ía distribución comparativa es una distribución de la puntuación í, y no de medias.
Determinación del valor muestra! de corte para
rechazar la hipótesis nula: utilización de la tabla f
El tercer paso del proceso de prueba de hipótesis es determinar el punto de corte para rechazar la
hipótesis nula. Existe una distribución t diferente para cada número de grados de libertad en par
ticular. Sin embargo, para no llenar hojas y hojas con tablas para cada posible distribución í, se
utiliza una tabla simplificada que incluye sólo los puntos de corte cruciales. En el apéndice B in
cluimos esta tabla t (tabla B-2).
En el ejemplo que estamos analizando, tenemos una prueba de una cola (nos interesa saber si
los alumnos del edificio en cuestión estudian más que los alumnos de esa facultad en general).
Creemos que podemos utilizar el nivel de significación del 5% ya que eí costo de un error Tipo I
(rechazar equivocadamente la hipótesis nula) no es grande. Tenemos 16 participantes, lo que da
15 grados de libertad para la estimación de la varianza poblacional.
La tabla 9-1 incluye una parte de una tabla t similar a la tabla B-2. Buscamos la columna correspon
diente al nivel de significación 0,05 para pruebas de una cola, luego descendemos por esa columna has
ta la línea correspondiente a 15 grados de libertad. El número crucial de corte es 1,753. Esto significa
que rechazaremos la hipótesis nula si la media muestra! se encuentra a 1,753 o más desvíos estándar por
encima de la media en la distribución comparativa. (Si estuviéramos utilizando una varianza conocida
hubiéramos encontrado el punto de corte en una tabla de áreas bajo la curva normal. La puntuación Z ne
cesaria para rechazar la hipótesis nula, sobre la base de la curva normal, hubiera sido 1,645).
Hay otro tema que queremos destacar acerca de la utilización de la tabla t. En la tabla t com
pleta que se encuentra en el apéndice, existe una línea para cada grado de libertad, desde el 1 has
ta el 30. Luego, para cada cinco grados de libertad (35,40,45, etc.), hasta 100. Supongamos que
el estudio incluyera grados de libertad que se encuentran entre dos valores. Para mayor seguridad,
deberíamos utilizar los grados de libertad inferiores más cercanos a los de la muestra que se en
cuentren en la tabla. Por ejemplo, si estuvieras realizando un estudio en el que hubieran 43 grados
de libertad, utilizaríamos la línea de la tabla correspondiente a 40 g l
Tabla 9-1.
Puntos de corte para las distribuciones t con grados de libertad del 1 a 17. (Se indica el punto de
corte para el ejemplo acerca de las horas de estudio).
En el ejemplo que estamos analizando, la media muestral de 3,2 está a 0,7 horas de la media de la dis
tribución de medias. Es decir, a un total de 3,5 desvíos estándar de la media (es decir, 0,7 horas dividi
do por el desvío estándar de 0,2 horas es igual a 3,5). En otras palabras, la puntuación t en el ejemplo
es 3,5. Aplicando la fórmula se obtiene:
T a b la 9 -2 .
P r u e b a d e h ip ó te s is c o n u n a s o ia m e d ia m u e s tr a l, y e n la q u e s e d e s c o n o c e la v a r ia n z a d e ia
p o b la c ió n {p r u e b a t) e n c o m p a r a c ió n c o n io s c a so s e n lo s q u e s e c o n o c e la v a r ia n z a p o b la c k m a l.
D ife r en cia c o n lo s c a so s en lo s q u e s e c o n o ce
P aso s de ia p ru e b a d e h ip ó te sis ia v a r ia n z a p o b la cio n a l
Resumen de ios pasos a seguir para realizar una prueba t para una sola muestra
La tabla 9-4 resume los pasos de la prueba de hipótesis cuando se trabaja con observaciones de
una sola muestra y con una población de la cual se conoce la media pero no la varianza.
Tabla 9-4.
P a s o s a s e g u ir p a r a realizar una prueba f para una sola muestra.
1. Replantear el problem a en función de hipótesis de investigación e hip ótesis nula sobre poblaciones.
2 . Determ inar las características de la distribución comparativa.
Diferencias
En un diseño de medidas repetidas, la muestra incluye dos valores por cada persona en lugar de
uno sólo. Esto se maneja convirtiendo los dos valores por persona en uno sólo. El truco es crear
diferencias; tomamos los valores de cada persona y restamos uno al otro.
Analicemos el ejemplo acerca del eeg.El psicólogo especializado en fisiología realizará una
resta por cada persona: la medida del eeg de la persona durante la tarea abstracta menos la medi
da del eeg de la misma persona durante la tarea concreta. Así, se obtiene una sola diferencia abs
tracto-menos-concreto para cada persona. Similarmente, si tomamos el ejemplo de las ausencias
laborales, el psicólogo empresarial realizará la siguiente resta por cada persona: la cantidad de
días perdidos después del programa menos la cantidad de días perdidos antes del programa. El re
sultado sería una diferencia posterior-menos-anterior para cada empleado.
Cuando se trata de un valor anterior y de un valor posterior, generalmente tomamos el valor
posterior y le restamos el anterior, para obtener una medida del cambio. En otros casos, tal como
el ejemplo del Eeg,realmente no importa cuálse resta a cuál, siempre que lo hagamos de la mis
ma manera con todas las personas de la muestra.
Una vez que tenemos la diferencia de cada persona del estudio, realizamos el resto del pro
cedimiento de prueba de hipótesis utilizando las diferencias. Es decir, procedemos como si se
tratara de un estudio de una sola muestra de valores, los cuales, en este caso, resultan ser las di
ferencias.2
2 También podemos utilizar una prueba t para medias dependientes en una situación en la que tenemos valores de pares
de participantes en ia investigación. Analizamos cada par com o si fuera una persona y calculamos una diferencia por
cada pár. Por ejemplo, supongamos que tenemos 30 parejas de matrimonios y estamos comparando edades de esposos
y esposas para ver si los esposos son sostenidamente mayores que las esposas, Podríamos calcular para cada pareja una
diferencia de la edad del esposo menos la de la esposa. Luego realizaríamos el resto de la prueba de hipótesis del m is
mo modo que cualquier otra prueba t para medias dependientes. Cuando la prueba r para medias dependientes se utiliza
de este modo, a veces se la llama prueba t para diseños apareados o prueba l de com paraciones pareadas.
tad era, en general, 2,5 horas. Sin embargo, ahora estamos utilizando diferencias, y por lo general
no conocemos la media poblacional de las mismas.
La solución es la siguiente; comúnmente, la hipótesis nula en un diseño de medidas repetidas es
tablece que no hay diferencia entre los dos grupos de valores. Por ejemplo, la hipótesis nula del estu
dio realizado por el psicólogo especializado en fisiología es que la actividad e e g será la misma al
hacer tareas abstractas o concretas. Similarmente, la hipótesis nula del estudio acerca de la promo
ción sanitaria establece que las inasistencias laborales serán iguales antes y después de presentar el
programa de promoción sanitaria. Por lo tanto, al utilizar diferencias usualmente comparamos una
hipótesis de investigación que establece una diferencia predicha, con una hipótesis nula que esta
blece una diferencia nula.
El punto clave es el siguiente: ¿Qué significa “diferencia nula”? Es decir, ¿qué significa decir
que en la población, en líneas generales, la diferencia entre los dos valores de una persona es nu
la? Es lo mismo que decir que la media de la población de diferencias es 0. En otras palabras, de
cir que la diferencia entre los dos valores es nula es equivalente a decir que el promedio de las
diferencias es cero.
Por lo tanto, al trabajar con diferencias suponemos una población comparativa artificial de di
ferencias que tiene una media poblacional igual a 0.
Es importante destacar que no tenemos información real acerca de los maridos de la población 2.
Los maridos del estudio son una muestra de la población 1 de maridos. Si la hipótesis de investi
gación es correcta, es probable que los maridos de la población 2 ni siquiera existan. Sólo con el
propósito de realizar la prueba de hipótesis, establecimos la población 2 como una especie de gru
po comparativo de hombres en pareja. Es decir, establecimos un grupo comparativo con el propó
sito de analizar maridos que, si se miden antes y después del matrimonio, no mostrarían ningún
cambio.
2. Determinar las características de la distribución comparativa. Si la hipótesis nula es
verdadera, la media pobiacíonai de las diferencias es 0. La varianza poblacional de las diferencias
puede estimarse a partir de la muestra de las diferencias. Tal como lo indica la tabla 9-5, la suma
de los desvíos cuadráticos de las diferencias con respecto a la media de diferencias es 2.772,9. Al
haber 19 maridos en el estudio, existen 18 grados de libertad. Dividiendo la suma de los desvíos
cuadráticos por los grados de libertad, obtenemos una varianza poblacional estimada de 154,05.
La distribución de medias (de esta población de diferencias) tendrá una media de 0, al igual
que la media poblacional; su varianza será la varianza poblacional estimada (154,05) dividida por
el tamaño de la muestra (19), lo que da 8,11. El desvío estándar es la raíz cuadrada de 8,11, que es
2,85. Dado que Olthoff estaba utilizando una varianza poblacional estimada, la distribución com
parativa es una distribución t. La estimación de la varianza poblacional se realizó sobre la base de
18 grados de libertad, por lo tanto, esta distribución comparativa es una distribución t para 18 gra
dos de libertad.
3. Determ inar el punto de corte en !a distribución comparativa, apartir del cual debería
rechazarse la hipótesis nula. Olthoff utilizó una prueba de dos colas porque no existía razón evi-
Tabia 9-5.
Análisis de la prueba t referida a los registros de calidad de comunicación antes y después del ma
trimonio, realizado a 19 esposos que no recibieron ninguna capacitación especial en cuanto a comu
nicación.
S; 2 .2 1 0 1.981 -2 2 9 2.772,9
Para las diferencias:
M = -229/19 = -12,05.
p, = 0 (tom ado com o base comparativa de ausencia d e cam bio).
5* = SC/gí« 2.772,9/(19 -1) = 154,05.
^ = ^=154,05/19 = 8,11.
4 = ^ í = C í í ==2,85.
t necesario para e l nivel 5%, con g l = 18 y prueba de d os c o la s = ± 2 , 1 0 1 .
t - ( M ~ jju)/5y = (-12,05 - 0)/2,85 = -4,23.
D ecisión : s e rechaza la hipótesis nula
dente para predecir un aumento o una disminución en la calidad de la comunicación. La tabla B-2
indica que utilizando un nivel de significación de 0,05 y 18 grados de libertad para rechazar la hi
pótesis nula, se necesita un punto t de +2,101 ó mayor, o bien de -2,101 ó menor.
4. D eterm inar el valor muestral en la distribución comparativa. La muestra de Olthoff te
nía una media de diferencias de -12,05. Es decir, la media estaba 12,05 puntos por debajo de la
media de distribución de medias, que es igual a 0. El desvío estándar de la distribución de medias
que calculamos era de 2,85. Por lo tanto, la media de las diferencias -12,05 se encuentra 4,23 des
víos estándar por debajo de la media de la distribución de medias, es decir, la muestra de diferen
cias de Olthoff corresponde a un punto t de - 4,23
Figura 9-6. Capacidad de comuni
cación de esposas que reciben ca
pacitación prematrimonial sobre
comunicación y de esposas que no
reciben dicha capacitación (sobre
la base de Olthoff, 1989).
5. C om p arar los valores de los pasos 3 y 4 p ara d ecid ir si se rechaza o no la hipótesis n ula.
El t de -4,23 de la muestra de diferencias es más extremo que el t ±2,101 necesario. Por lo tanto,
podemos rechazar la hipótesis nula. El resultado sugiere que los maridos analizados por Olthoff
pertenecen a una población en la que la calidad de comunicación de los maridos después del ma
trimonio es diferente de lo que era antes (es menor).
El estudio real de Olthoff era más complejo. Tal vez resulte interesante saber que se descubrió
que las esposas también mostraban esta disminución en cuanto a calidad de comunicación después
de casadas. Sin embargo, un grupo similar de parejas comprometidas, a quienes sus ministros die
ron capacitación especial sobre capacidad de comunicación (mucho mayor que la acostumbrada
sesión breve) no mostraron una disminución significativa en la calidad de comunicación marital
después del matrimonio (véase la figura 9-6). De hecho, actualmente existe gran cantidad de inves
tigación que indica que la calidad marital de todo tipo disminuye en líneas generales (p. ej., Kamey
& Bradbury), y los cursos intensivos sobre capacidad de comunicación pueden ser muy útiles para
reducir o eliminar esta disminución (Markman et al., 1993).
Desvío
Cirujano Condiciones D iferencia Desvío Cuadrático
Silencio Ruido
i 18 12 6 6 -2 = 4 16
2 21 21 0 . -2 4
3 19 16 3 1 1
4 21 16 5 3 9
5 17 19 -2 _4 16
6 20 19 1 -1 1
7 18 16 2 0 0
8 16 17 -1 -3 9
9 20 16 4 2 4
S: 170 152 18 0 60
Para las diferencias:
M= 18/9 = 2,0.
p. = 0 (tomado como base comparativa de ausencia de cambio).
SZ_ sc/gi =60/(9 - 1) = 60/8 = 7,5.
= S*/N= 7,50/9 = 0,83.
SM= 'í^ = 'lQ W = 0,9l.
t necesario para un nivel de significación del 1%, gl - 8 y prueba de una cola = 2,897.
t ={M~ = (2,00 - 0)/0,9 i = 2,20.
Decisión: no se rechaza la hipótesis nula..
D esv ío
N iñ o E dad D ife r en cia D esvío C u ad rático
3 m eses 4 m eses
1 10,4 10,8 0 ,4 0,26 0,07
2 12,6 12,1 - 0 ,5 -0 ,6 4 0,41
3 11,2 12,1 0 ,9 0,76 0,58
4 10,9 11,4 0,5 0,36 0,13
5 14,3 13,9 “0 ,4 -0 ,5 4 0,29
6 13,2 13,5 0 ,3 0,16 0,03
7 9,7 ‘ 10,9 1,2 1,06 1,12
8 11,5 11,5 0 ,0 -0 ,1 4 0 ,0 2
9 10,8 10,4 - 0 ,4 -0 ,5 4 0,29
10 13,1 12,5 - 0 ,6 -0 ,7 4 0,55
S: 117,70 1 19,10 1,4 0 3,49
Para las diferencias:
M = 1,4/10 = 0,14.
li = ü.
= S C /g l = 3 ,4 9 /(1 0 - 1 ) - 3 ,4 9 /9 = 0,39.
S i = SYiV = 0 ,3 9 /1 0 = 0,039..
4 = 0 0 3 9 = 0,20.
í necesario para el nivel de sign ificación 5%, g l = 9 y prueba de una cola = 1,833.
t ~ (M - = (0 ,1 4 - 0 )/0 ,2 0 = 0,70.
D ecisión: no se rechaza la hipótesis nula..
a) Convertir los dos valores de cada persona en una diferencia. R ealizar todos los pasos restantes utilizando
las diferencias.
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hipótesis nula.
¿Cómo sabemos que la población es muy asimétrica? Un caso puede ser aquel en el que la mues
tra de diferencias es muy asimétrica. Si la muestra es muy asimétrica, es probable que la pobla
ción de donde proviene la muestra sea muy asimétrica también. Otro caso es aquel en el que
existen razones para pensar que se produce un efecto techo o piso que hace que la distribución sea
asimétrica porque los valores de un lado no pueden ser mayores o menores a determinado punto.
Existen varias alternativas para reemplazar la prueba t, cuando hay razones para creer que reali
zarla violaría seriamente el supuesto de normalidad y daría resultados distorsionados. En el capí
tulo 15 veremos esas alternativas.
Es importante recordar que cuando se utiliza esta fórmula, \xl es la media predicha de la población
de diferencias y cr es el desvío estándar de las poblaciones de diferencias.
Las reglas del tamaño del efecto de una prueba t para medias dependientes son las mismas
que aprendimos para el caso analizado en el capítulo 8: un tamaño del efecto pequeño es igual a
0,20, uno mediano es igual a 0,50, y uno grande es igual a 0,80.
Analicemos un ejemplo. Un psicólogo especializado en deportes planifica un estudio acerca
de las actitudes hacia compañeros de equipo antes y después del juego. Realizará un cuestiona
rio sobre actitudes dos veces, una antes y otra después del juego. Supongamos que la diferencia
mínima entre antes y después, que puede tener cierta importancia, es de 4 puntos del cuestiona
rio. Supongamos además que sobre la base de investigaciones relacionadas con el tema, el inves
tigador calcula que el desvío estándar de las diferencias del cuestionario de actitud es
aproximadamente de 8 puntos. Así, (ij = 4 y a ~ 8. Aplicando la fórmula para calcular el tamaño
del efecto, d - p¡/(7 - 4/8 = 0,50, Conforme a las reglas del tamaño del efecto, el estudio planifi
cado tiene un tamaño del efecto mediano.
Si deseáramos estimar el tamaño del efecto después de haber realizado el estudio, dividiría
mos la media real de las diferencias de la muestra por el desvío estándar estimado de la población
de diferencias.
Es importante recordar que, en ésta fórmula, tanto M como S se refieren a diferencias. Además, S
es el desvío estándar de la población de observaciones individuales (es decir, en este caso, de las
diferencias de los individuos). No es lo mismo que SM, el desvío estándar de la distribución de
medias (de diferencias).
Analicemos nuestro primer ejemplo de prueba t para medias dependientes, el estudio acerca
del cambio de los maridos en cuanto a la calidad de la comunicación. En ese estudio, la media de
las diferencias era -12,05, y el desvío estándar poblacional estimado de diferencias seria 12,41.
Es decir, calculam os la varianza estim ada de registros diferenciales (S2) y nos da
154,05; 'Vs2 = 12,41. Por lo tanto, el tamaño de efecto se calcula como d = M/S - -12,05/12,41
= -0,97. Se trata de un tamaño del efecto muy grande. (El signo negativo deí tamaño del efecto
significa que el gran efecto era una disminución).
Potencia
La tabla 9-9 indica la potencia aproximada a un nivel de significación de 0,05 para los tamaños
del efecto pequeños, medianos y grandes, correspondientes a pruebas de úna o dos colas. En el
ejemplo del psicólogo especializado en deportes, el investigador esperaba un tamaño del efecto
mediano (d - 0,50). Si planificara realizar un estudio utilizando el nivel 0,05, con una prueba de
dos colas y con 20 participantes, el estudio tendría una potencia de 0,59. Lo cual significa que si
la hipótesis de investigación es realmente verdadera y tiene un tamaño del efecto mediano, existe
un 59% de chances de que el estudio resulte significativo.
La tabla de potencia (tabla 9-9) también es útil cuando leemos el resultado no significativo de
algún estudio publicado. Supongamos que un estudio que utiliza una prueba t para medias depen
dientes tuviera un resultado no significativo. El estudio probó la significación al nivel 0,05, con
T a b la 9 -9 .
P o te n c ia a p r o x im a d a d e e s tu d io s e n lo s q u e s e u tiliz a la p r u e b a t p a r a m e d ia s d e p e n d ie n te s e n p r u e
b a s d e h ip ó te s is c o n n iv e l d e s ig n ific a c ió n d e 0 ,0 5 .
R eg istro s de
d iferen cia s
d e la m u estr a ( N ) T am añ o de efecto
P equeño M e d ia n o G ran de
( d = 0,20} ( d = 0 ,5 0 } (d ^ 0 ,8 0 )
Prueba d e dos colas
10 0 ,0 9 0,32 0 ,6 6
20 0 ,1 4 0,59 0,93
30 0 ,1 9 0,77 0 ,9 9
40 0,2 4 0,88 *
50 0,2 9 0,94 £
100 0,2 5 $ *
una prueba de dos colas, y contaba con 10 participantes. ¿Deberíamos concluir que, en efecto, no
existe ninguna diferencia entre las poblaciones? Probablemente no. Aun suponiendo un tamaño
de efecto mediano, la tabla 9-9 indica que existe sólo un 32% de chances de obtener un resultado
significativo en este estudio. Analicemos ahora otro estudio que resultó no significativo, en el que
también se utilizó el nivel de significación 0,05 y una prueba de dos colas, pero que contaba con
100 participantes. La tabla 9-9 indica que existiría un 63% de chances de que el estudio resultara
significativo si existiera incluso un tamaño del efecto real pequeño en la población. Si en la pobla
ción hubiera un tamaño del efecto mediano, la tabla indica que existiría casi un 100% de chances
de que el estudio resultase significativo. Por lo tanto, en este estudio con 100 participantes podría
mos concluir, a partir de los resultados, que en la población probablemente no existe ninguna di
ferencia o que, en el mejor de los casos, existe una muy pequeña.
Para que la tabla 9-9 resultara simple, hemos incluido sólo la potencia correspondiente a unas
pocas cantidades diferentes de participantes (10,20, 30, 40, 50 y 100). Estos datos deberían ser
suficientes para el tipo de evaluaciones aproximadas que se realizan al analizar resultados de pu
blicaciones científicas.*3.
3 Cohén (1988, pp. 28-39) proporciona tablas más detalladas en cuanto a cantidades de participantes, niveles de tamaño
del efecto y niveles de significación. S i se utilizan sus tablas, debe tenerse en cuenta que la d a la que se hace referencia
está basada en realidad en una prueba / para medias independientes (que es la situación que trataremos en el capítulo
10). Para utilizar esas tablas para una prueba t para Medias dependientes, primero se debe multiplicar el tamaño del
efecto deseado por 1,4. Por ejemplo, si el tamaño del efecto es 0,30, para utilizar las tablas de Cohén consideraríamos
que es de 0,42 (es decir, 0,30 x 1,4 - 0,42). La tínica otra diferencia con respecto a nuestra tabla es que Cohén descrihe
el nivel de significación con la letra a (por “nivel alfa”), con un subíndice de 1 ó 2, haciendo referencia a una prueba de
una o dos colas. Por ejemplo, una tabla que en la parte superior indica al = 0,05 significa que es una tabla para p < 0,05,
con una cola,
Planificación del tamaño de la muestra
La tabla 9-10 indica la cantidad aproximada de participantes necesarios para tener un 80% de po
tencia con tamaños de efecto pequeños, medianos o grandes, utilizando pruebas de una o dos co
las con nivel de significación de 0,05. (Ochenta por ciento es un número comúnmente utilizado
■por los investigadores como potencia mínima para que tenga sentido realizar un estudio). Supon
gamos que planificamos un estudio en el que esperamos tener una gran tamaño del efecto y utili
záramos un nivel de significación de 0,05, con dos colas. La tabla indica que sólo necesitaríamos
14 participantes para tener una potencia del 80%. Por otro lado, un estudio en el que se utiliza el
mismo nivel de significación y en el que se realiza una prueba de dos colas, pero en el que se es
pera sólo un pequeño tamaño del efecto, necesitaríamos 196 participantes para tener una potencia
de! 80%.4
Tabla 9-9.
C a n tid a d a p r o x im a d a d e p a r tic ip a n te s n e c e s a r io s p a r a lo g r a r u n 80 % d e p o t e n c ia e n la p r u e b a t
p a r a m e d ia s d e p e n d ie n te s , e n p r u e b a s d e h ip ó te s is c o n u n n iv e l d e s ig n ific a c ió n d e l 0 ,0 5 ,
T am añ o d e l efecto
4 Cohén (1988, pp. 54-55) proporciona tablas más detalladas que indican la cantidad necesaria de participantes para
otros niveles de potencia además del de 80% (y también para otros tamaños del efecto además de las de 0 ,2 0 ,0 ,5 0 y
0,80, así como también para otros niveles de significación). D e todos modos, para la utilización de esas tablas se deben
tener en cuenta ias mismas indicaciones que en la nota al pie N ° 3).
En el año 1930, se realizó en Escocia un si sentían pena por alguno que creían que
importante experimento sanitario que invo podía beneficiarse más al recibir la leche!
lucraba a 20.000 alumnos. Su principal ob (Véase en el apéndice A una exposición 7
jetivo era comparar el crecimiento de un acerca de la asignación aleatoria de los par-. ;■
grupo de niños, a quienes se les hacía beber tici pautes a cada grupo). . f'Y f
leche regularmente, con el de otros niños De todos modos, es aún más interesan- ;
que formaban parte del grupo control. Los te, en vista de lo aprendido en esté capítulo, . 7
resultados obtenidos indicaron que aque que Gosset demostrara que los investigado- 7
llos que tomaban leche mostraban un creci res podrían haber llegado al mismo resulta- '•
miento mayor. do utilizando 50 pares de gemelos, lanzando t
Sin embargo, William S. Gosset, un una moneda para determinar cuál de cada 1!
estadístico de la época {véase cuadro 9-1), par estaría en el grupo que consumiría la le
estaba asombrado por la manera en que se che (y ateniéndose a los resultados de ese
realizó el experimento. ¡Había costado sorteo). Desde luego, el cálculo estadístico
£ 7.500, lo que en 1930 era una inmensa que se utilizaría sería la prueba /, tal como la f
cantidad de dinero, y se había realizado aprendimos eñ este capítulo, es decir, la
erróneamente! Los grandes estudios del es prueba t para medias dependientes. . ..
tilo del que tratamos eran muy populares en Más recientemente, el desarrollo .del'-,
tre los estadísticos de la época porque análisis de la potencia, que presentamos en ..
parecían imitar las grandes cantidades que el capítulo 8, ha reivindicado completamen- ;
se encuentran en la naturaleza, Gosset, por te a Gosset. Ya no quedan, dudas de que pue- ■■
el contrario, siendo fabricante de cerveza, den utilizarse, precisamente, cantidades
estaba obligado a utilizar en sus estudios sorprendentemente pequeñas de participan
cantidades muy reducidas, las tandas expe tes cuando el investigador puede encontrar ;
rimentales de cerveza eran muy costosas y, la manera de realizar un diseño de medidas
con frecuencia, era reprendido por los “ver repetidas en el que las diferencias son la
daderos estadísticos” debido a los pequeños .unidad básica de análisis (en este caso, cada 1
tamaños de muestra que utilizaba. No obs par.de gemelos sería un “participante”). Tai :
tante, Gosset sostenía que ninguna cantidad como el mismo Gosset podría haberles di
de participantes era lo suficientemente gran cho, ios estudios que utilizan la prueba t pa- ,
de cuando no se realizaba una asignación ra medias dependientes pueden tener una ■
estrictamente aleatoria. ¡Y en el estudio sensibilidad extremadamente alta.
mencionado, se permitió a los maestros
intercambiar a los niños de un grupo a otro Referencias: Peters (1987); Tankard (1984).
CONTROVERSIAS Y LIMITACIONES
Las principales controversias con respecto a la prueba t están relacionadas con sus ventajas y des
ventajas relativas en comparación con varias alternativas, las cuales se discutirán en mayor detalle
en le capítulo 15. (Los mismos temas surgen también con respecto a los procedimientos que trata
remos en los capítulos 10 al 13). Existe, sin embargo, una consideración que queremos comentar
aquí. Esta se relaciona con todos los diseños de investigación en los cuales los mismos participan
tes se prueban antes y después de alguna intervención experimental. (Es el tipo de situación para
la evaluación en la que con frecuencia se utiliza la prueba t para medias dependientes).
Medir simplemente a un grupo de personas antes y después de algún procedimiento experi
mental, sin ningún tipo de grupo control que no experimente el procedimiento, puede tener una
potencia alta, pero es un diseño de investigación débil en cuanto a la claridad de las conclusiones
que puede producir (Cook & Campbell, 1979). Como se describe detalladamente en el apéndice
A, aun cuando tal estudio produzca una diferencia significativa, quedan muchas explicaciones al
ternativas posibles en cuanto a la razón por la cual ocurrió tal diferencia. Por ejemplo, los partici
pantes podrían haber madurado o mejorado de todos modos durante ese período, o tal vez otros
hechos ocurrieron en el transcurso del tiempo entre una prueba y otra, o los participantes que no
recibieron beneficios pueden haber abandonado el experimento. Incluso es posible que la propia
prueba inicial causara cambios que, de otro modo, no podrían haber ocurrido.
No obstante, es importante observar que las dificultades que presentan las investigaciones en
las que se prueba a las personas antes y después de alguna intervención, se comparten sólo leve
mente con el tipo de estudio en el que los participantes son probados en dos condiciones diferen
tes, como por ejemplo de ruido y silencio, probando primero a una mitad en unas condiciones y a
la otra mitad, también primero, en las otras condiciones.
Tabla 9-11.
Sincronización menstrual y valores esperados (por días).
V alor de V alor
G ru p o /m es N sin c ro n iz a ció n e sp era d o D iferen cia SD P
Compañeras - hermanas
M es 1 30 . 6,32 7 ,7 6 1,44 3,40 2,27 0,011
M es 2 30 6 ,2 4 7 ,7 6 1,52 3,08 2,66 0 ,0 0 4 .
M es 3 29 7 ,4 0 7 ,7 6 0,36 3,08 0,57 0 ,2 8 0
A m igas íntim as - com pañeras
M esi 39 5,73 7,75 2,02 3,84 3,25 < 0 ,0 0 0
■ M es 2 39 6,01 7,7 5 ~ 1,74 4,25 2 ,5 2 0,006
M es 3 31 7 ,4 4 7 ,7 5 0,31 4,61 0 ,8 8 0,19
Fam ilias
M es 1 18 5,80 7 ,7 0 1,90 2,74 2 ,8 6 < 0 ,0 0 0
M es 2 18 6,09 7 ,7 0 1,61 1,89 3,52 < 0 ,000
M es 3 17 7 ,1 9 7 ,7 0 0,51 2,71 0,75 0,23
Fuente: Weller, A. & Weller, L. (1997), tab. 1. “Sincronización menstrual en condiciones óptimas: Familias nómades”.
R evista C ien tífica d e P s ic o lo g ía C o m p a ra tiva [J o u rn a l o f C o m p a ra tiv e P s y ch o lo g y ], H i , 143-151. Copyright, 1997,
por la Asociación Americana de Psicología [American Psychological Association]., Reimpreso con autorización.
Tabla 9-12.
Medias (y desvíos estándar) de medidas que comparan el recuerdo de hechos verdaderos y falsos
del experimento 1.
Hecho recordado
M ed ida Verdadero Falso
Cantidad d e palabras recordadas * * * 2 7 ,7 9 (8 ,8 1 ) 15,42 (7,69)
Cantidad de unidades d e ideas recordadas** 6,33 (2 ,5 3 ) 3,23 (1,55)
Puntuación en claridad*** 6 ,9 0 (0 ,1 7 ) 4 ,0 0 (0 ,1 8 )
Puntuación en certeza** 6,88 (0 ,2 1 ) 5 ,0 0 (0,21)
Términos clave
- Supuesto. - Robustez. ~ Prueba t para una sola muestra.
- Estimación sesgada. - Distribución t. - Prueba / para medias dependientes.
- Grados de libertad (gl). - Punto t. - Estimación no sesgada de la varianza
~ Diferencias. ~ Tablar. poblacional (S2).
- Diseño de medidas repetidas. - Pruebas t
Ejercicios
Los ejercicios implican la realización de cálcu ta la posibilidad de utilizarla, es conveniente
los (con la ayuda de una calculadora). La ma realizar estos ejercicios manualmente para in
yoría de los problemas estadísticos reales se corporar el método de trabajo.
resuelven por computadora, pero aunque exis
Para adquirir práctica en la utilización de su respuesta con un histograma de la distribu
una computadora, para resolver problemas esta ción maestral y gráficos de la distribución po-
dísticos, se puede utilizar la sección de compu bíacional y la distribución de medias, indique
tación de cada capítulo, publicada en la Guía de el punto í y los puntos de corte correspondien
estudio y libro de tareas de computación para el tes al nivel de significación seleccionado, y
alumno [Student's Study Guide and Computer c) explique su respuesta a alguien que nunca ha
Workbookj que acompaña este libro. tomado un curso de estadística.
Todos los datos de esta sección son ficti 3. Para cada uno de los siguientes estudios
cios (a menos que se especifique lo contrario). en los que se utilizan diferencias, determine si
Las respuestas a los ejercicios de la serie i
la diferencia media es significativamente dife
se encuentran al final del libro. rente de 0. Además, calcule el tamaño del
efecto (si en la tabla no se indican los gl, utili
SERIE I ce el t correspondiente al valor gl menor más
cercano).
1. En cada uno de los estudios que apare
cen a continuación, se está comparando la me Cantidad Media de las Varianza Nivel
dia de una sola muestra con una población de de diferencias diferencias pobiacional de
la cual se conoce la media pero no la varianza. de la muestra de la muestra est. de las dif. Colas signifie.
Decida si el resultado de cada uno de estos es (a) 2 0 1,7 8,29 1 0,05
tudios es o no significativo. (predicción
alta)
Tamaño Media Varianza Media Nivel (b) 164 2,3 4 1 4,53 2 0,05
maestral pobiacional pobiacional muestra! de (c) 15 -2,2 4 ,0 0 1 0,01
estimada Colas signifie. (predicción
(N) (fri (S*2) m (a ) __________________________ N a)_______ _
(a) 64 12,40 9 ,0 0 1 1 ,00 1 0,05 4. En cuatro ciudades del Valle Central de
(predicción California se implemento, en agosto de 1997,
baja)
un programa para reducir la cantidad de des
(b) 49 1.006,35 317,91 1.009,72 2 0,01
(c) 400 52,00 7 ,0 2 52,41 ' 1 0,01 perdicios. La cantidad de basura en las calles
(predicción (cantidad promedio en libras de basura reco
____________________________________ alta)________ lectada por manzana, por día) se midió durante
2. Supongamos que un candidato que seel mes de julio anterior al comienzo del progra
postula como jefe de policía afirma que reducirá ma y, luego, el siguiente julio, después de que
el tiempo promedio de respuesta a emergencias a el programa hubiera estado en efecto durante
menos de 30 minutos, que es considerado el un año. Los resultados fueron los siguientes:
tiempo de respuesta promedio para emergen
cias bajo el mandato del jefe de policía actual. C iud ad Ju lio 1997 Ju lio 1998
No existen registros anteriores, por lo tanto, Fresno 19 2
no podemos determinar el desvío estándar real M erced 10 4
de esos tiempos de respuesta. Gracias a esta Bakersfield 18 9
campaña, él es elegido jefe de policía, y aho Stockton 19 1
ra se guardan ios registros cuidadosamente.
Los tiempos de respuesta durante el primer Utilizando un nivel de significación del
mes son 26, 30,28,29,25, 28, 32,35,24 y 23 1%, ¿hubo una disminución significativa de la
minutos. cantidad de desperdicios? a) Realice los cinco
Utilizando un nivel de significación del pasos de la prueba de hipótesis; b) ilustre su
5%, ¿cumplió él su promesa? a) Realice los respuesta con un histograma de la distribución
cinco pasos de la prueba de hipótesis; b) ilustre muestra! y con gráficos de la distribución po-
blacional y la distribución de medias, indique dad. (Considere que los SD de la tabla corres
el punto t y los puntos de corte correspondien ponden a lo que hemos clasificado como S, la
tes al nivel de significación seleccionado; c) estimación no sesgada del desvío estándar de
calcule el tamaño del efecto, y d) explique su la población), b) Explique el significado de la
respuesta a alguien que comprende los concep tabla a una persona que nunca ha asistido a un
tos de media, desvío estándar y vari&nza pero curso de estadística.
que no sabe nada más sobre estadística.
5. ¿Cuál es la potencia de cada uno de los
SERIE 11
siguientes estudios (sobre la base de un nivel
de significación de 0,05)? 1. En cada uno de los siguientes estudios
se compara a la media de una sola muestra con
T am a ñ o d el efecto N C olas una población de la cual se conoce la media
(a) Pequeño 20 1 pero no la varíanza. Decida, en cada caso, si el
(b) M ediano 20 1 resultado es o no significativo. (Si los gl no
(c) M ediano 30 1 aparecen en la tabla, utilice el t correspondien
(d) M ediano 30 2 te al valor gl menor más cercano). Asegúrese
(e) Grande 30 2 de indicar todos sus cálculos.
fueron probados cada uno en las dos condicio (a) 16 100,31 2 ,0 0 100,98 1 0,05
nes distintas. El experimentador informó: “La (predicción
alta)
media de ilusiones efectivas fue 6,72 en condi
(b) 16 0 ,4 7 4 ,0 0 0 ,0 0 2 0 ,0 5
ciones de luminosidad y 6,85 en condiciones (c) 16 6 8 ,9 0 9 ,0 0 3 4 ,0 0 1 0,01
de iluminación débil, una diferencia no signifi (predicción
cativa, f(19) = 1,62". Explique el resultado a baja)
una persona que nunca ha asistido a un curso
sobre estadística. Asegúrese de utilizar en su 2. Existen teorías biológicas que sostienen
respuesta gráficos de las distribuciones. que los humanos se han adaptado a su ambien
7. Se realizó un estudio acerca de las te físico. Una de estas teorías sostiene la hipó
ca
racterísticas de la personalidad a 100 alumnos tesis de que las personas seguirían espontá
que fueron probados al comienzo y al final de neamente un ciclo de 24 horas de sueño y vigi
su primer año de facultad. Los investigadores lia, aun cuando no fueran expuestas al patrón
informaron los resultados en la siguiente tabla: usual de la luz solar. Para probar esta noción,
ocho voluntarios contratados fueron ubicados
E sca la de (individualmente) en una habitación en la que
p e r s o n a lid a d O to ñ o P r im a v e r a D ife r e n c ia
no había luz del exterior, ni relojes, ni ninguna
M SD M SD M SD otra indicación del transcurso del tiempo. Po
Angustia 16,82 4,21 15,32 3,84 1,50** 1,85 dían encender o apagar las luces cuando qui
Depresión 89,32 8,39 86,24 8,91 3,08** 4,23 sieran. Después de un mes en la habitación,
Introversión 59,89 6,87 60,12 7,11 0,23 2,22
cada individuo mostró una tendencia a desa
Neurosis 38,11 5,39 37,32 6,02 0,89* 2 4,21
rrollar un ciclo estable. Sus ciclos al finalizar
*p < 0,05; **p < 0,01. el estudio fueron los siguientes; 25,27,25,23,
24,25,26 y 25.
a) Concentrándose en las diferencias, cal Utilizando un nivel de significación del
cule los valores t para cada escala de personali 5%, ¿qué conclusión sacaríamos con respectó
a la teoría de que 24 horas es el ciclo natural? P a r tic ip a n te A n te s D esp u és
(Es decir, la duración promedio del ciclo en
L .B . 65 58
estas condiciones es significativamente dife
J.K . 62 65
rente al de 24 horas?), a) Realice los cinco pa R .C . 60 56
sos de la prueba de hipótesis, b) Ilustre su R .T . 70 66
respuesta con un histcgrama de la distribución J.M. 68 60
maestral y gráficos de la distribución pobla-
cional y la distribución de medias, e indique el Utilizando un nivel de significación del
5%, ¿deberíamos concluir que es probable
punto t y los puntos de corte correspondientes
que una persona conduzca.a menor velocidad
al nivel de significación seleccionado, c) Ex
después de participar de un taller de trabajo?
plique su respuesta a alguien que nunca ha
a) Realice los cinco pasos de la prueba de hi
asistido a un curso de estadística. pótesis. b) Ilustre su respuesta con un histo
3. Cuatro individuos con alto nivel de co-
grama de la distribución muestral y con grá
lesteroí iniciaron una dieta intensiva: evitan las ficos de la distribución poblacional y la distri
comidas con alto contenido'de colesterol y to bución de medias, e indique el punto t y los
man suplementos especiales. Sus niveles de puntos de corte correspondiente al nivel de sig
colesterol antes y después de la dieta fueron los nificación seleccionado.'c) Calcule el tamaño
siguientes: del efecto, d) Explique su respuesta a alguien
P a r tic ip a n te A n te s D esp u és
que está familiarizado con la prueba de hipóte
sis con poblaciones conocidas, pero que nunca
J.K . 287 255 ha aprendido nada sobre las pruebas í.
L.M .M 305 269
5, Se midió la cantidad de oxígeno consu
A .K . 243 245
R.O .S. 309 247
mido por seis individuos durante dos periodos
de 10 minutos mientras permanecían sentados
con los ojos cerrados. Durante un periodo, es
Utilizando un nivel de significación del cuchaban una excitante historia de aventuras;
5%, ¿se produjo un cambio significativo del ni durante el otro, escuchaban música tranquila.
vel de colesterol? a) Realice los cinco pasos de (El orden de las condiciones era el opuesto pa
la prueba de hipótesis, b) Ilustre su respuesta ra una mitad de los participantes).
con un histograma de la distribución muestral P a r t ic ip a n t e H is t o r ia M ú s ic a
y con gráficos de la distribución poblacional y
1 6 ,1 2 5 ,3 9
la distribución de medias, e indique el punto t y
2 7 ,2 5 6 ,7 2
los puntos de corte correspondiente al nivel de 3 5 ,7 0 5 ,4 2
significación seleccionado, c) Calcule el tama 4 6 ,4 0 6 ,1 6
ño del efecto, d) Explique su respuesta a al 5 5 ,8 2 5 ,9 6
6 6 ,2 4 6 ,0 8
guien que nunca ha asistido a un curso de
estadística.
4. Un tribunal ordenó a cinco personas pe Sobre la base de los resultados indicados
nadas por exceso de velocidad a que asistieran ¿es menor el consumo de oxígeno cuando es
a un taller. Un mecanismo especial incorpora cuchan música? Utilíce un nivel de significa
do en sus autos mantuvo un registro de sus ve ción del 1%. a) Realice los cinco pasos de
locidades durante 2 semanas antes y después prueba de hipótesis, b) Ilustre su respuesta con
de participar del taller. Las velocidades máxi un histograma de la distribución muestral y
mas de cada persona durante 2 semanas antes y con gráficos de la distribución poblacional y de
2 semanas después de participar del taller fue la distribución de medias, e indique el punto í y
ron las siguientes: los puntos de corte correspondiente al nivel de
significación seleccionado, c) Calcule el tama significación del 5%. a) Realicé los cinco pa
ño del efecto, d) Explique su respuesta a al sos de la prueba de hipótesis, b) ilustre su
guien que comprende el concepto de media, respuesta con un histograma de la distribu
desvío estándar y varianza pero que no sabe ción de muestras y con gráficos de la distri
nada más sobre estadística. bución poblacíonal y de la distribución de
6, A cinco alumnos de segundo año se les to
medias, e indique el punto t y los puntos de
mó un examen de evaluación del nivel de in corte de significación, c) Calcule la magnitud
glés antes y después de recibir instrucciones so de efecto, d) Explique su respuesta a alguien
bre gramática básica. Sus registros fueron los si que comprende el concepto de media, desvío
guientes: estándar y varianza pero que no sabe nada
E s t u d ia n te A n te s D esp u és más sobre estadística.
7. Se realizó un estudio comparando la ac
A 20 18
B 18 22 tividad sindical de empleados de 10 plantas du
C 17 15 rante dos décadas diferentes. El investigador
D 16 17 informó “un aumento significativo de la activi
E 12 9
dad sindical, t (9) - 3,28, p < 0,01”. Explique
este resultado a una persona que nunca ha to
¿Es razonable concluir que futuros alum mado un curso de estadística. Asegúrese de uti
nos lograrían registros más altos después de lizar gráficos de las distribuciones en su
recibir las instrucciones? Utilice un nivel de respuesta.
(9- 11)
La tabla 9-13 indica el cálculo de la prueba t para medias dependientes correspondiente al es
tudio ficticio acerca de la coordinación entre el pulso y la vista de cirujanos, utilizando las fórmu
las de cálculo. Compare estos cálculos con los de la tabla 9~6 correspondiente a la misma
información pero utilizando fórmulas de definición.
T a b ln 9 - 1 3 .
C á l c u l o d e la p r u e b a t p a r a m e d i a s d e p e n d i e n t e s c o r r e s p o n d i e n t e a l e j e m p l o a c e r c a d e la c o o r d i n a
c i ó n e n t r e e l p u l s o y l a v i s t a d e c i r u j a n o s , u t i l i z a n d o l a s f ó r m u l a s d e c á l c u l o . ( D a t o s f ic t i c io s ) .
C ir u ja n o C o n d ic io n e s D ife r e n c ia D if e r e n c ia c u a d r á t ic a
S ile n c io R u id o (X ) (X2)
1 18 12 6 36
2 21 21 0 0
3 19 16 3 9
4 21 16 5 25
5 17 19 -2 4
6 20 19 1 1
7 18 16 2 4
8 16 17 -1 1
9 20 16 4 16
S: 170 152 18 96
SI'fÑ 2 .7 4 /V 9 ~ 2 ,7 4 /3 ~ 0 ,9 1
UDescripción del capítulo
ste capítulo analiza la prueba de hipótesis para los casos en los que se comparan dos
E
muestras, tales como un grupo experimental y un grupo de control. Son situaciones
en las que se realiza una prueba t debido a que las varianzas poblacionales no se co
nocen y, por lo tanto, deben estimarse. Bn este caso, la prueba se denomina prueba
t para medias independientes, porque se comparan medias de dos grupos de per
sonas completamente separados, cuyos valores son independientes el uno del otro. La prueba
para medias independientes se contrapone con la prueba t para medias dependientes analizada en
el capítulo anterior, én la que había dos grupos de valores, pero ambos provenían del mismo gru
po de personas (como es el caso de las mismas personas medidas antes y después de un programa
de asesoramiento).
F i g u r a 1 0 - 1 . P a s o s p ara la c r e a c ió n
b u c ió n d e d if e r e n c ia s d e m e d ia s .
las dos muestras de valores realmente observadas. Las varianzas poblacionales se estiman sobre la
base de esos valores muestra.les. Las varianzas de las dos distribuciones de medias se basan comple
tamente en las varianzas poblacionales estimadas (y en los tamaños de las muestras). Y, como vere
mos pronto, las características de la distribución de diferencias entre medias se basan en las dos dis
tribuciones de medias que mencionamos anteriormente.
Aun así, el procedimiento es poderoso. Tiene el poder de la matemática y una lógica implíci
ta: ayuda a desarrollar un conocimiento general basado en los datos específicos de un estudio en
particular.
Teniendo una visión general de la lógica básica, ahora nos dedicaremos a cinco detalles cla
ve: a) la media de la distribución de diferencias entre medias, b) la varianza poblacionaí estimada,
c) la varianza y el desvío estándar de la distribución de diferencias entre medias, d) la forma de la
distribución de diferencias entre medias y e) el punto t correspondiente a la diferencia entre las
dos medias particulares que están siendo comparadas.
<1(W)
En la fórmula precedente, ‘$'2Combirta(iaes estimación combinada de la varianza poblacional,
g l{ son los grados de libertad correspondientes a la población 1, y gl2 son los grados de liber
tad correspondientes a la población 2, (No debemos olvidar que cada gl es la cantidad de valo
res muéstrales menos 1). glTotal son los grados de libertad totales (g/To{at = g l{ + gt2). ó ] es la
estimación de la varianza poblacional sobre la base de los valores de ía muestra que proviene de
la población 1; S \ es la estimación sobre la base de los valores de la muestra que proviene de la
población 2.
Analicemos un estudio en el que la estimación de la varianza poblacional, sobre la base de un
grupo experimental de 11 participantes, es 60, y la estimación de la varianza poblacional sobre la
base de un grupo de control de 31 participantes es 80. La estimación del grupo experimental
se basa en 10 grados de libertad (11 participantes menos 1); la estimación del grupo de control se
basa en 30 grados de libertad (31 participantes menos 1). La información total sobre la que se ba
sa la estimación son los grados totales de libertad, en este caso, 40. Por lo tanto, el grupo experi
mental proporciona un cuarto de la información (10/40 = 1/4), y el grupo control proporciona tres
cuartos de la información (30/40 = 3/4).
Después multiplicamos la estimación del grupo experimental por 1/4 y obtenemos 15 (es
decir, 60 x 1/4 = 15), y la estimación del grupo de control por 1/4 y obtenemos 60 (es decir, 80
x 3/4 = 60). Sumando los dos resultados obtenemos una estimación de 15 más 60, es decir de
75. Aplicando la fórmula:
= 1 ( 6 0 ) + | ( 8 0 } = 15 + 6 0 = 7 5
Cabe mencionar que este procedimiento no da el mismo resultado que un promedio simple (sin
ponderar). Un promedio simple daría una estimación de 70 (es decir, [60+80J/2 = 70). Nuestra es
timación combinada ponderada, igual a 75, está más cerca de la estimación realizada sólo sobre la
base del grupo de control que de la estimación realizada tínicamente sobre la base del grupo expe
rimental. Así es como debe ser, porque la estimación del grupo de control se basó en mayor infor
mación. Por otro lado, aún sigue siendo un tipo de promedio. Será evidente que hemos cometido
un error en los cálculos si este número no se encuentra entre las dos estimaciones. (También re
sultará evidente el error de cálculo si no obtenemos un número más cercano a la estimación que
proviene de la muestra mayor).
Cálculo de ía varianza de cada una de las dos distribuciones de medias
La estimación combinada de la varianza poblacional es la mejor estimación para ambas poblacio
nes. (No debemos olvidar que para realizar una prueba t para medias independientes, debemos es
tar en condiciones de suponer que las dos poblaciones tienen la misma varianza). Sín embargo,
aunque las dos poblaciones tienen la misma varianza, las distribuciones de medias tomadas de
ellas usualmente no tienen la misma varianza, ya que la varianza de una distribución de medias es
la varianza poblacional dividida por el tamaño de la muestra. Por lo tanto, aun cuando la varianza
poblacional sea la misma para las dos poblaciones, si los tamaños de las muestras son diferentes,
entonces las dos distribuciones de medias tendrán diferentes varianzas. Expresado en fórmulas:
«2
o2 „ ^Combinada
( 10 - 2 )
N¡
..^Combinada
(10-3)
Su * - ~ ñ ;
Analicemos nuevamente el ejemplo del estudio en el que había 11 individuos en el grupo experi
mental y 31 en el grupo de control. En ese ejemplo, descubrimos que la estimación combinada de
la varianza poblacional era 75. Por lo tanto, para el grupo experimental, la varianza de la distribu
ción de medias sería 75/11, es decir 6,82; y en el grupo de control, la varianza sería 75/31, es de
cir, 2,42. (Es importante recordar que al calcular varianzas estimadas dividimos por los grados de
libertad, pero cuando calculamos la varianza de una distribución de medias, que no involucra nin
guna estimación adicional, dividimos por la cantidad real de observaciones en la muestra). Apli
cando las fórmulas,
= ^C^binada = — —2 42
31
(10-7)
Por ejemplo, supongamos que la media de la primera muestra es 198 y la media de la segunda
muestra es 190. La diferencia entre estas dos medias es 8 (es decir, 198 - 190 = 8). Calculamos
que el desvío estándar de la distribución de diferencias entre muestras es, en este ejemplo, 3,04,
es decir, un punto t de 2,63 (8/3,04 = 2,63). Én otras palabras, en este ejemplo la diferencia de las
dos medias se encuentra 2,63 desvíos estándar por encima de ia inedia de la distribución de dife
rencias de medias. Se expresa bajo ia fórmula,
M i ~ M 2 „ 1 9 8 -3 8 0 _ 8 _ 2>63
^ D ife r e n c ia 3 ,0 4 3 ,0 4
Figura 10-2. Distribuciones relacionadas con el ejemplo de control de manipulación en una prueba t para
medias independientes. (Fuente: Norman & Aron, 1997).
1 En este ejemplo, ias varianzas estimadas de las dos poblaciones son sustancialmente diferentes. Esto genera objecio
nes en cuanto al supuesto de que ambas poblaciones tienen la misma varianza. Al final del capítulo, veremos el tema
del supuesto de iguales varianzas poblacionales. en. forma general. N o obstante, en este ejemplo, utilizar métodos alter
nativos que no requieran del supuesto produce resultados similares.
Tabla 10-1.
Prueba t para medias independientes correspondiente al control de manipulación de la excitación
experimentada, comparando las condiciones de excitación con las de control.
iV( - l = 14;iV2 = 13 ; g l2 = N 2 ~ 1 = 12
^ b i ^ = 7 ^ ( « f ) + - p ( s I)=XÍ0.33)+|(2,77)=0,54(033)+0,4<i(2,77)=0,I8tl37=l,45
¿»Total ¿»Total ■“ ¿0
■Sg, = = 1145/15 = 0,097
% = S« . " í2= 1'« ' » = 0'i n
+ = 0,097 + 0 ,1 1 2 = 0,209
W * = ' ® 5 ¡ ^ = * 3 *® = M 57
t necesario para nivel 1 % , g l= 2 6 , con prueba de una coia = 2 ,479
F igura 10-3. D istribuciones relacionadas co n el ejem plo acerca de madres de niñ os pobres adecuadam ente a li
m entados en com paración con m adres de niñ os pobres crónicam ente desnutridos. (F u en te: V alenzuela, 1997).
3. Determinar el punto de corte en la distribución comparativa, a p artir del cual debería
rechazarse la hipótesis nula. El punto de corte que necesitamos es el de una prueba de dos colas
al nivel usual de 0,05, con 83 grados de libertad. Dado que la tabla t del apéndice B (tabla B-2) no
incluye los datos para 83 grados de libertad, utilizamos el gl menor más cercano, que es 80. Obte
nemos así un punto de corte de ±1,990 (En realidad son dos puntos simétricos: -1,99 y +1,99).
4. Determinar el valor muestra! en la distribución comparativa. La puntuación t es la di
ferencia entre las dos medias muéstrales dividida por el desvío estándar de la distribución de dife
rencias de medias. El resultado es un t de 2,16. (Es decir, t = 6,1/2,82 = 2,16).
5. Com parar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hipótesis nula.
La puntuación t de 2,16, correspondiente a la diferencia entre las medias de las dos condiciones, es
más extremo que el punto t necesario de ± 1,99. Por lo tanto, el investigador podría rechazar la hipóte
sis nula. Se sostiene la hipótesis de investigación: las madres délos niños adecuadamente alimen
tados brindan una mejor calidad de asistencia a sus niños que las madres de niños crónicamente des
nutridos. (La tabla 10-7 indica los resultados completos de este estudio en la sección en la que
tratamos el modo en que se describen los resultados de las pruebas t para medias independientes en
las publicaciones científicas).
Tabla 10-2.
Prueba t para medias independientes del estudio acerca de la calidad de asistencia brindada por
madres de niños chilenos pobres adecuadamente alimentados, en comparación con madres de niños
chilenos pobres crónicamente desnutridos.
N iños adecuadam ente alimentados:
W, = 43; ¿Ij - A!, - 1 = 42; Af, = 33,1; = 2 0 1,64
N iñ o s crónicam ente desnutridos:
N 2 = 42; g lz = - 1 = 41; M 2 = 27,0; S \ = 134,56
8 h M ' 8 l i * g l2 = 42 + 4 1 - 8 3
gl, „ gL „ 42 41
£W l ■ Tw.l 83 83
= 0.51(201,64) + 0,49(134,56) = 1020,84 + 65,93 = 168,77
168,77/43 = 3,92
t necesario con nivel 5%, g l - 83 (utilizando un gf= 80 d e la tabla) y prueba de dos c olas = 1,990
G r u p o e x p e r im e n ta l G r u p o d e c o n tr o l
(r e c ib e e l p r o g r a m a e s p e c ia l) (R e c ib e e l p r o g r a m a e s t á n d a r )
D e s v ío D e s v ío
D e s v ío d e c u a d r á tic o D e s v ío c u a d r á tic o
R e g istr o la m e d ia d e la m e d ia R e g is tr o d e la m e d ia d e la m e d ia
6 0 0 6 • 3 9
4 -2 4 l -2 4
9 3 9 5 2 4
7 1 1 3 0 0
7 1 1 l -2 4
3 -3 9 i -2 4
6 0 0 4 1 1
1: 42 0 24 21 0 26
M v = 6; S ] = 2 4 /6 = 4 ;M 2 = 3; S f = 2 6 /6 = 4 ,3 3
N ^ l - . g l , —JV, - 1 ==6;AT2 = 7 ; g l 2 = N 2 - l ~ 6
S^Ibtal = 8Í 1 + ^ 12 = 6 + 6 = 12
= = 0 ,6 0 + 0 ,6 0 = 1 , 2 0
^Diferencia = ^D iferencia = ^ 2 0 “ M 0
í necesario para un nivel 5%, g l = 12, 5 % y prueba de dos colas = ± 2 ,1 7 9
t = ( M l ~ M 2) /S D¡ferenck = (6 ,0 0 ~ 3 , 0 0 ) / U 0 = 3 ,0 0 /1 ,1 0 = 2,73
En una prueba t para medias independientes existe una segundo supuesto muy importante, que ya
hemos mencionado: se supone que las dos poblaciones tienen la misma varianza. (Aprovechamos
este supuesto cuando promediamos las estimaciones de cada una de las muestras). Sin embargo,
una vez más sucede que en la práctica la prueba t da resultados bastante precisos aun cuando exis
ten diferencias considerablemente grandes entre las varianzas poblacionales, particularmente
cuando existe la misma cantidad ~o prácticamente la misma cantidad- de observaciones en las
dos muestras, (¿Cómo sabemos que la prueba t se aplica adecuadamente a pesar de incumpli
mientos moderados de las presunciones? Véase en el cuadro 10-1 la descripción de lo que se de
nomina “Método de Montecarlo”).
Sin embargo, la prueba t puede dar resultados bastante engañosos si a) los valores muéstrales
sugieren que las poblaciones son muy diferentes de lo normal, b) las varianzas son muy diferentes
o c) coexisten ambos problemas. En esos casos, existen alternativas al procedimiento ordinario de
prueba t, algunas de las cuales trataremos en el capítulo 15.
Tabla 10-4.
Pasos a seguir para la realización de una prueba t para medias independientes.
1. Replantear el problema en función de hipótesis de investigación e hipótesis nula de las poblaciones.
2. Determinar las características de la distribución comparativa.
a) La media será 0.
b) Calcuiar el desvío estándar.
i) Calcular las varianzas poblacionaies estimadas sobre la base de cada muestra (es decir, calcular dos
estimaciones),
ii) Calcular una estimación combinada de ¡a varianza poblacionai.
S2 __ A (s i )+ J ! l í s >)
Combinada
brocal
( g t { a N l - 1 and g t 2 = N t ~ U g ^ = gl} + gty
iii) C alcular la varianza de cada distribución de medias: = ^combinada/Wi and Sí = ^Combinada /N2
iv) Calcular la varianza d e la distribución de diferencias de medias:
‘‘^Piferfincia = +
v) Calcular e l desvío ......
estándar
-
de la distribución de diferencias de medias:
Di fewncia •^Difere ncia
c) D eterm inar la forma; será una distribución t con g / Toia( grados de libertad.
3) Determinar el punto de corte en la distribución comparativa, a partir del cual debería rechazarse la hipótesis nula
a) Determinar los grados de libertad (g/TwaJ), el nivel de significación deseado, y las colas de la prueba (una o dos).
b) B uscar el punto de corte apropiado en la tabla f. Si no aparece el g l exacto, se utiliza el g l inm ediatam ente
inferior al buscado.
4) D eterm inar el valor m uestral en la distribución comparativa: t = ( M l - M ,)/S p ift(f neia
5) Comparar io s valores de los pasos 3 y 4 para decidir si se rechaza o no la hip ótesis nula.
d~ (10-8)
cr
Las reglas de Cohén (1988) de la prueba t para medias independientes son las mismas que en to
das las situaciones que hemos tratado hasta ahora: 0,20 para un tamaño del efecto pequeño, 0,50
para un tamaño del efecto mediano y 0,80 para una gran tamaño del efecto.
Analicemos un ejemplo de cálculo de este tipo de tamaño del efecto. Supongamos que un
psicólogo especializado en temas ambientales está trabajando en una ciudad con altos niveles
de contaminación en el aire. El psicólogo planifica un estudio acerca de la cantidad de ejerci
cios resueltos en una prueba de creatividad durante un periodo de una hora. El estudio compara
el desempeño en dos condiciones: en la condición experimental, cada participante realiza la
prueba en una habitación con un puriñcador de aire especial; en la situación de control, cada par
ticipante realiza la prueba en una habitación sin el puriñcador de aíre, El investigador espera
que el grupo de control obtenga probablemente valores similares a otros que han realizado esta
prueba en el pasado, es decir, con una media de 21, pero que el grupo experimental se desempe
ñe mejor y que tenga una media aproximadamente de 29. Se sabe por investigaciones anterio
res que la prueba en cuestión tiene un desvío estándar de aproximadamente 10. Por lo tanto.
p,j = 29, p-2 = 21, y o-= 10. Dadas estas cifras, d = ( jjlj ~ jx2)/or = (29 - 21)/10 = 0,80, es decir, una
gran tamaño del efecto.
Cuando se utiliza información de un estudio ya realizado, el tamaño del efecto se estima co
mo la diferencia entre las medias muéstrales dividida por la estimación combinada del desvío es
tándar poblacíonal (la raíz cuadrada de la estimación combinada de la varianza poblacional). Se
expresa bajo la fórmula,
, .M i-M i
¿Combinada (10-9)
Analicemos el estudio de Valenzuela (1997) acerca de la calidad de la asistencia brindada por las
madres a sus hijos. La media muestral de madres de niños adecuadamente alimentados era 33,1;
la media muestral de madres de niños crónicamente desnutridos era 27,0. Calculamos que la esti
mación combinada de la varianza poblacional era 168,77; el desvío estándar era, por lo tanto,
12,99. La diferencia de medias era 6,1 y, al dividirla por 12,99, obteníamos un tamaño del efecto
igual a 0,47, es decir, un tamaño del efecto mediano. La fórmula es la siguiente,
_ 33,1-27,0 . 6,1 _ Q1?
¿Combinada 12,99 12,99 ’
Potencia
La tabla 10-5 indica la potencia aproximada correspondiente a un nivel de significación de 0,05,
para tamaños del efecto pequeños, medianos y grandes, y para pruebas de una y dos colas. Anali
cemos nuevamente el ejemplo acerca de la psicología ambiental, en el que los investigadores e s -.
peraban un gran tamaño del efecto (d = 0,80). Supongamos que el investigador planifica realizar
un estudio utilizando un nivel de 0,05, con una prueba de una cola y 10 participantes. Utilizando
la tabla, el estudio tendría una potencia de 0,53, lo que implica que, aun si la hipótesis de investi
gación es realmente verdadera y tiene un gran tamaño del efecto, existe sólo un 53% de posibili
dades de que el estudio resulte significativo.
Analicemos otro tipo de ejemplo. Supongamos que hemos leído un estudio que utiliza una
prueba t para medias independientes, el cual tuvo un resultado no significativo utilizando un nivel
de significación de 0,05 en una prueba de dos colas con 50 participantes en cada grupo. ¿Debería
mos concluir que, en realidad, no existe ninguna diferencia entre las poblaciones? La conclusión
parece bastante injustificada, ya que la tabla 10-5 indica que el estudio tendría una potencia de só
lo 0,17 para un tamaño del efecto pequeño. Lo anterior sugiere que si ese pequeño efecto de he
cho sí existe en las poblaciones, el estudio no lo reflejaría. Por otro lado, también podemos con
cluir que si existe una verdadera diferencia entre las poblaciones, probablemente no es una gran
diferencia, ya que la tabla 10-5 indica una potencia de 0,98 para un gran tamaño del efecto, lo que
implica que si existiera un gran efecto, casi con seguridad sería reflejado por el estudio.
,, - '“.Cuadro'! 0-1.
Los métodos de Mostrearlo, í >bien, cuando la matemática
sé convierte sólo en un experimento y la estadística
_ depende de un ju ég o Je.azar.
El nombre Montecarlo, con el que se deno tan cercano a lo aleatorio que resolver él 7
minan ciertos métodos (por la famosa ciu problema matemáticamente á partir de.
dad monegasca de veraneo y de juegos de ecuaciones era prácticamente imposible, y
azar), se adoptó hace sólo unos pocos años. Sin embargo* simulando artificialmente las ..
Pero el método en sí mismo tiene su origen condiciones estadísticas de lo. que esen- ;
algunos siglos atrás, en la época en la que cialmente eran experimentos físicos, era y
los matemáticos dejaban sus lápices o tizas posible comprender el mundo físico, o ál 7
y salían a intentar un experimento real'para menos aproximarse a él de manera más L :
probar la interpretación particular de un adecuada.
problema de probabilidad. Por ejemplo, en El alumno seguramente recordará el '
1777, Buffon describió en su Essai d ’Arith- movimiento browniano que nos mostraban :
métique morale, un método de cálculo de la en las clase de química o física en la escue- .
razón entre el diámetro de un círculo y su la secundaria. Su estudio es un buen ejem- :
circunferencia, lanzando una aguja sobre plb de un problema Montecarlo, Se trata,
una superficie plana con líneas paralelas. en líneas generales, de partículas atómicas, J
Presumiendo que la aguja cayera al azar esta vez en un fluido, libres para hacer una ,
en cualquier posición, uno podía calcular cantidad casi ilimitada de cosas practica- .y
las posibilidades de que cayera en ciertas mente al azar. De hecho, el movimiento :
posiciones, como por ejemplo, la posibi browniano se ha comparado con la “cami- . ;
lidad de que tocara las líneas o no y de que nata al azar” de un borracho: en cualquier •
cayera en ciertos ángulos. El término M on momento, el borracho podría moverse en
tecarlo refleja, sin duda, la antigua inter cualquier , dirección; Pero el problema se -y:
pretación de los matemáticos y estadísti simplifica limitando al borracho (o a la par- ;y
cos en cuánto a que muchos de sus proble tícula) a una cuadrícula imaginaria. :
mas eran similares a aquellos que involu ■ Imaginemos :1a, cuadrícula de las ca- y'y-
craban juegos de azar (recordemos a Pascal lies de una ciudad; Imaginemos también y
y al problema de los puntos descripto en el que hay una pared alrededor de la ciudad que ■;
cuadro 5-2). el borracho no puede cruzar (de la misma y
La utilización generalizada de los mé manera que las partículas deben tener un l í - . :
todos de Montecarlo se hizo posible con el mite y no pueden avanzar eternamente). En .
advenimiento de las computadoras, ya que el límite (la pared), el borracho: debe pagar
la esencia de los estudios de Montecarlo una multa, que también varía al azar. El ob-
es la interacción entre el azar y las proba jetivo de este ejemplo es determinar cuánto •;
bilidades, lo que significa someter a prueba cuesta el azar (todos los movimientos, así
una gran cantidad de posibilidades. De he como también todas las consecuencias fi
cho, la primera aplicación de los métodos nales.) Por lo tanto, la cantidad de posibles
de Montecarlo ocurrid en el campo de la recorridos es enorme.
física nuclear, dado que el comportamien El ejemplo de la caminata al azar nos
to de las partículas, al ser esparcidas por lleva a la característica principal de los'mé
un rayo de neutrones, es tan complicado y todos Montecarlo: requieren la utilización .
de números aleatorios. Podemos'encontrar las computadoras tienen límites, los estu 1-
una explicación acerca de estos números dios Montecarlo son probados sólo en una V
más adelante en el cuadro 154. serie representativa de esas variaciones. Otro |
Volvamos ahora a lo que nos interesa, inconveniente más específico es que exis- i
es decir, la utilización de ios estudios Mon- ten buenas razones para pensar que algunas |
tecario para probar cuál será el resultado de de las variaciones que no se analizan son í
los incumplimientos de ciertos supuestos mucho más semejantes a la vida real que ;
en las pruebas estadísticas. Por ejemplo, la aquellas que se han estudiado (véase en el
computadora puede crear dos poblaciones capítulo 5 la controversia acerca dé cuán
con medias idénticas, mientras que los otros común es realmente la curva normal). Fi
parámetros son establecidos por el investi nalmente, cuando intentamos decidir la uti
gador estadístico de maneta que violen al lización de un cálculo o prueba estadística . ■
gún supuesto importante. Las pobla- ciones en particular, en cualquier situación: especí
podrían ser asimétricas hacia cierto lado, o fica, nó tenemos idea de la población de la .
bien, las dos poblaciones podrían tener va- cual proviene la muestra: ¿E¿ una pobla- :¡
rianzas diferentes. ción semejante a alguna de aquellas sobre \ :
Después se toman muestras aleatorias las cuales se ha realizado un estudio Mon-
de cada una de estas dos extrañas poblacio tecarío o no? Saber simplemente que los es
nes (recordemos, fueron inventadas por tudios Montecarlo han demostrado que al-
una computadora), se comparan las medias gunos cálculos y pruebas; estadísticas son
muéstrales utilizando el procedimiento usual robustos a pesar de incumplimientos a dis
de prueba t, con las usuales tablas i, con to tintos tipos de supuestos, no prueba que lo :
dos los supuestos. Se selecciona una gran sean en cualquier situación determinada. Só-: .
cantidad de tales pares de muestras, gene lo nos da cierta esperanza en cuanto a que
ralmente alrededor de 1.000, y se calcula : ekistán más posibilidades de que utilizar
una prueba t para cada par. La cuestión es: •
: :ese cálculo o. prueba estadística sea seguro
¿Cuántas de esas 1.000 pruebas f serán sig-.■
y justificable.
nificativas al nivel de significación del 5%?
En todo caso, los estudios Montecarlo
Lo ideal sería que el resultado sea aproxi-
; son un ejemplo' perfecto del modo en que
madamente dé15%, Ó50 de las 1.000. Pero
■ las computadoras han cambiado la ciencia.
¿qué sucedería si el 10% (100) de esas
pruebas, supuestamente a nivel 5%, resul Shzeidér (1966) lo expresó de la siguiente .
tara significativo? ¿Qué sucedería si fuera manera:
L as com pu tadoras han produ cid o u n a ' v
sólo el 1%? Si se dieran este tipo de resul
; ' rev o lu ció n ú n ica en, la ;m a te m á tic a .1■ ; ’ ■■■■
tados, entonces ese incumplimiento en par
M ientras q u e anteriorm ente una in ves- ; ■ :
ticular de. presunciones en la prueba t no
: tig a c ió n d e un p r o c eso aleatorio se
podría ser tolerado. Pero de hecho, la ma
c o n sid e ra b a : c o m p le ta tan pronto c o
yoría de los incumplimientos (excepto los
muy extremos), controlados con el método. ; m o fu era red ucida a una d e scr ip c ió n
descripto, no crean grandes cambios enlos ■ : ' analítica, actu alm en te, en. m u ch os c a
válores p . s o s e s c o n v e n ie n te résoiver u n proble- ::
Los métodos Montecarlo son todo un ■ m a a n a lítico red u cién d o lo ai p roceso
suceso para la estadística, pero como todo, aleatorio corresp on d ien te y lu e g o si- .
también tienen sus desventajas, y por lo tanto m u lan d o e s e p ro ceso (p. v ii). .
sus críticos. Uno de los inconvenientes es En otras palabras, en lugar de que la mate
que el modo en que las poblaciones pueden mática nos ayude a analizar experimentos, :-
violar las presunciones es casi ilimitado en son los experimentos los que pos están ayu
cuanto a sus variaciones, y dado que incluso dando a analizar la matemática. • . ■
Tabla 10-5.
Potencia aproximada de estudios en los que se utiliza la prueba t para medias independientes, pro
bando la hipótesis a un nivel de significación de 0,05.
Cantidad de participantes en cada grupo Tamaño del efecto
Pequeño M ediano Grande
(0,20) (0,50) (0,80)
Prueba de una cola
10 0,11 0,29 0,53
20 0,15 0,46 0,80
30 0,19 0,61 0,92
40 0,22 0,72 0,97
50 0,26 0,80 0,99
100 0,41 0,97 *
Prueba d e dos colas
10 0,07 0,18 0 ,3 9
20 0,09 0,33 0,69
30 0,12 0,47 0,86
40 0,14 0,60 0,94
50 0,17 0,70 0,98
100 0,29 0,94 *
«Casi 1.
Nota: basado en Cohen (1988), pp. 28 -3 9 .
Por lo tanto, aunque tenemos un total de 40 participantes, el estudio tiene la potencia de un estu
dio con muestras ijguales, de un tamaño de sólo 10 personas en cada grupo. (Es decir, un estudio
con un total de 20 participantes habría tenido exactamente la misma potencia). Supongamos que
el investigador está utilizando el nivel 0,05, una prueba de dos colas, y espera un gran tamaño del
Tabla 10-6.
Cantidad aproximada de participantes necesarios en cada grupo (suponiendo que las muestras son
de igual tamaño) para obtener una potencia dei 80% en una prueba t para medias independientes,
probando la hipótesis a un nivel de significación de 0,05.
Tamaño del efecto
Pequeño M e d ia n o G ran de
(o a o ) (0,50) (0,80)
U na coía 310 50 20
D o s colas 393 64 26
efecto. La tabla 10-5 indica que el estudio tendría una potencia de aproximadamente 0,39 (el nú
mero correspondiente a 10 participantes en cada grupo). Sin embargo, supongamos que el inves
tigador hubiera podido organizar el estudio dividiendo los 40 participantes en dos grupos de 20,
En ese caso, el estudio habría tenido una potencia de 0,69.
CONTROVERSIAS Y LIMITACIONES
Una vieja controversia se refiere a lo que usualmente llamamos el problema del “exceso de prue
bas f \ Las cuestiones básicas se presentan en todo tipo de prueba de hipótesis, no sólo en la
prueba f. Sin embargo, analizamos el problema ahora porque tradicionalmente se ha tratado en
este contexto.
Supongamos que se realizan una gran cantidad de pruebas t como parte del mismo estudio.
Por ejemplo, podemos estar comparando dos grupos con cada una de. 17 medidas diferentes, co
mo pueden ser diferentes indicadores de memoria en una tarea en la que se emplea la capacidad
de recordar varias sub-escalas de pruebas de inteligencia o diferentes aspectos de interacciones
observados entre niños. Cuando se han realizado varias pruebas t en el mismo estudio, la posibili
dad de que cualquiera de ellas resulte significativa a un nivel, digamos, del 5%, es realmente ma
yor al 5%. Sí se realizan 100 comparaciones independientes, a un nivel del 5%, en promedio 5 de
2 Cohén (1988, pp. 54-55) proporciona otras tablas que indican las cantidades necesarias de participantes para otros ni
veles de potencia además dei 80%, para tamaños del efecto distintos de 0 ,2 0 ,0 ,5 0 y 0,80, y para otros niveles de signi
ficación. Si es suficiente saber cuál es la cantidad aproximada, Dunlap y Myers (1997) han desairoitado una forma más
corta de encontrar la cantidad aproximada de participantes necesarios para estudios que utilizan ía prueba t para medias
independientes. Para un 50% de potencia, la cantidad de participantes necesarios por grupo es aproximadamente
8/d2 + I. Para un 80%-90% de potencia, 16/d2 + 2.
ellas serán significativas sólo por azar. Es decir, aproximadamente 5 serán significativas aun si no
existiera ninguna diferencia real entre las poblaciones que las pruebas t están comparando.
La cuestión fundamental no es controvertida. Todo el mundo está de acuerdo con que existen
inconvenientes en un estudio que incluye una gran cantidad de comparaciones. Todo el mundo es
tá de acuerdo que en un estudio de ese tipo, si sólo unos pocos resultados son significativos, las
diferencias reflejadas deberían ser revisadas muy cuidadosamente. La :ontroversÍa surge en
cuanto a cuán cuidadoso se debe ser y en cuanto a qué cantidad implica “sólo unos pocos”. Una
de las razones que da lugar a la controversia es que, en la mayoría de los casos, las muchas com
paraciones que se realizan no son independientes, y la posibilidad de que una resulte significativa
está relacionada con la posibilidad de que otra resulte significativa.
Veamos el siguiente ejemplo. Un estudio compara una muestra de abogados con una muestra
de doctores con respecto a 100 rasgos de personalidad. Supongamos ahora que el investigador
simplemente realiza 100 pruebas t. Si las 100 pruebas t fueran realmente independientes, espera
ríamos que, en promedio, 5 resultaran significativas sólo por azar. De hecho, existen tablas para
calcular con bastante precisión las chances de que cualquier cantidad determinada de pruebas t
resulte significativa. De todos modos, el problema es que, en la práctica, estas 100 pruebas í no
son independientes. Muchos de los distintos rasgos de personalidad probablemente estén correla
cionados, como es el caso de las escalas que miden el dogmatismo y la confianza en sí mismos. Si
los doctores y los abogados difieren en cuanto a dogmatismo, probablemente también tendrán di
ferencias en cuanto a confianza en sí mismos. Por lo tanto, ciertas seríes de comparaciones pue
den tener más o menos probabilidades de resultar significativas por azar, de tal forma que 5 en
100 puede no ser un indicador preciso de cuántos resultados significativos esperar por azar.
Existe además otra complicación: en la mayoría de los casos, las diferencias en algunas de las
variables son más importantes que en otras. Algunas comparaciones pueden probar directamente
una teoría o la efectividad de algún procedimiento práctico, y otras pueden ser más “explorato
rias”. Esta complicación, junto con el problema de la falta de independencia, ha llevado a una va
riedad de soluciones conflictivas. En el capítulo 12 presentaremos algunas de esas soluciones
cuando analicemos una situación relacionada con este tema, situación que surge en estudios que
comparan más de dos grupos.
Grupo Grupo
adecuadamente crónicamente
alimentado desnutrido
(n =43) (« = 42)
M edida M SD M SD valor / P
Materna y familiar
Ingresos totales 45,30 9,0 44,7 10,0 0,30 0,77
Tamaño familiar 5,7 2,2 5,2 1,4 1,18 0,24
Cantidad de hermanos 2,6 0,8 2,8 0,8 0,85 0,39
Edad del padre 31,4 5,6 29,6 6,9 1,29 0,20
Educación del padre 7,2 2,8 6,8 2,9 0,64 0,52
Edad de la madre 28,6 4,7 27,6 5,7 0,84 0,40
Educación de la madre 7,0 2,6 6,1 2,9 1,39 0,17
Peso de la madre (kg.) 59,2 10,0 53,3 10,0 2,5 0,01
Estatura de la madre (cm.) 153,6 5,6 150,5 6,4 2,31 0,02
Sensibilidad materna 5,63 2,4 2,1 1,5 8,14 0,0001
Cuestionario sobre salud
(registro total) 10,8 3,9 10,7 5,3 0,08 0,93
Escala de adaptación marital
(registro total) 84,7 26,6 73,8 32,9 1,59 0,11
Niño
Edad (meses) 18,5 1,4 18,4 1,5 0,33 0,74
Peso 103,72 7,3 81,6 3,9 17,40 0,0001
Estatura 98,3 2,8 92,9 3,3 7,93 0,0001
Funcionamiento madre-hijo
Sensibilidad materna 7,7 3,8 7,3 3,6 0,58 0,59
Control materno 3,4 4,1 4,2 3,7 0,98 0,36
Insensibilidad materna 2,8 2,9 2,4 3,1 0,67 0,53
Cooperación del niño 7,9 4,5 6,8 4,1 0,12 0,24
Sumisión compulsiva del niño 1,2 3,2 2,1 3,8 0,12 0,26
Dificultad del niño 2,5 2,8 3,5 3,4 0,39 0,71
Pasividad del niño 2,2 2,7 2,4 2,6 0,36 0,72
Resolución de problemas
Apoyo materno 37,9 10,6 30,54 7,9 3,62 0,001
Calidad de asistencia materna 33,1 14,2 27,0 11,6 2,16 0,03
Competencia social del niño 19,9 4,1 15,7 3,8 4,78 0,0001
Demostración de poder del niño 15,6 5,3 12,5 4,5 2,85 0,006
Sentimientos negativos del niño 7,4 4,2 9,4 4,8 2,00 0,050
*Las medidas de peso y estatura de los niños están indicadas en forma de porcentajes del peso y medidas según la edad,
conforme a las normas del Centro Nacional de Estadísticas Sanitarias.
Fuente: Valenzuela, M. (1997), tab. 1. “Sensibilidad materna en una sociedad en desarrollo: el contexto de la pobreza
urbana y la desnutrición infantil crónica". Psicología de Desarrollo (Developmental PsychologyJr 33, 845-5)55.
Copyright, 1997, por la Asociación Americana de Psicología [American Psychological Association], Reimpreso con
autorización.
La tabla 10-8 es otro ejemplo, tomado de un estudio realizado por Frisch, Shamsuddín y Kurtz
(1995), en el que 293 mujeres estudiantes de medicina en Malasia fueron entrevistadas acerca de
sus opiniones en cuanto a fumar, y en cuanto a si fumaban o no los miembros de sus familias y sus
amigos. La tabla compara aquellas estudiantes que tienen hermanos fumadores con aquéllas cu
yos hermanos no fuman. (La publicación no explica cómo se resolvía el problema de que la per-
sona tuviera dos hermanos, uno fumador y otro no fumador), Las medidas fueron: conocimiento
(de los riesgos para la salud ocasionados por estar rodeado de fumadores), actitud (hacia estar ro
deado de fumadores), esfuerzos (para evitar estar rodeado de fumadores) y responsabilidad como
médico (de informar a los pacientes sobre los riesgos para la salud ocasionados por estar rodeado
de fumadores). En todas las escalas, el puntaje estaba establecido de tal forma que el más alto es
tuviera a favor de fumar. Los valores más bajos significaban mayor preocupación acerca de los
riesgos para la salud.
La primera línea de la tabla indica que aquellas que tenían un hemano fumador presentaban
valores más altos en la escala de conocimiento, lo que significa que esas estudiantes tenían menos
conocimiento acerca de los riesgos de estar con fumadores. La segunda línea indica que aquellas
que tenían un hermano fumador tenían una actitud más positiva hacia estar con fumadores (es de
cir, no consideraban que era una causa de riesgo para la salud).
Es importante notar que algunos de estos resultados no fueron significativos. ¿Cuál debería
ser la conclusión? Analicemos lo que piensan las estudiantes acerca de la responsabilidad como
médico. En esta comparación, había 41 estudiantes con hermanos fumadores y 73 con hermanos
no fumadores. Aplicando la fórmula de la medía armónica observamos que, en lo que respecta al
cálculo de la potencia, hay 52,5 participantes por grupo. Es decir,
(2)(jV iX M >) _ (2 X 4 1 X 7 3 ) _ 5 .9 8 6
M ed ia a rm ó n ica = 52,5
N{ + N2 41+73 “ 114
Una vez que sabemos qué tamaño de muestra utilizar, podemos buscar la potencia en la tabla 10-5
buscando la hilera de 50 participantes (el número más cercano a 52,5 en la tabla) para una prueba
Tabla 10-8.
Prueba t para medias, acerca del conocim iento, las actitudes y el esfuerzo relacionados con el hecho
de ser fum ador pasivo, según la condición de fum ador y con respecto al grupo total y a hombres y
mujeres separadam ente.
H om bres
Conocimiento 2,15(54) 1,92(69) 2,97 0,004
Actitud 2,08(54) 1,83 (67) 2,12 0,036
Esfuerzos 2,50(52) 2 3 1 (66) 1,87 0,064
Resp. Médico* 1,81 (54) 1,65 (69) 1,27 0,207
M ujeres
Conocimiento 1,87 (42) 1,85(71) 0,30 0,767
Actitud 1,77 (40) 1,57(70) 2,43 0,0 i 8
Esfuerzos 2,17(40) 2,15(67) 0,26 0,797
Resp. Médico* 1,76(41) 1,58(73) 1,51 0,136
'■
“Responsabilidad com o médicos
Fuente: Frisch, Shamsuddín Se Kurtz (1995),
de dos colas. Descubrimos que la potencia del estudio, para resultar significativa con un pequeño
tamaño del efecto, es sólo de 0,17. Por otro lado, la potencia del estudio en el caso de un tamaño
del efecto mediano es 0,70, y en el de un tamaño del efecto grande es 0,98. Así, si en realidad te
ner un hermano fumador produce un pequeño efecto, dicho efecto probablemente no habría sido
reflejado por el estudio. Por otro lado, supongamos que en realidad había un efecto mediano de
ese tipo; en ese caso, el resultado del estudio probablemente habría sido significativo; y si el efec
to fuera grande, casi con seguridad el estudio habría resultado significativo. Por ló tanto, con bas
tante confianza podemos inferir de este estudio que el hecho de tener un hermano fumador proba
blemente no produce una gran diferencia en las opiniones de las mujeres estudiantes de medicina
de Malasia, en cuanto a la responsabilidad del médico de informar a sus pacientes acerca de los
riesgos de estar con fumadores. Pero no podemos concluir que no podría haber un pequeño efec
to en ese sentido.
RESUMEN
Una prueba t para medias independientes se utiliza para realizar pruebas de hipótesis con dos
muestras de observaciones. La diferencia principal con una prueba í para una sola muestra, o una
prueba t para medias dependientes, es que la distribución comparativa es una distribución de dife
rencias entre medías muéstrales. Esta distribución puede considerarse construida en dos pasos:
cada población de individuos produce una distribución de medias y luego se crea una nueva dis
tribución de diferencias entre pares de medias tomadas de esas dos distribuciones de medias.
La distribución de diferencias de medias tiene una media de 0, y es una distribución t con el
total de los grados de libertad de las dos muestras. El desvío estándar se calcula en varios pasos:
a) se utiliza cada muestra para estimar la varianza poblacional; b) se supone que ambas poblacio
nes tienen la misma varianza, y se realiza una estimación combinada sacando un promedio pon
derado de las dos estimaciones (multiplicando cada estimación por la proporción con que contri
buye su muestra a los grados totales de libertad y sumando los resultados); c) se divide la
estimación combinada por la cantidad de observaciones de cada muestra para obtener la varianza
de la distribución de medias de cada población; d) se suman esas dos varianzas para obtener la va
rianza de la distribución de diferencias de medias, y e) se calcula la raíz cuadrada.
Los supuestos en la prueba t para medias independientes son las siguientes: las dos poblacio
nes están normalmente distribuidas y tienen la misma varianza. Sin embargo, .la prueba t otorga
resultados bastante precisos aun cuando la situación real sea moderadamente diferente de lo que
indican los supuestos.
El tamaño del efecto de una prueba t para medias independientes es la diferencia entre las
medias dividida por el desvío estándar. La potencia es mayor cuando los tamaños de las muestras
de los dos grupos son iguales. Cuando no lo son, se utiliza la media armónica de los dos tamaños
muéstrales para buscar la potencia en las tablas.
Cuando se realizan demasiadas pruebas de significación en el mismo estudio, como en el ca
so de una serie de pruebas t que comparan dos grupos con respecto a varias medidas, la posibili
dad de que cualquiera de las comparaciones resulte significativa por azar al nivel del 0,05 es ma
yor a 0,05. La forma de adaptación de los cálculos para resolver este problema es controvertida,
aunque la mayoría está de acuerdo con que en una situación de ese tipo los resultados deberían ser
interpretados con mucho cuidado.
Cuando las publicaciones científicas informan acerca de pruebas t para medias independien
tes, el investigador usualmente incluye los grados de libertad, el punto t y el nivel de significa
ción. También pueden informarse los resultados de estas pruebas a través de una tabla.
Términos clave
- Distribución dé diferencias - Desvío estándar de la -Varianza de la
de medias. distribución de diferencias distribución de
- Media armónica. demedias (óDifercncia). diferencias entre
~ Estimación combinada de la varianza - Prueba t para medias medias (5^iferenciíi).
poblacíonai 0$^ombinaíla). independientes. - Promedio ponderado.
Diferencias
Situación de pareja íntergrupales
Nota: las proporciones de cada código de control y de cada sentimiento fueron convertidas utilizando la transformación
arco-seno para utilizarías en comparaciones íntergrupales *p <0,01; **p <0,001; (gl = 28).
Fuente: Escudero, V., Rogers, L. R &Gutiérrez, E, (1997), tab. 3. “Patrones de control en la relación y de sentimiento
no verbal en parejas clínicas y no clínicas". Revista Científica de Relaciones Sociales y Personales {Journal of Social
andPersonal Relationships}, 14,5-29. Copyright © 1997 por Sage Publications, ínc. Reimpreso con autorización de
Sage Publications.
grupos de cada comparación tenían aproxima 16 nombres masculinos. (Tendrá que excluir
damente el mismo tamaño muestra!). aquellos nombres cuyo género no esté seguro).
7. ¿Quiénes tienen primeros nombres másCalcule una prueba t para medias independien
largos, los hombres o las mujeres? Tome un tes utilizando esas dos muestras. (Asegúrese de
directorio telefónico y utilice los números alea destacar a qué ciudad pertenece el directorio te
torios que le proporcionamos a continuación lefónico que utilizó).
para seleccionar una página. En la primera pá
gina (página 12), busque el primer nombre clara 1 2 ,7 9 , 1 0 , 9 7 , 5 3 , 7 4 , 1 5 , 5 5 ,4 1 , 1 2 8 ,5 7 , 9 3 ,
mente femenino y anote la cantidad de letras de 9 4 ,3 1 ,6 8 ,5 1 6 ,6 0 ,5 6 ,7 ,9 3 ,4 3 ,9 1 ,5 7 ,5 8 ,3 8 ,
ese nombre. Haga lo mismo 16 veces (busque la 120, 14, 38, 57, 743, 98, 471, 38, 66, 20, 32,
página correspondiente al número indicado, 6 0 , 4 3 ,7 8 ,2 9 , 3 9 , 1 7 ,3 1 , 1 2 , 6 1 ,1 0 0 , 80, 35,
etc.). Después busque la cantidad de letras de 3 1 ,9 9 ,2 2
( 10-11)
Tabla 10-10.
Cálculos de la prueba t para medias independientes correspondientes al estudio acerca de la calidad de
asistencia por parte de madres de niños pobres chilenos adecuadamente alimentados en comparación
con niños pobres chilenos crónicamente desnutridos, utilizando la fórmula de cálculo para
83
í necesario para nivel 5%, gl =83 (utilizando gl ~ 80 de la tabla), y prueba de dos colas = 1,990
r - ( M t - M 2)/S d í m , = (33, i - 27.OV2.81 = 6,1/2,81» 2,17.
Conclusión: se rechaza la hipótesis nula y se sostiene la hipótesis de investigación.
indy Hazan y Philip Shaver (1987) realizaron los arreglos necesarios para que el
C
Rocky Mountain News, un importante periódico de la zona de Denver, imprimiera
una encuesta que se distribuiría con el diario. La encuesta incluía la pregunta que
aparece en la tabla 11-1, cuya finalidad es realizar una medición de estilos de
vinculación. Aquellos que eligieron la primera opción son individuos “seguros”;
los que eligieron la segunda, “evasivos”, y los que eligieron la tercera, “ansiosos-ambivalentes”. Lo
estilos de vinculación mencionados se consideran formas diferentes de actuar y pensar en lo que
respecta a las relaciones personales estrechas, formas que se desarrollan a partir de la experiencia
de cada persona con quienes se hicieron cargo de cuidarlos desde temprana edad (p. ej. Míckelson
et al., 1997). Los lectores también respondieron preguntas acerca de una cantidad de aspectos.re-
lacionados con el amor, entre los que se incluía el nivel de celos que experimentaran. Posterior
mente, Hazan y Shaver compararon el nivel de celos registrado para personas con diferentes
estilos de vinculación.
Con una prueba t, Hazan y Shaver podrían haber comparado las medias de los valores del ni
vel de celos entre dos de los estilos de vinculación. Pero, en realidad, estaban interesados en las
diferencias entre los tres, estilos de vinculación. El procedimiento estadístico para probar diferen
cias entre medias de varios grupos se denomina a n o v a (Analysis o f Varianee, Análisis de varían-
za), (El análisis de varianza se podría utilizar para un estudio con sólo dos grupos, pero la prueba
t, que en ese caso da los mismos resultados, es más simple).
En este capítulo, presentamos el análisis de varianza concentrándonos en la situación en la
que los diferentes grupos comparados tienen la misma cantidad de valores observados. La situa
ción más complicada, en la que la cantidad de personas en cada grupo no es la misma, será trata
da en el capítulo 12. En el capítulo 13, completamos el estudio del análisis de varianza analizando
situaciones en las que los distintos grupos se organizan a partir de más de una dimensión. Por
ejemplo, en el mismo análisis podríamos tener en cuenta tanto el sexo como el estilo de vincula
ción, con lo cual se crearían seis grupos en total (femenino seguro, masculino seguro, femenino
Tabla 11-1.
Pregunta utilizada en la encuesta realizada por Hazan y Shaver (1987) a través de un periódico.
¿Cuál de las siguientes posibilidades describe mejor sus sentimientos? [Marque una],
(] Me resulta relativamente fácil acercarme a los demás y me siento cómodo si confío en ellos y sé que con
fían en raí. En líneas generales no me preocupo por la posibilidad de ser abandonado o de que alguien se
acerque demasiado a mí.
[ ] Estar cerca de otros me hace sentir un poco incómodo; me resulta difícil confiar completamente en los
demás y permitirme depender de ellos. Me pone nervioso que alguien se acerque demasiado a mí, y mis
parejas a menudo me piden una relación más íntima de la que puedo mantener sintiéndome cómodo.
[ j Me parece que los demás no quieren acercarse a mí tanto como yo quisiera. Con frecuencia me preocupo
porque pienso que mi pareja realmente no me ama o no va a querer permanecer a mi lado. Quiero unirme
completamente con otra persona, y este deseo a veces las ahuyenta.
Fuente: Hazan & Shaver (1987), p. 515.
ansioso, etc.), formados conforme a las dos dimensiones: sexo y estilo de vinculación. El caso
que acabamos de describir se conoce como “análisis factorial de varianza”. Para acentuar la dife
rencia con el análisis factorial de varianza, lo que aprenderemos en este capítulo y el siguiente se
denomina con frecuencia análisis de varianza de un criterio. (No debemos preocupamos ahora
si el concepto de dimensiones resulta confuso. Ya lo trataremos pausada y sistemáticamente en el
capítulo 13; sólo lo mencionamos ahora para que el alumno no se sorprenda si llegara a encon
trarse con esos términos).
La hipótesis nula en un análisis de varianza establece que las diversas poblaciones que se com
paran tienen la misma media. Por ejemplo, en el estudio de Hazan y Shaver la hipótesis nula es
tablecería que las poblaciones de personas seguras, ansiosas y evasivas presentan todas el mismo
nivel de celos, es decir, que la media en cuanto a celos es la misma en las tres poblaciones. La hi
pótesis de investigación establecería que el nivel de celos difiere entre las tres poblaciones, es
decir, que sus medias no son todas iguales.
La prueba de hipótesis con anáfisis de varianza trata de probar si las medias muéstrales difie
ren más de lo que esperaríamos si la hipótesis nula fuera verdadera. Sorprendentemente, esta
cuestión sobre medias se responde analizando varianzas (por eso el nombre análisis de varian
za). (Para expresarlo de modo más simple, nos concentramos en las varianzas porque cuando es
tamos interesados en el grado en el que difieren varias medias entre sí, lo que estamos estudiando
es la variación entre esas medias).
Por lo tanto, para comprender la lógica del análisis de varianza nos dedicaremos a estudiarlas.
Particularmente, comenzamos analizando dos formas diferentes de estimar las varianzas pobla-
cionales. Como veremos, el análisis de varianza es una comparación de los resultados de estas
dos maneras diferentes de estimar las varianzas de la población.
Figura 13.-1. Las medias de muestras provenientes de poblaciones idénticas no serán idénticas. Las medias
muéstrales que provienen de poblaciones con menos variación, variarán menos (a). Las medias muéstrales
que provienen de poblaciones con más variación, variarán más (b). Las medias pobiacionales se indican
con un triángulo; las medias muéstrales con una X. ;
hipótesis nula fuera verdadera). Aun en el caso en que todas tuvieran la misma media, es probable
que la muestra de una población no tenga exactamente la misma media que la muestra de una se
gunda población. Del mismo modo,es probable que la muestra de una tercera población sea leve
mente diferente de las de las otras dos. Y así sucesivamente. Más aún, cuánto más varíe cada una
de esas poblaciones internamente, más variarán las medias de muestras tomadas de esas pobla
ciones. Variarían incluso si, de hecho, las medias poblacionales fueran idénticas.
La figura 11-1 representa gráficamente el principio que hemos estado analizando. Las tres
poblaciones idénticas de la izquierda tienen poca varíanza, y las tres poblaciones idénticas de la
derecha registran una gran varíanza. En cada serie de tres poblaciones idénticas, aun cuando las
medias de las tres poblaciones sean iguales, las medias de las muestras provenientes de esas po
blaciones no son iguales! Es muy importante destacar que las medias de las poblaciones con me
nos varíanza son más cercanas (tienen menos varíanza entre sí) y que las medias de poblaciones
con más varíanza están más dispersas (tienen más varíanza entre sí).
Ya hemos visto que la variación entre las medias de muestras tomadas de poblaciones idénti
cas está directamente relacionada con la variación de los valores dentro de cada una de esas po
blaciones. Esto tiene una implicancia muy importante: sería posible estimar la varíanza dentro de
cada población a partir de la variación entre las medias de las muestras. Es decir, podríamos utili
zar la variación de las medias muéstrales para calcular el grado de variación en la población de
donde provienen esas muestras.
Tal estimación se denomina estimación m tergrupal de la varíanza poblacional. (Lleva es
te nombre porque se basa en la variación entre las medias de las muestras, es decir, de los “gru
pos”). Más adelante, en éste capítulo, veremos cómo se calcula realmente esta estimación.
Hasta aquí, la lógica que hemos analizado supone que la hipótesis nula es verdadera, en cuyo
caso no existe variación entre las medias poblacionales. Veamos ahora qué sucede cuando la hi
pótesis nula no es verdadera y sí lo es la hipótesis de investigación.
Cuando la hipótesis nula no es verdadera. Si la hipótesis nula no es verdadera y la hipóte
sis de investigación sí lo es, las propias poblaciones tendrán diferentes medias. En ese caso, la va
riación entre las medias de muestras tomadas de esas poblaciones sigue siendo el resultado de la
variación dentro de las poblaciones. La diferencia radica en que, en este caso, en el que la hipóte
sis de investigación es verdadera, la variación entre medias muéstrales es causada además por la
variación entre las medias poblacionales. Es decir, en este caso las medias muéstrales se disper
san por dos razones diferentes: a) por la variación dentro de cada una de las poblaciones y b) por
la variación entre las poblaciones. La figura 11-2a representa gráficamente tres poblaciones con
las mismas medias y las medias muéstrales provenientes de ellas (es decir, la misma situación que
en la figura 11-1, a y b). La figura 11-2b representa gráficamente tres poblaciones con diferentes
medias y las medias de las muestras tomadas de ellas (es decir, la situación que acabamos de expli
car). Vale la pena observar que las medias de las muestras están más dispersas en la figura 1l-2b
que en la figura 11-2a, aun cuando las variaciones dentro de las poblaciones sean las mismas en
11-2b y en 11-2a. Esta dispersión adicional (varíanza) que representa la figura 11-2b se debe a
que las poblaciones tienen diferentes medías.
En resumen, la estimación intergrupal de la varíanza poblacional se calcula sobre la base de
la variación entre las medias muéstrales. Si la hipótesis nula es verdadera, esa estimación es una
indicación precisa de la variación dentro de las poblaciones. Pero si la hipótesis nula es falsa, este
método de estimación de la varíanza'poblacional se ve influenciado tanto por la variación dentro
de las poblaciones como por la variación entre ellas. Por lo tanto, no proporcionará una estima
ción precisa de la variación dentro de las poblaciones porque también estará afectada por la va
riación entre las poblaciones. La diferencia que acabamos de mencionar tiene implicancias
importantes: es lo que hace del análisis de varíanza un método de prueba de hipótesis basado en la
existencia o no de diferencias entre las medías de diferentes grupos.
Figura 11-2. Las medias muéstrales que provienen de poblaciones cuyas medias son diferentes (b) variarán
más que las medias muéstrales que provienen de poblaciones cuyas medias son iguales (a). Las medias
poblacionales se indican con un triángulo; las medias muéstrales con una X.
estimación intergrupal y la estimación intragrupal debería ser mayor que 1. Por ejemplo, la esti
mación intergrupal podría ser 638,9 y la estimación intragrupal 107,5, dando una razón de
638,9/107,5, ó lo que es igual, de 5,94. Es decir, si dividimos la estimación mayor, la intergrupal,
por la menor, la intragrupal, no obtenemos 1, sino un número mayor.
Lo que acabamos de describir es el principio fundamental del análisis de varianza. Cuando la
hipótesis nula es verdadera, la razón entre la estimación de varianza intergrupal y la estimación de
varianza intragrupal debería ser aproximadamente 1, pero cuando la hipótesis de investigación es
verdadera, la razón debería ser mayor a 1. Por lo tanto, si calculamos la razón y ésta resulta mucho
mayor a 1, podemos rechazar la hipótesis nula. Es decir, no es verosímil que la hipótesis nula pue
da ser verdadera ya que la estimación intergrupal es mucho mayor que la estimación intragrupal.
La razón F
Esta razón fundamental entre las estimaciones intergrupal e intragrupal de la varianza se denomi
na razón F. (La F se debe a Sír Ronald Fisher, un destacado estadístico que desarrolló el análisis
de varianza; véase cuadro 11-1).
La distribución F y la tabla F
Ya hemos mencionado que cuando la razón fundamental entre la estimación intergrupal y la esti
mación intragrupal (la razón F) es mucho mayor a 1, podemos rechazar la hipótesis nula. La si
guiente pregunta es: ¿Cuánto mayor a 1 necesita ser la razón para que podamos rechazar la
hipótesis nula con confianza?
Conforme a lo que el alumno seguramente ya debe haber imaginado, los estadísticos han de
sarrollado los cálculos matemáticos de una distribución F y han preparado tablas de razones F.
Para cualquier situación determinada, simplemente buscamos en una tabla F cuán extremo debe
ser una razón F para rechazar la hipótesis nula a, digamos, un nivel 0,05. (Más adelante, en este
capítulo, aprenderemos a utilizar la tabla F).
Para dar un ejemplo de la razón F, volvamos al estudio acerca del estilo de vinculación reali
zado por Hazan y Shaver (1987). Los resultados de ese estudio, en cuanto al nivel de celos, fueron
los siguientes: la estimación de varianza poblacional intergrupal era de 23,19. (Este número se
calcula sobre la base de las medias de las tres muestras de estilo de vinculación, que eran 2,17,
2,88 y 2,57; pronto aprenderemos a realizar estos cálculos). La estimación intragrupal de varian
za poblacional era 0,53. (Este número se calculó combinando las estimaciones de la varianza de
Ronald A. Fisher, contemporáneo de Wi- sido sus más cercanos aliados, y quienes :;
Uiam Gosset (véase cuadro 9-1) y de Karl verdaderamente deberían haber, sido sus
Pearson (véase cuadro 14-1), fue proba compañeros de investigación.. Cuando le
blemente el más brillante y productivo de hablaban en broma él contestaba con .serie- : :
los miembros del cerrado grupo de esta dad mortal; cuando los demás estaban se
dísticos británicos. A lo largo del proceso rios él bromeaba. En una oportunidad,
de elaboración de trescientos trabajos y de relata Wüliam G. Cochran (otro estadístico, ■
siete libros, desarrolló muchos de los con reconocido), estaba por cruzar una calle'
ceptos clave de la ciencia moderna: va- junto don Fisher. Él momento no era el m á s ,'
rianza, análisis de varianza, estadísticas indicado y , ante la vacilación de Cochran,.
(en el sentido de describir una muestra, en Fisher lo increpó: “¡Ah, vamos!, ¡no nos- 1
oposición con los parámetros de una po lastimará un poco de selección natural” !, y •
blación), niveles de significación, hipóte-, Cochran. tímidamente arriesgó su vida.. .
sis nula, y. casi también de todas las ideas La poca compasión de Fisher se exten-. ..
básicas del diseño de investigación, ade día también a sus lectores:: su estilo no sólo
más de señalar la importancia fundamen era terriblemente oscuro .sino que, confie-ó.
tal de la aíeatorización. ■ cuencia, omitía explicitar importantes s u -. .
Una de las tantas leyendas familiares puestos y pruebas. Gosset mismo expresó,
cuenta que el pequeño Ronald, nacido en el que cuando Fisher comenzaba una oración
año 1890 en East Finchíey, un suburbio del con evidentemente, eso significaba dos .
norte de Londres, estaba tan fascinado por horas de arduo trabajo antes de que uño
la matemática que, un día, a los 3 años de pudiera tener esperanzas de discernir por.
edad, al ser puesto frente a. su silla alta para qué él tema era evidente. Otro estadístico .
el. desayuno, le preguntó a su niñera: “¿Qué buscó excusarlo, sin embargo, diciendo: ‘
es la mitad de la mitad?” Cuando se le ex que “Fisher hablaba en un nivel escasa
plicó que era un cuarto, preguntó “¿Qué es mente comprendido por el resto de la hm
la mitad de un cuarto?” Al recibir la res manidad”. Y es verdad que era invariable
puesta :quiso saber qué era la mitad de un mente admirado y respetado pbr su traba-;
octavo. Ante la siguiente respuesta supues jo, aunque no por sus modales.
tamente pensó un momento y dijo “Enton De hecho, su falta de empatia se extendía
ces supongo que la mitad de un dieciseisavo a toda la humanidad. Al igual: que. Gaítonj
debe ser un treintaidosavó”. En fin, hísto- ■ Fisher estaba a favor de la eugenesia; favo
rías de niños. recía todo aquello que pudieraaumentár el -
Sin embargo, cuando fisher llegó a la índice de natalidad de las clases altas y . -
adultez, parece haber estado muy lejos de profesionales, como también de los artesa
ser adorable. Algunos observadores atribu nos capacitados. Él no sólo pensaba que la'
yen esta característica al hecho de que tuvo anticoncepción era una mala idea '-temía
una madre fría y poco emotiva. Cualquiera que las personas cuya descendencia era .
sea la razón, durante su vida, Fisher se vio menos deseable recurrieran a ella en me
involucrado en profundas enemistades, in nor proporción-, sino que defendía el in- .
cluso con alumnos que previamente habían fantícidio como herramienta de la función J
evolutiva. Probablemente también haya si dad profesional de mayor influencia tal vez -
do un acto de justicia que sus oportunida . hay sido la invitación a la Facultad del Es^
des de experimentar con la reproducción tado de lovva, en Ames, en los veranos, dé
nunca hayan llegado más allá de la crianza 1931 y 1936 (donde, según se dice, estaba
de sus propios hijos y de algunos cultivos de', muy perturbado por el terrible, calor que-
papa y trigo. . . guardaban sus sábanas todo.el día en el re
Lo que con más fuerza influyó en Físher frigerador).: En .Ames; Fisher provocó una
fueron probablemente sus catorce años de fuerte impresión en Qeorge Snedecor, un
trabajo en una estación experimental agríco profesor de matemática estadounidense.,
la llamada Rothamsted, en Hertfordshire, 25. ■ que también investigaba problemas agríco-
millas al norte de Londres. En Rothamsted,. las. Posteriormente, Snedecor escribió •un'
Fisher, al igual que Gosset en su fábrica de
, libro sobre estadístiea aplicád.a a laagricul-.;
cerveza en Dublín, enfrentó todo, tipo de
tura, que tomaba muchas ideas del trabajó
problemas prácticos, tales como averiguar s i ..
de Fisher en Rothamsted. El libro, difundió..
las aplicaciones anuales de abono mejora- ' ■
a tal:punto las ideas dé Fishérsóbre estádís-.
ban el rendimiento del campo a largo plazo o
si eran la causa de misteriosas disminuciones •. tica y diseño d e:investigación; que su. se -:
de producción luego dé muchas décadas. Tal . gunda edición vendió 100.000 copias. C. .
vez fue este aislamiento de las disputas perso Durante su estadía en Ames, Fisher.
nales entre los académicos de Londres y la también se ganó la admiración de E. ; F. '•
cercanía a los temas reales los que ayudaron á lindquist, profesor de educación en iá.UniA
Fisher a concentrarse en el desarrolló de la es-, í- versidad de lowa, con sede en la misma ciú-:.
tadística como una poderosa herramienta me dad. Él siguiente libro He Lindquist estuvo
todológica. totalmente permeado con las ideas de Fisher ■
Aunque con el tiempo Fishér accedió, aplicadas al campo de la educación;y la psi-:; .
al cargo de titular de la cátedra de Eugene- : coiogía, áreas en las que han desempeñado
sia en el University College, su; oportuni . un papel primordial hasta la actualidad.
cada población sobre la base de los valores de cada muestra). La razón entre las estimaciones de
varianza intergrupal e intragrupai (23,19/0,53) resulta ser 43,91; es decir F = 43,91. La razón F
calculada es considerablemente mayor a 1. De hecho, la razón F necesaria para rechazar la hipó
tesis nula al nivel 0,05 es sólo 3,01. Kazan y Shaver rechazaron con confianza la hipótesis nula, y
concluyeron que el nivel de celos varía según el estilo de vinculación.
Una analogía
Para algunos estudiantes, la siguiente analogía les resulta de gran ayuda para comprender el análi
sis de varianza, La analogía se realiza con lo que los ingenieros llaman razón señal-ruido. Por
ejemplo, la capacidad de comprender las palabras en una conversación por teléfono celular con in
terferencia depende de la potencia de la señal, en contraposición con la cantidad de ruido aleatorio.
En el caso de la razón F en e! análisis de varianza, la diferencia entre las medias de las muestras se
equipara con la señal, es la información de interés, y la variación dentro de las muestras se equipa
ra con el ruido. Cuando la variación entre las muestras es lo suficientemente grande en compara
ción con la variación dentro de las muestras, la conclusión es que existe un efecto significativo.
REALIZACIÓN DE UN ANÁLISIS DEVARIANZA
Luego de haber estudiado la lógica básica del análisis de varianza, analizaremos un ejemplo para
ilustrar los detalles. (Utilizamos un estudio ficticio para que los números sean simples).
Supongamos que un psicólogo especializado en temas sociales está estudiando la influencia
del conocimiento de la existencia de antecedentes crimínales en la percepción del jurado con res
pecto a la culpabilidad o inocencia del acusado. El investigador recluta 15 voluntarios que han si
do seleccionados para integrar un jurado (pero que todavía no han actuado en un juicio). El
investigador les muestra una filmación de video de un juicio de cuatro horas de duración en el que
una mujer es acusada de entregar cheques falsos. Antes de ver la cinta, se entrega a todos los par
ticipantes una “hoja de antecedentes” con la edad, estado civil, educación y otros datos sobre la
acusada. La hoja es la misma para los 15 participantes, con una diferencia: en el caso de 5 de los
participantes, la última sección de la hoja dice que la mujer ha sido condenada varias veces antes
de entregar los cheques falsos. (Llamaremos a los participantes que recibieron esta versión de la
hoja de antecedentes “grupo del informe delictivo”). En el caso de otros 5 de los participantes,
la última sección de la hoja dice que la mujer tiene una historia delictiva completamente limpia
(“grupo del informe en blanco”). Finalmente, en el caso de los cinco participantes restantes, la
hoja no hace ninguna mención acerca de antecedentes delictivos (“grupo sin información”).
Los participantes son asignados a los grupos al azar. Después de ver los videos del juicio, los
15 participantes califican a la acusada con una escala de 10 puntos, que va desde “completamente
seguro de que es inocente" (1) a “completamente seguro de que es culpable” (10). Los resultados
del estudio ficticio se indican en la tabla 11-3. La tabla muestra que las medias de los tres grupos
son diferentes (8,4 y 5), pero que además hay bastante variación dentro de cada uno de los tres
grupos (las estimaciones de varianza poblacional realizadas a partir de los valores de estos
tres grupos son 4,5,5,0 y 6,5).
Necesitamos realizar tres cálculos para probar la hipótesis que establece que las tres pobla
ciones son diferentes: a) una estimación de varianza poblacional sobre la base de la variación de
los valores dentro de cada muestra; b) una estimación de la varianza poblacional sobre la base de
las diferencias entre las medias de los grupos, y c) la razón de las dos, es decir, la razón F. (Ade
más, necesitamos el punto de corte correspondiente al nivel de significación elegido tomado de
una tabla F). Analicemos cada uno de estos cálculos por vez.
Tabla 11-3.
Resultados del estudio acerca de antecedentes delictivos. (Datos ficticios).
Grupo del informe delictivo Grupo del informe en blanco Grupo sin información
D e s v ío D e s v ío D e s v ío
D e s v ío d e c u a d r á tic a D e s v ío d e Q u a d r à tic o D e s v ío d e c u a d r á tic a
C a lific a c ió n la m e d ia d e la m e d ía C a lif ic a c ió n la m e d ia d e la m e d ia C a lif ic a c ió n la m e d ia d e la m e d ia
10 2 4 5 l ' l 4 -1 l
7 ~1 1 1 -3 9 6 1. 1
5 -3 9 3 -1 1 9 4 16
10 2 4 7 3 9 3 -2 4
JS J> J _4 0 0 _3 -2 4
X: 40 0 18 20 0 20 25 0 26
M = 4 0 /5 = 8. M - 2 0 /5 = 4 U ~ 2 5 /5 = 5
5*= 18/4 = 4,5 S2 - 2 0 /4 = 5 ,0 ^ = 2 6 / 4 = 6 ,5
La varianza poblacional puede estimarse a partir de cualquiera de los grupos (es decir, a partir de
cualquier muestra) utilizando el método usual para estimar la varianza poblacional a partir de una
muestra. Primero, calculamos la suma de los desvíos cuadráticos, es decir, tomamos el desvío de
cada registro con respecto a la media de su grupo, elevamos el desvío al cuadrado y sumamos to
dos los desvíos cuadráticos. Segundo, dividimos esa suma de desvíos cuadráticos por los grados
de libertad del grupo (los grados de libertad de un grupo constituyen la cantidad de valores obser
vados en el grupo menos 1). En el ejemplo, como lo indica la tabla 11-3, esto da una varianza po
blacional estimada de 4,5 sobre la base del grupo del informe delictivo, una estimación de 5,0
sobre la base del grupo del informe en blanco, y una estimación de 6,5 sobre la base del grupo sin
información.
No debemos olvidar que en el análisis de varianza, al igual que en la prueba t, se supone
que las poblaciones tienen la misma varianza. Dado que estas estimaciones pertenecen a po
blaciones que se supone tienen la misma varianza, las estimaciones basadas en los valores de
cada muestra están estimando todas el mismo número (la verdadera varianza poblacional).
Además, dado que los tamaños de muestra en este ejemplo son iguales, cada grupo representa
una estimación basada en la misma cantidad de información; por lo tanto, podemos combinar
estas estimaciones de varianza realizando un promedio ordinario. El resultado es una estima
ción general de la varianza poblacional sobre la base de la variación dentro de los grupos, que
es igual a la suma de 4,5, 5,0 y 6,5 (o sea 16) dividida por la cantidad de grupos (o sea 3). El
resultado es 5,33.
La varianza estimada sobre la base de la variación de los valores dentro de cada uno de los gru
pos es la estimación íntragrupal de la varianza. Se simboliza como S2DmtI0 ó CMDentr(). CMDen{roes
la abreviatura de eudrado medio dentro. El término cuadrado medio de los cuadrados es otro
nombre de la varianza, ya que la varianza es la media de los desvíos cuadráticos. (La 52Dej3íro ó
CMDenlt0 también se denomina a veces “varianza del error", y se simboliza como S2Efror ó CMError.)
La fórmula para la estimación Íntragrupal de varianza, cuando los tamaños de las muestras
son iguales, es:
(U -l)
En la fórmula, S 2 es la varianza poblacional estimada sobre la base de los valores del primer gru
po (el que proviene de la población 1); S \ es la varianza poblacional estimada sobre la base de los
valores del segundo grupo; S es la varianza poblacional estimada sobre la base dé los valores
del ultimo grupo, (Los puntos, o elipsis, en la fórmula indican que debemos completarla con la
varianza poblacional estimada correspondiente a todos los otros grupos que hay en el análisis).
^Gruposes la candóad grupos.
Utilizando esta fórmula para realizar los cálculos, obtenemos:
„2 _ X(M~GM)2
(U-2)
M Skntre
En el ejemplo referido a los antecedentes delictivos, las tres medias son 8,4 y 5. Los cálculos apa
recen en la tabla 11-4.
De la varianza estimada de la distribución de medias a «na varianza estimada de la po
blación de valores observados. Lo que acabamos de calcular a partir de una muestra de unas po
cas medias es la varianza estimada de una distribución de medias. A partir de ese dato queremos
estimar la varianza de la población (la distribución de valores individuales) en la que se basa esa
distribución de medias. En el capítulo 7 vimos que la varianza de una distribución de medias es
menor que la varianza de la población en la que se basa (la distribución de valores individuales).
Esto ocunre porque las medias tienen menos posibilidades de ser extremas que los valores indivi
duales (ya que es poco probable que varios valores extremos en la misma dirección puedan que
dar incluidos en una misma muestra). Específicamente, en el capítulo 7 aprendimos que la
varianza de una distribución de medias es la varianza de la distribución de valores individuales di
vidida por la cantidad de valores de cada muestra.
Tabla 11-4.
Varianza de la distribución de medias, estimada sobre la base de las medias de los tres grupos
experimentales del estudio referido a los antecedentes delictivos (datos ficticios).
Medias Desvíos de la Desvío cuadrátíco
muéstrales gran media de ia gran media
m (M-GM) (M~~GMf
4 -1,67 2,79
8 2,33 5,43
5 -0,67 0,45
X; Í7 -0,01 8,67
= 17/3 » 5,67; SjA ~ %{M- - 8,67/2 - 4,34.
Ahora, sin embargo, vamos a revertir lo que hicimos en el capítulo 7, en el que calculamos la va
rianza de la distribución de medias dividiendo la varianza de la distribución de observaciones in
dividuales por el tamaño de la muestra. Ahora vamos a calcular la varianza de la distribución de
valores individuales multiplicando la varianza de la distribución de medias por el tamaño de la
muestra. {Véase tabla 11-5). Es decir, para obtener la varianza poblacional de observaciones indi
viduales, multiplicamos la estimación de la varianza de la distribución de medias por el tamaño
de la muestra. El resultado de este proceso es la estimación intergrupal de la varianza. Lo anterior
se expresa bajo la fórmula (en los casos en que los tamaños de muestra son iguales),
« L * ó C M ^ = (S ÌX iO = (4,34)(5) =21,7
Resumiendo, el procedimiento de estimación de la varianza poblacional, sobre la base de las dife
rencias entre las medias de los grupos, es el siguiente: a) calcular la varianza estimada de la distri
bución de medias y luego b) multiplicar esa varianza estimada por la cantidad de observaciones
de cada grupo.
Tabla 11-5.
Comparación del cálculo de varianza de una distribución de medias a partir de la varianza de una
distribución de observaciones individuales al revés.
D e distribución de individuos a distribución de m edías; = S 2!N
D e distribución de m edias a distribución d e individuos: = S 2 - ( S ^ ) (/V)
Figura 11-3,
U n a d istrib u ció n i l
Cálculo de la razón F
La razón F es el cociente entre la estimación intergrapal de la varianza poblacíonal y la estima
ción intragrupal de la varianza poblacíonal, Se representa bajo la fórmula,
ó (11-5)
■^Dentro CM)emro
En el ejemplo que analizamos, el ratio entre intergrupal e intragrupal es el cociente entre 21,7 y
5,33. Realizando la división obtenemos una razón F de 4,07. Se expresa,bajo la fórmula,
La distribución F
El siguiente paso es determinar .el punto de corte a partir del cual se considera que F es lo sufi
cientemente grande como para rechazar la hipótesis nula. Esto requiere una distribución de razo
nes F que podamos utilizar para establecer qué es una razón F extrema.
En la práctica, simplemente buscamos el punto de corte necesario en una tabla. Pero para en
tender de dónde proviene el número de la tabla, necesitamos comprender la distribución F. La
manera más fácil de comprender esta distribución es analizar cómo haríamos para elaborar una.
Supongamos que comenzamos con tres poblaciones idénticas. Después, seleccionamos al
azar cinco valores de cada una, y sobre la base de esas tres muestras (de cinco valores cada una),
calculamos la razón F. (Es decir, utilizamos estos valores para calcular una estimación intergra-
pal y una estimación intragrupa!, y después dividimos la primera por la segunda). Digamos que ai
realizar ese proceso, la razón F a la que llegamos es de 1,36. Ahora bien, seleccionamos otras tres
muestras al azar de cinco valores cada una y calculamos la razón F utilizando estas tres muestras.
Tal vez obtenemos una F de 0,93. Si realizamos todo este proceso muchas veces, finalmente ob
tendremos muchas razones F. La distribución de todas las razones F posibles calculadas del mo
do descripto (utilizando muestras aleatorias de poblaciones idénticas) se denomina distribución
F. La figura 11-3 muestra un ejemplo de distribución F. (Existen muchas diferentes distribucio
nes F, y cada una tiene una forma levemente distinta. La forma exacta depende de cuántas mues
tras tomemos cada vez y de cuántos valores haya en cada muestra, pero la forma general es
similar a la que aparece en la figura).
En realidad, nadie se dedica a elaborar su propia distribución F del modo arriba mencionado.
Se trata de una distribución matemática cuyas características exactas pueden encontrarse a partir
de una fórmula. También puede probarse matemáticamente que si tuviéramos la paciencia de se
guir este procedimiento el tiempo necesario, obtendríamos el mismo resultado.
Como podemos observar en la figura 11-3, la distribución F no es simétrica sino que tiene
una larga cola hacia la derecha. La razón de esta asimetría positiva es que una distribución F
es una distribución de razones de varianzas, y las varianzas siempre son números positivos (una
varianza es un promedio de desvíos cuadráticos, y cualquier número elevado al cuadrado es posi
tivo). Una razón entre un número positivo y otro número positivo nunca será menor a 0. Pero na
da impide que una razón sea un número muy alto. Por lo tanto, las razones F no pueden ser
menores que 0 y pueden ser bastante altas.1(La mayoría de las razones F se apilan cerca del valor
1, pero se dispersan más sobre el lado positivo, donde tienen espacio para dispersarse).
La tabla F
La tabla F es un poco más complicada que la tabla t, ya que existe una distribución Fdiferente se
gún los grados de libertad utilizados en la estimación intergrupal de varianza y según los grados
de libertad utilizados en la estimación íntragrupai de varianza. Es decir, deben considerarse dos
tipos distintos de grados de libertad para buscar el punto de corte necesario. Unos son los grados
de libertad entre, que también se denominan grados de libertad delnumerador. Se trata de los
grados de libertad utilizados en la estimación intergrupal de la varianza; el numerador de la razón
F. Los otros son los grados de libertad dentro, también denominados grados de libertad del
denominador. Son los grados de libertad totales en el cálculo de la estimación íntragrupai de la
varianza, es decir, el denominador de la razón F.
1 Es posible, por casualidad, que F s e a mayor o menor a 1 en cualquier situación en particular. Tanto la intergrupal co
mo la íntragrupai son sólo estimaciones, y ambas pueden variar un poco aun cuando la hipótesis nula sea verdadera. Si
F es considerablemente mayor a 1, rechazamos la hipótesis nula que establece que en realidad todas las poblaciones
tienen la misma media, ¿Pero qué sucede si F es considerablemente menor, a 1? Esto rara vez sucede. Cuando ocurre,
podría indicar que existe menos variación entre los grupos de la que se esperaría por casualidad; por lo tanto, algo está
restringiendo la variación entre los grupos. Una causa podría ser que, al organizar el experimento, se equiparen los su
jetos entre los grupos en cuanto a determinadas variables (tales com o edad o inteligencia) que resulten estar relaciona
das con la variable bajo estudio. Una implicancia de esta posibilidad es que equiparar grupos de este modo, antes de
realizar el estudio, podría realmente evitar un resultado significativo. Aun si existen diferencias reales entre las medias
de la población, la influencia de estas diferencias en la estimación intergrupal puede ser compensada por el efecto de la
equiparación. Este tema es tratado más adelante en el capítulo.
Los grados de libertad entre son la cantidad de grupos menos 1 (porque ese es el grado de liber
tad utilizado para calcular la estimación intergrupal de la varianza). Se expresan bajo la fórmula,
ík « » = * W .~ 1 ("-«>
Los grados de libertad dentro son la suma de los grados de libertad de todos los grupos (ya que
todas sus estimaciones están incluidas en ia combinación). Se expresan bajo la fórmula,
8 l Dentro “ 8 l t + S l2 + - • ■+ 8 ¿Último C1 1
En el ejemplo referido a los antecedentes delictivos, los grados de libertad entre son 2 (3 medias
menos 1). Aplicando la fórmula,
^Entre ~ ^Grupos~ 1 = 3 - 1 = 2.
Los grados de libertad dentro son 12, ya que cada grupo tiene 4 grados de libertad en los que se
basa la estimación (5 registros menos í) y hay 3 grupos en total que, sumados, dan como resulta
do 12 grados de libertad. Aplicando la fórmula,
Tabla 11-6.
Puntos de corte en la distribución F. (Información parcial).
G rados de
lib er ta d d el N iv e l de
d e n o m in a d o r sig n ifica ció n G ra d o s de lib er ta d d el n u m era d o r
i 2 3 4 5 6
10 0,01 10,05 7,56 6,55 6,00 5,64 5,39
0,05 4,97 4 ,1 0 3,71 3,48 3,33 3 ,2 2
0 ,1 0 3,29 2,93 2,73 2,61 2,52 2 ,4 6
11 0,01 9,65 7,21 6,22 5,67 5,32 5,07
0,05 4,85 3,98 3,59 3,36 3,20 3,10
0,1 0 3,23 2,86 2 ,6 6 2 ,5 4 . 2,45 2,39
12 0,01 9,33 6,93 5,95 5,41 5,07 4 ,8 2
0,05 4,75 3,89 3,49 3,26 3,11 3,00
0 ,1 0 3,18 2,81 2,61 2,48 2,40 2,33
13 0,01 9,07 6 ,7 0 5 ,7 4 5,21 4 ,8 6 4 ,6 2
0,05 4,67 3,81 3,41 3 ,1 8 3,03 2 ,9 2
0,10 3,14 2 ,7 6 2 ,5 6 2 ,4 3 2,35 2,28
La hipótesis nula establece que las tres poblaciones tienen la misma media (p^ = |x2 = p,3). La hi
pótesis de investigación establece que las medias poblacionales son diferentes,
2. Determinar las características de la distribución comparativa. La distribución compa
rativa es una distribución F con 2 y 12 grados de libertad.
3. D eterm inar el punto muestral de corte en la distribución comparativa, a p artir del
cual debería rechazarse la hipótesis nula. Utilizando la tabla F para el nivel 0,05 de significa
ción, la razón F necesaria es 3,89.
4. Determinar el valor muestral en la distribución comparativa. En el análisis de varian-
za, la distribución comparativa es una distribución F, y el valor muestral en esa distribución es,
por lo tanto, la razón F. En el ejemplo, la razón F que calculamos era 4,07.
5. C om p arar los valores de los pasos 3 y 4 p ara decidir si se rechaza o no la hipóte-:
sis nula. En el ejemplo que estamos analizando, la razón F calculada es más extrema que el
punto de corte ai nivel 0,05 de significación. Por lo tanto, el investigador rechazaría la hipótesis
nula que establece que los tres grupos provienen de poblaciones con la misma media. El resul
tado sugiere que provienen de poblaciones con diferentes medias; que las personas expuestas a
diferentes tipos de información (o a la falta de información) acerca de los antecedentes delicti
vos de un acusado, en una situación de este tipo calificarán de forma diferente aí acusado en
cuanto a su culpabilidad.2
Otro ejemplo
Mikulincer (1998) realizó una serie de estudios en Israel utilizando la misma medida de clasifica
ción de estilo de vinculación que vimos anteriormente en este capítulo (véase tabla 11-1). Uno de
sus estudios incluía a 30 alumnos universitarios (10 para cada estilo de vinculación), todos los
cuales tenían relaciones amorosas serias. Como parte del estudio, cada noche cada alumno anota
ba si durante el día su pareja había hecho algo que traicionara su confianza. Los participantes ano
taban hechos tales como que su pareja llegaba muy tarde a un encuentro acordado o que
“olvidaba” comentar al participante algún plan de importancia. Los resultados, junto con los
cálculos del análisis de varianza, se indican en la tabla 11-7. A continuación, se detallan los pasos
de la prueba de hipótesis.
2 Varios estudios reales han investigado sobre el hecho de si conocer ios antecedentes delictivos del acusado afecta la
probabilidad de que sea condenado. En términos generales, la conclusión parece ser razonablemente coherente con la
del estudio ficticio aquí descripto. Para una revisión de tales estudios, véase Dañe y Wrightsman (1982).
Tabla 11-7.
Cantidad de hechos que traicionan la confianza de individuos “cometidos por sus parejas durante
tres semanas” con tres estilos distintos de vinculación.
E s t ilo d e v in c u la c ió n
M D esvío D e sv ío cu a d r á tic o
3, Determinar el punto de corte en la distribución comparativa, a partir del cual debería rechazarse la hipótesis nula.
a) D eterm inar el nivel de significación deseado,
b) B uscar en una tabla F el punto de corte indicado, utilizando los grados d e libertad calculados en e l paso 2.
5. Comparar los valores de lo s pasos 3 y 4 para decidir si se rechaza o no la hip ótesis nula.
( 11- 8)
® Dentro
Am, (U-9)
“^Dentro
Las medidas de Cohén para el tamaño del efecto del análisis de varianza son: 0,10 para un efecto
pequeño, 0,25 para un efecto mediano y 0,40 para un gran tamaño deí efecto.
Analicemos nuestro experimento ficticio acerca de los antecedentes delictivos. En el estudio
calculamos que S^, la varianza estimada de la distribución de medias basada en las medias de las
tres muestras, era igual a 4,34. SM, la raíz cuadrada de S ^, es 2,08. Calculamos que 5^eíiü0, la esti
mación de la varianza de cada población de individuos, basada en las estimaciones de varianza
utilizando los valores de cada grupo, era igual a 5,33.5Dentr0, la raíz cuadrada de S$entxo, es 2,3 i .
Aplicando la fórmula para el tamaño del efecto estimado a partir de un estudio completo,
f =* Sm- = ^ = 0,90
^Dentro 2,31
Se trata de un tamaño del efecto muy grande (gracias a nuestros datos, ficticios).
En el estudio referido a los estilos de vinculación realizado porMikulmcer (1998),
En este caso, también tenemos un gran tamaño del efecto. Tanto en el estudio acerca de los ante
cedentes delictivos como en el estudio realizado por Mikulincer, esperaríamos un tamaño del
efecto importante sólo por saber que F fue significativa en un estudio con tamaños de muestra pe
queños (véase capítulo 8).
También sucede que, con un poco de manipulación algebraica, podemos estimar el tamaño
del efecto sólo conociendo F y la cantidad de observaciones en cada grupo. La fórmula es,
( 11- 10)
3 En ei capítulo 12, después de que hayamos presentado el método del modelo estructural para el análisis de varianza,
aprenderemos cómo calcular otro tipo de tamaño del efecto, la “proporción de varianza justificada”. Este indicador del
tamaño del efecto está relacionado con el mismo concepto en el análisis de regresión (capítulo 4), por eso tiene un sig
nificado más directo para muchos investigadores, y lo veremos con frecuencia. En el capítulo 12 trataremos la relación
de / con este indicador del tamaño del efecto.
Por ejemplo, en el estudio acerca de los antecedentes delictivos habíamos calculado que F era
4,07, y había cinco personas en cada grupo. Utilizando la fórmula,
( p _ -fê,07 _ 2,02 ^
'vr
7=
TZ S ~ 2,24
Para el estudio acerca del estilo de vinculación realizado por Mikulincer (1998),
f - Æ =Î -0,60
f 4n VÍ0 ” 3,16
(Los resultados son iguales a los que calculamos utilizando las estimaciones de varianza). La fór
mula que acabamos de ver es muy útil cuando se evalúa el tamaño del efecto de un estudio en una
publicación científica, en las que con frecuencia no se proporcionan detalles sobre las varianzas.
Potencia
La tabla 11-9 indica la potencia aproximada para un nivel de 0,05 de significación, con tamaños
del efecto pequeños, medianos y grandes; tamaños de muestra de 10,20,30,40,50 y 100 por gru
po, y para tres, cuatro o cinco grupos. Los anteriores son los valores más comunes de los distintos
parámetros que influyen sobre la potencia.4
Analicemos un estudio planificado que compara cinco grupos delO participantes cada uno,
con expectativa de un gran tamaño del efecto (0,40), y que utiliza el nivel 0,05 de significación.
Basándonos en la tabla 11-9, el estudio tendría una potencia de 0,56, lo que implica que aun si la
hipótesis de investigación es en efecto verdadera y tiene un gran tamaño del efecto, existe sólo un
poco más del 50 % de posibilidades (56%) de que el estudio resulte significativo.
Como observamos en capítulos anteriores, determinar la potencia es especialmente útil cuan
do se interpretan las implicancias prácticas de un resultado no significativo. Por ejemplo, supon
gamos que hemos leído un estudio que utiliza un análisis de varianza para cuatro grupos de 30
participantes cada uno, en el que el investigador informa un resultado no significativo al nivel
0,05 de significación. La tabla 11-9 indica una potencia de sólo 0,13 para un tamaño del efecto
pequeño. Esto sugiere que aun si dicho efecto leve existe en la población, hubiera sido muy im
probable que este estudio resultara significativo. Pero la tabla indica una potencia de 0,96 para un
gran tamaño del efecto, lo que sugiere que si existiera un gran efecto en la población, casi segura
mente se habría reflejado en el estudio.
La tabla 11-10 nos indica la cantidad aproximada de participantes necesarios en cada grupo para
tener un 80% de potencia al nivel 0,05 de significación, con tamaños estimados del efecto peque
ños, medíanos y grandes y en estudios con tres, cuatro y cinco grupos.5 Por ejemplo, supongamos
4 Cohen (1988, pp. 289-354) proporciona tablas más detalladas. Al utilizar estas tablas, se debe observar que el valor u
en ia parte superior de cada una de las tablas se refiere a gíEntre, el cual en el caso de un análisis de varianza de un crite
rio es la cantidad de grupos menos 1, y no la cantidad de grupos, como sucede en la tabla I i -9.
5 Cohen (1988, pp. 381-389) nos proporciona tablas más detalladas. Sise utilizan, se debe tener en cuenta la nota a¡ pie
número 4 de éste capítulo.
Tabla li-9.
P o ten cia a p ro x im ad a p a ra estu d ios q u e u tiliza n el an álisis de varian za p rob an d o la h ip ótesis a nivel
0,05 de sign ificación .
*Casi 1,
que estamos planificando un estudio que involucra cuatro grupos, del cual esperamos un tamaño
del efecto pequeño (y utilizáramos el nivel 0,05 de significación). Para obtener una potencia del
80% necesitaríamos 274 participantes en cada grupo, un total de 1.096. Sin embargo, suponga
mos que pudiéramos adaptar el plan de investigación de tal forma que fuera razonable predecir un
gran tamaño del efecto (tal vez utilizando medidas más precisas y una manipulación experimental
más poderosa). En ese caso, necesitaríamos sólo 18 participantes para cada uno de los cuatro gru
pos, un total de 72.
T abla 11-10.
C an tid ad ap ro x im ad a de p articip an tes n ecesarios en ca d a gru p o (su p on ien d o qu e las m u estras
ten g a n el m ism o tam año) para lo grar u n 80% d e p o ten cia en u n anáfisis de varian za de un criterio
qu e p ru eb a la h ip ótesis al nivel 0,05 d e sign ificación .
Existe una controversia relacionada con el análisis de varianza que se refiere al diseño de experi
mentos. Comúnmente, la forma óptima de emprender un experimento es utilizando asignaciones
totalmente aleatorias para las condiciones experimentales (véase apéndice A). Sin embargo, in
cluso con la asignación aieatoria continúa existiendo cierta variación aleatoria debido a las dife
rencias entre los participantes, lo cual agrega confusión al experimento. Por lo tanto, algunos
investigadores modifican la asignación aleatoria estricta preparando sus estudios de modo de
asegurarse que los participantes de cada grupo experimental sean, en líneas generales, semejan
tes en cuanto a una o más variables relevantes para el estudio. Analicemos un estudio en ei que
alumnos de cuarto grado serán asignados a uno de los tres diferentes programas experimentales
de matemática. Es probable que los investigadores quieran asegurarse que el ci promedio y la
capacidad promedio para la matemática sean iguales en cada uno de los grupos antes de comen
zar el experimento.6
La controversia acerca de la utilización.de equiparación de grupos, para minimizar las dife
rencias promedio en las variables relevantes, está relacionada con el efecto que ese procedimien
to tiene sobre la potencia del análisis de varianza para probar el resultado del estudio. La
selección sistemática reduce artificialmente la variación natural entre muestras (a tal punto que
las variables sobre las cuales se realiza la equiparación están relacionadas con la variable estudia
da). SÍ disminuimos la variación aleatoria entre las muestras, la variación general entre medias, es de
cir, el numerador de la razón F, en líneas generales sena menor. Por el contrario, el denominador
de la razón F, la estimación intragrupal de la varianza, no es afectada por el hecho de que se reali
ce una equiparación de grupos o una asignación aleatoria ordinaria. Si reducimos el numerador
y mantenemos igual el denominador, la razón F sólo puede disminuir. Una razón F menor signifi
ca menor posibilidad de obtener un resultado significativo, aun si existe una verdadera diferencia
de medias entre las poblaciones representadas por las condiciones experimentales; es decir, dis
minuye la potencia. (Lo que acabamos de describir se contradice con lo que nos diría nuestra in
tuición, ya que, a primera vista, reducir la ‘‘confusión” debería aumentar la potencia. El problema
radica en que estamos reduciendo la confusión de manera despareja; por lo tanto, la confusión
que normalmente contribuiría a la estimación intergrupal de la varianza se pierde, mientras que la
6 Una forma de realizar esta selección sería comenzar con un grupo de todos los participantes disponibles. Primero se
leccionaríamos al azar tantos com o fueran necesarios para el primer grupo. Luego seleccionaríamos ai azar alumnos
adicionales para cada uno de los otros grupos, unos pocos por vez, adaptando las inclusiones coherentemente hasta que
los tres grupos tuvieran los mismos promedios de ci y capacidad matemática. En este tipo de equiparación de grupos, la
estructura resultante sigue siendo un verdadero experimento: el experimentador determina en qué grupo se incluye un
participante utilizando procedimientos aleatorios; cualquier niño tiene las mismas posibilidades de pertenecer a cual
quiera de los tres grupos. N o se debe confundir esta clase de equiparación de grupos (la equiparación que vem os en es
ta sección) con otros dos tipos de equiparación. Uno de estos otros tipos de equiparación se realiza cuando la
asignación aleatoria no e s posible. Se intenta seleccionar personas de diferentes poblaciones preexistentes, de forma tal
que las muestras sean lo más similares posibles. Un ejemplo sería un estudio en el que se comparen hombres y mujeres
o personas de tres nacionalidades diferentes. En tal estudio, no podríamos asignar a las personas al azar a los grupos de
los diferentes sexos o nacionalidades, pero podríamos intentar que los grupos que estudiamos sean similares en cuanto
a la edad, preparación educativa, y así sucesivamente. Es un método mucho menos riguroso que la verdadera asigna
ción aleatoria a los grupos.
Existe un segundo tipo de equiparación que no estamos tratando aquí, que es una especie de equiparación uno-a-uno.
Por ejemplo, un investigador podría seleccionar series de tres estudiantes, en las que los tres estudiantes son muy sim i
lares y, luego, a partir de cada serie, los tres son asignados al azar a cualquiera de las tres condiciones experimentales.
Este tipo de equiparación individual, que no es controvertida, es casi siempre ventajosa, pero rara ve 2 práctica.
confusión que contribuye a la estimación intragrupai de varianza permanece igual). Por lo tanto,
la recomendación tradicional en la mayoría de los libros de diseño experimental es que no se uti
lice este tipo de equiparación de grupos al programar los experimentos.
Sin embargo, Ross y Klein (1988) han cuestionado esta recomendación tradicional. Ellos re
conocen que con la equiparación de grupos, el numerador de la razón F (y por lo tanto la razón F
en su totalidad), en líneas generales se reduce. Pero también señalan que esto sucede en líneas ge«
neraies, y que es bastante posible que, en determinadas situaciones que pueden especificarse, la
razón F en realidad aumente por causa de ese procedimiento.
Ross y Klein realizaron una serie de estudios de Montecario (véase cuadro 10-1) para deter
minar el efecto real de la equiparación de grupos en distintas condiciones. El resultado de sus es
tudios fue que utilizar la equiparación de grupos, en comparación con la asignación aleatoria
ordinaria, a) es conveniente si la hipótesis nula es verdadera, en cuanto a que se reduce la posibi
lidad de cometer un error Tipo I (rechazar equivocadamente la hipótesis nula); b) no es conve
niente cuando la hipótesis de investigación es verdadera, pero las diferencias reales entre las
medias grupales son pequeñas debido a que, en este caso, la potencia se reduce, y c) es convenien
te cuando la hipótesis de investigación es verdadera y las diferencias reales entre las medías gru
pales son grandes porque, en este caso, la potencia aumenta. De todos modos, en todos tos casos
la mejor opción es utilizar la equiparación de gmpos, pero analizando los resultados con un pro
cedimiento estadístico más sofisticado denominado “análisis de covarianza” (brevemente des-
cripto en el capítulo 17). El análisis de covarianza tiene en cuenta sistemáticamente ios valores
observados en cada participante en las variables en las que se realiza ía equiparación. Lamenta
blemente, este procedimiento no puede ser utilizado en muchos casos, ya sea porque no pueden
cumplirse los exigentes supuestos o porque la información necesaria no está disponible. Por lo
tanto, cuando en un estudio es factible la equiparación de grupos, ésta parece recomendable en las
situaciones a) y c) establecidas por Ross y Klein, aun sí el procedimiento especial de anáfisis de
covarianza no puede utilizarse, y el querido y viejo anáfisis de varianza estándar sí.
Resumen
El a n o v a prueba la hipótesis de que hay diferencias entre las medias de varias poblaciones. El
procedimiento compara dos estimaciones de la varianza poblacional. Una, denominada “estima
ción intragrupal”, que se determina por el promedio de las estimaciones de la varianza realizadas
a partir de cada una de las muestras. La otra, denominada “estimación íntergrupaT, se basa en la
variación entre las medias muéstrales.
La razón F es igual a la estimación intergrupal dividida por la estimación intragrupal. La hi
pótesis nula establece que todas las muestras provienen de poblaciones con la misma media. Si la
hipótesis nula es verdadera, la razón F debería ser aproximadamente 1, ya que las dos estimacio
nes de la varianza poblacional se basan en lo mismo, la variación dentro de cada población. Pero
si la hipótesis de investigación es verdadera, y las muestras provienen de poblaciones con diferen
tes medias, la razón F debería ser mayor a 1, ya que la estimación intergrupal se ve, en ese caso,
influenciada tanto por la variación dentro de las poblaciones como por la variación entre las po
blaciones, mientras que la estimación intragrupal continúa afectada sólo por la variación dentro
de cada una de las poblaciones.
Cuando las muestras tienen el mismo tamaño, la estimación intragrupal de la varianza pobla-
cional es el promedio de las estimaciones de la varianza poblacional calculadas a partir de cada
muestra. La estimación intergrupal de la varianza poblacional se realiza en dos pasos: primero, se
estima la varianza de la distribución de medias sobre la base de las medias de las muestras reales
(para realizar este cálculo se utiliza la fórmula usual de estimación de la varianza poblacional a
partir de valores muéstrales). En segundo lugar, se multiplica la estimación anterior por el tamaño
de la muestra de cada grupo. A través de este segundo paso obtenemos la varianza de la distribu
ción de valores individuales a partir de la varianza de la distribución de medias.
Los supuestos del análisis de varianza son los mismas que los de la prueba t; las poblaciones
deben estar normalmente distribuidas y tener las mismas varianzas. Se ha descubierto que el aná
lisis de varianza, al igual que la prueba t, otorga resultados razonablemente precisos aun cuando
se violen moderadamente los supuestos.
El tamaño del efecto en el análisis de varianza puede calcularse como el desvío estándar de la
distribución de medias dividido por el desvío estándar de la distribución de observaciones indivi
duales. En el caso de un estudio ya realizado, también se puede calcular como la raíz cuadrada de
F dividida por la raíz cuadrada de la cantidad de participantes en cada grupo. La potencia depen
de del tamaño del efecto, de la cantidad de personas que participan en el estudio, del nivel de sig
nificación y de la cantidad de grupos.
Asignar participantes sistemáticamente a los grupos experimentales, para asegurar prome
dios similares en cuanto a variables de fondo, generalmente reduce la potencia. Esto ocurre por
que el procedimiento reduce la contribución de varianza aleatoria a la estimación intergrupal,
pero no a la estimación intragrupal. Sin embargo, en ciertas condiciones el procedimiento puede
aumentar la potencia.
Términos clave
- ANOVA. - Distribución F. - Grados de libertad
- Grados de libertad intergrupales - Razón F. intragrupales (g/DenlX0).
~ Tabla F. - Estimación intragrupal
-Estimación intergrupal de la varianza - Gran media iGM). de la varianza poblacional
poblacional (S¡ntre ó CMEntre). - Grados de libertad ^Dentro ^ ^^Dentro^'
- Grados de libertad del denominador del numerador (g¿Entre).
^Deníro^*
- Tamaño del efecto del análisis
de varianza (j).
Tabla 11-11.
Medias de las escalas principales de medición de la personalidad correspondientes a cada condición
experimental (datos ficticios).
E sc a la M a d re P a d re A m igo P r o fe so r F (3 ,5 6 )
Conform idad 24 21 12 16 4 ,2 1 * *
E xtroversion 14 13 15 13 2,05
M adurez 15 15 22 19 3,11*
C onfianza 38 42 27 32 3 ,58*
en s í m ism o
2 estructural
en el análisis
I de varianza
D e sc r ip c ió n d ei capitulo
E
visión, podemos decir que el principio fundamental es que se realizan dos estima
ciones de la varianza poblacional. Una, denominada estimación intergrupal de la
m varianza poblacional (5‘2Entre ó CÜÍEntre), se basa en la variación entre las medias de*
1
* los grupos. La otra, denominada estimación intragrupal de la varianza poblacional
(■^Dentro ^ ^D entro^se ^asa en Ia variación de los registros dentro de cada uno de los grupos. Si la
hipótesis nula es verdadera, las dos estimaciones de la varianza poblacional deberían ser aproxi
madamente iguales y, por ende, la razón entre la estimación intergrupal y la estimación intragru-
pal, es decir, la razón F, debería ser aproximadamente 1. En cambio, cuando la hipótesis nula es
falsa, la estimación intergrupal estará influida por la diferencia entre las medias pobiacionales.
Por lo tanto, la estimación intergrupal será mayor que la intragrupal, y la razón F será mayor a 1.
En la prueba de hipótesis comparamos la razón F calculada con un punto de corte (obtenido de la
tabla F). El punto de corte es el extremo inferior de un intervalo de valores mayores que 1, el cual
se extiende sin límite. La probabilidad de obtener una razón F en ese intervalo es del 5% (o del
1%) si la hipótesis nula es verdadera.
Partiendo de esta base, en el capítulo 12 exploramos una forma alternativa, pero matemática
mente equivalente, de interpretar el análisis de varianza. Esa alternativa se denomina modelo es
tructural. Si bien también se aplica la lógica central aprendida en el capítulo 11, el modelo
estructural proporciona una forma diferente y más flexible de calcular las dos estimaciones de va
rianza poblacional. Este nuevo método facilita el manejo de aquella situación en la que la canti-
dad de individuos de cada grupo no es la misma, situación especial que analizamos en este capítu
lo. Además, al comprender el modelo estructural podremos entender con mayor profundidad la
lógica implícita del análisis de varianza. Finalmente, la comprensión del método del modelo es
tructural ayudará a entender la forma en que las computadoras presentan los resultados del análi
sis de varianza.
Partición de la desviación
La idea central del modelo estructural requiere pensar en términos de desviación. En primer lu
gar, existe la desviación de una observación con respecto a la gran media. La gran media es la me
dia de todas las observaciones, independientemente del grupo en el que se encuentran. En el
ejemplo del estudio acerca de los antecedentes delictivos, analizado en el capítulo 11, la gran me
dia de los 15 valores observados era 85/15 - 5,67. En el ejemplo del estudio referido a estilos de
vinculación, estudiado en el mismo capítulo, la gran media de las 30 observaciones con respecto
a la traición de la confianza era 3,33.
Después debemos pensar que la desviación con respecto a la gran media tiene dos partes:
a) la desviación de la observación con respecto a la media de su grupo y b) la desviación de la me
dia de su grupo con respecto a la gran media. Analicemos a un participante en el estudio acerca de
los antecedentes delictivos que calificó la culpabilidad del acusado con 10. La gran media de las
calificaciones de culpabilidad de todos los participantes era 5,67. La calificación de la persona en
cuestión presenta una desviación total de 4,33 (10 - 5,67 - 4,33). La media, únicamente del gru
po de antecedentes delictivos, era 8. Por lo tanto, la desviación de la calificación de esta persona
con respecto a la media de su grupo es 2 (es decir, 10 - 8 = 2), y la desviación de la media grupal con
respecto a la gran media es 2,33 (es decir, 8 - 5,67 = 2,33). Es importante observar que esas dos
desviaciones (2 y 2,33) suman la desviación total de 4,33. La figura 12-1 gráfica lo anterior. Es
conveniente estudiar este concepto hasta comprenderlo bien.
Figura 12-1. E jem p lo tom ado d e un e stu d io fic ticio acerca d e an teced en tes d e lic tiv o s, e n e l q u e se repre
sen ta la d e sv ia c ió n d e la o b serv a ció n d e un ind ividu o c o n resp ecto a la gran m ed ia c o m o la su m a d e la
d e sv ia c ió n d e la o b serv a ció n ind ividu al c o n respecto a la m ed ia d e su grupo, m ás la d e s v ia c ió n d e la m ed ia
d e su grupo c o n resp ecto a la gran m edia.
Suma de las desviaciones cuadráticas
El siguiente paso en la utilización de estas diferentes desviaciones es elevar a cada una al cuadra
do y sumar cada tipo de desviaciones cuadráticas de todos los participantes. El resultado es la su
ma de desviaciones cuadráticas de cada tipo de desviación. Sucede que la suma de desviaciones
cuadráticas de cada observación con respecto a la gran media es igual a a) la suma de las desvia
ciones cuadráticas de cada observación con respecto a la media de su grupo más b) la suma de las
desviaciones cuadráticas de la media del grupo de cada-observación con respecto a la gran inedia.
El principio que acabamos de explicar se puede expresar con una fórmula:
2 TL(M-GM)2 Entre
Ó C^Entre ~ ( 12- 2)
E"íre “ filEntre
, £%ntre
2 S(X-M )* SCD M
^Dentro j ° ^^Dentro" , (12-3)
£ ¿Dentro ^Dentro
Es importante mencionar que hemos ignorado ia suma de desviaciones cuadráticas de cada
observación con respecto a la gran media (SCTota!). Esta suma de cuadrados es útil principalmente
para controlar nuestra aritmética. Recordemos que SCTotaí = SCDer¡Cr0 + SCgritre.
La figura 12-2 nuevamente representa la partición de la desviación en dos partes, pero esta
vez acentúa la estimación de la varianza poblacional con la que se relaciona cada desviación.
Relación del enfoque del modelo estructural con el método del capítulo 11
Los métodos que acabamos de describir para el cálculo de las estimaciones intragrupal e intergru-
pal de la varianza, utilizando el modelo estructural, dan exactamente el mismo resultado que los
métodos que aprendimos en el capítulo 11. (Si al alumno le divierte realizar manipulaciones alge
braicas, podría intentar llegar a las fórmulas anteriores a partir de las que acabamos de aprender).
De todos modos, los procedimientos que realizamos para calcular esas estimaciones son bas
tante diferentes. En el caso del enfoque del modelo estructural que vemos en este capítulo, cuan
do desarrollamos el método de estimación intragrupal de la varianza, en realidad nunca calcu
lamos la estimación de varianza de cada grupo para luego promediarlas. Del mismo modo, en el
caso de la estimación intergrupal, con el método del modelo estructural, nunca multiplicamos
ningún número por la cantidad de observaciones de cada muestra. Sin embargo, lo importante es
que, con ambos métodos, obtenemos las mismas estimaciones intragrupal e intergrupal de varian
za. Por lo tanto, de cualquier modo, los componentes utilizados para calcular la razón F son los
mismos. Y de todas maneras, el resultado es el mismo.
La lógica implícita en el análisis de varianza con el modelo estructural es también esencial
mente la misma que la que aprendimos en el capítulo 11, pero con un pequeño cambio. Lo que
permanece igual es el hecho de que si la hipótesis nula es verdadera, las dos ¿stimaciones de la
varianza poblacional deberían ser prácticamente iguales, y si la hipótesis nula es falsa, la estima
ción intergrupal debería ser mayor (porque las diferencias entre las medias poblacionales contri
buyen a ello) que la estimación intragrupal. El cambio radica en el énfasis. El método que
aprendimos en el capítulo 11 hace hincapié en los grupos íntegros, comparando una varianza ba
sada en las diferencias entre medias grupales con una varianza basada en el promedio de las va-
rianzas grupales. El modelo estructural pone el acento en las observaciones individuales.
Compara una varianza basada en las desviaciones de las medias de los grupos a los que pertene-
Figura12-2. La desviación de las observaciones con respecto a la media de su grupo es la base para la esti
mación intragrupal de la varianza poblacional. La desviación de la media del grupo con respecto a la gran
media es la base de la estimación intergrupal de la varianza poblacional.
cen los valores observados individuales con respecto a la gran media, con una varianza basada en
los desvíos de los valores observados individuales con respecto a la media de su grupo. El método
del capítulo 11 se concentra directamente en los aspectos que contribuyen a la estimación general
de la varianza poblacional; el modelo estructural se concentra directamente en los aspectos que
contribuyen a las partes en que se descomponen las desviaciones de las observaciones con respec
to a la gran media.
Las diferencias lógicas mencionadas anteriormente son bastante sutiles y, finalmente, se re
ducen a lo mismo. Entonces, sí tanto los cálculos como la lógica se refieren a lo mismo, ¿por qué
debemos aprender dos formas diferentes de razonar ese tema? Hemos analizado el método del ca
pítulo 11 principalmente porque es más intuitivo. Es especialmente útil para ayudar a comprender
de qué se tratan las estimaciones de la varianza poblacional, y por qué deberían ser iguales cuan
do la hipótesis nula es verdadera y diferentes cuando no lo es. Además, con el método del capítu
lo 11 podemos calcular un análisis de varianza en forma directa a partir de medias y varianzas de
grupos, sin necesidad de trabajar directamente con las observaciones.
Sin embargo, como dijimos al comienzo del capítulo, es importante presentar el modelo es
tructural porque a) ha sido el más utilizado (en parte porque es más cercano a las fórmulas de
cálculo que durante tanto tiempo dominaron el razonamiento de todos), b) es más flexible, y por
lo tanto más fácil de utilizar cuando se trabaja con grupos de tamaños desiguales y con el análisis
factorial de varianza (presentado en el capítulo 13) y c) está relacionado con un método matemá
tico fundamental que queríamos estar seguros de exponer a aquellos alumnos que podrían llegar a
asistir a cursos más avanzados de estadística.
Tabla 12-1.
Análisis de varianza del estudio acerca de los antecedentes delictivos (datos ficticios)
utilizando el método del modelo estructural (comparar con tablas 11-3 y 11-4).
G r u p o co n a n tec e d e n te s d elictivos
X X - GM X-M M - GM
Desviación Desviación Desviación
Desviación cuadrática Desviación cuadrática Desviación cuadrática
10 4 ,3 3 1 8 ,7 4 2 4 2 ,3 3 5 ,4 3
7 1 ,3 3 1 ,7 7 »1 1 2 ,3 3 5 ,4 3
5 » 0 ,6 7 0 ,4 5 »3 9 2 ,3 3 5 ,4 3
10 4 ,3 3 1 8 ,7 4 2 4 2 ,3 3 5 ,4 3
8 2 ,3 3 5 ,4 3 0 0 2 ,3 3 5 ,4 3
40 45J3 18 2 7 ,1 4
M ss 4 0 /5 = 8
X X ~ GM X -M M - GM
Desviación Desviación Desviación
Desviación cuadrática Desviación cuadrática Desviación cuadrática
5 » 0 ,6 7 0 ,4 5 1 1 -1 ,6 7 2 ,7 9
I -4 ,6 7 2 1 ,8 1 -3 9 -1 ,6 7 2 ,7 9
3 -2 ,6 7 7 ,1 3 -1 1 -1 ,6 7 2 ,7 9
7 1 ,3 3 1 ,7 7 3 9 -1 ,6 7 2 ,7 9
4 -1 ,6 7 2 ,7 9 0 0 -1 ,6 7 2 ,7 9
20 33^95 20 1 3 ,9 5
2 0 /5 = 4
G ru p o sin inform ación sobre a n te c e d e n te s
X X ~ GM X~M M - GAí
D e s v ia c ió n D e s v ia c ió n D e s v ia c ió n
D e s v ia c ió n c u a d r á tic a D e s v ia c ió n c u a d r á tic a D e s v ia c ió n c u a d r á tic a
4 - 1 ,6 7 2 ,7 9 -1 1 -0 ,6 7 0,45
6 0 ,3 3 0,11 1 1 - 0 ,6 7 0,45
9 3,33 11,09 4 16 - 0 ,6 7 0,45
3 -2 ,6 7 7 ,1 3 -2 4 —0 ,6 7 0,45
3 -2 ,6 7 7,13 -2 4 -0 ,6 7 0 ,4 5
25 28¿5 26 2,25
M = 2 5 /5 = 5
Grados de libertad:
¿n*, = * - 1 = 1 5-1*14
C oatrol ( g i ^ = + S ‘m j - 1 4 = 12 + 2
E stim aciones d e varianza poblacional:
Los grados de libertad, el siguiente paso que aparece en la tabla, se calculan de la misma forma
que en el capítulo 11. Más abajo, la tabla indica los cálculos de las dos estimaciones cruciales de
varianza poblacional. Las calculamos dividiendo cada suma de desviaciones cuadráticas por los
grados de libertad correspondientes. Finalmente, la tabla muestra el cálculo de la razón F, realiza- •
do de forma usual, dividiendo la estimación intergrupal de la varianza por la estimación intragru-
pal de varianza. Todos esos números, grados de libertad, estimaciones de varianza y F son iguales
(con diferencias de redondeo) a las cifras calculadas en el capítulo 11.
T a b la 1 2 -2 .
Tabla de análisis de varianza correspondiente al estudio acerca de antecedentes delictivos,
(datos ficticios).
F u en te SC gl CM F
Intergrupal 4 3 ,3 4 2 21,67 4,07
Intragrupal 64 12 5,33
Total 107,33 14
1 Una ventaja del método que aprendimos en ei capitulo 1 í, además de su utilidad para clarificar la lógica implícita, es
que permite calcular un análisis de varianza utilizando sólo las medias y las varianzas poblacionales estimadas. Esto
puede resultar rito cuando la información ordinaria no está disponible; por ejemplo, ai calcular un análisis de varianza
basándonos en medias y desvíos estándar informados en una publicación cien tífica . Por io :tanto, si los tamaños de las
muestras no fueran iguales, la siguiente es la forma de determinar las estimaciones de varianza poblacional utilizando
el método del capítulo 11.
El cálculo de ó |,entol con d istin to s tamaños de muestra es una extensión directa del método que aprendimos en el ca
pítulo 10 para ’?c0(a¡,¡!lí,(i4>Ia estimación combinada de la varianza poblacional. Es decir, es Ia suma de la Ó^pon-
derada de cada grupo, siendo ’ ’la ponderación
’ ración ios Indos por los g í totales de
3 g / del grupo en cuestión (su ¿Vmenos 1) am an
todos los grupos. Es decir,
Ejemplo
Analicemos un ejemplo ficticio. Un investigador de un centro de tratamiento del alcoholismo rea
liza un estudio acerca de la satisfacción del paciente con tres métodos diferentes de tratamiento,
utilizados en el centro. Los llamaremos tratamiento A, tratamiento B y tratamiento C. El investi
gador asigna al azar a cada uno de los 10 pacientes disponibles para que reciban uno de estos tra
tamientos; a 4 pacientes Ies toca el tratamiento A, a 3 pacientes el tratamiento B y a 3 pacientes el
tratamiento C. Dos semanas más tarde, el investigador mide la satisfacción de los pacientes con
respecto a los tres tratamientos en una escala del 1 (bajo nivel de satisfacción) al 20 (alto nivel de
satisfacción). La tabla 12-3 muestra los resultados, los cálculos y la tabla del análisis de varianza.
La figura 12-3 representa gráficamente las distintas distribuciones involucradas. Seguiremos el
procedimiento habitual de prueba dé hipótesis paso a paso.
1. Replantear el problema en función de hipótesis de investigación e hipótesis nula de las
poblaciones. Existen tres poblaciones.
Población 1: alcohólicos que reciben el tratamiento A.
Población 2: alcohólicos que reciben el tratamiento B.
Población 3: alcohólicos que reciben el tratamiento C.
La hipótesis nula establece que las tres poblaciones tienen la misma media. La hipótesis de inves
tigación establece que no todas tienen la misma media.
2. Determinar las características de la distribución comparativa. La distribución compa
rativa en un análisis de varianza es siempre una distribución F. Calculamos sus grados de libertad
del mismo modo que lo hemos venido haciendo hasta ahora. La estimación íntergrupal de la
varianza es la cantidad de grupos menos 1. Existen tres grupos, por lo tanto gl£ntre es 2. El
gl D es la cantidad de observaciones de cada grupo menos uno. Hay 3 grados de libertad en el
primer grupo (4 observaciones menos 1) y dos grados de libertad en cada uno de los otros grupos;
por lo tanto, g/Dentro es 7. Es decir, se trata de una distribución F para 2 y 7 grados de libertad.
¿¿i ¿¿2
■^Dentro ;
+ -H)1
2 + -- ■+ ¿¿Últimos ' ih +i k +1'1* ¿¿Últimos'
j .______ ¿¿Últimos / . \
Calcular la es un poco más complejo. Primero, calculamos la gran media general (que no es sólo la media de
las medias). Para calcular la gran media, primero multiplicamos la media de cada grupo por la cantidad de observacio
nes de ese grupo, sumamos los resultados de todos los grupos y dividimos la suma por la cantidad total de observacio
nes. Se expresa bajo la fórmala,
CM - + ( ^ ) í » 2 ) + ~‘ + (^Últimos) (rcÚltimos )
n { +rt2 + «Últimos
D espués calculamos 5 | tfe: calculamos la desviación de la media de cada grupo con respecto a la gran media; elevamos
la desviación al cuadraoq; multiplicamos las desviaciones cuadráticos de cada grupo por la cantidad de observaciones
del grupo; sumamos los resultados de todos los grupos y dividimos esa suma por los grados de libertad intergrupales
{¿¿Eiití* = e n tid a d de grupos menos 1). Se expresa bajo la fórmula,
c2 (/V/j- G M f { n x) + { M 2
, ¿Entre ~
3. Determinar el punto muestral de corte en ia distribución comparativa, a partir del
cual debería rechazarse la hipótesis nula. Utilizando la tabla F del apéndice B (tabla B-3), bus
camos en la columna correspondiente a 2 grados de libertad en el numerador y nos detenemos a
los 7 grados de libertad del denominador. Utilizando el nivel 0,05 de significación (el número del
medio), encontramos un punto de corte de 4,74.
4. Determinar el valor muestra! en la distribución comparativa. Dado que la distribu
ción comparativa es una distribución de razones F, este paso implica calcular la razón F de la
muestra (utilizando ei método estudiado en este capítulo). El numerador es la estimación inter-
grupal de varianza. Se basa en la desviación de la media del grupo de cada observación con res
pecto a la gran media. Por ejemplo, la media del grupo de la primera observación es 10, y la gran
media es 7. La desviación es 3, y la desviación cuadrática es 9. Sumando las 10 desviaciones
cuadráticas de este tipo obtenemos 66, que aparece en la tabla del análisis de varianza bajo la co
lumna SC, en la fila “Intergrupal”. Después, dividimos la suma de las desviaciones cuadráticas
por los grados de libertad íntergrupales (gíEntre). El resultado, como lo indica la tabla del anáfisis
de varianza, bajo CM, resulta ser 33. Es decir, 33 es el numerador, la estimación intergrupal de la
varianza poblacxonal.
Tabla 12-3.
Análisis de varianza del estudio acerca de tratamientos de alcoholismo (datos ficticios).
Tratamiento A Tratamiento B Tratamiento C
X X - GM X ~ M M - GM X X - GM X ~ M M - GM X X -G M X - M M ~ GM
D esv' D e s v 1 D e sv D e s v ' D e sv D esv1 D esv' D e s v 1 D e s v D e s v 1'D e s v ’ D e s v 1 D e sv D e s v 1 D esv D e sv 1D esv D e sv ‘
8 1 1 ~2 4 3 9 7 0 0 1 1 -I 1 6 -I 1 2 4 -3 9
13 6 36 3 9 3 9 3 -4 16 -3 9 -1 1 4 -3 9 0 0 -3 9
10 3 9 0 0 3 9 8 1 1 2 4 -1 I 2 -5 25 -2 4 -3 9
9 2 4 -1 1 3 9
40 50 14 36 18 17 14 3 12 35 8 27
Aí = 40/4 = 10 : 18/3 := 6 Ai* 1 2 /3 = 4
Nota: Desv = Desviación. Desv! = Desviación cuadrática
GM » (40 + 18 + 12)/10 * 70/10 * 7
+^2 + ’ ■’ + Í^Úuímo “ U - D + (3 -- 1) + (3 - 1) = 3 + 2 + 2 = 7
S^Bnac ~ ^Grupos “ 1 = 3 - 1 =*2
F necesario para g l ~ 2 , l al nivel 0,05 « 4,74
S C r m ¡ = 50 + 17 + 35 * 102
^-Dentro = 14 + 14 + 8= 36
* ^ ,« 3 6 +3+27*66
FUENTE SC GL CM F
Intergrupal 66 2 33 6,42
íntragrupal 36 7 5,14
Total 102 9
Conclusión: Se rechaza la hipótesis nula.
El denominador de la razón F es la estimación intragrupal de la varianza poblacionaL Se basa
en las desviaciones de cada observación con respecto a la media de su grupo. Por ejemplo, la pri
mera observación es 8 y ia media de su grupo es 10. Esto da una desviación de -2 y una desvia
ción cuadrática de 4. Sumando las 10 desviaciones cuadráticas de este tipo, obtenemos 36.
Dividimos 36 por los grados de libertad intragrupals, que son 7, y obtenemos 5,14.
La razón F, como siempre, es ía estimación intergrupai dividida por la estimación intragru
pal. El resultado es 6,42.
Al utilizar el método tratado en este capítulo, y al trabajar manualmente, conviene a esta altu
ra calcular la suma de las desviaciones cuadráticas de cada observación con respecto a la gran
media, que aparece en la línea correspondiente a ‘Total” de la tabla. De ese modo podemos con
trolar ios cálculos aritméticos, ya que esta suma debería ser igual al total de las otras dos sumas de
desviaciones cuadráticas. (En este caso, 66 más 36 es igual a 102).
5. C o m p arar ios valores obtenidos en los pasos 3 y 4 p a ra d ecid ir s i se rechaza o no la h i
pótesis nula. La razón F de 6,42 es más extrema que el punto de corte F de 4,74 correspondiente al
nivel 0,05 de significación. Por lo tanto, el investigador puede rechazar la hipótesis nula. Si esta
F ig u r a 1 2-3.
Distribuciones relacionadas con el estadio ficticio acerca del tratamiento del alcoholismo.
fuera información real, el investigador podría concluir que los tres tratamientos tienen diferentes
efectos en cuanto a la satisfacción de pacientes, como los suyos con respecto a sus tratamientos.
Otro Ejemplo
Ahora examinaremos información ficticia basada en resultados de un estudio real realizado por
Clark et al. (1997). Los investigadores estudiaron tres grupos de pacientes: pacientes con pánico,
pacientes con angustia generalizada y pacientes con fobia social. También incluyeron un grupo
comparativo de personas que no eran pacientes. Como parte inicial del estudio, compararon ios
cuatro grupos sobre la base de varias medidas estándar. La tabla 12-4 se basa en los descubrimien
tos reales de los investigadores a través de las pruebas de ansiedad. (El patrón de los resultados es
el mismo. Sin embargo, para que el ejemplo fuera simple, hemos utilizado muchos menos partici
pantes y hemos transformado ios valores individuales en números agradables, enteros y pequeños.
Los resultados del estudio real se indican en la tabla 12-8, más adelante en este capítulo). La tabla
12-4 también presenta los cálculos principales y la tabla del análisis de varianza. La figura 12-4 re
presenta gráficamente las distintas distribuciones relacionadas con el estudio. A continuación,
analizamos el ejemplo siguiendo eí procedimiento normal de prueba de hipótesis paso a paso.
Tabla 12-4,
Análisis de varianza de valores de ansiedad basado aproximadamente en Clark et al. (1997).
(Datos ficticios).
Pacientes Paciente con angustia Paciente con
No pacientes con pánico generalizada fobia social
D e s v ia c io n e s c u a d r á tic a s D e s v ia c io n e s c u a d r á tic a s D e s v ia c io n e s c u a d r á tic a s D e s v ia c io n e s c u a d r á tic a s
X X -G M X -M M -G M X X -G M X - M M -GM X X -G M X -M M -G M X X - G M X - M M - GM
7 9 1 4 11 1 0 1 10 0 1 1 11 1 0 1
8 4 0 4 10 0 1 1 12 4 1 1 11 1 0 1
10 0 4 4 Í2 4 1 1 11 1 0 1
1 9 1 4
32 22 6 16 33 1 2 1 22 ~4 2 "2 33 ~3 0 1
M-- =32/4 = 8 itf = 3 3 /3 = 11 M = 22 /2 a 11 M ~ *3 3 /3 = 11
GM = (32 + 33 + 22 + 33)/12 = 10
^ = * -1 = 12-1*11
¿^Dentro * #¿2 + ■■■+ ^Últirao = ^ ~ 1) + (3 ~ 1) + (2 - 1} + (3 - 1) = 3 + 2 + 1 + 2 = 8
ANALISIS DE VARIANZA:
Fuente SC gl CM F
írttergrupa! 24 3 8 6 .4
Irtíragrupal 10 8 1,25
Total 34 11
Conclusión: se rechaza la hipótesis nula.
: Se supone qué ias distribuciones de población son normales y tienen la misma varianzá. Tienen la misma media
O (si la hipótesis nula es verdadera), o tienen diferentes medias (si la hipótesis de iqvestigációñ.es verdadera): . . .
Pn n ■ i ......i ■ n n 11 _
8 10 12 8 10 12 8 10 12 8 10 12
Personas.que no Pacientes que sufren Pacientes que sufren Pacientes que sufren ■.■■■■■
son pacientes de pánico de angustia generalizada de fobía social
Distribuciones de muestras
Figura 12-4.
D istr ib u c io n e s r ela cio n a d a s con e l an álisis d e varianza d e la in form ación fic ticia basado aproxim ad am ente
en C lark e t al.
COMPARACIONES MÚLTIPLES
Rechazar la hipótesis nula en un análisis de varianza implica que las medias poblacionales no son
todas iguales. Lo que no queda claro, sin embargo, es cuáles son las medias poblacionales que di
fieren entre sí. Por ejemplo, en el estudio acerca de los antecedentes delictivos, los miembros del
jurado que formaban el grupo al que se le informó la existencia de antecedentes delictivos fueron
los que asignaron el mayor nivel de culpabilidad (M - 8); los miembros del jurado que no recibie
ron información al respecto fueron los segundos en cuanto al nivel de culpabilidad asignado
(M - 5), y los miembros del jurado a los que se informó que el acusado no tenía antecedentes de
lictivos fueron los que asignaron el nivel más bajo de culpabilidad (M = 4). A partir de los resulta
dos del análisis de varianza, concluimos que las verdaderas medias de las tres poblaciones que
representaban estos grupos no eran todas iguales. Sin embargo, no sabemos qué medias de qué
poblaciones en particular son significativamente diferentes entre sí. Ni siquiera existe garantía de
T a b la 1 2 -5 .
P a s o s , s ím b o lo s y fó r m u la s p a r a c a lc u la r u n a n á lisis de v a r ia n z a u t iliz a n d o el m é to d o d e l m o d e lo
e s t r u c tu r a l (g r u p o s d e ta m a ñ o s ig u a le s o d e s ig u a le s ).
Pasos d e la p r u e b a d e h ip ó te s is
1. Replantear e i problem a en función de hip ótesis de investigación e hip ótesis nula de las poblaciones.
2. Determ inar las características de la distribución comparativa.
a) L a distribución comparativa será una distribución F.
b) Los grados de libertad del numerador son la cantidad de grupos m enos 1; g /Entre = /VGfupos - 1 .
c) L os grados de libertad del denom inador son la sum a de io s grados de libertad de cada grupo
(la cantidad de observaciones de cada grupo m enos 1): g l ÜMttQ - g l { + g lj + . . . + g l$ ]úmo.
d) Controlar la exactitud de los c á lc u lo s a s e g u rá n d o s e de q u e g¿Di¡ntto m ás g IEnu<¡ sum an g !rm ¡
(que es la cantidad total de casos m enos 1).
3. D eterm inar e l punto muestral de corte en la distribución comparativa, a partir del c u a l debería rechazarse la
hip ótesis nula.
a) Determinar e l nivel de significación deseado.
b) B uscar e l punto de corte correspondiente a la tabla F.
4. Determ inar e l valor muestral en la distribución comparativa (será un razón F ).
a) C alcular la m edia d e cada grupo y la gran m edia de todas Jas observaciones.
b) Calcular las siguientes desviaciones para cada observación:
i) La desviación con respecto a la gran m edía ( X ~ G M ).
ii) La desviación con respecto a la m edia de su grupo (X - M ).
a i) La desviación de la m edia de su grupo con respecto a la gran m edia (Ai - G M ).
c) Elevar al cuadrado cada una de esas d esviaciones.
d) Calcular las sum as de cada uno de estos tres tipos de desviaciones cuadráticas
S ím b o lo s c o r r e s p o n d ie n t e s a c a d a p a r t e
d e u n a n á lis is d e v a r ia n z a
F u en te SC gt CM F
Intergrupai F
^ E n tre ^Emte ^^E n tie ^ ^ Entre)
Intragrupal ¿ W o •^Dentro ^^Deiitro (° ^Dentro)
Total ■^"Total •á^Total
F u en te SC CM F
gl
Intergrupai X (M -G M )2 N
Grupos * ^E íiírt/^E iitre
C M i'J C M Demw
Intragrupal M X - ¿VI)2 8*1 + 8*2 + ' ‘ ' + ^Òttimo ^ D m ro
Total M X-CM )2 N - 1
que los dos grupos más extremadamente diferentes (el grupo que recibió información de antece
dentes delictivos y el grupo al que se le informó que no existían antecedentes delictivos) represen
ten poblaciones con medias diferentes y, ciertamente, no queda claro si la media de la población
correspondiente al grupo que no recibió información al respecto es diferente de cualquiera de las
medias de las poblaciones representadas por los otros dos grupos.
Cuando se determina cuáles son las medias que difieren entre sí se dice que se realizan com
paraciones múltiples, porque frecuentemente se comparan varios pares de medias. Las compa
raciones múltiples son un tema complejo muy tratado en cursos de estadística en psicología de
nivel intermedio. Además, es un tema controvertido.
Existe un punto en el que casi todo el mundo está de acuerdo. Por lo general no es suficiente
calcular simplemente una serie de pruebas ¡r, una para cada posible par de medias, ya que si no se
aplican modificaciones, es muy probable que este tipo de procedimiento arroje lo que aparente
mente es un resultado significativo. Por ejemplo, con tres grupos existirían tres pruebas t posibles
(el grupo 1 comparado con el 2, el 2 con el 3 y el 1 con el 3). Supongamos que utilizamos el nivel
0,05, de forma tal que cada una de las tres pruebas t posibles tengan una probabilidad 0,05 de re
sultar significativas equivocadamente. La probabilidad de que al menos una de las pruebas de la
serie de tres pruebas t resulte significativa por equivocación, es aproximadamente del 15%. Con
cuatro grupos, podría haber seis comparaciones. Lo cual significa que si usáramos el nivel 0,05
para cada prueba, tendríamos un riesgo total de casi el 30% de que, al menos, una resulte signifi
cativa sólo por casualidad.2 Más aún, un investigador puede necesitar hacer comparaciones adi
cionales que no comparan simplemente a un grupo con otro; por ejemplo, se puede comparar, el
promedio de tres grupos con un cuarto grupo (tal vez los primeros tres son diferentes tipos de gru
pos experimentales y el cuarto es el grupo de control). La cantidad de comparaciones, aun con
una cantidad bastante pequeña de grupos, puede ser considerablemente grande.
La controversia surge cuando los estadísticos intentan ponerse de acuerdo acerca de la mejor
alternativa para no realizar simplemente un puñado de pruebas t. Las soluciones disponibles de
penden, en parte, de la situación.
Comparaciones planificadas
Existe un tipo de situación que se presenta cuando el investigador ha decidido previamente obser
var unas pocas comparaciones en particular que están directamente relacionadas con la teoría o
con alguna aplicación práctica. A esto se lo denomina comparaciones planificadas (o, a veces,
comparaciones a priori o contrastes planificados), porque han sido planificadas previamente a
la realización del estudio. (Estas comparaciones también son lo que habitualmente se denominan
“contrastes lineales”). Analicemos nuevamente el ejemplo del estudio acerca de los antecedentes
delictivos. El investigador podría decidir previamente que las únicas comparaciones de interés
son a) el grupo que recibió los antecedentes delictivos con el grupo al que se informó que no exis
tían antecedentes delictivos y b) el grupo que recibió los antecedentes delictivos con el grupo que
no recibió información ái respecto.
2 En realidad, la probabilidad de obtener al menos un resultado significativo por casualidad, de tres, al nivel 0,05, es
0 ,Í43; y de obtener al menos uno de seis, es de 0,265. La fórmula para tres pruebas e s ! - (1 - ot)(l - ot){l - a ), en don
de a representa el nivel de significación. Además, es evidente que toda esta cuestión está muy relacionada con e l tema
de “demasiadas pruebas r” que analizamos en el capítulo 10. La cuestión planteada en ese capítulo se refería a dos gru
pos con diferencias en varias variables. En este caso, estamos hablando de diferencias entre varios grupos en cuanto a
una variable. Por supuesto, algunas veces se presentan a la vez varios grupos y varias variables.
Un método ampliamente utilizado para analizar las comparaciones planificadas es el proce
dimiento Bonferroni (también llamado la “prueba de Dunn”), que se basa en la idea de utilizar
un nivel de significación más exigente para cada comparación. El resultado es que la probabilidad
total de que cualquiera de las comparaciones resulte significativa por error sigue siendo razona
blemente baja. Por ejemplo, si cada una de dos comparaciones planificadas utilizara el nivel
0,025 de significación, la probabilidad total de que cualquiera de ellas resulte erróneamente signi
ficativa aún sería de menos del 0,05. Con tres comparaciones planificadas, podríamos utilizar el
nivel 0,017 (3 por 0,017 es igual a 0,05). A veces, los investigadores que tienen dos o tres contras
tes planificados simplemente utilizan el nivel 0,01 para cada uno, ya que se trata de un caso con
un punto de corte con el que están familiarizados y que resulta fácil de encontrar en las tablas.
Comparaciones p o s t hoc
Una situación muy diferente a la de las comparaciones planificadas es aquella en la que, des
pués de haberse realizado el estudio, el investigador simplemente busca entre los resultados
tratando de descubrir cuáles son los grupos que difieren entre sí. A estas comparaciones se las
denomina comparaciones post hoc (o comparaciones a posteriori), porque no se planifican
previamente,
Cuando se realizan comparaciones post hoc, se deben tener en cuenta todas las posibles com
paraciones para calcular la probabilidad total de que cualquiera de ellas resulte significativa. Por
ese motivo, utilizar el procedimiento Bonferroni para las comparaciones post hoc es seguro, pero
cualquiera de las comparaciones presenta muy baja potencia. El nivel 0,05 se divide en tantas par
tes que, obtener alguna comparación significativa, sería extremadamente raro. Por lo tanto, los es
tadísticos han desarrollado una variedad de procedimientos para utilizar en estas búsquedas
exploratorias. Los procedimientos mencionados intentan mantener el alfa general a un nivel cer
cano al 0,05, sin reducir de manera demasiado drástica la potencia. Algunos de estos procedi
mientos aparecen en las publicaciones descriptos por los nombres de aquellos que los desarro
llaron; los métodos Scheffé, Tukey, Heuman-Keuls y Duncan son ios más utilizados. Aún se dis
cute qué procedimiento es más conveniente en distintas condiciones. Las distintas posibilidades y
controversias acerca de este tema son tratadas en cursos de estadística de nivel medio.
r 2 = _£jEbüS-. - ..y’I 4 ~ o 40
SCxotai 1 0 7 ,3 3 ’
Qué sucede si, como ocurre con frecuencia en los estudios publicados, las sumas de los cuadrados
no están disponibles. También es posible calcular R2 directamente a partir de F y de los grados de
libertad. La fórmula es la siguiente:
*2 = ------ (i 2-5)
(J7)(^Emre}+‘^Dentro
Por ejemplo, en el estudio acerca de los antecedentes delictivos,
W e ntre)________ . (4 ,0 7 ){2 )
W t o W W o ( 4 ,0 7 ) ( 2 ) + 1 2
8 ,1 4 8 ,1 4
8 ,1 4 + 1 2 2 0 ,1 4
4 La relación exacta entre R2 y f e$ R2 = / 2/( 1 + f 1) y f = '!R2/( i- R2). Sin embargo, si intentamos calcular una a partir
de la otra utilizando información tomada de un estudio real, tos resultados no coincidirán exactamente con lo que obte
nemos cuando calculamos cada una directamente. Esto ocurre porque / se basa en desvíos estándar de población esti
mados, y R 1 es una descripción directa de información de la muestra. '
T a b la 1 2 -6 .
R e g la s d e C o h e n p a r a ta m a ñ o s d e l e fe c t o e n u n a n á lis is d e v a r ia n z a d e u n c r ite r io .
T a m a ñ o d e l e fe cto
P equeño M e d ia n o G ra n d e
/ 0 ,1 0 0,2 5 0,40
R O JO 0 ,2 4 0,37
R2 0 ,0 1 0 ,0 6 0 ,1 4
También debemos saber que otro nombre común para esta medida dei tamaño del efecto (ade
más de J?2) es T|2, la letra griega eta al cuadrado; rj2 también se conoce como razón de corre
lación.
T a b la 1 2 -7 .
Medias de subescalas de amor correspondientes a los tres estilos de vinculación (muestra tomada
de un periódico).
A n sio so -
N o m b r e esca la E v a siv o a m b iv a len te Seguro F (2 ,5 7 1 )
Nota: Dentro (le cada fila, las medias con diferentes subíndices difieren segün el nivel 0,05 de significación, de acuerdo
con la prueba de Scheffé,
*p < 0,05; * * p < 0,01; ***p < 0,001.
Fuente: Hazan, C, & Shaver, P. (1987), tab, 3. "Amor romántico conceptuado como un proceso de vinculación”. R e v is
ta d e P s ic o lo g ía S o c i a l y d e la P e r s o n a lid a d ( J o u r n a l o f P e r s o n a lity a n d S o c i a l P s y c k o lo g y ] , 52,5 í 1-524. Copyright,
1987, por la Asociación Americana de Psicología. Reimpreso con autorización.
Tabla 12-8.
Estudio 2: medias y desviaciones estándar correspondientes a las características de los participantes.
M (y S D ) p o r G r u p o
Angustia Fobia
Pánico Generalizada Social No pacientes
Variable (n = 45) (n ==33) (n ==73) (» ==45)
Edad 33,0a (7,1) 40, l b (9,6) 34,9a (8,9) 33,0a (6,9)
STAÍ 48,8b (12,1) 49,5b (9,5) 46,4b (10,0) 29,2a (5,4)
Inventario de depresión
de Beck 15,3b (: m 18,3c (10,2) 12,8b (7,8) 2, l a (2,2)
VAS-Ansiedad 23,0b OS,6) 28,8b (22,1) 25,0b (18,2) 5,6a (9,4)
VAS-Depresión 21,8b (21,1) ' 29,4b (21,1) 24,7b (18,5) 8,2a (11,3)
VAS-Felicidad 53,1b (16,3) 55,7b (17,0) 53,0b (17,1) 74,5a (15,1)
Nota: Las medias con diferentes subíndices difieren significativamente ( p < 0,01): STai { S ta te - T r a it A n x ie t y In v e n o ry ,
S ta te S u b s c a t e , Inventado de ansiedad o estado, subescala de estado); vas ( V is u a l a n a l o g m s c a l e , Escala análoga v i
sual).
Fuente: Clark, D. M,, et al. (1997), tab, 3, “Malas interpretaciones de sensaciones corporales en enfermos con pánico”.
R e v is ta d e p s i c o l o g í a c lín ic a y c o n s u ltiv a ( J o u r n a l o f C o n s u ltin g a n d C li n i c a l P s y c h o lo g y ] , 6 5 ,2 0 3 -2 1 3 . Copyright,
1997, por la Asociación Americana de Psicología. Reimpreso con autorización.
Tabla 12-9.
Efectos del tipo de relaciones.
T ip o d e rela ció n
N in g u n a Casual Exclusiva
M e d id a d e p e n d ien te
P otencia conductora de la piel m b 1 9 ,l b 15,8,
D e se o de con ocer al objetivo 14,6 b 15,3 b 11.2,
A tractivo fís ic o percibido del objetivo 154, 1 7 ,l b 13,8a
N o ta ; L o s números m ás altos reflejan m ayor excitación, deseo d e conocer ai objetivo y atractivo percibido; para
io s d os últim os íte m s , el rango posible era 1 -1 9 . D entro de cada fila, las m edias con diferentes subín dices difie
ren significativam ente (p < 0 ,0 5 ), prueba de rango m últiple d e Duncan.
F u en te: M iller, R . S. (1 9 9 7 ), tab. 4. "D esatento y satisfecho; com prom iso en la relación y atención a alternati
vas” . Revista sobre Psicología Social y de Personalidad [Journal of Personality and Social Psychology] , 7 3 ,
7 5 8 -7 6 6 . C opyright, 1997, por la A so cia ció n Am ericana d e P sicología. R eim preso con autorización.
Existe un enfoque alternativo del análisis de vaxianza, qtie se denomina modelo estructural. En el
enfoque del modelo estructural, la desviación de cada observación con respecto a la gran media
se divide en dos partes: a) la diferencia entre el valor observado y la media de su grupo y b) la di
ferencia entre la media de su grupo y la gran media. Estas desviaciones, al elevarse al cuadrado y
sumarse y dividirse por los grados de libertad adecuados, dan las mismas estimaciones de las va-
rianzas intragrupaies e intergrupales que las obtenidas utilizando el método del capítulo 11. Sin
embargo, el modelo estructural es más flexible y puede aplicarse a estudios con muestras de ta
maños desiguales.
Los cálculos realizados a través del modelo estructural usualmente están resumidos en una
tabla del análisis de varianza, con una columna para la fuente de variación (intergrupal, iníragru-
pal y total), las sumas de desviaciones cuadráticos (SC), los grados de libertad (gl)> las estimacio
nes de la varianza poblacional (CM, que es igual a SClgl) y F (que es igual a CMEn(J CMDentt0).
Los supuestos son los mismos que los de cualquier análisis de varianza, aunque el análi
sis con grupos de tamaños desiguales es un poco más sensible a los Incumplimientos de los
supuestos.
Un análisis de varianza es seguido generalmente de comparaciones múltiples, planificadas o
post hoc, las cuales analizan las diferencias entre pares o subgrupos específicos de medias. Dichas
comparaciones tienen que protegerse contra la posibilidad de obtener algunos resultados significa
tivos sólo por casualidad, debido a que pueden realizarse una gran cantidad de comparaciones.
La proporción de varianza explicada (i?2), también denominada eta cuadrado (rj2), es una me
dida del tamaño del efecto del análisis de varianza. Es 5CE[ltre dividida por
Algunos expertos recomiendan que en lugar de utilizar un análisis de varianza para realizar
comparaciones difusas y generales entre varias medias, los investigadores deberían planificar
previamente la realización de comparaciones planificadas específicas, apuntadas directamente a
las cuestiones teóricas.
Términos clave
- Tabla del análisis de varianza. - Comparaciones planificadas. - Modelo estructural.
- Procedimiento Bonferroni. - Comparaciones post hoc. - Suma de desviaciones
- Eta cuadrado (Tj2 ). ~ Proporción de varianza cuadráticas
- Comparaciones múltiples. explicada (R2). SCTotai).
Ejercicios
Los ejercicios implican la realización de cálcu SERIE 1
los (con la ayuda de una calculadora). La ma
1. Los datos mostrados a continuación son
yoría de los problemas estadísticos reales se
los mismos que aparecen en el ejercicio 2 de la
resuelven por computadora, pero aunque exista
serie I del capítulol 1. Resuelva el mismo pro
la posibilidad de utilizarla, es conveniente reali
blema utilizando el método del modelo estruc
zar estos ejercicios manualmente para incorpo
rar el método de trabajo. tural y compare su respuesta con la respuesta
lograda en el capítulo 11 (utilice el nivel 0,01).
Para adquirir práctica en la utilización de
Asegúrese de mostrar sus cálculos y de incluir
una computadora, para resolver problemas esta
una tabla del análisis de varianza.
dísticos, se puede utilizar la sección de compu
tación de cada capítulo, publicada en la Guía de
estudio y libro de tareas de computación para el Grupo 1 Grupo 2 Grupo 3
alumno {Studenfs Study Guide and Computer
8 6 4
Workbook] que acompaña este libro.
8 6 4
Todos los datos de esta sección son ficti
7 5 3
cios (a menos que se especifique lo contrario).
Las respuestas a los ejercicios de la serie I 9 7 5
se encuentran al final del libro.
2, Calcule un análisis de varianza para los
puntuaciones atribuidas generales son 13,8,10
siguientes datos (al nivel de significación del y 9; tres programas que utilizan el método B,
1%). Asegúrese de mostrar sus cálculos y de en el cual sus puntuaciones atribuidas son 5, 7
incluir una tabla del análisis de varianza. y 6, y otros tres programas que utilizan el mé
todo C, en el cual sus puntuaciones atribuidas
Grupo 1 Grupo 2 Grupo 3 Grupo 4 son 4, o y 2. Sobre la base de esas muestras,
71 82 68 78 ¿deberíamos concluir que los programas que
67 82 70 76
utilizan diferentes métodos tienen diferentes
82
grados de efectividad? Utilice el nivel 0,05.
3. Para cada una de ios siguientes conjun Escriba un informe a una comisión del gobier
tos de datos, calcule a) las medias de cada gru no explicando sus conclusiones. El informe
po, b) un análisis de varianza utilizando el debería escribirse de forma tal que lo compren
método del modelo estructural (al nivel de sig dan funcionarios que tal vez nunca hayan asis
nificación del 5%) y c) R2. (Al realizar el paso tido a un curso sobre estadística.
b, asegúrese de mostrar todos sus cálculos y de 6. Van Lange et al. (1997) realizaron un e
incluir una tabla del análisis de varianza). tudio en el que los participantes tomaban parte
en una tarea de juegos estándar. En la tarea de
Grupo 1 Grupo 2 Grupo 3
juegos, el participante realiza una serie de deci
(0 3 0 1
4 1 2 siones en cuanto a otorgarse puntos a sí mismo o
5 2 3 a otra persona. Utilizando los resultados de esta
Grupo 1 Grupo 2 Grupo 3 tarea, se puede clasificar a cada participante se
gún su “orientación en cuanto a valores socia
(ü ) 3 0 1 les’' como “pro-social” (tiende a ser cooperativo
5 0 3
1 2 2 y favorecer resultados igualitarios para sí mismo
4. Un investigador está interesado en los y para otros), "individualista” (busca obtener la
niveles de autoestima de profesores de tres ma mayor cantidad posible para él mismo sin preo
terias diferentes. Los niveles de autoestima de cuparse por el resultado logrado por otros) o
los cuatro profesores de lengua analizados fue “competitivo” (se preocupa porque su resultado
ron 2, 2, 3 y 5. Los niveles de autoestima de los sea mejor al de los demás). Una de las hipótesis
tres profesores de matemática analizados fue de Van Lange et al. establecía que las personas
ron ó, 4 y 5. Los niveles de autoestima de los “pro-sociales” tendrían más hermanos que los
cinco profesores de ciencias sociales analiza integrantes de los otros dos grupos. Sus resulta
dos fueron 9, 6, 7,10 y 13. ¿Sostienen los re dos mostraron un efecto significativo general,
sultados una diferencia en los niveles medios “F(2,535) = 4,82, p < 0,01”. (p. 739) Luego, lo
de autoestima de los tres distintos tipos de pro informan de la siguiente forma:
fesores (al nivel 0,05)?
Coherentemente con la hipótesis que relaciona
a) Realice el análisis de varianza. b) Calcu hermanos y carácter pro-social de la persona
le R2. c) Explique su respuesta a alguien que la cantidad de hermanos es mayor en el caso de
comprende los conceptos de media, varianza y las personas pro-sociales (M = 2,03, SD ~ 1,56)
varianza poblacional estimada (incluyendo las que en caso de ios individualistas (M ~ 1,63,
nociones de muestra, población y grados de li SD = 1,00) y los competitivos (M= 1,71, SD = 1,35).
bertad), pero que no sabe nada más sobre esta Comparaciones planificadas realizadas poste
dística. riormente revelaron un contraste significativo
5. Un estudio comparaba la efectividad de entre pro-sociales versus individualistas y com
los programas de prevención del abuso de dro petitivos, F(l, 535) = 9,14,p < 0,005. Las dife
gas. En toda Norteamérica existen cuatro pro rencias entre individualistas y competitivos no
gramas que utilizan el método A, en el cual sus fueron significativas, (pp. 739-740)
Explique el significado de todo lo anterior a al Grupo 1 Grupo 2 Grupo 3
guien que nunca ha tomado un curso de esta (ii) 0 0 4
dística. 2 2 6
5
6
SERIE II
4. Un investigador dedicado al tema del
1. El ejercicio 3 de la serie II dei capítulo
descanso comparó el efecto de tres tipos de al
11 era un análisis de varianza que investigaba teraciones dei sueño (ser despertado en distin
si los individuos que trabajaban en diferentes tos intervalos) en la agilidad mental al día
áreas de una empresa tenían diferentes actitu siguiente. Originalmente, había 12 participan
des hacia la misma. Los resultados, en cuanto a tes en la investigación que fueron asignados al
actitudes positivas para las tres personas anali
azar a una de las tres condiciones ( 4 por con
zadas del área de ingeniería, fueron 10, 12 y dición). Sin embargo, uno de los participantes
11; para los tres del área de comercialización,del programa I de alteración no cumplió las
fueron, ó, 6 y 8; para los tres de área de conta
instrucciones, y la información proveniente
duría, 7, 4 y 4 y para los fies del área de pro
de ese participante no pudo utilizarse en el
ducción, 14, 16 y 13. Resuelva el mismo análisis, lo cual dio como resultado muestras
problema utilizando el método del modelo es de tamaños desiguales. Los resultados de la
tructural y compare su respuesta con la res medida de agilidad mental fueron las si
puesta del capítulo 11. (Asegúrese de mostrar guientes: programa I de alteración: 120, 140,
todos sus cálculos y de incluir una tabla com 140; programa II de alteración: 130, 150,120,
pleta del análisis de varianza). 140; programa III de alteración: 100, 90, 110,
2. Calcule un análisis de varianza para 120. ¿Sostienen los resultados un efecto dife
los siguientes datos (al 5% de nivel de signi rente en la agilidad mental producido por los
ficación). Asegúrese de mostrar sus cálculos tres tipos de programas de alteración (al ni
y de incluir una tabla completa del análisis de vel 0,05)? a) Realice el análisis de varianza.
varianza. b) Calcule R2. c) Explique su respuesta a al
guien que comprende los conceptos de medía,
Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 varianza y varianza estimada de población (in
1 3 2 2 4 cluidas las nociones de muestra, población y
grados de libertad) pero que no sabe nada más
7 11 12 8 10
sobre estadística.
6 8 5. El ejercicio 5 de la serie II del capítulo
10 era una prueba t para medias independien
3. tes, correspondiente a un estudio acerca de los
Calcule un análisis de varianza para
cada uno de los siguientes conjuntos de da efectos del color para calmar la angustia.
tos, utilizando el método del modelo estruc Comparaba los valores en las pruebas de an
tural para cada una (a un nivel dei 5% de gustia realizadas por individuos en papel ama
significación). Además, calcule R2. Asegúre rillo pastel o papel verde chillón. Los valores
se de mostrar sus cálculos y de incluir una observados de los cinco participantes que rea
tabla completa del análisis de varianza para lizaron la prueba impresa en papel amarillo
cada una. fueron 17, 19, 28, 21 y 18. Los valores de los
cuatro participantes que completaron la prue
Grupo I Grupo 2 Grupo 3 ba en el papel verde fueron 20, 26, 17 y 24.
Calcule un análisis de varianza con estos da
0 0 4
2 2 6 tos. (Está utilizando el a n o v a para una situa
0 ción con sólo dos grupos). Si saca la raíz
2 cuadrada de la razón F, debería obtener lo
mismo (teniendo en cuenta el error de redon tes a una de las cuatro condiciones según quién
deo) que el valor t que calculó utilizando la fuera la persona necesitada: a) casi un extraño,
prueba t para medias independientes (veremos b) un conocido, c) un buen amigo, d) un fami
esta relación entre la prueba t y el análisis de liar cercano. Cialdini et al. informaron:
varianza en el capítulo 16). Realizamos un anova probando nuestras ex
ó. Cialdini y sus colegas (1997) pidieron a pectativas generales en etianío a que una rela
sus participantes que indiquen hasta qué grado ción más cercana aumentaría la voluntad de
ayudarían a una persona en problemas. Por ayudar. Ese análisis produjo un efecto alta
ejemplo, en una pregunta se íes pedía que indi mente significativo que sostenía nuestra hipó
caran cuánta ayuda le darían a una persona que tesis, F(3, 82) = 33,28, p < 0,001- La [tabla
acababa de ser desalojada de su departamento. 12-10] presenta las medias de ayuda relacio
Las posibles respuestas iban desde “no hacer nadas con cada uno de los niveles de cercanía
nada”, pasando por opciones intermedias tales de la relación.
como “llevar en auto a la persona a buscar un Explique los resultados a una persona que nunca
nuevo departamento”, hasta opciones extremas ha tomado un curso sobre estadística. (Concén
tales como “invitar a la persona a vivir con uno trese sólo en la línea superior de la tabla, en los
indefinidamente”. Se asignaba a los participan resultados en cuanto a la ayuda del estudio 1).
Tabla 12-10.
Medias de registros en cuanto a la ayuda, la preocupación empática y la entereza como una función
del nivel de cercanía de la relación y de la situación de necesidad.
Nivel de cercanía de la relación
Casi Buen Eamiliar
Situación de necesidad extraño Conocido amigo cercano
Estudio 1: Desalojo
Ayuda 1,20 4,13h 6,63 6,89
Preocupación empática 3,04* 4,36* 4,21? 4,50?
Entereza 1,52* 3,16* 4,52* 4,57b
n 22 * 22 b 20 22 e
Estudio 2: Niños huérfanos
Ayuda 4,13 6.11, 7,96b 9,0lb
Preocupación empática 4,42* 5,52? 5,85b 5,82b
Entereza 1,90* 3 ,i r 5,24* 4,66*
n 15 * 17 b 17 c 19 b
Estudio 3: Llamada telefónica
Ayuda 0,80, 0,98 ,b l,54b 1,55.
Preocupación empática 2,87* 3,49*,b 4,55* 4,66b
Entereza 2,17* 3,16* 4,43* ■ 4,66b
n 33 * 18 * 20 b 19 b
D esalojo
Ayuda 1,77. 3,63h 5,88 6,95,
Preocupación empática 3,56 4,34b 4.90L 5,66
E n te r e z a 2,16* 3 5ó*b 5,00° 5,66<3
n 27 19 20 16
N iñ os huérfanos
Ayuda 4,15 5,36 8,23b 8,83.
Preocupación empática 4,53* 4,51* 5,41* 6,21b
Entereza 2,40* 3,02* 4,48*bb 4,80*
n 20 ' 23 * 19 b 20 *
N ota: Dentro de cada fila, las medias que tienen el mismo subíndice no son significativamente diferentes según la prue
ba de Tukey.
Fuente: Cialdini, R. B., Brown, S. L., Lewis, B, P., Luce, C ,, & Neuberg, S. L, (1997), tab, 1, “Reinterpretación de la
relación empatia-altruismo: cuando uno en uno es igual a entereza". Revista de Psicología Social y de Personalidad
{Journal of Personality and Social Psyckologyj.'IX 4 8 1 -4 9 4 . Copyright, 1997, por la Asociación Americana de Psico
logía. Reimpreso con autorización.
Apéndice I del capítulo: fórmulas de cálculo optativas
para las sumas de cuadrados en un análisis de varianza
de un criterio
Las siguientes son fórmulas de cálculo para las sumas de los cuadrados:
íjx f
SOTotal' ■2X7 ( 12- 6)
N
(S X ,f t (SX;)2 , .^A--------------
r m in o ) 2 --------
m 2
SC Entre" (12-7)
«1 «2 « Ú ltim o M
Tabla 12-11.
Análisis de varianza de valores de ansiedad basado aproximadamente en Clark et al. (1997), en el
que se aplican fórmulas de cálculo para las sumas de las desviaciones cuadráticas. (Datos ficticios).
Pacientes
Pacientes con angustia Pacientes con
Mo pacientes con pánico generalizada fobia social
X X 1 X X1 X X2 X X3
7 49 n 121 10 100 11 í 21
8 64 10 100 12 144 11 121
10 100 12 144 11 121
7 49
X: 32 262 33 365 22 244 33 363
XX« 32+ 33+22 + 33 = 120
IT- = 262 + 365 + 244 + 363 = 1,234
v, (xxy Ì202 14.400 ......
s e T ^ x r - y -1.234-------- = 1.234 ~ — - « 1.234 - -1.200 = 34
12 12
y (XX)1 32a 332 22a 33a 120a
sce „ „ W + W + ..
Elltt0 rt, n2 nÚltima IV 4 3 2 3 12
1.024 1,089 484 1.089 14,440
4 ’ 3 ’ 2 T 3 12
=256 + 363 + 242 + 363 -1,200 = 24
‘■^Dentro“ ■"T
r„o,.i
ral~ 5 Entre'— 34 —24 =10
Análisis de
Varianza
Factorial
Descnpción del cápítulo
E
procedimientos aprendidos en los capítulos 11 y 12. El análisis de varianza fac
torial proporciona un enfoque altamente flexible y eficiente para analizar resul
tados de cierto tipo de experimentos complejos que son ampliamente utilizados
en psicología.
Comenzaremos el capítulo analizando con detenimiento la naturaleza de estos complejos di
seños factoriales de investigación; luego expondremos brevemente el razonamiento y los procedi
mientos de cálculo de un análisis de varianza factorial. En este capítulo hemos invertido la
presentación del material por una buena razón. La lógica y la terminología de los diseños experi
mentales probablemente sean nuevos para el alumno, mientras que el razonamiento y los procedi
mientos de cálculo involucrados en la realización de un análisis de varianza factorial son una
extensión bastante directa de lo aprendido en el capítulo 12.
T a b la 1 3 - 1 .
D i s e ñ o f a c t o r i a l u t iliz a d o p o r L a m b e r t e t a l. ( 1 9 9 7 ) .
E sta d o de ánim o
oa. T r is te N e u tro
Apropiado a , y . v ;c -
Inapropiado '- y i r f ; r i d /
Definición del diseño factorial de investigación
El estudio de Lamber! et al. (1997) es un ejemplo de un estudio con diseño factorial de investi
gación, en el que se analiza de una sola vez el efecto de dos o más variables formando grupos
con cada combinación de dichas variables. En el ejemplo que hemos presentado, existen dos ni
veles de estado de ánimo (triste y neutro) y dos niveles de calidad del estereotipo (apropiado e
inapropiado), que permiten cuatro combinaciones posibles. Lamben et al. utilizaron todas ellas
en su estudio.
Un diseño factorial de investigación presenta una importante ventaja con respecto a la reali
zación de estudios de cada variable por separado: la eficiencia. Con un diseño factorial podemos
analizar ambas variables de una sola vez, sin necesidad de convocar el doble de participantes. En
el ejemplo presentado, Lambert et al. pudieron utilizar un sólo grupo de participantes para anali
zar los efectos del estado de ánimo y de la calidad del estereotipo.
Efectos interactivos
Existe una ventaja aún más importante del diseño factorial de investigación. Este diseño brinda la
posibilidad de analizar los efectos de la combinación de dos o más variables. En el ejemplo que
estamos analizando, el estado de ánimo y la calidad del estereotipo podrían afectar la contrata
ción en un modo simple y aditivo. Lo que queremos decir es que las influencias combinadas po
drían ser la suma de las influencias separadas; por lo tanto, si aumenta una de esas influencias, y
también la otra, entonces el efecto general, que es la suma total de los dos efectos individuales, tam
bién será mayor. Por ejemplo, supongamos que sentirse triste predispone a contratar a alguien y,
similarmente, el hecho de que el estereotipo sea apropiado predispone a contratar a una persona.
Si estos dos efectos son simplemente aditivos, entonces los participantes del grupo que se siente
triste y que recibió el estereotipo apropiado serán los más predispuestos a contratar a la persona;
los participantes del grupo neutro, que recibieron el estereotipo inapropiado, serán los que tengan
menos predisposición a contratar a la persona, y aquellos en las otras dos condiciones tendrían
una predisposición intermedia para contratar a la persona en cuestión.
También podría suceder que una variable tuviera cierto efecto y la otra no. O que tal vez nin
guna variable tuviera ningún efecto. En la situación aditiva, o en la que sólo una variable o
ninguna tienen efectos, observar a las variables en combinación no agrega ninguna información
interesante.
Sin embargo, también es posible que la combinación de las dos variables cambie el resultado.
De hecho, Lambert et al. predijeron que el efecto del estereotipo inapropiado sería especialmente
fuerte en la condición de tristeza. Esta predicción se basaba en la noción de que cuando nos senti
mos tristes, estamos más predispuestos a rever nuestras reacciones iniciales, irreflexivas, basadas
en un estereotipo.
El anterior es sólo un ejemplo del modo en que diferentes condiciones podrían combinarse en
formas que no esperaríamos al conocer sólo el efecto de cada factor separadamente. Veamos otro
ejemplo. Supongamos que sentirse triste disminuye la posibilidad de contratar a alguien cuando el
estereotipo es inapropiado, pero que aumenta la probabilidad de contratar cuando el estereotipo es
apropiado (es decir, que la tristeza hace que las personas presten más atención a lo apropiado de la
situación). Incluso, otra posibilidad sería que el único grupo que tenga altas probabilidades de con
tratar a la persona sea aquel en el que el estereotipo es apropiado y el estado de ánimo neutro, es
decir, estando triste, se clasifica con bajo nivel a todos en general, pero con un estado de ánimo
neutro, se presta atención a lo adecuado del estereotipo y se clasifica con un nivel alto a aquél cuyo
Tabla 13-2.
Posibilidad media de contratación en el estudio de Lambert et ai. (1997),
Estado de ánimo
T r is te N e u tro
8 Apropiado 5,80
« Inapropiado 5,83 . 6,75 '
atractivo físico es adecuado. Existen también otras posibilidades (sería interesante que el alumno
pensara algunas y razonara su significado en relación con los temas que estamos estudiando).
Todas aquellas situaciones en las cuales la combinación de variables tiene un efecto especial
son ejemplos de lo que se denomina efecto interactivo. Un efecto interactivo ocurre cuando el
efecto de una variable depende del nivel de la otra variable. En el estudio de Lambert et a l, exis
tía un efecto interactivo. Si observamos la tabla 13-2 veremos que el resultado fue que los partici
pantes del grupo apropiado-triste presentaban las mayores posibilidades de contratar al solicitante;
el grupo inapropiado-neutro le seguía en orden de posibilidad, y los otros dos grupos eran los que
tenían menos posibilidades (estando casi al mismo nivel). Analicemos la parte del resultado en el
que el grupo triste-inapropiado presenta menos posibilidades de contratar que el grupo neutro-
inapropiado. Esta parte del resultado sostiene la teoría del investigador que establece que, cuando
uno se siente triste, puede contrarrestar sus estereotipos. (¿Qué sucede con el hecho de que el gru
po apropiado-triste sea el que presenta más posibilidades de contratar? Los investigadores reco
nocieron que este resultado era “inesperado y difícil de explicar” (p. 1011).
Supongamos que los investigadores habían analizado la calidad del estereotipo y el estado
de ánimo en dos estudios separados. Habrían llegado a la conclusión de que cada factor tenía só
lo un leve efecto. El promedio de posibilidad de contratación, siendo el estereotipo apropiado, es
6,77 (es decir, el promedio de 5,80 y 7,73 es igual a 6,77), y en los casos en los que el estereoti
po es inapropiado, el promedio es 6,29. La posibilidad promedio de contratación, en el caso de
los que se sienten tristes, es de 6,78, contra 6,28 de aquellos en la condición neutra. Por lo tanto,
siguiendo el método de los dos estudios independientes, los resultados importantes se hubieran
pasado totalmente por alto. Los resultados más importantes estaban relacionados con la combi
nación de los dos factores. ¿Ya se empieza a percibir la importancia de descubrir los efectos de
la interacción?
Terminología
El estudio de Lambert et al. se analizaría con lo que se denomina un análisis de varianza de dos
criterios de clasificación (el que se aplica a un diseño factorial de investigación de dos facto
res). Por el contrario, las situaciones que analizamos anteriormente en los capítulos 11 y 12 (co
mo el estudio acerca del estilo de vinculación o el experimento con antecedentes delictivos) eran
ejemplos de estudios analizados utilizando un análisis de varianza de un criterio. Se dice que
estos estudios tienen un criterio único de clasificación porque analizan el efecto de una sola varia
ble (como por ejemplo, el efecto del estilo de vinculación de una persona o de la información
acerca de los antecedentes delictivos del acusado).
Algunos estudios investigan el efecto de tres o más variables juntas. Por ejemplo, Lambert et
al. también querían estar seguros de que sus resultados no estaban afectados por el sexo. Por lo
Figura 13-1.
D is e ñ o factorial d e tres factores u tilizad o en el
e stu d io d e L am bert e t al. (1 9 9 7 ).
tanto, en otro análisis dividieron cada uno de sus cuatro grupos en dos subgrupos: mujeres y hom
bres. A través de esa división se crearon ocho combinaciones: mujeres tristes con el estereotipo
apropiado, hombres tristes con el estereotipo apropiado, mujeres tristes con el estereotipo inapro
piado, y así sucesivamente. La figura 13-1 representa gráficamente la serie completa de agrupa
ciones. El análisis que describimos estudiaba la influencia de tres variables al mismo tiempo. Se
requieren tres dimensiones para diagramar este tipo de estudios, por eso se lo denomina diseño
factorial de tres factores, (El resultado indicó que no se producían efectos significativos relacio
nados con el sexo, ni generales ni en interacción con el estado de ánimo, ni con la calidad del es
tereotipo o la combinación de los dos). Es posible realizar diseños factoriales de cuatro factores o
más, aunque no son sencillos de diagramar. Sin embargo, la mayoría de las investigaciones psico
lógicas se limitan a diseños factoriales de dos factores y, ocasionalmente, de tres.
En un análisis de dos criterios, cada variable o “criterio de clasificación” (cada dimensión en
el diagrama) es un posible efecto principal. Sí el resultado de una variable, haciendo un promedio
a través de las categorías de la otra u otras variables, es significativo, se trata de un efecto princi
pal. Lo anterior es completamente diferente de un efecto interactivo, que se basa en la combina
ción de variables. En el estudio básico de Lambert et al. en dos sentidos, existía la posibilidad de
dos efectos principales y de un efecto interactivo. Los dos efectos principales posibles son la cali
dad del estereotipo y el estado de ánimo, y el efecto interactivo posible es el de la combinación de
la calidad del estereotipo con el estado de ánimo. En un análisis de varianza de dos criterios,
siempre se prueban dos posibles efectos principales y una posible interacción.
Cada combinación de grupos en un diseño factorial se denomina casilla. La medía de ios va
lores observados de cada agrupación se denomina media de ía casilla. Por ejemplo, en el estu
dio de Lambert et al. existen cuatro casillas, por ende, existen cuatro medias de casillas, una para
cada combinación de los niveles de calidad del estereotipo y del estado de ánimo. Es decir,
una casilla se refiere al estereotipo apropiado y al estado de ánimo triste (como lo muestra la
tabla 13-2, su media es 7,73); otra casilla se refiere al estereotipo inapropiado y al estado de
ánimo triste (5, 83); otra casilla se refiere al estereotipo apropiado y el estado de ánimo neutro
(5,80), y otra casilla se refiere al estereotipo inapropiado y el estado de ánimo neutro (6, 75).
Las medias según una sola variable se denominan medias marginales. Por ejemplo, en el es
tudio de Lambert et al. hay cuatro medias marginales, una media correspondiente a todos los parti
cipantes que trabajan con el estereotipo apropiado (como vimos anteriormente, 6,77), una para
todos los participantes que trabajan con el estereotipo inapropiado (6,29), una para todos ios par
ticipantes que se sienten tristes (6,78) y una para todos los participantes con estado de ánimo neu
tro (6,28). (Las inedias que acabamos de mencionar no aparecen en las tablas porque estábamos
interesados principalmente en la interacción).
Para observar el efecto principal debemos concentramos en las inedias marginales. Para
observar el efecto interactivo, debemos concentramos en el patrón de medias de las casillas
individuales.
Total 35 35 20 35' 25 40
En el resultado A, existe una interacción. Observamos que en la fila “Menores” no existe diferen
cia de ingresos por educación; pero en la fila “Mayores”, la media de la casilla correspondiente a
la educación universitaria es mucho mayor que la media de la casilla correspondiente a educación
secundaria. Una manera de expresar verbalmente lo anterior sería la siguiente: “La educación no
está relacionada con el ingreso en el caso del grupo ‘Menores5, pero en el caso del grupo M ayo
res', las personas con educación universitaria ganan mucho más que aquellas con menor nivel de
educación".
El resultado ficticio B también refleja una interacción. En la fila “Menores", la media de in
greso correspondiente a la educación secundaria es mayor a la media de ingreso correspondiente
a la educación universitaria; sin embargo, en la fila “Mayores” la media de ingreso correspon
diente a la “educación secundaria” es menor. Expresado verbaimente, este patrón indica que entre
las personas de menor edad, aquellos con sólo una educación secundaria ganan más dinero (tal
vez porque ingresaron al empleo con anterioridad o porque las ciases de empleos que desempe
ñan comienzan con un nivel superior); sin embargo, entre las personas de mayor edad, aquellos
con una educación universitaria ganan más dinero.
El resultado ficticio C no refleja un efecto interactivo. En la fila “Menores”, la media de edu
cación secundaria es 20 puntos menor que la media de educación universitaria. Lo mismo ocurre
en la fila “Mayores” . Expresado en palabras, lo anterior significa que, ya sean menores o mayo
res, las personas con educación universitaria ganan $20.000 más.
El resultado ficticio D tampoco refleja interacción, ya que en ninguna de las filas existe dife
rencia alguna. Independientemente de la educación, las personas mayores ganan $50.000 más.
El resultado ficticio E refleja una interacción. En la fila “Menores”, la media correspondiente
a la educación universitaria es 10 puntos mayor; pero en la fila “Mayores”, la media correspon
diente a la educación universitaria es 20 puntos mayor. Por lo tanto, si bien entre las personas me
nores, los que tienen educación universitaria ganan un poco más, entre las personas mayores, los
que tienen educación universitaria ganan mucho más.
Finalmente, el resultado F también refleja un efecto interactivo. Existe una diferencia menor
en la fila “Menores” que en la fila “Mayores” . Al igual que el resultado E, este patrón indica que,
en el caso de las personas menores, aquellas que tienen educación universitaria ganan un poco
más; pero entre las personas mayores, aquellas con educación universitaria ganan mucho más.1
La tabla 13-4 indica los posibles resultados de otro estudio ficticio. En este experimento fac
torial, las dos variables manipuladas experimentalmente son el grado de dificultad de la tarea (fá
cil en contraposición con difícil) y el nivel de excitación psicológica (baja, moderada o alta). La
excitación, en este estudio, se refiere al nivel de ansiedad del participante con respecto a la impor
tancia de realizar bien la tarea. La variable que se está midiendo es el nivel de desempeño del par
ticipante en una serie de tareas aritméticas. La interpretación de las posibles interacciones es la
siguiente:
Resultado A: no hay interacción. Las medias de las casillas en la fila “Fácil” no difieren en
tre sí, y las medias de las casillas en la fila “Difícil" tampoco. Sí existe un efecto principal: la difi
cultad de la tarea afecta el desempeño; la excitación no.
Resultado B: no hay interacción. Las medias de las casillas en la fila “Fácil” aumentan de a
10, de bajo a moderado y de moderado a alto. Lo mismo ocurre con las medias de las casillas en la
fila “Difícil”. Nuevamente existe sólo un efecto principal: la excitación afecta el desempeño; la
dificultad de la tarea, no.
Resultado C: no hay interacción. Las medias de las casillas en la fila “Fácil” aumentan de a
10, de bajo a moderado y de moderado a alto; lo mismo sucede con las medias de las casillas en la
fila “Difícil”. En este ejemplo, existen dos efectos principales: la excitación afecta el desempeño
y la dificultad de la tarea también.
Resultado D: existe interacción. El patrón de las medias de las casillas en la fila “Fácil"
muestra un aumento de a 10, de bajo a moderado, y otro aumento de a 10, de moderado a alto. El
patrón que describimos anteriormente no es el mismo que el de las medias de las casillas en la fi
la “Difícil", donde nuevamente el aumento es de a 10 de bajo a moderado, pero de 40 de modera
do a alto. Por lo tanto, en todos los casos, el desempeño con tamas fáciles o difíciles tiende a
mejorar con el aumento de la excitación. Sin embargo, el impacto entre excitación alta y modera
da es mucho mayor para tareas difíciles que para tareas fáciles.
Resultado É: existe interacción. El patrón de las medias de las casillas en la fila “Fácil"
muestra un aumento de a 10 y luego una disminución de a 10. Este patrón es bastante diferente al
de la fila “Difícil", donde observamos una disminución de a 10 y luego un aumento de a 10. En el
caso de las tareas fáciles, el mejor desempeño se produce en la condición de excitación modera
da; en cambio, para las tareas difíciles, el peor desempeño se produce en la condición de excita
ción moderada.
Resultado P: existe interacción. En la fila “Fácil”, las medias de las casillas aumentan a me
dida que avanzamos, mientras que en la fila “Difícil” disminuyen. En el caso de las tareas fáciles,
a mayor excitación, mejor es el desempeño; en el caso de las tareas difíciles, la excitación inter
fiere con el desempeño. (El resultado F es el más cercano a un descubrimiento psicológico bien
fundamentado, el cual se conoce como la Ley de Yerkes-Dodson).
! Sobre la base de las estadísticas realizadas en 1990 p o r la Secretaría de Educación de ios Estados Unidos, 3a situación
actual en ese país es muy cercana al resultado F, aunque no tan extrema. En ambas franjas de edad, las personas con
educación universitaria ganan más que aquellas que tienen sólo educación secundaria, pero la diferencia e s un poco
mayor en la franja de personas mayores. Sin embargo, es importante recordar que el hecho de que una persona reciba o
no educación universitaria también está relacionado con la ciase social de sus padres y con otros factores que pueden
afectar el ingreso más de ío que lo hace la educación.
Tabla 13-4.
Algunos resultados posibles de un experimento acerca del efecto del grado de dificultad y la excita
ción sobre el desempeño. (Datos ficticios).
R esu lta d o A R esu ltad o B R esu ltad o C
'í
Excitación Excitación Excitación
Tarea Baja Moderada Alta Total Baja Moderada Alta Total Baja Moderada Alta Total
Fácil 10 10 10’A 10 TÓiV; :2a y. 30 y. 20 10 • 20 : ' soy
Difícil . (:20 \:U 20 ' 20 ; 10 • 20 3Ó " 20 20 'ri 30 40 ^
Total 15 15 15 10 20 30 15 25 35
O
Fácil v v íí# 20 30- 20 10 '20 13,3 10 '■20A;: 30 ■
Difícil ■:20 ■ '6 0 - 30 20 ' 10 1 20 '• 16,7 30 :V-20^ 10'
Total 10 20 45 15 15 15 20 20 20
2 La utilización de gráficos de barras para representar las medias de las casillas de un análisis de varianza, cuando exis
te un efecto interactivo, se ha convertido en e l método estándar en los últimos años. Anterioimente, era más común uti
lizar gráficos de líneas. Veremos este tema y ejem plos referidos al mism o en la sección donde tratamos la descripción
del análisis factorial de varianza en las publicaciones científicas.
rras que representan al grupo “Mayores” indican un aumento. En los resultados B, las barras que re
presentan al grupo “Menores” muestran una disminución, en el caso de la educación universitaria,
con respecto a la secundaria, mientras que las barras que representan el grupo “Mayores” muestran
un aumento en el caso de la educación universitaria con respecto a la secundaria. En los resultados E
y F, tanto las barras que representan al grupo “Menores” como ai “Mayores” muestran un aumento,
pero las barras que representan al grupo “Menores” muestran un aumento menor que las barras que
representan al grupo “Mayores”.
Analicemos la figura 13-4. Los resultados A, B y C muestran la ausencia de interacción den
tro de cada resultado, y los patrones de las barras que representan la excitación baja, moderada y
alta son iguales. En el resultado D existe interacción, que se refleja en la figura de la siguiente ma
nera: las barras dentro del nivel bajo son parejas al igual que dentro del nivel moderado; pero en
tre las barras que representan el nivel de excitación alto, hay un aumento en la condición de tarea
difícil con respecto a la tarea fácil. La interacción del resultado E se ve en tos aumentos en ios ni
veles bajo y alto de excitación y, por otro lado, en la disminución en el nivel moderado de excita
ción. La interacción del resultado F se refleja en el hecho de que existe un aumento entre las
barras del nivel bajo, mientras que las barras del nivel moderado son parejas, y una disminución
en la barra que representa la condición difícil.
La figura 13-5 muestra una alternativa diferente a la de la figura 13-4 en cuanto a la forma de
representar gráficamente los resultados de la tabla 13-4. En este caso, hemos agrupado las barras
correspondientes a las condiciones “difícil” y “fácil” . Las barras que representan la tarea fácil con
excitación baja, moderada y alta están ubicadas una al lado de la otra, y las barras que representan
la tarea difícil, con excitación baja, moderada y alta, se encuentran también una al lado de la otra.
Esta alternativa de agrupación es completamente equivalente en significado y produce exacta
mente las mismas conclusiones. Por ejemplo, en el resultado A las tres barras de tarea difícil son
parejas, al igual que las tres barras de tarea fácil. En el resultado C, donde tampoco hay interac
ción, las tres barras de tarea fácil aumentan con el mismo patrón que las tres barras de tarea difí
cil. Sin embargo, analicemos el resultado D, donde sí existe una interacción. El patrón de las
Figura 13-2.
Calificaciones con respecto a la candidata
físicamente atractiva para el empleo, como ¡ Estado dé isú m o t r í ^ '.- -.
una función de la concepción del atractivo
físico (inapropiado en contraposición con
apropiado) y del estado de ánimo manipu
lado (triste en contraposición con neutro).
Experimento 3. Los números mayores in
dican una mayor posibilidad de contrata
ción del objetivo para el empleo [Fuente:
Lambert, A. IKhan, S. R., LickelB. A. &
Fricke, K. (1997), fig. 1. “El estado de áni
mo y la correlación con estereotipos positi
vos en contraposición con los negativos”.
R e v is ta c ie n tífic a d e P s ic o lo g ía S o c ia l y d e
P e r s o n a lid a d [ J o u r n a l o f P e r s o n a l i t y a n d
S o c i a l P s y c h o l o g y ] 72,1002-1016. Copy ÍIriápropía¡d<5: Api^iádí) :
right 1997, por la Asociación America
na de Psicología. Reimpreso con Auto n^Cbnce^jiSb'del!
rización]
Resultado A' • Resultado B ■. Resultado C •
60- 60. ' ''
50-;.v 50- . ' 50-
Figura 13-3.
Gráficos de los resultados ficticios de la tabla 13-3.
barras que representan la tarea fácil es diferente del patrón de las barras que representan la tarea
difícil. Existe un escalón mayor entre la excitación moderada a alta en las barras de la tarea difícil
que en las de tarea fácil.
También podemos identificar efectos principales a partir de estos gráficos. En la figura 13-3,
se mostraría un efecto principal de la edad si las barras que representan al grupo de menor edad
fueran todas más altas o más bajas que las barras que representan al grupo de mayor edad. Por
ejemplo, en el resultado C, las barras que representan al grupo de mayor edad son claramente más
altas que las barras del grupo de menor edad. ¿Qué sucede con el efecto principal de las barras
que no están agrupadas, como son, en este caso, la educación universitaria en contraposición con
la secundaria? En el caso de las barras no agrupadas, debemos observar si el patrón general au
menta o disminuye. Por ejemplo, en el resultado C también existe un efecto principal de la educa
ción, porque el patrón general de las barras aumenta en cuanto a la educación universitaria con
respecto a la educación secundaria, y lo hace tanto para el grupo de menor edad como para el de
mayor edad. El resultado D muestra un efecto principal de la edad (las barras del grupo de mayor
edad son más altas que las barras del grupo de menor edad). Sin embargo, el resultado D no mues-
Resultado A
Tarea -
□ Fácil.
S Difícil
F igura 13-4.
Gráficos de los resultados ficticios de la tabla 13-4.
tra un efecto principal de la educación; el patrón es parejo tanto para las barras que representan al
grupo de mayor edad como para las que representan al grupo de menor edad. El resultado A en la
figura 13-4 muestra un efecto principal del grado de dificultad de la tarea, pero no del nivel de ex
citación, ya que las alturas promedio de las barras son las mismas para la excitación baja, modera
da y alta; mientras que dentro de cada nivel de excitación, las barras aumentan de fácil a difícil.
’•20
V'iO
Baja Moderada j^ita/ ■Baja Moderada Alta' : :Y8aj¿ Moderada, Alta Baja Modelada Alta .
' ' ;■.Excitación,. ■' ¡: Excitación Excitación ■ ' ■ i ■Excitación Excitación :r • Excitación ...
Figura 13-5.
Gráficos alternativos (en relación con la figura 13-4) de los resultados ficticios que aparecen en la tabla 13-4.
fíciles, se debe en su totalidad al alto nivel de excitación. Más adelante seguiremos tratando este
tipo de situaciones).
También puede existir un efecto interactivo sin efectos principales. El resultado B de la tabla
13~3 es un ejemplo de lo anterior. El nivel promedio de ingreso es el mismo para “Menores” y
“Mayores” (no existe efecto principal de la edad), y es el mismo para personas con educación uni
versitaria o secundaria (no existe efecto principal del nivel de educación). De manera similar, en
el resultado F de la tabla 13-4, el desempeño promedio es el mismo páralos niveles bajo, modera
do y alto de excitación (no existe efecto principal del nivel de excitación), y es el mismo para ta
reas fáciles y difíciles (no existe efecto principal del nivel de dificultad de la tarea). Sin embargo,
en ambos ejemplos existen claras interacciones.
El ejemplo de Lambed; et al. (1997) que analizamos anteriormente es, en realidad, un ejemplo
de interacción sin efectos principales (véase tabla 13-2 ó figura 13-2). Es verdad, que en líneas ge
nerales, los participantes que se sentían tristes calificaron sus posibilidades de contratar de forma
más alta que los participantes con estado de ánimo neutro. Sin embargo, la diferencia no fue lo su
ficientemente importante como para resultar significativa desde el punto de vista estadístico. De
modo similar, la diferencia entre las condiciones en las que el estereotipo era apropiado o inapro
piado no fue lo suficientemente importante como para ser significativa. Es decir, que en ese estu
dio sólo el efecto interactivo era significativo. (En la próxima sección principal veremos cómo se
calcula realmente si un efecto es lo suficientemente importante como para ser significativo).
También puede ocurrir que exista un efecto principal significativo junto con una interacción,
o sólo un efecto principal significativo, o bien que no existan ni efectos principales ni interactivos
que sean significativos. Sería interesante observar cuántas de esas posibilidades se pueden identi
ficar en las dos series de resultados ficticios de las tablas 13-3 y 13-4.
Cuando no existe interacción, el efecto principal tiene un significado directo. Sin embargo,
cuantío existe una interacción junto con un efecto principal, debemos ser cuidadosos al sacar con
clusiones acerca del efecto principal. Analicemos el resultado D del ejemplo relacionado con la
excitación y la dificultad de la tarea (tabla 13-4). Suponiendo que las diferencias son lo suficien
temente importantes como para ser significativas, existen dos efectos principales y una interac
ción. Pero como observamos anteriormente, el efecto principal de la dificultad de la tarea se debe
completamente a la casilla en la que se combinan el alto nivel de excitación y la tarea difícil. Se
ría engañoso realizar cualquier afirmación acerca de la comparación de tareas difíciles con tareas
fáciles en general, sin tener en cuenta que el efecto realmente depende del nivel de excitación.
A veces, el efecto principal se mantiene claramente por encima de cualquier interacción.
Analicemos nuevamente el resultado D del ejemplo acerca de excitación y dificultad de la tarea.
En ese resultado, el efecto principal de la excitación se mantiene por encima de la interacción.
Tanto en el caso de las tareas fáciles como de las difíciles ocurre que el bajo nivel de excitación
produce el menor nivel de desempeño, la excitación moderada produce el segundo desempeño en
la escala, y el nivel alto de excitación produce el mejor desempeño. (Aun así, existe una interac
ción porque el grado en el cual un alto nivel de excitación produce mejor desempeño que la exci
tación moderada es mayor para las tareas difíciles que para las tareas fáciles).
Figura 13-6.
Diagrama de ayuda para comprender un análisis de varianza factorial 2x2: (a) estimación intergrupai co
lumna de ía varianza basada en la diferencia entre la media de los participantes en la primera (sombreada) y
la segunda (no sombreada) columna; (b) estimación intergrupai fila, basada en la diferencia entre la media
de los participantes de la fila superior (sombreada) e inferior (no sombreada), y (c) estimación intragrupal de
varianza basada en la variación entre las observaciones de cada casilla.
En el cuadro 12-1 vimos que el análisis de realmente predecirse á través de medidas 1
varianza simula la forma en que los investi de la personalidad? És decir, que los teóri
gadores en el campo de la psicología plani cos de la personalidad se vieron obligados
fican la investigación, como también la a pensar estadísticamente. . ■ '■ ' -;:
forma én que todos pensamos. Conociendo Uno de los resultados de este desafío ;
ese paralelismo -sea que los investigadores ha sido lo que se dio en llamar “interaccio- .
realicen la comparación conscientemente o nismp” (p. ej i:Endler & Magnusson, 1976). ",
no- es probable que con frecuencia utilicen El interaccionismo representa la idea de
el modelo bien definido del análisis de va- que el comportamiento se predice mejor a i
rianza como guía de su propia lógica, Y lo través de la interacción entre la persona y la .
hacen no sólo cuando analizan información circunstancia. De inmediato adivinamos
o cuando diseñan una investigación; proba cuál ..fue el método estadístico que m a y o r ,
blemente, también utilizan el análisis de influencia tuvo en este campo (lo estamos -j
varianza como metáfora cuando teorizan. analizando en este capítulo), . .
Estudiar estadística es, en cierto sentido, un Por ejemplo, de. acuerdo con este mo-
entrenamiento en cuanto a la manera de ver délo, ni la ansiedad como rasgo de persona- •:
el mundo. lidad, ni la círcuristáncia de rendir él s a t , es ;
Un claró ejemplo del modo en que la tan buen elemento de predicción del estado .:
estadística influye en la forma de pensar de de ansiedad como saber que una persona I
los psicólogos acerca de su objeto de estu con determinada tendencia á la ansiedad • ■
dio, y no sólo sobre la información recopi percibe el hecho de rendir el s a t como una
lada, es el estudio de la personalidad. En circunstancia angustiante. El acento ésta ' .
los años 60, el campo de la personalidad puesto en él hecho de que él comporta
cambió para siempre a través del trabajo de miento es alterado constantemente por la Y
Walter Mischel (1968). Mischel parecía ha disposición interna del individuo en inte-
ber demostrado que, como regía general, la racción con su percepción de las cambian
circunstancia (el semáforo poniéndose en tes circunstancias. - •
rojo, por ejemplo, o una persona bien vesti ; Sigamos a un hombre ansioso a través .
da pidiendo ayuda) era un mejor elemento de algunas situaciones. Puede sentirse aún ;
de predicción de cómo va a actuar una per más o menos ansioso a medida que pasa de :
sona que cualquier otro rasgo de la perso la circunstancia del examen a una j^aya/de : 1
nalidad (por ejemplo, que una persona sea estacionamiento oscura y vacía, •según la •
cautelosa o altruista por naturaleza). Aco interacción que se produzca entre su rasgo
sados, los teóricos de la personalidad -que de ansiedad y su percepción de esa hueva . ;
eran de formación psicodínámíca- lucha circunstancia. Lo mismo sucederá cuando
ron por defenderse dentro de las reglas de vaya en camino hacia su casa en Ja autopis- :
juego que Mischel había establecido: ¿Cuán ta, abra el portón dei garaje y entre en una
to de la varianza del comportamiento podía casa vacía. . v
lumnas, pero también es posible agrupar las casillas de un modo diferente. La figura 13-7, basada
en el estudio de Lambert et a l, muestra una posible organización restante de las cuatro casillas en
dos agrupaciones mayores: a) una agrupación de dos casillas formada por la casilla superior iz
quierda (estereotipo apropiado y estado de ánimo triste) junto con la casilla inferior derecha (este
reotipo inapropiado y estado de ánimo neutro), y b) otra agrupación de dos casillas formada por la
casilla inferior izquierda (estereotipo inapropiado y estado de ánimo triste) y la casilla superior
derecha (estereotipo apropiado y estado de ánimo neutro). La estimación intergrupal de la varian
za, según el efecto interactivo, puede entonces ser determinada a partir de la variación entre las
medias de estas dos agrupaciones.
Con un diseño 2 x 2 , existe sólo una combinación de pares de casillas que yá no fueron teni
das en cuenta por las organizaciones en columnas y en filas, el patrón de agrupación representado
por el ejemplo en la figura 13-7. Pero con diseños mayores de dos criterios, como por ejemplo un
diseño 2 x 3 , existe más de una forma de combinar las agrupaciones, y todas deben tenerse en
cuenta. Por eso, calcular la estimación intergrupal de la varianza a partir de un efecto interactivo,
cuando tratamos con situaciones distintas del diseño 2 x 2 , puede ser bastante complicado. Afor
tunadamente, sucede que calcular la estimación intergrupal de la varianza, según el efecto de la
interacción, es mucho más directo desde el punto de vista del modelo estructural que aprendimos
en el capítulo 12.
F igura 13-7.
Interacción como comparación de la media de las observa
ciones de las casillas sombreadas (estado de ánimo neutro,
estereotipo apropiado y estado de ánimo triste, estereotipo
inapropiado) con la medía de las observaciones en las casi
llas no sombreadas (estado de ánimo triste, estereotipo apro
piado y estado de ánimo neutro, estereotipo inapropiado) del
estudio de Lamber! et al. (1997).
F igu ra Í3-8.
Cálculo del desvío de cada observación con respecto a la gran media.
3. El desvío de la media de la columna de la observación con respecto a la gran media (que se
utiliza en la estimación intergrupal basada en el efecto principal de la variable diagramada a lo
largo de las columnas).
4. Un desvío restante, que queda después de restar los otros tres desvíos-,al desvío general con
respecto a la gran media (es el que se utiliza en la estimación intergrupal del efecto interactivo).
Es recomendable tomarse un momento para estudiar la figura 13-8, ya que es la mejor mane
ra de comprender y recordar lo que estamos explicando.
C 3' 2)
Interacción =
, , % , ,,9 (13-3)
S((Jf-<3W ) - (X - ifJ-tJlÍF U ,, - G W )-(«C olu m n -,-O *0j"
■SCDe[,tr0=X(X~AÍ)2 03-4)
En las fórmulas anteriores. SCFltos, 5CColumn„, S C ¡aata¡6a y S C D am son las sumas de los cua-
drados de las filas, de las columnas, de las interacciones y de las intragrupales de las casillas.
El signo suma (X) indica que se deben sumar todas las observaciones que corresponden (no
sólo todas las filas o columnas o casillas). GM es la gran media; X es la observación; AfPi¡a y
^Columnason *as meclias de la fila o la columna de una observación, y M es la media de la casi
lla de una observación.
Como es usual, las diferentes sumas individuales de cuadrados forman la suma total de cua
drados. (Este dato se puede utilizar para controlar los cálculos aritméticos). La fórmula es la si
guiente,
<SC*fF„as (13-7)
¿‘Filas
<?2 A ruA —^ Columnas
‘-'Columnas0 Coluroñas ~~ ¡ (13-8)
Sl Columnas
sL w o 6 „ = í£ i» rs (I3. 10)
%^Dentro
‘-’Columnas a Ó^Columnas
Columnas ~ c2 u (13-12)
S Dentro Dentro
F — interacción a Interacción
‘ interacción „2 ° (13-13)
‘-'Dentro ‘"^Dentro
En Las fórmulas anteriores, FPi¡as es la razón F del efecto principal de las filas; FColuranas es la ra
zón F del efecto principal de las columna, y FMeracción es la razón F del efecto interactivo.
Antes de seguir avanzando, es necesario que veamos cómo se calculan los distintos grados de
libertad y cómo se diseña la tabla del análisis de varianza.
o ¿Columnas = ^Columans ” * (1 3 -1 4 )
y
^Filas ~ ^Filas “ ¿ (1 3 -1 5 )
En las fórmulas anteriores, AfColumnas - cantidad de columnas, y WFilas = cantidad de hileras.
Grados de libertad de la estimación de la varianza a p artir del efecto interactivo. Los grados
de libertad de la estimación intergrupal de varianza, calculados a partir del efecto interactivo, son
iguales a la cantidad total de casillas menos la cantidad de grados de libertad de los dos efectos
principales menos 1. En el estudio de Lambert et al,, hay cuatro casillas, y cada efecto principal
tiene un grado de libertad. Es decir, quedan 2 grados de libertad a los que se les resta 1 más, y que
da 1 para la interacción. En los ejemplos relacionados con el nivel de excitación y dificultad de la
tarea, había ó casillas. El efecto de las columnas tenía 2 grados de libertad, y el efecto de las filas
(tarea fácil versus tarea difícil) tenía 1. Es decir, hay 3 grados de libertad, y al restar 1 más quedan
2 grados de libertad para la interacción.
Lo anterior se expresa bajo la siguiente fórmula,
^Total ~ N ~ 1 (13-18)
También podemos calcular los grados totales de libertad sumando todos los grados individuales
de libertad (los de las columnas, de las filas, de la interacción y de las intragmpales). Teniendo en
cuenta lo anterior, podemos controlar los cálculos aritméticos realizados al calcular los grados de
libertad. La fórmula es la siguiente,
(13-19)
Intergrupaï;
Colum nas ir "1 V
Columnas
^Columnas ^^Coiumnas
Filas Fitos g Fúta C M ^ ■MFilas
Interacción se ■^Interacción
‘".interacción ^interacción " ■ ‘ interacción
Interacciones ^ D e a ito ¿^Dentro ^ D e n tro
Totai ^ T o ta l S^Totai
Tabla 13-6.
Medias de casillas y marginales de la cantidad de veces que se encontró a los participantes en
actividades sociales.
D eseo d e r elación
B a jo A ito
Muchachas
17,4 15,60 2,74 13.54 0,18 0,92 22,0 73,10 2,72 13,54 0,18 0,92
17,1 13,32 1,82 13,54 0,18 0,92 20,5 49,70 3,96 13,54 0,18 0,92
16,8 11,22 1,10 13,54 0,18 0,92 19,9 41,60 1,93 13,54 0,18 0,92
16,7 10,56 0,90 13,54 0,18 0,92 19,1 31,92 0,35 13,54 0,18 0,92
15,5 4,20 0,06 13,54 0,18 0,92 18,5 25,50 0,00 13,54 0,18 0 ,9 2
15,3 3,42 0,20 13,54 0,18 0,92 17,4 15,60 1,23 13,54 0,18 0,92
15,0 2,40 0,56 13,54 0,18 0,92 17,0 12,60 2,28 13,54 0,18 0,92
15,4 3,80 0,12 13,54 0,18 0,92 17,1 13,32 1,99 13.54 0,18 0,92
14,3 0,72 2,10 13,54 0,18 0,92 17,1 13,32 1,99 13,54 0,18 0,92
14,0 0,30 3,06 13,54 0,18 0,92 16,5 9,30 4,04 13,54 0,18 0,92
157,5 65,54 12,64 135,40 1,80 9,20 185,1 285,96 29,95 135,40 1,80 9,20
Control de exactitud: SCToia¡ = 654,24; S C ^ + SCm + 5CColüirats + = 67,21 + 543,20 + 7,20 + 36,80 = 654,41
(Los resultados contemplan diferencias de redondo).
T a b la 1 3 - 8 .
C á lc u lo d e u n a n á lis is d e v a r ia n z a u t iliz a n d o s u m a s d e c u a d r a d o s , s o b r e la b a s e d e l e s t u d io d e
W o n g y C s i k z e n t m i h a l y i ( 1 9 9 1 ) . ( D a t o s F i c t i c i o s ) . *1
F punto d e corte para el efecto principal del sex o ( g l = 1 ,3 6 ; p < 0 ,05) ~ 4 ,1 2 ( g l = 1, 35 de la tabla)
F punto de corte para el efecto principal de deseo de relacionarse para (gí = 1, 36; p < 0 ,0 5 ) = 4 ,1 2
F punto de corte para e l efecto Interactive ( g l = 1 , 36; p < 0 ,0 5 ) = 4 ,1 2
F u en te SC si CM F
La tabla 13-8 muestra los valores correspondientes al punto de corte F y a la tabla del análisis de
varianza. La figura 13-9 representa los resultados gráficamente. Analizaremos el ejemplo si
guiendo el procedimiento habitual de prueba de hipótesis paso a paso.
1. Replantear el problema en función de hipótesis de investigación e hipótesis nula de las
poblaciones para cada efecto principal y efecto interactivo. Existen cuatro poblaciones:
Población 1,1: muchachas que tienen un nivel bajo de deseo de relacionarse.
Población 1,2: muchachas que tienen un nivel alto de deseo de relacionarse.
Población 2,1: muchachos que tienen un nivel bajo de deseo de relacionarse.
Población 2,2: muchachos que tienen un nivel alto de deseo de relacionarse.
La primer hipótesis nula establece que las poblaciones combinadas de muchachas (poblacio
nes 1,1 y 1,2) tienen la misma media que las poblaciones combinadas de muchachos (2,1 y 2,2),
en cuanto a la cantidad de veces que se involucraron en actividades sociales. Esta es la hipótesis
nula que prueba el efecto principal del sexo (muchachas en contraposición con muchachos). La
hipótesis de investigación establece que las poblaciones de muchachas y de muchachos tienen di
ferentes medias.
Figura 13-9.
G ráfico de lo s datos fic tic io s (sim p li
fic a d o s) b asados e n lo s resultados d el
e stu d io d e W o n g y C sikszentm dhalyi
(1 9 9 1 ).
La segunda hipótesis nula establece que las poblaciones combinadas de aquellos con bajo de
seo de relacionarse (poblaciones 1,1 y 2,1) tienen la misma media que las poblaciones combina
das de aquellos con alto deseo de asociación (poblaciones 1,2 y 2,2), con respecto a la cantidad de
veces que se involucraron en actividades sociales. Esta es la hipótesis nula que prueba el efecto
principal del deseo de relacionarse (bajo en contraposición con alto). La hipótesis de investiga
ción establece que las poblaciones con alto y bajo nivel de deseo de relacionarse tienen diferentes
medias.
La tercer hipótesis nula establece que la diferencia entre la cantidad media de actividades so
ciales de las dos poblaciones de muchachas (población 1,1 menos población 1,2) será la misma
que la diferencia entre las medias de las dos poblaciones de muchachos (población 2,1 menos po
blación 2,2). Esta es la hipótesis que prueba el efecto interactivo. (También podría haberse plan
teado, sin cambiar el significado, como la diferencia entre las dos poblaciones con bajo nivel de
deseo, igualando la diferencia entre las dos poblaciones con alto nivel de deseo). La hipótesis de
investigación establece que estas diferencias no serán iguales.
2. Determ inar las características de las distribuciones comparativas. Las tres distribucio
nes comparativas serán distribuciones F. Los grados de libertad de ios denominadores serán la su
ma de los grados de libertad de cada una de las casillas (la cantidad de observaciones de la casilla
menos 1). En este caso, hay 10 participantes en cada una de las cuatro casillas, es decir, 9 grados
de libertad por casilla; queda un total de 36. El numerador de la distribución comparativa del
efecto principal del sexo tiene 1 grado de libertad (2 filas menos 1); el numerador del efecto prin
cipal del deseo de relacionarse también tiene 1 grado de libertad, y el grado de libertad del nume
rador del efecto interactivo es, nuevamente, 1 (es la cantidad de casillas, 4, menos los grados de
libertad de las columnas, menos los grados de libertad de las filas, menos 1). Como control de la
precisión del cálculo de los grados de libertad, los tres numeradores más los grados de libertad del
denominador son igual a 1 + 1+ 1+ 36 = 39; lo que es igual al total de grados de libertad calcula
dos como la cantidad de participantes menos 1 (es decir, 40 - 1 = 39).
3. Determinar los puntos de corte en las distribuciones comparativas, a p artir de los
cuales debería rechazarse cada hipótesis nula. Utilizando el nivel 0,05 de significación, la ta
bla B-3 indica un punto de corte para 1 y 35 grados de libertad de 4,12 (el más cercano disponible
en la tabla debajo de 1 y 36). Los grados de libertad y el nivel de significación son los mismos, en
este caso, para ambos efectos principales y para el efecto de interacción; por lo tanto, el punto de
corte también es el mismo para los tres efectos.
4. Determ inar los valores m uéstrales en cada distribución comparativa. Este paso re
quiere el cálculo de tres razones F, que, como hemos visto, requiere calcular primero varios des
víos, elevarlos al cuadrado y sumarlos. La tabla 13-7 indica los desvíos cuadráticos de cada
participante.
Para ahorrar espacio, la tabla indica sólo los desvíos cuadráticos. Sin embargo, debajo de la
tabla de desvíos cuadráticos mostramos un ejemplo de la forma de cálculo de los desvíos cuadrá
ticos de la primera observación. Dos consejos son especialmente útiles para el cálculo del desvío
en el efecto interactivo: a) se debe prestar mucha atención a los signos de los cuadrados que se es
tán restando y b) no se debe olvidar que el desvío interactivo, antes de elevarse al cuadrado, se
calcula a partir de los desvíos originales no elevados al cuadrado, y no de los desvíos cuadráticos.
Después los desvíos cuadráticos individuales se suman para obtener 5CTotai, y así sucesiva
mente, como lo indica la siguiente parte de la tabla 13-7. Es importante recordar que las sumas de
los distintos desvíos cuadráticos (ÓCDemro ó SCFiias, SCColumoas, SCImeracdJ conforman el desvío
cuadrático total. Sin embargo, si tomamos a un sólo participante, los distintos desvíos cuadráticos
no dan el desvío cuadrático general a la observación con respecto a la gran media. La tabla 13-7
también indica el control de la exactitud de los cálculos: la suma de ios desvíos cuadráticos con
respecto a la gran media es igual al total de las sumas de las otras cuatro clases de desvíos cuadrá-
ticos (teniendo en cuenta las diferencias de redondeo),
Existe otro detalle importante con respecto a los cálculos, que se indican en la tabla 13-7. Co
múnmente, en un análisis 2 x 2 todos los desvíos cuadráticos de las filas son iguales (como lo son
todos los desvíos cuadráticos de las columnas y todos los desvíos cuadráticos de la interacción).
La pequeña diferencia (136,20 contra 135,40) entro los desvíos cuadráticos de las filas de la parte
inferior y las de la parte superior se debe simplemente a diferencias de redondeo al calcular las
medias de las filas.
Los siguientes pasos se indican en la tabla 13-8 del análisis de varianza. Primero, ingresamos
la suma de los desvíos cuadráticos de la tabla anterior para cada estimación de la varianza, y ade
más los grados de libertad del paso 2. Después utilizamos esos datos para calcular el resto de la
tabla (los cuadrados medios y los valores F). Las conclusiones se indican en el extremo derecho
de la tabla y se detallan en el punto 5.
5. C o m p a rar los valores de los pasos 3 y 4 p ara d ecid ir si se rechazan o no la s hipótesis
n u las. La razón F calculada para el efecto principal del sexo, de 290,48, es mucho mayor que el
punto de corte de 4,12. Por lo tanto, podemos rechazar la hipótesis nula que establece que las po-
bláciones de muchachas y muchachos tienen la misma cantidad media de actividad social. Es de
cir, el efecto principal del sexo es significativo. El F de 3,85, correspondiente al efecto principal
de la necesidad de relacionarse, no llegó ai 4,12, punto de corte necesario. Se puede decir que es
te efecto se ha acercado a la significación pero no la ha alcanzado. Finalmente, el efecto interacti
vo F de 19,68 excede el punto de corte de 4,12; por lo tanto, el efecto interactivo también es
significativo. (En el estudio real se encontró el mismo patrón básico, el efecto principal del sexo y
el efecto interactivo eran significativos, mientras que el efecto principal del deseo de relacionarse
se acercó pero no llegó a la significación). Antes de continuar, seria una buena idea que el alumno
intentara explicar con palabras el significado de esta interacción.
La figura 13-9 representa gráficamente el patrón de medias. Como podemos observar en el
gráfico (y por las medias de casillas de la tabla 13-6), el efecto principal del sexo se debe a que las
muchachas participan en más actividades sociales que los muchachos. El efecto interactivo se de
be a que el deseo de relacionarse está asociado con la mayor cantidad de actividad social de las
muchachas, pero básicamente no relacionado con la cantidad de actividades sociales de los mu
chachos. Es decir, existía una diferencia entre la cantidad de actividades de muchachas con alto
nivel y aquellas con bajo nivel de deseo de relacionarse. Pero entre muchachos, la diferencia casi
no existía (incluso se daba levemente en la dirección contraria). Esta es la razón por la cual, en ge
neral, combinando muchachos y muchachas, ei deseo de relacionarse parecía tener poca o ningu
na influencia en las actividades. Una vez más podemos observar cómo se descubre una relación
interesante entre las variables a través de la aplicación del análisis de varianza para analizar efec
tos interactivos.
Figura 13-10.
G ráfico d e io s d atos fic tic io s (s im p li
fic a d o s) basad os en lo s resu ltad os d el
e stu d io d e B lanchard, L illy y V aughn.
Influencia
las poblaciones de alumnas que responden pública y privadamente tienen diferentes medias en
cuanto a la expresión de actitudes antirracistas.
La segunda hipótesis nula establece que no existe diferencia entre las medias de las poblacio
nes combinadas expuestas a influencia antirracista (poblaciones 1,1 y 1,2), las poblaciones com
binadas no expuestas a ninguna influencia (poblaciones 2,1 y 2,2) y las poblaciones combinadas
expuestas a influencia no antirracista (poblaciones 3,1 y 3,2). Esta es la hipótesis nula que prueba
el efecto principal de la dirección de la influencia. La hipótesis de investigación establece que
esas tres poblaciones combinadas tienen diferentes medias.
La tercera hipótesis nula establece que el patrón de las medias de las tres poblaciones que res
ponden en público (poblaciones 1,1,2,1 y 3,1) será igual al patrón de las medias de las tres poblacio
nes que responden en privado (poblaciones 1,2, 2,2 y 3,2). Esta es la hipótesis nula que prueba el
efecto interactivo. (También podría plantearse del siguiente modo sin cambiar el significado: la dife
rencia entre las poblaciones que responden en público y en privado será la misma al comparar las
dos poblaciones con influencia antirracista, las dos poblaciones que no reciben influencia, y las dos
poblaciones con influencia no antirracista). La hipótesis de investigación establece que el patrón de
las medias de las tres poblaciones que responden públicamente difiere del patrón de las mechas de las
tres poblaciones que responden en forma privada.
2. D eterm in ar la s características de la s d istrib uciones com parativas. Las tres distribucio
nes comparativas serán distribuciones F con grados de libertad del denominador, iguales a la su
ma de los grados de libertad de cada una de las casillas (la cantidad de observaciones de la casilla
menos 1). En este caso, hay 4 observaciones en cada una de las seis casillas, lo que da 3 grados de
libertad en cada uno, y un total de 18. El numerador de la distribución comparativa del efecto
principal de la modalidad de respuesta tendrá 1 grado de libertad (2 columnas menos 1); el nume
rador del efecto principal de la dirección de la influencia tendrá 2 grados de libertad (3 filas me
nos 1), y los grados de libertad del numerador correspondiente al efecto interactivo también será 2
(la cantidad de casillas, 6, menos los grados de libertad de las columnas, 1, menos los grados de
libertad de las filas, 2, menos 1). Como control de la exactitud, los grados de libertad de los tres
numeradores más los grados de libertad del denominador son igual a 1+2+2+18-23, cantidad que
coincide con los grados de libertad totales calculados como la cantidad de participantes menos 1
(24-1=23).
3. D eterm in ar los puntos de corte en la s distrib uciones co m p arativas, a p a rtir de ios
cuales se debería rech a za r cada hipótesis nula. Utilizando el nivel 0,05 de significación, la ta
bla B-3 indica los puntos de corte que aparecen justo debajo de las casillas y las medias margina
les en la parte superior de la tabla 13-9.
4. D eterm in ar los valores m uéstrales en cada d istrib ución com parativa. Este paso re
quiere de tres razones F; se calculan todos los desvíos, se los eleva al cuadrado, se los suma y se
los divide por los grados de libertad para obtener los cuadrados medios. Finalmente, se calculan
las razones de los distintos cuadrados medios intergrupales y cuadrados medios íntragrupales. La
tabla 13-9 índica todos los cálculos anteriores.
5. C o m p arar los valores de los pasos 3 y 4 para decidir si se rechazan o no la s hipótesis
n u las. La razón F, que resultó ser 0, para el efecto principal de la modalidad de respuesta, cierta
mente no es significativa. (Si bien se basan en resultados reales, los números específicos son in
ventados. Utilizando información real, seria muy improbable obtener un F exactamente igual a
0). El F calculado en 11,7, para el efecto principal de la dirección de la influencia, es claramente
significativo. Excede en mucho el punto de corte de 3,56. Finalmente, la razón F del efecto inte
ractivo igual a 1,7 no alcanzó el punto de corte 3,56 necesario. Por lo tanto, los resultados no son
concluyentes para esta hipótesis. La figura 13-10 representa gráficamente el patrón de las medias.
Para observar en el gráfico el efecto principal de la dirección de la influencia, debemos comparar
Tablal3-9.
Cálculos del análisis de varianza de la información ficticia basada en los resultados del estudio de
Bíanchard, Lilly y Vaughn (3991),
Modalidad de respuesta
P ú b lic a P r iv a d a
(^c'olunuia ^Co/Mmna
X { X - G M )7 (X - M f l -G M )1 - g m y- IN T X (X -G M fl '(X -W )1 ~ g m y - G M )1 JTVr
influencia aníirracista
25 25 4 4 0 l 19 I 4 4 0 1
20 0 9 4 0 1 24 16 9 4 0 1
23 9 0 4 0 I 21 1 0 4 0 1
24 J 6 .1 _0 J. 20 _0 _1 _4 _ó J.
50 14 16 0 4 18 14 16 0 4
Ausencia de influencia
22 4 1 i 0 0 24 16 9 l 0 0
19 1 4 i 0 0 18 4 9 1 0 0
22 4 1 i 0 0 22 4 l 1 0 0
21 _ i J) _0 J) 20 _0 1 __1 J) 1
10 6 4 0 0 24 20 4 0 0
Influencia no aníirracista
16 16 0 9 0 1 18 4 0 9 0 1
19 1 9 9 0 1 21 1 9 9 0 l
13 49 9 9 0 1 16 16 4 9 0 1
16 16 _0 _G J. 17 _9 _ i _9 1 J.
82 18 36 0 4 30 14 36 0 4
b) Los grados de libertad del numerador de la distribución F del e fe cto principal de las filas son la cantidad
de fila s m en os 1 : g lB ^
c) L os grados d e libertad del numerador de la distribución F del efecto interactivo son la cantidad de casillas
m enos los grados de libertad de las colum nas, m enos lo s grados de libertad de las filas, m enos 1 :
^Interacción ~ ^Casillas ~ ¿^Columnas ~ áfilas
d) Las distribuciones comparativas serán distribuciones F c o n grados d e libertad del denom inador, igual a
la sum a de lo s grados d e libertad de cada casilla (la cantidad de casos en la casilla m enos 1 ):
^Dentro "
e) S e controla la exactitud de lo s cálculos asegurándose d e que todos los grados de libertad sum en
los grados de libertad totales: g lT m 1 = JV- 1 * g¿Demo + $¿Ccíumi3 + g íF¡ias + M nteraccíú,r
3. D eterm inar los cortes m uéstrales en las distribuciones com parativas, a partir d e lo s cuales se debería
rechazar cada hipótesis nula,
a) Determ inar los niveles de significación deseados.
b) B uscar lo s puntos de corte adecuados en una tabla F (tabla fí-3).
D eterm inar los valores m uéstrales en cada distribución comparativa (serán razones F ).
a) Calcular la m edia de cada casilla, fila y colum na m ás la gran m edia de todas las observaciones.
b) Calcular lo s siguientes desvíos de cada observación.
1) El desv ío con respecto a la gran media: X ~ G M .
li) E l d esv ío con respecto a la m edia de su casilla X ~ M .
iii) E l d esv ío de la m edia de su fila con respecto a la gran m edia: M F¡ja - GM.
iv ) El d e sv ío de la m edia de su colum na c o n respecto a la gran media: M Co]tln)(ia - G M .
v ) E l d e sv ío co n respecto a la gran m edia m en os tod os ios otros desvíos: d esv ío Interactivo =
( X - G M ) ~ ( X - M ) ~ (M Rja - GMMAfp^umna - G M ). (Para calcular este d esvío es necesario
asegurarse de utilizar los d esv ío s no cuadráticos y de prestar m ucha atención a lo s signos).
c ) Elevar cada uno d e lo s d esv ío s al cuadrado.
d) Calcular las sum as de cada uno de lo s distintos tipos de d esvíos cuadráticos
^TotaU ^Dentro’ ^Columna’ ^Interacción)'
e) C o n tr o la r ia e x a c titu d de lo s cálculos asegurándose de que la sum a de lo s d esvíos cuadráticos, basados
en el d esv ío de cada observación con respecto a la gran m edia, sea igual a la sum a de todas las otras
sum as d e d esv ío s cuadráticos. '^'Total “ ^Dentro + ^Columna * ^ F iia + ^Interacctóir
f) Calcular la estim ación intergrupal de varianza para cada efecto principal e interactivo (CM Co|umoas ó
^Columnas = ^ C oColumnas
lu m n as^' 5C‘Columna’
o lu m n a’ á f1i■
‘Filas
l a s ° ^Filas “ ^ F i i a s a p i l a s ’* ^ In teracc ió n
OSj.Interacción ~ SCín(era£C¡t5ntgl^
g ) Calcular la estim ación intragrupal de varianza { C M ^ ^ ó & - 5 C 0t /g /Dmt0).
h) C alcular las razones F para cada efecto principal e interactivo ( r Cofumnas = S i Columnas
¡ /C2
Dentro
° ^C o lu rru tas^p ^ D en tio ’^ F iia = ^ F ita ^ D e n tto ^ ^ P i i a ^ ^ D e n t r o 1
F _na <j2 /C2 JC M r,
r interacción ° Interacción
Interacción'^^ Dentro. Ó
u C M,
^ "interacción'D entro*
5. Comparar lo s valores obtenidos en los pasos 3 y 4 para decidir si se rechazan o no las hip ótesis nulas.
Tabla de análisis de varianza:
Fuente SC CM F
gi
íntergrapaí:
Columnas [i
Columnas ^"Columnas ^Columnas^ Columnas
Filas ^ R ta » ^Fílas
interacción F interacción
interacción ^EíítCfaccídn ^'•^Interacción ^ ^ Interacción)
Dentro ^D entro ^Dentro
Total d^Toral (Ó ’Sratajl
Fuente SC gl CM F
Intergrupal:
Columnas M _ 1
^ ^ C o lu m n a /^ iD c n fro
C o ta m a s ^ C o lu m n a /^ C o lu m n a s
S C M o ^ -G M Í*
Filas i(M n h ~G M ? á fila s "* S C ftlJ áf i l a s ^ F ils ÿ ^ D c m ro
Interacción S((X - GM) ^ C a silla s —^Columnas “ ^Fite ~ ^ g l\ ntcrcecióti ^ '^ i n t c ì a c c i ó n ^ ^ D e n t r o
-(x -m
- ( M Fth~ G M )
necesitamos contar con suficientes participantes como para que el efecto con el menor tamaño del
efecto esperado tenga una potencia adecuada. Del mismo modo, al evaluar los resultados de un
experimento factorial, debemos tener en cuenta el tamaño del efecto de cada efecto principal e in
teractivo separadamente.
p2 _ _______ ^Columnas
^Columnas ~ (13-20)
■^Total ~ ‘^■'íñlas ~ Interacción
Simplemente,
^Fiias
%i)as (13-21)
‘^-'Total ” “^Columnas “^interacción
‘^-'interacción________
■^interacción (13-22)
“^-Total ‘-^-Columnas a p ila s
Técnicamente, cada uno de los cálculos anteriores es una R2 “parcial”, porque describen la pro
porción de varianza explicada por un efecto después de “excluir” los otros efectos. (Volveremos a
tratar el tema de correlaciones parciales en el capítulo 17).
En el ejemplo basado en el estudio realizado con los equipos de radio llamadas por Wong y
Csikszentrnihalyi, R2 se hubiera calculado de la siguiente forma:
__________ ‘-^-Filas______
^Fílas (S e x o ) j
■SCrotai ~ *5Q:ointnnas ~ *->Qnte
5 4 3 ,2 0 __ 5 4 3 ,2 0
6 5 4 , 2 4 - 7 , 2 0 - 3 6 , 8 0 ~ 6 1 0 ,2 4 ~ ’
____^^interacción ________
^interacción (In tera cció n );
SGfotal “ ^Qüolurnnas“ ^^tlas
3 6 ,8 0 ^ 3 6 ,8 0
= 0 ,3 5
¿z a i a Z?toó- sanoo ~ 1ni M
Sobre la base de las reglas de Cohén para R2 en el análisis de varianza, según las presentamos en
el capítulo 12, existe un enorme tamaño del efecto, es decir, una R2 alta para el sexo y además un
buen tamaño del efecto para la interacción. El efecto no significativo del deseo de relacionarse te
nía un tamaño del efecto entre mediano y grande. (En el estudio real, los tamaños del efecto eran
mucho más pequeños. En el ejemplo, los tamaños del efecto son tan grandes porque inveníamos
datos con mucha menos varianza que en el estudio real, con el fin de que se pudieran observar los
patrones con claridad).
Si un estudio sólo proporciona los valores F y los grados de libertad, se aplica la fórmula que
vimos en el capítulo 12, R2 = (F)(glnatc&)l[(F)(glBnttc)+glVtmol sustituyendo los F y los grados de
libertad del efecto correspondiente.
nZ _ f e i urnnasX^Columnas)
^Columnas (1 3 -2 3 )
( ^Columñas) ^Columnas) ^ ^Dentro
r2 _ f e a s )(g¿Piias )
(1 3 -2 4 )
Fll3S {^Fiias X^Filas ) + ^Dentro
Por ejemplo, en el estudio realizado con los equipos de radio llamada, el deseo de relacionarse era el
efecto principal de las columnas. Calculamos FColumnas en 3,85, los grados de libertad para este efec-
t0 (¿^Columnas) en 1, y los grados de libertad intragrupales de las casillas (g/DenEf0) en 36. Por lo tanto,
( Columnas X-^Coiumnas)
■^Columnas
(^Columnas )(í^Coiumnas) ^ g a m ito
(3 ,8 5 )(1 ) _ 3 ,8 5
~ ( 3 , 8 5 ) ( l ) + 3 6 ~ 3 9 ,8 5
Potencia
En un análisis factorial de varianza, la potencia de cada efecto está influenciada por el diseño ge
neral. Por ejemplo, un efecto de columnas de tres niveles, tendrá distinta potencia si se cruza con
un efecto de filas de dos niveles o si se craza con un efecto de filas de tres niveles. Por lo tanto, el
análisis de la potencia es diferente según la cantidad de niveles de un efecto y, teniendo en cuenta
cada cantidad de niveles, según la cantidad de niveles con que se cruce.
Para simplificar las cosas, veremos las cifras relacionadas con la potencia sólo para las tres si
tuaciones más comunes del análisis de varianza de dos criterios; todos los efectos en un diseño
2 x 2, un efecto principal de dos niveles (dos filas o dos columnas) en un diseño 2 x 3 y un efecto
principal de tres niveles (tres filas o tres columnas) en un diseño 2 x 3 . (La potencia de la interac
ción en un diseño 2 x 3 es la misma que la del efecto principal de tres niveles). La tabla 13-12 in
dica la potencia aproximada al nivel 0,05 de significación para cada una de las situaciones
mencionadas, con tamaños del efecto pequeños, medianos y grandes, y con tamaños de casillas
de 10,20,30,40,50 y lOO.*3
Analicemos un estudio planificado 2 x 2 con 30 participantes por casilla y con un tamaño me
diano del efecto esperado (R2 ~ 0,06), a realizarse con el nivel 0,05. El estudio que mencionamos
arriba tendría una potencia de 0,78, es decir, que si la hipótesis de investigación en efecto es ver
dadera y tiene un tamaño del efecto mediano, las posibilidades de que el estudio resulte significa
tivo es de aproximadamente el 78%. O veamos un ejemplo tomado de una publicación, en el que
se encontró un resultado no significativo para un efecto interactivo en un análisis de varianza
2 x 3 con 20 participantes por casilla. Basándonos en la tabla, para un tamaño del efecto pequeño
el poder del estudio es de sólo 0,14. Es decir, que aun si ese efecto pequeño existe en la población,
sería muy improbable que el estudio resultara significativo. Por el contrarío, la tabla muestra una
potencia de 0,98 para un gran tamaño del efecto; por lo tanto, si existiera un gran efecto en la po
blación, casi con seguridad hubiera resultado significativo en el estudio.
Tabla 13-12.
Potencia aproximada de estudios realizados con un análisis de varianza 2 x 2 ó 2 x 3 con respecto a
hipótesis probadas a un nivel 0,05 de significación.
N p o r C a silla Tamaño del efecto
P equeño M e d ia n o G ra n d e
(f=0J0) ( f = 0 ,2 5 ) ( f = 0 ,4 0 )
(R = 0,10) (R = 0 ,2 4 ) ( R - 0 ,3 7 )
(í? = 0,01) (R 2 = 0 ,0 6 ) (R 2 = 0 ,1 4 )
Todos lo s efecto s en un análisis 2x2:
10 0,09 0,33 0,68
20 0,13 0 ,6 0 0,94
30 0 ,1 9 0,78 0,99
40 0,24 0,89 *
50 0,29 0,94 *
200 0,52 * *
*Casi 1.
3 Cohén (2988, p.389-354) proporciona tablas más detalladas. Sin embargo, utilizar esas tablas con el diseño factorial
requiere algunos cálculos preliminares, tai como lo explica Coheñ en las páginas 364-379.
Planificación del tamaño de la muestra
La tabla 13-13 indica la cantidad aproximada de participantes necesarios por casilla para obtener
una potencia del 80% a un nivel 0,05 de significación, con tamaños del efecto estimados peque
ños, medianos y grandes y para los mismos casos incluidos en la tabla de potencia.4
Supongamos que queremos planificar un análisis de varianza 2 x 3, en el que predecimos un
gran tamaño del efecto para el efecto principal en la variable de tres niveles, y un tamaño del efec
to mediano para los otros efectos principales y para el efecto interactivo. Para obtener una poten
cia del 80% (al nivel 0,05 de significación), necesitaríamos 11 participantes por casilla para el
efecto principal de tres niveles, 22 por casilla para el efecto principal de dos niveles y 27 por casi
lla para el efecto interactivo. Dado que el experimento se realiza completo de una sola vez, debe
mos tener al menos 27 participantes por casilla (a menos que decidamos arriesgamos a tener
menor potencia para el efecto interactivo). En consecuencia, deberíamos reclutar 162 participan
tes (27 para cada una de las seis casillas del diseño 2 x 3).
Tabla 13-13.
Cantidad aproximada de participantes necesarios en cada casilla (suponiendo igual tamaño de
muestras) para obtener una potencia del 80% en estudios que utilizan el análisis de varianza 2 x 2 ó
2 x 3 , probando las hipótesis a un nivel 0,05 de significación.
Tamaño del efecto
P equeño M e d ia n o G ra n d e
(f * 0 ,1 0 ) Cf * 0,2 5 ) ( f = 0 ,4 0 )
(R ^ O J O ) (R = 0 ,2 4 ) (R = 0 ,3 7 )
(R l = 0 ,0 1 ) (R 1 = 0 ,0 6 ) (R* ~ 0 ,1 4 )
2 x 2 : todos lo s efectos 197 33 14
2 x 3: e fe cto principal en dos niveles 132 22 9
efecto principal en tres niveles y efecto interactivo 162 27 11
4 Cohén (1988, pp. 381-389) proporciona tablas más detalladas. Para utilizarías es indispensable leer primero las pági
nas 396-403 de Cohén.
Diseños de análisis de varianza de tres criterios o más
La extensión más directa del análisis de varianza de dos criterios es la de ios experimentos que in
cluyen diseños de tres criterios de clasificación o más. En esos casos, el análisis se realiza exacta
mente como lo hemos descripto en este capítulo, excepto por la existencia defecto s principales e
interactivos adicionales.
A veces un experimento incluye variables que sólo son de interés si interactúan con las va
riables más importantes. Ejemplos de tales variables son el orden de presentación o cuál de dos
experimentadores realizaron el estudio con cada participante. En los casos que acabamos de
mencionar, el investigador puede comenzar con un análisis de varianza factorial de varios crite
rios. Si las variables de interés secundario no tienen efectos interactivos significativos con las
variables de interés primario, se vuelve a realizar el análisis ignorando las variables secundarias.
El diseño se convierte entonces en un análisis de varianza más manejable, de dos o tres criterios;
se dice que el análisis resultante se ha plegado sobre las variables que se están ignorando. Por
ejemplo, en el estudio de Lambert et al. acerca del estado de ánimo y de la calidad del estereotipo,
los investigadores primero realizaron un análisis de tres criterios que incluía el sexo, (Anterior
mente en este capítulo, figura 13-1, incluimos un diagrama del caso anterior). Cuando descubrie
ron que no existían efectos principales ni interactivos en relación con el sexo procedieron a realizar
un análisis de dos criterios, plegado sobre el sexo (es decir, el sexo no se tuvo en cuenta en el aná
lisis en dos sentidos).
En esta sección veremos dos antiguas controversias con respecto al análisis factorial de varianza.
Una cuestión trata sobre lo que se debe hacer cuando hay distinta cantidad de participantes en las
diversas casillas. La otra cuestión trata sobre el modo de manejar una situación en la que una de
las variables no es categórica sino numérica cuantitativa, situación generalmente denominada
“dicoíomización” de una variable.
En este análisis surgió una interacción significativa entre la amenaza hacia e! participante y la simili
tud de la situación, jF(1, 77) - 5,57, p = 0,02. Ningún otro efecto resultó significativo. Como se obser
va en la figura [13-11J, queda claro que un alto nivel de amenaza produjo que se mirara más a un
compañero al que se creía en la misma situación, en comparación con aquél al que se creía en una si
tuación diferente, mientras que esa diferenciación no ocurrió en el caso de participantes bajo una
amenaza de bajo nivel.
El tipo de gráfico que presentaron Gump y Kulik (figura 13-11) tiene la ventaja de hacer que el
patrón de la interacción sea muy claro, aun comparado con el usual gráfico de barras. La razón
por la que los gráficos de líneas como el del ejemplo se han vuelto menos comunes en los últimos
años, es que son levemente engañosos, en el sentido de que la línea implica que existe un efecto
continuo. Por ejemplo, en el estudio de Gump y Kulik había una condición de alto nivel de ame
naza y otra de bajo nivel de amenaza. Las líneas dan la impresión de que el patrón de cada condi-
F igura 13-11.
Estudio 1: efecto de ia amenaza y la
similitud de situación en el tiempo
transcurrido mirando a un compañe
ro. [Fuente: Gump, B- B. & Kulík, J.
A, (1997), fig. 1. ‘‘Estrés, relación y
contagio emocionar. R e v is ta C ie n tí
f i c a d e P s i c o l o g í a S o c i a l y d e la P e r
s o n a l i d a d ( J o u r n a l o f P e r s o n a lity
a n d S o c i a l P s y c h o lo g y } , 72, 305-
319. Copyright, 1997, por la Asocia
ción Americana de Psicología. Reim-
impreso con autorización].
ctón de similitud es continuo de bajo a alto nivel de amenaza. Supongamos que los investigadores
hubieran incluido una condición intermedia de amenaza. Es posible que el resultado para esa condi
ción no estuviera en absoluto en el lugar en el que la línea del gráfico en cuestión indica que debería
estar. Los gráficos de barra, por el contrario, no reflejan nada en cuanto a ios niveles intermedios,
simplemente muestran los resultados de cada nivel de la variable probada.
Resumen
En un diseño de investigación factorial los participantes son divididos en grupos según las combi
naciones de las variables cuyos efectos están siendo analizados. A través de los diseños factoria
les podemos analizar los efectos de dos (o más) variables sin necesidad de convocar el doble de
participantes. Además, estos diseños hacen posible el análisis de efectos interactivos, es decir, los
efectos de las combinaciones de las dos variables. Específicamente, un efecto interactivo ocurre
cuando el efecto de una variable depende del nivel de la otra variable. Un efecto principal es el
efecto promedio general de una variable, ignorando el efecto de la otra variable. Los efectos prin
cipales e interactivos pueden describirse verbal, numérica y gráficamente.
Los cálculos de un análisis de varianza de dos criterios siguen el método del modelo estructu
ral. La estimación intragrapal de varianza pobíacional es, en realidad, una estimación de varianza
poblacional a partir del interior de las casillas. Se basa en los desvíos de cada registro con respec
to a la media de su casilla. Existen tres diferentes estimaciones intergrupales de varianza: una pa
ra las diferencias de la dispersión de la variable a través de las filas, otra para las diferencias de la
dispersión de la variable a través de las columnas y una para la interacción de las variables de fila
y de columna. El efecto de las filas se basa en los desvíos entre las medias de las filas y la gran
media, y el efecto principal de las columnas se basa en los desvíos entre las medias de las colum
nas y la gran media. El efecto interactivo se basa en el desvío restante entre las observaciones y la
gran media después de restar todos los otros desvíos con respecto a la gran media (desvíos de las
medias de las casillas, las medias de filas y las medias de columnas). Para obtener las estimacio
nes reales de varianza poblacional, esos distintos desvíos (interno, filas, columnas' e interactivo)
se elevan al cuadrado, se suman y se dividen por sus grados de libertad. Las razones F para los
efectos de fila, columna e interactivo se calculan dividiendo las estimaciones de varíanza pobla-
cional, correspondientes a cada uno de ellos, por la estimación iníragrupal de casilla de la varian-
za poblacionaí. ..
En un análisis factorial de varianza se calcula el tamaño del efecto y la potencia separada
mente para cada efecto principal e interactivo. El indicador más útil del tamaño del efecto es la
proporción de varianza explicada, R2 (también denominada eta2), En un análisis de varianza de
dos criterios, se calcula R2 para cualquier efecto principal o interactivo en particular de la siguien
te forma: se divide la suma de los cuadrados correspondientes a ese efecto en particular por la par
te de la suma total de cuadrados que queda después de restarle la suma de los cuadrados
correspondientes a los otros dos efectos.
El análisis factorial de varianza puede extenderse a diseños de más de dos criterios e incluso
puede utilizarse para manejar estudios de medidas repetidas.
Existen dos antiguas controversias con respecto al análisis factorial de varianza. Una se basa
en la forma de manejar situaciones con tamaños desiguales de casilla. El método de cuadrados
mínimos se considera usualmente el mejor, pero la solución óptima es trabajar con casillas del
mismo tamaño. La otra controversia se basa en la conveniencia de realizar una dicotomización de
variables continuas para realizar un análisis de varianza. El procedimiento de dicotomización ca
da vez está siendo menos común; generalmente se considera mejor utilizar procedimientos más
avanzados que conservan todos los valores de cada variable.
Los resultados del análisis factorial de varianza incluyen con frecuencia descripciones gráfi
cas de Jos resultados, particularmente cuando el efecto interactivo es significativo. Por lo general
se utilizan gráficos de barra, pero, a veces, se incluyen gráficos de líneas.
Términos clave
- Casilla. - Efecto principal. - Diseño factorial
- Media de casilla. - Medias marginales. • de tres criterios.
- Dicotomización. - División por la mediana. - Análisis de varianza
-Análisis factorial de varianza. - Análisis de varianza de dos criterios.
- Diseño factorial de investigación. de un criterio. - Diseño de investigación
- Efecto interactivo. - Análisis de varianza factorial de dos criterios.
- Análisis de varianza de de medidas repetidas.
cuadrados mínimos.
un gran efecto de los estereotipos previos, co agrupe las barras según una variable y en el
F(l, 42<9 = 38,94, p < 0,0001, indicando, lo otro gráfico agrupe las barras según la otra va
cual no es sorprendente, que los participantes de riable); b) indique qué efectos se encuentran
estereotipo extremo continuaron considerando a (principales e interactivos), si existen; c) des
los agentes RRPP como más extrovertidos de lo criba el significado del patrón de medias (es
que lo hicieron los participantes de estereotipo decir, cualquier efecto principal o interactivo o
moderado. También hubo un efecto marginal de la ausencia de los mismos) con palabras,
la condición, F(I, 42) = 2,89, p < 0,10, que se i) Variable medida: intensidad de atención.
debía c la r a m e n te e n su totalidad a los partici
pantes de estereotipo extremo, (p. 974).
Describa brevemente el significado de estos re
sultados a una persona que nunca ha asistido a P ro g ra m a
_
§o .2? O ra c ió n
«
Sexo U N in g u n o
■S
W®
F e m m in a M a s c u lin o
O 3. En determinado colegio secundario, se
Q 1 m es . 3 . 3 . probaron tres tipos de programas de enseñanza
«n o. 1 año . 4 . . 4 , ... de inglés, historia y matemática a través de vi
Sanos ... • 9 - ■ ■ ■ 9 deos, Después, los investigadores midieron el
nivel de aprendizaje. Había dos alumnos por
casilla. Sobre la base de los resultados que apa
iv) Variable medida: nivel de envidia del
recen abajo, a) realice una tabla de medias de
éxito de otra persona.
casilla y marginales y trace un gráfico de ba
rras de las mismas; b) realice los cinco pasos
N iv e l d e éx ito de la prueba de hipótesis (utilice el nivel 0,05 de
■§ G ra n d e Pequeño significación); c) calcule los tres tamaños del
•I £ A m ig o ,8 5
efecto, y d) describa los resultados con pala
^ 8 E x tra ñ o ■:l " 4
bras (indique qué efectos son significativos y,
sobre la base de ellos, cómo interpreta el pa
trón de medias de casillas).
2. En este estudio se instruyó a participan
tes de habla inglesa para que intentaran leer In glés H is t o r ia M a t e m á t ic a
Tabla 13-14.
Media de pago auto-asignado por una tarea experimental, dividido por categorías según el sexo y el
ingreso percibido el verano anterior.
I n g r e s o d e l v e r a n o e n te r io r
B a jo M e d ia n o A lto
Sexo M SD M SD M SD
Hom bres 5,03 1,71 3,17 3 ,0 0 3,77 2 ,7 7
M ujeres 3,13 1,68 2,65 1,89 2 ,4 4 1,65
Nota: Los estudiantes de ia categoría de bajos ingresos ganaron menos de $6,00/hr; los estudiantes de la categoría de
medianos ingresos ganaron entre $7,50 y $8,50/hr; los alumnos de la categoría de altos ingresos ganaron más de $10,00
la hora. Para cada casilla, n = 12. Sólo fue significativo el efecto principal del sexo, p < 0,02.
Fuente: Desmarais, S. & Curtís, J. (1997), tab. 1. “Sexo y percepción del ingreso merecido: prueba de los efectos del in
greso percibido”. R e v is ta c ie n tífic a d e P s ic o lo g ía S o c ia l y d e la P e r so n a lid a d [ J o u rn a l o f P e r so n a lity a n d S o c ia l
P sy ck o lo g y], 72, 141-150. Copyright, 1997, por la A sociación Americana de Psicología. Reimpreso con autorización.
Apéndice í del capítulo: fórmulas optativas de cálculo
para el análisis de varianza de dos criterios
Esta sección proporciona las fórmulas de cálculo para un análisis de varianza de dos criterios, que
no requieren el cálculo de desvíos para cada individuo. Al igual que las otras fórmulas presenta
das en este capítulo, sólo se aplican cuando hay igual cantidad de participantes por casilla.
La fórmula de cálculo para la suma total de desvíos cuadráticos es igual a la fórmula 12-6 (y
la misma que para SC en la fórmula 12-9).
sq .ot„= X X 2 - £ 9 ! (13-26)
En la fórmula anterior, XX2 es la suma de los cuadrados de todas las observaciones; (XX)2 es el
cuadrado de la suma de todas las observaciones, y N es la cantidad total de observaciones.
La fórmula para el efecto intergrupal general también es igual a la anterior (fórmula 12-7),
excepto que los subíndices ahora se refieren a casillas en lugar de grupos.
En esta fórmula, (ZK{)2 + (EX2)2 + (XX^{tiraa)2 son los cuadrados de las sumas de las observa
ciones de cada casilla; n es la cantidad de participantes de cada casilla.
La suma de los cuadrados intragrupales es el total menos el intergrupal:
( XXFl]as 1 ) ¡ ( XXFijaSl
SC Filas
«Fila «Fila
(13-29)
«Fila N
En la fórmula anterior: (XXFilai)2, (£XFUa2)2 .... (^ F iiaúltítna)2 son l°s cuadrados de las sumas de to
das las observaciones de cada fila; nRla es la cantidad de participantes en cada fila.
La fórmula general intergrupal para columnas sigue el mismo principio:
(XXçoiumnai) ^ (^Columna?)
S C C olu m n as
«Columna «Columna
(13-30)
(sx0lolumna última (xxy
«Columna ¿V
Tabla 13-15.
Cálculo de sumas de cuadrados para un análisis de varianza de dos criterios basado en Blanchard
et al. (1991), utilizando fórmulas de cálculo. (Datos ficticios).
M o d a lid a d d e M o d a lid a d d e Filas
r esp u esta p ú b lica resp u esta p rivad a
X X* X X*
Influencia antirracista
25 625 19 36!
20 400 24 576
23 529 21 441 In flu en cia a n t i r r a c i s t a
24 576 20 400 XX XX*
C asilla X: 92 2 .1 3 0 84 1.778 176 3.908
Total XX = 4 8 0
Total XX* = 9 .8 1 4
ÍXXV 480* 2 3 0 .4 0 0 Aí>iji
----------= 9 . 8 1 4 - ' -------------- -- 9 .8 1 4 - 9 .6 0 0 =
^Total S X X * - - 7 T ==9.814 24 24
‘-’^Dentro - s c ^ - s c , Entre =
' 214-128 = 86
480*
. ( V + W + . . . + (Mm— J - C W
( £'FM' 176* 136a
S C * ,» N 24
RFüas n,Pilas Filas
3 0 .9 7 6 28 .2 2 4 18.496 230 .4 0 0
= 3.872 + 3.528 + 2 .3 1 2 - 9 .6 0 0 = 112
.... “8 .....+ “ T + 8 ' 24
.800 + 4 .8 0 0 - 9 ,6 0 0 = 0
En la fórmula anterior: (2XCo )2, (XXCoíuIBna2)2 (XXColuroíiaúltima)2 son los cuadrados de las
sumas de todas las observaciones ae cada columna; «Co!timna es la cantidad de participantes de ca
da columna.
Finalmente, la suma de cuadrados para la interacción se calcula sobre la bgse de lo que queda
después de restar las sumas de cuadrados de filas y columnas a la suma general de cuadrados in-
tergmpaíes:
T ip o d e p a la b r a
P a la b r a P a la b r a S o n id o F ila
Participante f a m i lia r n o f a m i lia r n o p a la b r a X M
A 9 3 0 12 4
B 6 2 1 9 3
C 11 6 4 21 7
D 10 5 3 18 6
X 36 16 8
M 9 4 2
GM = 5
D e s v ío s c u a d r á r te o s c o n r e s p e c to a la g r a n m e d ia
A 16 16 1 1 4 1 1 0 25 9 1 1
B 1 16 4 1 9 1 4 0 16 9 4 1
C 36 16 4 0 1 1 4 0 1 9 4 0
D 25 16 1 0 0 .1 , X 0 4 9 1 0
X 78 64 10 2 14 4 10 0 • 46 36 10 2
SCm = 78 + 14 + 4 6 = 138
^Columnas" 6 4 + 4 + 3 6 ~ 104
SCm s = 1 0 + 1 0 + 1 0 = 30
^Interacción^ 2 + 0+ 2= 4
Control: S C ^ = 5C CoIomnas + = 104 + 3 0 + 4 = 138
8^tcuí “ 12- 1 = 11
^Columnas ” 3 ~ 1 —*■
« b . = 4~ í= 3
¿^Interacción" H —2 “ 3 = 6
Punto de corte F para el efecto de medidas repetidas (colum nas) (gl 2 ,6 ; p < 0 ,0 5 ): 5 , í 4
Fuente SC gl CM F
E
cuyos valores son categorías, tales como preferencias religiosas o color de pelo. Los
procedimientos.a los que nos referimos se concentran en la cantidad de personas de
las diferentes categorías más que en la media de alguna dimensión.
Ejemplo
Analicem os un ejemplo. Harter et al. (1997) estaban interesados en tres estilos de relaciones amo
rosas: un estilo autónomo concentrado en sí m ism o, un estilo de relación en el que la atención es
tá puesto en el otro, y un estilo de mutua reciprocidad. Para reunir inform ación acerca de los
estilos mencionados, realizaron una encuesta por medio de periódicos con ítems que evaluaban
tanto los estilos de aquellos que respondían como la percepción de aquellos que respondían con
respecto al estilo de sus parejas. Una de las predicciones del investigador establecía que los hom
bres que se describían a sí mism os como autónomos y concentrados en s í mismos casi segura
mente describirían a sus parejas como personas que ponían su atención en el otro.
Harter y sus colegas descubrieron lo siguiente. D e los 101 hombres en su estudio que se des
cribieron como autónomos concentrados en sí m ism os, el 49,5% (50 hombres) “informaron el ti
po de pareja predicha, comparado con el 25,5% (26 hombres) que informaron tener parejas
autónomas concentradas en s í mismas y el 24,5% (25 hombres) que informaron tener parejas con
el estilo de reciprocidad.: (p. 156)
Supongamos que las parejas de estos hombres hubieran tenido las mismas probabilidades de
tener cada uno de los tres estilos de relación. S i ese fuera el caso, entonces aproximadamente
33,66 (1/3 de los 101) de las parejas de estos hombres deberían haber pertenecido a cada uno de
los tres estilos diferentes. L a inform ación que estamos manejando aparece en la segunda y terce
ra columna de la tabla 14-1. L a segunda columna (“frecuencia observada”) indica el detalle de los
estilos de relación de pareja realmente observados, y la tercera columna (“frecuencia esperada”)
indica el detalle que se esperaría si los diferentes estilos de pareja hubieran tenido exactamente la
misma probabilidad de ocurrir.
T a b la 1 4 -1 .
Frecuencias observadas y esperadas de los estilos de relación de las parejas de hombres autónomos
concentrados en s í mismos.
Diferencia
cuadrática
Estilo Frecuencia Frecuencia Diferencia ponderada según la
de pareja observada1 esperada Diferencia cuadrática frecuencia esperada
(O ) (E) iO-B) (O -E f ( 0 - E)2ÍE
Relación con el centro de atención
puesto en el otro 50 33,67 16,33 266,67 7,92
Autónomo concentrado en sí mismo 26 33,67 -7,67 58,83 1,75
D e reciprocidad 25 33,67 -8,67 75,17 2,23
Queda claro que existe una diferencia entre lo que realmente se observó y el detalle de lo que se
hubiera esperado si los estilos fueran igualmente probables. L a cuestión es la siguiente: ¿Debería
mos suponer que la discrepancia observada no es más que la que esperaríamos sólo por casuali
dad en una muestra de este tamaño? Supongamos que las m ujeres de los tres estilos tienen las
mismas probabilidades de ser parejas de los hombres concentrados en s í mism os en general (la
población). Aun así, en cualquier muestra en particular tomada de esa población no esperaríamos
que las com posiciones de los estilos de parejas fueran perfectamente iguales. Pero si la composi
ción de la muestra está muy lejos de ser pareja, dudaríamos de que las com posiciones de los esti
los de pareja en la población fueran realmente iguales. E n otras palabras, tenemos una situación
de prueba de hipótesis muy parecida a la que hemos estado considerando hasta ahora, aunque con
una diferencia importante.
E n las situaciones descriptas en capítulos anteriores, los valores observados siem pre han sido
valores numéricos referidos a alguna dimensión, como por ejemplo, una puntuación en una prue
ba estándar de evaluación de nivel, de la duración de una relación, la calificación de la efectividad
de un empleado por parte del empleador en una escala de 9 puntos, la cantidad de errores en la
identificación de palabras, y así sucesivamente. Por el contrario, ei estilo de relación de pareja de
un hombre es un ejemplo de lo que en el capítulo 1 denominamos v ariab le nom inal (o variable
categórica). Una variable nominal es aquella en la que la inform ación es la cantidad de personas
en cada categoría. (Se denominan variables nominales porque las diferentes categorías o niveles
de la variable se identifican con nombres en lugar de números).
L a prueba de hipótesis con variables nominales es una de las denominadas pruebas chi-cua
drado.1 L a s pruebas chi-cuadrado fueron desarrolladas originalmente por K arl Pearson (véase
cuadro 14-1).
EL ESTADÍSTICO CHI-CUADRADO
Y LA PRUEBA CHI-CUAPRAPO DE BONDAD DE AJUSTE_________ _ _
L a idea básica de cualquier prueba chi-cuadrado es que se compara la forma con que el esquema
de repartición observado de personas en varias categorías se ajusta a un esquema esperado (como
K a rl Pearson, hijo de un abogado .de Yorks- club desapareció, pero gracias a él conoció •’
hire, nació en el año 1857. Pearson es mu a su esposa, M aría 3harp,;
chas veces aclamado como e l fundador de . : Pqarson finalmente se volcó a la esta- ;
la s ciencia estadística. L a m ayoría de sus dística debido a su interés por probar la
•;virtudes y de sus vicios se revelán en lo que teoría de; la evolución, y además estaba es-
él relató a su colega Ju lia Bell- como sus pecialmenté influenciado por la.obra de S ir . :
pñm éros recuérdós: estaba sentado en su . Franéis Galton (véase cuadro 3-1). P e a r-. :
sillita alfa, con el pulgar en la boca, cuando . son, qué era mejor matemático, vio en las ;
le dijerph que dejara de hacerlo o si no su ; ideas de correlación de Galton, una form a', ■
pulgar iba a desaparecer. Pearson miró sus . de .convertir la psicología, la antropología y .
.■dos pulgares y silenciosam ente concluyó: : la sociología en campos tan científicos ■ co- ■'■
“No veo que el pulgar que me llevo a la bo mo lo eran la física y la quím ica. Esperaba' \
ca sea para nada más pequeño que el Otro; / evitar la cuestión de la causalidad a través y
me pregunto sí me estarán mintiendo/’ Lo ■de la utilización de esta categoría más am- '
anterior refleja la confianza que Pearson te pita de correlación, asociación, o contin
nía en sí mismo y en las pruebas obtenidas gencia (con un rango de Ó, independencia,
por la observación, corno también su ne a 1 “unidad de causalidad” . “Ningún fenó
gación a la autoridad. Tam bién podemos meno es causal” -expresó. “Todos los fe
\ observar su tendencia a dudar del carácter nómenos son contingentes, y el problema :
de las personas con quienes no estaba de .y que enfrentárnosles el.pe medir el grado de .
acuerdo. • contingencia.” ■/• /yTó y.y;/ yf;
Pearson estudió matemática gracias a . Durante toda su vida, Pearson fue muy 1
: una beca qn Cambridge. Poco después de in controvertido y tuvoduna fuerte voluntad,
gresar, pidió que sé lo excusara de las clases especialmente citando se. trataba dé. “seudo y
obHgatórias. de teología y del servicio reli . ciericia’l y dé la máscafada dé Ja teología, la ..:
gioso. Sin embargó, en cuanto accedieron a . m etafísica o las apelaciones' ¿ la áutórjdad. y
su pedido, Pearson asistió al servicio reli i bajo el pretexto dé la ciencia. Incluso pen-
gioso. E l decano lo convocó para que le die sapa que 1¿ física; debía dejar dé utilizar p a -.
ra uiia explicación, y Pearson declaró que no ' labras como átóm ó, lueirzaL m ateria
había pedido que sé lo excusara del servicio porque nóeran feñótaenos obsérVabíesl ’
religioso, “ ¡sino del servicio religioso obli L a m ayor parlé dé su investigación, en-
gatorio!” ' tre 1893 y 1901, se concentró en las leyes .
. Después dé graduarse, Pearson viajó y de la herencia y la evolución, péró necési-
estudió en Alem ania, donde practicó la ,taba m ejores métodos estadísticos para rea
doctrina socialista y, como él mismo lo'des liza r su trabajo. Entonces sé volcó a otros
cribía, se convirtió en un “libre pensador” . temas, realizando finalmente su: niás faino- ;
A l regresar a Inglaterra, elaboró un trabajo sa contribuéión, la prueba chi-cuadrado. í
escrito bajo un seudónimo, en el que ataca Pearson también inventó, el método de
ba a la cristiandad, y en 1885 fundó un club cálculo dé la correlación utilizado en la ac
de hombres y mujeres para promover la dis tualidad (véase capítulo 3), y acuñó los tér-,; ¡
cusión de las relaciones entre los sexos. E l minos histogram a, a sim e tría jj^ rre la ció n
esp u ria. Cuando, sintió quedas revistas es D e hecho, a lo largo de su vida, Pear
pecializadas en biología no apreciaban ade son fue un hom.bre que provocó amistades
cuadamente su trabajo, fundó la fam osa. . devotas, o, por el contrario, profunda- averi)
revista especializada en estadística, llam a sión. W illiam S. Gossét {véase cuadro 9-1),
da BiométrÜxi. Durante su vida. Pearson el inventor de la prueba t, fue uno de sus.
llevó la estadística de la situación de mate amigos. S ir Ronald Fisher, inventor- del;
ria ampliamente ignorada a una posición análisis de varianza y hombre relacionado'
prim ordial para el método científico, espe con actitudes aún más extremas (como las;,
cialmente en las ciencias naturales. descriptas en el cuadro 11-1), fue uno dé
Lamentablemente, Pearson era fanáti los peores enemigos de Pearson (y; el aína-.
co de la eugenesia, el “perfeccionamiento” ble, pacífico Gosset, amigo de ambos, estaba:
de la raza humana a través de la reproduc siempre intentando suavizar ios problemas
ción selectiva y, más tarde, su obra fue uti entré ellos). E n 1933, Pearson finalmente
lizada por los nazis como justificación de se. retiró, y fue Fisher, nada m enos, quién
su trato a los judíos y otras m inorías étni tomó su lugar en la cátedra de Eugenesia dé :
Galton en la Universidad dé Londres: ' Erb
cas. Pero a medida que Pearson envejecía,
1936, los dos comenzaron su más punzante '. 'i
sus opiniones enfrentaron fuerte resistencia
discusión; Pearson m urió'ese mismo año.
y mucho descrédito por parte de otros esta
dísticos más jóvenes, lo que sólo sirvió pa
ra poner a Pearson en contra de cada vez R e fe r e n c ia s : Pe ters ( 1987); S tiglen ( í 986) ^ [
una m ayor cantidad de colegas. Tankara(1984). ; ■ -ri■
por ejem plo, un esquema de repartición uniforme). Con respecto al ejemplo acerca del estilo de
relación, estamos comparando el esquema observado de 50, 26 y 25 con el esquema de repartición
esperado de aproximadamente 34 (33,67) para cada estilo. Un esquema de repartición de la canti
dad de personas esperadas en cada categoría es, en realidad, una distribución de frecuencias como
las que aprendimos en el capítulo 1. Por lo tanto, una prueba chi-cuadrado se describe más for
malmente como la comparación de una distribución de frecuencias observadas con una distribu
ción de frecuencias esperadas. E n general, la prueba de hipótesis im plica, primero, calcular las
discrepancias entre las frecuencias observadas y las frecuencias esperadas y, después, observar
si esas discrepancias son mayores de lo que se esperaría por casualidad. ■
Em pecem os analizando de qué modo encontramos esa discrepancia entre las frecuencias ob
servadas y esperadas. L a discrepancia entre lo observado y lo esperado en cualquier categoría es
simplemente la frecuencia observada menos la frecuencia esperada. Por ejem plo, veamos nueva
mente el estudio de Harter et al. Con respecto a los hombres con parejas concentradas en el otro,
la frecuencia observada de 50 es 16,33 puntos mayor de la frecuencia esperada de 33,67 (no debe
mos olvidar que la frecuencia esperada es 1/3 de 101). E n la segunda categoría, la diferencia es
-7 ,6 7 , y en la tercera -8,67. L a s diferencias mencionadas aparecen en la cuarta columna (“D ife
rencia”) de la tabla 14-1.
L a s diferencias no se utilizan directamente ya que algunas son positivas y otras negativas y,
por lo tanto, se cancelarían entre sí. Este problema se resuelve elevando cada diferencia al cuadra
do. (Se trata de la misma estrategia que vim os en el capítulo 2 cuando trabajamos con las diferen
cias de valores observados al calcular la varianza). E n el ejemplo acerca del estilo de relación, la
diferencia cuadrática correspondiente a parejas concentradas en el otro es de 13,33 al cuadrado, o
266,67; en el caso de las parejas concentradas en s í m ism as, es de 58,83; y en el caso de las pare
ja s con estilo de reciprocidad, 75,17. Estas diferencias cuadráticas aparecen en la quinta columna
de la tabla 14-1.
E n el ejemplo de Harter et al., las frecuencias esperadas son las m ism as en todas las catego
rías. Pero en otras investigaciones, las frecuencias esperadas para las diferentes categorías pue
den no ser iguales. L a diferencia efectiva entre lo observado y lo esperado tiene diferente
im portancia según el tamaño de la frecuencia esperada. Por ejemplo, una diferencia de 8 perso
nas, entre lo observado y lo esperado, es una discrepancia mucho m ayor si la frecuencia espera
da es 10 que si lo esperado es 1,000. S i la frecuencia esperada es 10, una diferencia de 8
significaría que la frecuencia observada fue de a 18 ó de 2, frecuencias tajantemente diferentes
de 10. Pero sí la frecuencia esperada es 1.000, una diferencia de 8 es sólo una leve desigualdad.
Significaría que la frecuencia observada fue de 1.008 6 de 992, frecuencias que son sólo leve
mente diferentes de 1.000.
¿Cóm o obtenemos un número adecuado de discrepancia (la diferencia cuadrática) entre lo
observado y lo esperado con respecto a una categoría en particular? L o que necesitamos hacer es
adaptar o ponderar la desigualdad de modo tal de tener en cuenta la frecuencia esperada para esa
categoría. Lo anterior se logra simplemente dividiendo la diferencia cuadrática de una categoría
por la frecuencia esperada para esa categoría. Entonces, si la frecuencia esperada para determina
da categoría es 10, dividim os,la diferencia cuadrática por 10, S i la frecuencia esperada para la ca
tegoría es 1.000, dividim os la diferencia cuadrática por 1.000. De ese modo, ponderamos cada
diferencia cuadrática según ia frecuencia esperada. Esta ponderación ubica la diferencia cuadráti
ca en una escala comparativa más adecuada.
Volvamos al ejemplo que analizábamos. E n el caso de los hombres con parejas concentradas
en el otro, ponderaríamos la desigualdad dividiendo ía diferencia cuadrática de 266,67 por 33,67,
y el resultado sería 7,92. E n el caso de aquellos con parejas concentradas en s í m ism as, 58,83
dividido 33,67 da 1,75; y en el caso de ios hombres con parejas con estilo de reciprocidad, 75,17 d ivi
dido 33,67 da 2,23. Las desigualdades ajustadas (diferencias cuadráticas divididas por las fre
cuencias esperadas) aparecen en la últim a columna de la tabla 14-1.
Lo que resta es obtener un número general de discrepancia entre las frecuencias observadas y
esperadas. Este últim o paso se realiza sumando los resultados de todas las categorías. E s decir, to
mamos el resultado de la diferencia cuadrática dividida por la frecuencia esperada de la primera
categoría, sumamos el resultado de la diferencia cuadrática dividida por la frecuencia esperada de
la segunda categoría, y así sucesivamente. En el ejemplo de Harter et al. sería igual a 7,92 más
1,75 más 2,23, y daría un total de 11,90.
E l número final (la suma de las diferencias cuadráticas ponderadas) es un indicador general
de la discrepancia entre las frecuencias esperadas y observadas. Esa cantidad se denomina esta
dístico chi-cuadrado. Se expresa bajo la fórmula,
En la fórmula anterior, x2es estadístico chi-cuadrado. S es el signo de suma, que índica que de
bemos sumar todas las categorías distintas. O es la frecuencia observada de una categoría (la can
tidad de personas realmente encontradas en esa categoría a través del estudio). E es la frecuencia
esperada de una categoría (en el ejemplo que analizam os, se basa en lo que esperaríamos si hubie
ra la m ism a cantidad en todas las categorías).
Aplicando la fórmula ai ejemplo de Harter et al.,
La distribución chi-cuadrado
E l siguiente paso es averiguar si el estadístico chi-cuadrado que hemos calculado representa una
discrepancia mayor a la que podría ocurrir por casualidad. Para responder esta pregunta necesita
mos saber cuáles son las probabilidades de que el chi-cuadrado tome valores de distintos interva
los por casualidad. E s decir, necesitamos la distribución del estadístico chi-cuadrado que
ocurriría por casualidad. Sucede que siempre que el estudio tenga una cantidad razonable de per
sonas, la distribución del estadístico chi-cuadrado es bastante próxim a a una distribución mate
mática conocida que se denomina, por supuesto, distribucióncbi-cuadrado.
L a manera exacta de la distribución chi-cuadrado depende de los grados de libertad. En una
prueba chi-cuadrado, los grados de libertad son la cantidad de categorías que son libres de variar
en cuanto a sus frecuencias, dándose como conocido el total de participantes. E n el ejemplo acer
ca del estilo de relación hay tres categorías. S i conocemos la cantidad total de personas y también
sabemos la cantidad que corresponde a dos de las categorías, automáticamente podemos calcular
la cantidad de participantes en la tercera categoría. E n un estudio como el del ejemplo que esta
mos analizando, si hay tres categorías, hay dos grados de libertad.
L a figura 14-1 indica las distribuciones chi-cuadrado para varios grados de libertad. Según se
observa en la figura, las distribuciones son todas asim étricas hacia la derecha. Esto se debe a que
el chí-cuadrado no puede ser menor a 0, pero puede tener valores muy altos. (E l chi-cuadrado de
be ser positivo porque se calcula sumando un grupo de fracciones en las que el numerador y el de
nominador deben ser todos positivos. E l numerador necesariamente es positivo porque está
elevado al cuadrado, y el denominador necesariamente es positivo porque la cantidad de personas
esperadas en determinada categoría no puede ser negativa, ¡no se puede esperar que haya menos
que ninguna persona!).
La tabla chi-cuadrado
Lo más importante acerca de la distribución chi-cuadrado para una prueba de hipótesis es el pun
to de corte que indica que un chi-cuadrado es lo suficientemente grande como para rechazar la hi
pótesis nula. Por ejemplo, supongamos que queremos utilizar el nivel de significación de 0,05. En
ese caso, necesitamos saber qué punto de la distribución chi-cuadrado tiene el 5% de los chi-cuadra-
dos por encima de sí mismo. Una tablachi-cuadradoproporciona los puntos de corte para los dis
tintos niveles de significación y para varios grados de libertad. L a tabla 14-2 muestra una parte de
una tabla chi-cuadrado como la que aparece en el apéndice B (tabla B -4). Analicem os el ejemplo
referido al estilo de relación, en el que había dos grados de libertad. L a tabla muestra que el pun
to de corte chí-cuadrado para un nivel de 0,05, utilizando una distribución chi-cuadrado con 2
grados de libertad, es 5,992.
Ahora contamos con toda la inform ación necesaria para probar la hipótesis en el ejemplo de H ar
ter et al. Cabe recordar que el chi-cuadrado que calculam os para el ejemplo era de 11,90. Adem ás,
acabamos de encontrar el punto de corte correspondiente al ejemplo (utilizando el nivel 0,05 de
significación), que es de 5,992. Comparando los dos números mencionados anteriormente, el
chi-cuadrado del estudio es claramente superior al punto de corte. Por lo tanto, los investigadores
que realizaron el estudio rechazaron la hipótesis nula, es decir, la rechazaron por considerar de
masiado improbable que la discrepancia que observaron pudiera haber ocurrido si, de hecho, la
población de hombres concentrados en s í mism os tuviera una cantidad igual de parejas de cada
estilo de relación. Parecía, más razonable sostener que los estilos de relación de las parejas de ese
tipo de hombres eran realmente diferentes.
Acabamos de realizar un procedimiento de prueba de hipótesis completo del ejemplo de H ar
ter et al. E l ejemplo incluía diferentes cantidades de personas en tres niveles de una determinada
variable nominal (el estilo de relación de las parejas de hombres concentrados en sí m ism os). E s
te tipo de pruebas chi-cuadrado, que incluye niveles de una sola variable nominal, se denomina
prueba chi-cuadrado de bondad de ajuste. (M ás adelante, en el capítulo, analizaremos situa
ciones que incluyen más de una variable nominal a la vez).
Figura 14-1.
Ejemplos d e d istrib u cio n es chi-cuad rad o para diferen tes grados de libertad.
Tabla 14-2.
P a rte de una tabla chi-cu ad rad o.
N iv el d e sign ificación
Si 0 ,1 0 0,05 0,01
i 2 ,7 0 6 3,841 6,635
2 4,6 0 5 5,992 9,211
3 6 ,2 5 2 7,815 11,345
4 7 ,7 8 0 9,488 13,277
5 9 ,2 3 7 11,071 15,087
L a hipótesis de investigación establece que la distribución de las personas en las categorías de las
dos poblaciones es diferente; la hipótesis nula establece que es igual.
2. D eterm in ar la s características de !a d istrib ución com parativa. L a distribución compa
rativa en este caso es una distribución chi-cuadrado con dos grados de libertad. (U na vez que co
nocemos el total, sólo las cantidades en dos categorías pueden variar libremente).
E s importante no confundimos con la terminología. L a distribución comparativa es la distri
bución con la que comparamos el número que resume todo el patrón del resultado. Con una prue
ba t, este número es el punto í, y utilizam os una distribución t. Con un análisis de varianza, es la
razón F, y utilizam os una distribución F. D el mismo modo, con una prueba chi-cuadrado, la dis
tribución es una distribución chi-cuadrado.
Decim os que puede surgir cierta confusión, ya que al preparamos para utilizar la distribución
chi-cuadrado comparamos una distribución de frecuencias observadas con una distribución de
frecuencias esperadas. Pero la distribución de frecuencias esperadas no es una distribución com
parativa en el sentido en el que utilizam os ese término en el paso 2 de la prueba de hipótesis.
3. D eterm in ar el punto de corte en la distrib ución co m p arativa, a p a rtir del cu al debería
rechazarse la hipótesis n u la. Buscamos el punto de corte en la tabla chi-cuadrado según el nivel
de significación y los grados de libertad del estudio. E n este caso, utilizam os el nivel 0,05 de sig
nificación y determinamos, en el paso 2, que había 2 grados de libertad. Basándonos en la tabla,
el chi-cuadrado de corte es igual a 5,992.
4, D eterm in ar el valo r m uestral en la distrib ución com parativa. E l valor muestral es el
chi-cuadrado calculado a partir de la muestra. En otras palabras, este es el paso en el que se reali
zan todos los cálculos; es decir, para cada categoría necesitam os calcular las frecuencias espera
das, las diferencias entre las frecuencias esperadas y observadas elevadas al cuadrado, y dividir
ese resultado por la frecuencia esperada. Sumando los resultados de todos estos cálculos para ca
da categoría obtenemos el chi-cuadrado del estudio. E n el ejemplo que estamos utilizando el re
sultado es 11,90.
5, Com parar los valores obtenidos en los pasos 3 y 4 para decidir sí se rechaza o no la hipóte
sis nula. Dado que el punto de corte para rechazar la hipótesis nula es 5,992 y el chi-cuadrado de
nuestra muestra es 11,90, podemos rechazar la hipótesis nula. Se sostiene la hipótesis de investi
gación que establece que las dos poblaciones son diferentes. E s decir, los investigadores conclu
yen que las parejas de hombres concentrados en s í mismos no tienen las mismas probabilidades
de presentar los tres estilos de relación. ' ’
Otro ejemplo
Analicem os otro ejemplo. Un equipo de investigación ficticio formado por psicólogos clínicos
desea probar una teoría que establece que la salud mental se ve afectada por el nivel de cierto m i
neral incluido en la dieta alim enticia. A l m ineral lo llamaremos Q. E l equipó4de investigación ha
localizado una región de los Estados Unidos cuyo suelo presenta una alta concentración del mine
ral Q y, debido a ello, ese mineral se encuentra en el agua que las personas consumen y en los ali
mentos que se siembran en el lugar. L o s investigadores realizan una encuesta a personas mayores
que han vivido toda su vida en esa área, concentrándose en los trastornos de la salud mental. De
las 1.000 personas entrevistadas, 134 habían experimentado en algún momento de su vida un tras
torno relacionado con la angustia, 160 habían sufrido alcoholism o o drogadicción, 97 trastornos
de estados aním icos (tales como depresión crónica) y 12 habían sufrido esquizofrenia; 597 nunca
habían experimentado ninguno de los problemas anteriores. (E n este ejemplo, ignoraremos lo que
ocurre cuando una persona ha sufrido más de uno de los trastornos).
Los psicólogos compararon los resultados con lo que se esperaría sobre la base de una gran
encuesta realizada al público en general de los Estados Unidos. En esa encuesta, el 14,6% de los
adultos en algún momento de sus vidas sufre de trastornos relacionados con la angustia, eí 16,4%
padece alcoholism o y drogadicción, el 8,3% sufre trastornos del estado aním ico y el 1,5% padece
esquizofrenia, mientras que el 59,2% no experimenta ninguno de esos trastornos (Regier et a i,
1984), S i la muestra de 1.000 no es diferente de la población general de Estados Unidos, el 14,6%
de ellos (146) deberían haber sufrido trastornos relacionados con la angustia, el 16,4% (164) de
berían haber padecido alcoholism o y drogadicción, y así sucesivamente. L a cuestión planteada
por los psicólogos clínicos es la siguiente: sobre la base de la muestra que hemos estudiado, ¿po
demos concluir que los porcentajes de los diferentes problemas mentales sufridos por las perso
nas de esta región son diferentes a los de la población de los e e . u u . en general?
L a tabla 14-3 indica las frecuencias observadas y esperadas y los cálculos de la prueba ehi-
cuadrado.
C o n d ició n O b se rv a d a E sp e r a d a
, _ {O -E f (1 3 4 - 1 4 6 ) * (1 6 0 - 1 6 4 ) * (9 7 - 83)* (1 2 -1 5 )* (5 9 7 -5 9 2 )*
* E 146 164 83 15 592
5. C o m p a rar los valores de los pasos 3 y 4 p ara d ecid ir si se rechaza o no la hipótesis nu
la . E l chi-cuadrado de 4,09 es mucho menos extremo que el punto de corte de 9,488 {véase figura
14-2). Lo s investigadores no pueden rechazar la hipótesis nula; el estudio no es concluyente. (No
habiendo podido rechazar la hipótesis nula con una muestra tan grande, es razonable suponer que
s i existe alguna diferencia entre las poblaciones, esa diferencia es bastante pequeña).
Un tercer ejemplo
Supongamos que una profesora de una gran universidad está dando un curso de introducción a la
estadística a 200 alumnos. L a clase ya ha terminado de rendir su p arcial Anteriormente, la profe
sora siempre ha calificado con una curva aproximada a la distribución normal, es decir, el 2,5%
superior de los alumnos obtuvo A , el siguiente 14% recibió B , el siguiente 67% recibió C , el si
guiente 14% recibió D y el 2,5% más bajo recibió F.
Figura 14-2.
Distribución chi-cuadrado (gl = 4) correspondiente al ejemplo
del mineral Q, que muestra el punto de corte para el rechazo de
la h ip ó te sis nula al nivel 0 ,0 5 .
Este año, sin embargo,- la profesora ha decidido asignar las calificaciones según el porcentaje
del examen realizado correctamente; un 90% ó más es una A , entre un 80% y 89% una B , y así su
cesivamente. L a pregunta que la profesora se plantea entonces es la siguiente: sobre la base de la
muestra de este semestre formada por 200 calificaciones de parciales a travos del nuevo sistem a,
¿existe alguna razón para creer que el nuevo sistem a produce una distribución diferente de ca lifi
caciones?
L a tabla 14-4 índica las frecuencias observadas y esperadas y los cálculos de la prueba
chi-cuadrado.
Población 1: alumnos calificados según el nuevo sistema (que tiene en cuenta sus calificacio
nes sin importar el nivel de los otros alumnos de la clase).
Población 2: alumnos calificados con una curva de distribución normal.
L a hipótesis de investigación establece que las poblaciones son diferentes; la hipótesis nula esta
blece que las poblaciones son iguales.
2. D eterm in ar las características de la d istrib ució n com parativa. L a distribución compa
rativa es una distribución chi-cuadrado con 4 grados de libertad (5 categorías ~ í = 4).
3. D eterm in ar el punto de corte en la d istrib u ció n co m p arativa, a p a rtir del cu al se de
b ería re ch a za r la hipótesis n ula. L a profesora es conservadora en cuanto a sus decisiones es
tadísticas y, por lo tanto, elige el nivel 0,01. U tilizando la tabla 14-2 (o la tabla B -4) para 4
grados de libertad, el profesor necesita un chi-cuadrado de al menos 13,277 para rechazar la h i
pótesis nula.
Tabla 14-4.
Frecuencias observadas y esperadas y prueba chi-cuadrado de bondad de ajuste del ejemplo de ca
lificaciones parciales. (Datos ficticios).
C a lifica ció n O b se rv a d a E sp er a d a
A 10 5 ( 2,5% X 200)
B 34 28 (14,0% X 200)
C 140 134 (67,0% X 200)
D 10 28 (14,0% X 200)
F 6 5 ( 2,5% X 200)
, _ ÍO -E f (1 0 - (3 4 -2 8 )* ( 1 4 0 - 134)z (1 0 -2 8 )* , (6 -
X E 5 * 28 134 28 ^ 5
~18J , ll 25 324
----- T* —---- * - + - * + . ----- 1
5 28 134 28 5 28 134 28
= 5 + 1 ,2 9 + 0 ,2 7 + 1 1 ,5 7 + 0,20*= 18,33
C onclusión: S e rechaza 3a hipótesis nula.
4. D eterm in ar el valo r m aestral en la d istrib ución com parativa. Para calcular el chi-cua-
drado, primero calculam os las frecuencias esperadas m ultiplicando los porcentajes esperados por
la cantidad en la muestra. Para el prim er grupo (calificación A ), la profesora esperaba un 2,5% se«
gún el sistema de curva normal que había utilizado previamente; 2,5% x 200 = 5. Por lo tanto, pa
ra las calificaciones A , ella esperaba una frecuencia de 5. Según el antiguo sistema, el 14% habría
obtenido una B , lo que da una frecuencia esperada de 28 alumnos de su clase de 200. L a tabla 14-4
indica el resto de las frecuencias esperadas más los cálculos del chi-cuadrado. Como se observa
en la tabla, el resultado es un chi-cuadrado de 18,33.
5. C o m p a rar los valores obtenidos en los pasos 3 y 4 p ara d eterm in ar si se rechaza o no
ía hipótesis n u la. E l chi-cuadrado necesario para rechazar la hipótesis nula era 13,277. E l chi-
cuadrado de la muestra es 18,33. Por lo tanto, la profesora puede rechazar la hipótesis nula y con
cluir que las poblaciones son diferentes (véase figura 14-3). E l nuevo método de calificación no
produjo una distribución normal de las calificaciones de la clase. S i bien no se predijo la dirección
de la diferencia, un análisis de los valores de las categorías muestra que, en este ejem plo, utilizar
el método de calificación por puntos dio como resultado que más alumnos obtuvieran A , B ó C , y
menos alumnos obtuvieran D y F.
Figura 14-3.
D istrib u ció n chi-cuad rad o ( g i ~ 4 ) d el eje m p lo acerca d el
siste m a d e c a lific a c io n e s, que m u estra e l pu nto de corte
para e l r ech a zo d e la h ip ó tesis nula al n iv el 0 ,0 1 .
del personal se les pregunta acerca del tipo de transporte que utilizan, y si prefieren acostarse tem
prano y levantarse temprano (“personas diurnas”) o acostarse tarde y levantarse tarde (“personas
nocturnas”). Lo s resultados se reflejan en la tabla. 14-5. Observemos las dos variables nominales;
a) tipo de transporte, con tres niveles y b) tendencia de descanso, con dos niveles.
Tabias de contingencia
L a tabla 14-5 es un ejemplo de una tab la de contingencia, aquella en la que se establecen las dis
tribuciones de dos variables nominales de modo que refleje las frecuencias de sus combinaciones
y también los totales. Una tabla de contingencia es sim ilar a las tablas utilizadas en los diseños
factoriales de investigación que se analizan con un análisis de varianza de dos criterios (véase ca
pítulo 13). Sin embargo, en una tabla de contingencia, los números son frecuencias y no medias.
E l número en cada categoría o combinación de categorías es una cantidad de individuos, no un
promedio de registros de determinada clase. Por lo tanto, en la tabla 14-5, el 60 en la combinación
autobús-diurna expresa cuántas personas diurnas toman autobús. No es un promedio ni nada que
se le parezca.
L a tabla 14-5 es un ejemplo de tabla de contingencia 3 x 2 porque tiene tres niveles de una va
riable cruzados con dos niveles de otra variable (no importa qué dimensión se nombre primero). Tam
bién es posible crear tabias de contingencia mayores, como por ejemplo d e 4 x 7 ó 6 x !8 . Las tablas
más pequeñas, las tablas de contingencia 2 x 2 , son las más comunes.
Independencia
E ! objetivo en el ejemplo que estamos analizando es saber si existe alguna relación entre el tipo de
transporte que utilizan las personas y el hecho de que sean personas diurnas o nocturnas. S i no
existe relación, la proporción de personas diurnas y nocturnas será la misma entre los que viajan
en autobús, los que comparten los autos y los que van con sus propios autos. O para decirlo de
otro modo, si no existe relación, la proporción de personas que viajan en autobús -com parten los
autos y conducen sus propios autos-, es la m ism a en el caso que se trate de personas diurnas o
nocturnas. No importa cómo se describa. L a situación de ausencia de relación entre las variables
en una tabla de contingencia se denomina independencia.2
Tabla 14-5.
Tabla de contingencia de frecuencias observadas de personas diurnas y nocturnas que utilizan dife
rentes medios de transporte. (Datos ficticios).
M edio de transporte Total
A u to b ú s A u to m ó v il c o m p a r tid o A u to m ó v il p r o p io
T otal 80 50 70 2 0 0 (1 0 0 % )
2 El término independencia se utiliza usualmente para referirse a la ausencia de relación entre dos variables nominales.
Sin embargo, si el alumno ya ha estudiado e l capítulo 3, puede resultarle útil pensar en la independencia com o algo si
milar a la situación de falta de correlación o coeficiente de correlación 0 (r = 0).
Muestra y población
Según los resultados de la encuesta observados en el estudio, las proporciones de personas noc
turnas y diurnas de la muestra varían de acuerdo con los diferentes medios de transporte. Por
ejemplo, los que viajan en autobús se dividen en 60-20, es decir, tres cuartas partes de los que via
jan en autobús son personas diurnas. Entre las personas que viajan en su propio auto, la división
es 30-40, es decir, una leve mayoría son personas nocturnas. Aun así, debemos tener en cuenta
que la muestra es de sólo 200 personas, y es posible que en la población mayor, el tipo de trans
porte que utiliza una persona sea independiente del hecho de que esa persona sea diurna o noctur
na. L a gran pregunta es si la falta de independencia en la muestra es lo suficientemente grande
como pararechazar la hipótesis nula de independencia en la población.
T o ta l 80 50 70 2 0 0 (100% )
el patrón proporcional de personas diurnas y nocturnas en cada columna debería ser igual que al de
toda la distribución. Lo anterior significaría que el medio de transporte no afecta la proporción de per
sonas diurnas y nocturnas, y que el medio de transporte es independiente de la proporción de perso
nas diurnas y nocturnas.
Analicem os ahora los números reales de la encuesta del ejemplo. En total existe un 60% de per
sonas diurnas y un 40% de personas nocturnas. Por lo tanto, si el medio de transporte es indepen
diente del hecho de ser una persona diurna o nocturna, este 60% -40% debería mantenerse en cada
columna (cada tipo de transporte). En primer lugar, el 60% -40% total debería mantenerse en el
grupo de personas que viajan en autobús, es decir, que en la casilla de la personas diurnas que to
man el autobús esperaríamos una frecuencia del 60% sobre 80, es decir, 48 personas. L a frecuen
cia esperada para las personas nocturnas que toman autobús es 32 (es decir, el 40% de 80 es 32).
Del mismo modo, analicemos las frecuencias esperadas para la columna de aquellos que comparten
el automóvil. L a columna debería dividirse en 60% -40% ; por lo tanto, se espera que su total de 50
personas se divida en un 60% - 40% , dando como resultado una frecuencia esperada de 30 personas
diurnas que viajan en automóviles compartidos (es decir, el 60% de 50 es 30) y 20 personas noctur
nas que viajan en automóviles compartidos (es decir, el 40% de 50 es 20). La s frecuencias esperadas
para la columna de personas que viajan en sus propios automóviles se calculan del mismo modo, y
dan 42 y 28, tal como lo muestra la tabla 14-6.
Lo anterior se expresa bajo la fórm ula,
£ =( 0 C ) (14-2)
En la fórm ula, E es la frecuencia esperada para una casilla en particular (la combinación de cate
gorías); R es la cantidad de personas observadas en la fila de esa casilla; N es la cantidad total de
personas, y C es la cantidad de personas observadas en la columna de esa casilla. (Aun si se con
funden las casillas y las columnas, la frecuencia esperada resulta la mism a).
Aplicando la fórmula a las personas diurnas que viajan en autobús,
E= = ( ^ ) ( 8 0 ) = ( 0.60)(80) = 48
Observando la tabla 14-6 en su totalidad, vemos que las frecuencias esperadas suman los mismos
totales de columnas y filas que las frecuencias observadas. Por ejemplo, en la primera columna
(autobús), las frecuencias esperadas de 32 y 48 suman 80, al igual que las frecuencias observadas
de 60 y 20 de la misma columna. D e modo sim ilar, en la fila superior (diurna), las frecuencias es
peradas de 48, 30 y 42 suman 120, el mismo total de las frecuencias observadas de 60, 30 y 30.
Para controlar los cálculos aritméticos, es siempre una buena idea asegurarse de que las frecuen
cias esperadas y observadas sumen los mismos totales tanto de fila como de columna.
K E
(60 -48)2 . (3 0 -3 0 )2 , (30 -42)2 , (2 0 -3 2 )2 , (2 0 -2 0 f , (4 0 -2 8 )2
es -f* ........ 4* * 4" —"4*'--------------- ■4*.............. —
48 30 42 32 20 28
= 3+0+3,43 + 4,5 + 0 + 5,14=16,07
Grados de libertad
Como siempre, antes de que podamos probar la significación debemos saber cuáles son los gra
dos de libertad. Lo s grados de libertad para el chi-cuadrado de una tabla de contingencia son la
cantidad de columnas menos 1 por la cantidad de filas menos 1. Se expresa bajo la fórm ula,
( 1« )
E n la fórmula anterior, ^Co¡umas es la cantidad de columnas y Nmas es la cantidad de filas. S i apli
camos esta fórmula a la encuesta del ejemplo,
A u to b ú s A u to m ó v il c o m p a r tid o A u to m ó v il p r o p io
3 <n ■" "
0 a D iu r n a 60 30 \ Ï i 2 0 (60% )
E* a
-8 i N o c tu r n a - y**-.. 80 (40% )
S '*
H Ä
T o ta l 80 50 70 2 0 0 (100% )
nocemos las frecuencias de todas las casillas de personas diurnas y los totales de columnas para
cada tipo de transporte, entonces la frecuencia de cada casilla correspondiente a las personas noc
turnas es igual al total de su columna menos las personas diurnas de esa columna. Por ejemplo,
hay SO personas que viajan en autobús y 60 son personas diurnas, entonces los 20 restantes deben
ser personas nocturnas. Por lo tanto, en este ejem plo, aunque hay seis celdas, hay sólo 2 grados de
libertad; entonces, hay sólo dos casillas cuyas frecuencias son realmente libres de variar una vez
que tenemos todos los totales de fila y columna.
Prueba de hipótesis
Con 2 grados de libertad, la tabla 14-2 (o tabla B -4) muestra que el punto de corte chi-cuadrado
necesario para tener significación a un nivel de 0,01 es 9,211. E l chi-cuadrado de 16,07 del ejem
plo es mayor que ese punto de corte. Por lo tanto, podemos rechazar la hipótesis nula que estable
ce que en la población las dos variables son independientes.
L a hipótesis nula establece que las dos poblaciones son iguales, y que en general las proporciones
que utilizan diferentes tipos de transporte son las mismas para las personas diurnas y nocturnas.
L a hipótesis de investigación establece que las dos poblaciones son diferentes, y que entre las per
sonas en general, las proporciones que utilizan diferentes tipos de transporte varían según se trate
de personas diurnas o nocturnas.
Para decirlo de otro modo, la hipótesis nula establece que las dos variables son independien
tes (no están relacionadas entre sí). L a hipótesis de investigación establece que no son indepen
dientes (que están relacionadas entre sí).
2. D eterm in ar las características de la d istrib ución com parativa. L a distribución compa
rativa es una distribución chi-cuadrado con 2 grados de libertad. S i conocemos la cantidad de par
ticipantes de dos casillas y los totales de fila y columna, todas las demás cantidades pueden
determinarse. O bien, utilizando la regla para tablas de contingencia, la cantidad de casillas libres
de variar es la cantidad de columnas menos 1 por la cantidad de filas menos 1.
3. D eterm in ar el punto de corte en la distrib ución co m p arativa, a p a rtir del cu al debería
rechazarse la hipótesis nula. Utilizam os la m isma tabla que para cualquier prueba chi-cuadrado.
E n el ejemplo, estableciendo un nivel de 0,01 de significación con 2 grados de libertad, necesita
mos un chi-cuadrado de 9,211.
4. D eterm in ar el valo r m aestral en la distrib ución com parativa. En el ejemplo, encontra
mos un chi-cuadrado de 16,07.
5. C o m p a rar los valo res obtenidos en los pasos 3 y 4 p a ra determ inar si se rechaza o no
la hipótesis n ula. E l chi-cuadrado necesario para rechazar la hipótesis nula es de 9,211, y el chi-
cuadrado del ejemplo es de 16,07 (véase figura 14-4). Por lo tanto, podemos rechazar la hipótesis
nula. Se sostiene la hipótesis de investigación que establece que, en la población, las dos variables
no son independientes. E n consecuencia, las proporciones del tipo de transporte utilizado para ir a
trabajar difiere según se trate de personas diurnas o nocturnas.
En el año 1994, R iehl realizó un estudio para analizar la experiencia universitaria de alumnos de
prim er año que eran la primera generación de la fam ilia en asistir a la universidad. Lo s alumnos
fueron comparados con otros alumnos que no eran la prim era generación de la fam ilia que asistía
a la universidad (todos los alumnos pertenecían a la Universidad de Indiana). U na de las variables
que m idió R iehl fue si los alumnos abandonaban o no los estudios durante el prim er semestre.
L a tabla 14-8 muestra los resultados y los porcentajes correspondientes a los grupos de aban
dono y no abandono, más las frecuencias esperadas (entre paréntesis) basadas en esos porcenta
je s. Debajo de la tabla de contingencia se encuentran los cálculos de la prueba chi-cuadrado de
independencia.
Figura 14-4.
D istrib u ció n ch i-cu a d ra d o (gl = 2 ) d e l e je m p lo a cerca d e la
te n d en cia d e d e s c a n so y m e d io d e transporte, q u e m u estra e l
p u n to d e co rte para rechazar la h ip ó tesis nula al n ivel 0 ,0 1 .
1. Replantear el problema en función de hipótesis de investigación e hipótesis nula de las
poblaciones. Las dos poblaciones son:
Población 1: alumnos como los entrevistados.
Población 2: alumnos cuyo abandono o continuidad en la facultad durante-.el prim er semestre
es independiente del hecho de ser o no la prim era generación en la fam ilia que
asiste a la universidad.
L a hipótesis nula establece que las dos poblaciones son iguales y que, en general, si los alumnos
abandonan o no durante el primer semestre es independiente de que sean la primera generación de
su fam ilia que asiste a la universidad. L a hipótesis de investigación establece que las poblaciones
no son iguales. En otras palabras, la hipótesis de investigación establece que los alumnos como los
entrevistados, no son iguales a la población hipotética en la que abandonar no está relacionado con
que sean la primera generación.
2. D eterm in ar la s cara cterística s de la d istrib u ció n com parativa. E s una distribución
chi-cuadrado con 1 grado de libertad.
3. D eterm in ar el punto de corte en la distrib ución com p arativa, a p a rtir del cu al debería
rechazarse la hipótesis nula. Utilizando el nivel 0,01 y 1 grado de libertad, el chi-cuadrado ne
cesario para alcanzar significación es 6,635. L a figura 14-5 representa gráficamente este cálculo,
4. D eterm in ar el valo r m uestral en la distrib ución com parativa. Para calcular el chi-cua
drado, primero debemos calcular las frecuencias esperadas para cada casilla. La s frecuencias
mencionadas se calculan m ultiplicando los porcentajes esperados por la cantidad en la muestra.
Por ejemplo, analicemos los abandonos de la prim era generación. E n general, los abandonos re
presentan el 7,9% de los alumnos; por lo tanto, si la hipótesis nula fuera verdadera, los abandonos
deberían representar el 7,9% de los 730 alumnos de la prim era generación. E s decir, la frecuencia
esperada para los abandonos de la prim era generación es 57,7 (7,9% x 730 = 57,7). Una vez que
hemos calculado las frecuencias esperadas para cada casilla, el resto del análisis chi-cuadrado s i
gue el procedimiento habitual que im plica calcular la diferencia de cada casilla, elevarla al cua
drado, dividirla por la frecuencia esperada y sum ar los resultados de todas las casillas. Como lo
indica la tabla 14-8, el resultado es un chi-cuadrado de 6,73.
5. Comparar los valores obtenidos de los pasos 3 y 4 para determinar si se rechaza o no
la hipótesis nula. E l chi-cuadrado de 6,73 es m ayor que el punto de corte de 6,635 (véase figura
14-5), Por lo tanto, la conclusión es rechazar la hipótesis nula. E s decir, a juzgar por una muestra
de 2.045 alumnos de la Universidad de Indiana, lo s alumnos que son la prim era generación de su
fam ilia en asistir a la universidad tienen más posibilidades que los demás alumnos de abandonar
durante el prim er semestre. (No debemos olvidar, por supuesto, que podría haber m uchas razo
nes para este resultado).
Un tercer ejemplo
Janice Steil y Jennifer H ay (1997) realizaron una encuesta a profesionales (abogados, doctores,
banqueros, etc.) acerca de cuáles eran las personas con las que se comparaban cuando pensaban
en su situación laboral (salario, beneficios, responsabilidades, nivel social, etc.). U na de las cues
tiones de mayor interés era averiguar cuántos profesionales se comparaban a s í mism os con per
sonas de su propio sexo, del sexo opuesto, o ambos.
L a tabla 14-9 muestra los resultados junto con el porcentaje correspondiente a cada tipo de
comparación, más las frecuencias esperadas (que aparecen entre paréntesis) sobre la base de esos
porcentajes. Debajo de la tabla de contingencia están los cálculos de la prueba chi-cuadrado de
independencia.
T a b la 1 4 -8 .
R e su lta d o s y c á lc u lo s d e la p r u e b a ch i-c u a d ra d o d e in d ep en d e n c ia q u e p r u e b a si la p r im e r a gen eración
d e a lu m n o s u n iv er sita r io s d ifiere d e o tra s en cu an to a a b a n d o n o de e stu d io s d u ra n te el p r im e r sem estre.
P r im e r a O tr a s
= 4 ,0 6 + 2 ,1 4 + 0,35 + 0,1 8
= 6,73
C onclusión: se rechaza la hipótesis nula.
N ota: 1. Con un análisis 2 x 2 , las diferencias y las diferencias cuadráticas (numeradores) de las casillas son idénticas.
Bn el e je m p lo q u e analizamos, las diferencias se deben al redondeo. 2. Fuente: Riehl (1994). E l chi-cuadrado exacto
(6,73) es levemente diferente al informado en el artículo (7,2) debido a diferencias de redondeo.
Tabla 14-9.
Resultados y cálculos de la prueba chi-cuadrado de independencia que prueba si hombres y muje
res difieren en cuanto al sexo de las personas con las que comparan su situación laboral.
R esp u esta T o ta l
H om bres M u je r e s
M is m o s e x o [ . 2 9 ;( 2 3 ) U Ú L 4 6 (39,0% )
A m bos sexos j- . 2 6 (2 7 ) ■ 5 4 (4 5 ,8 % )
59 59 118
_ (O-Ef ( 2 9 - 2 3 ) 2( 1 7 - 2 3 ) 1 ( 4 ~ 9 ) s (1 4 - 9 ) 5 (2 6 - 27)a (2 8 -2 7 )1
K E 23 23 9 9 27 27
e -6 * 9^ _ -l* l2
36 36 25 25 1 1
= 23 + 23 * 9 + 9 + 27 + 27
Fuente: Steil & Hay (1997), El chi-cuadrado calculado aquí (8,78) es levem ente diferente del informado en la publica
ción (8,76) debido a diferencias de redondeo.
Una vez que calculam os las frecuencias esperadas para cada. )
casilla, el resto del análisis chi-cuadrado sigue el procedimiento L
habitual: calcular la diferencia para cada casilla, elevarlas alo
cuadrado, dividirlas por las frecuencias esperadas y sumar lo s :
resultados de todas las casillas. Tal como lo Índica la tabla 14-9,
el resultado es un chi-cuadrado de 8,78.
5. Comparar los valores obtenidos en los pasos 3 y 4 p
determinar si se rechaza o no la hipótesis nula. E l chi-cuadra
do de 8,78 es mayor que el punto de corte de 5,992 (véase figura ::
14-6); por lo tanto, podemos rechazar la hipótesis nula. E s decir,: ;
basándonos en el ejemplo, el sexo de las personas con las que s e :
comparan los profesionales con respecto a su situación laboral '
es probablemente diferente para hombres y mujeres. A l analizar :
Figura 14-6. las frecuencias de las casillas observadas, la mayor diferencia
Distribución chi-cuadrado
(gl =2) del ejemplo de Steil y parece ser que las mujeres tienen aproximadamente las mismas
Hay (1997), que muestra el probabilidades de compararse con otras personas del mismo se
punto de corte para rechazar xo o del sexo opuesto, mientras' que es mucho más probable que
la hipótesis nula al nivel 0,05. los hombres se comparen con personas del mismo sexo que con
las del sexo opuesto.
(14-4)
Las reglas de Cohén (1988) para el coeficiente phi establecen que 0,10 es un tamaño del efecto
pequeño, 0,30 es un tamaño del efecto mediano y 0,50 es un gran tamaño del efecto.
Por ejemplo, en el estudio de R iehl acerca de la prim era generación de estudiantes universita
rios, el chi-cuadrado que calculam os era de 6,7, y había 2.045 personas en el estudio. Aplicando
la fórmula para el coeficiente phi,
Se trata de un tamaño del efecto muy pequeño. Lo s resultados con respecto a la significación nos
indican que la mayor probabilidad de que los alumnos de primera generación abandonen los estu
dios, probablemente no es casual. Pero el coeficiente phi nos indica que, en la práctica, esa dife
rencia no casual no puede ser un factor muy importante. (En el capítulo 8 tratamos aquellas
situaciones en la que un resultado es estadísticamente significativo pero cuyo tamaño de efecto es
muy pequeño).
E l estadístico phi sólo se aplica cuando existe una situación 2 x 2 . Podemos decir que el esta
dístico p h i de C ra m e r es una extensión del coeficiente phi ordinario, que puede aplicarse a ta
blas de contingencia mayores de 2 x 2. (E l phi de Cram er también se conoce como la V de
Cram er, y a veces se escribe <j)c ó Vc). Se calcula del mismo modo que el coeficiente phi ordina-
3 S í eí alumno ya ha estudiado el capítulo 3, puede resultarle útil considerar un tamaño deí efecto chi-cuadrado estima
da com o un coeficiente de correlación. D e hecho, en ei caso de una tabla de contingencia 2 x 2, la estimación es real
mente idéntica al coeficiente de correlación. Supongamos que tomáramos las dos variables de una tabla de
contingencia 2 x 2 y arbitrariamente hiciéramos que uno de ios valores de cada uno fuera 1 y el otro fuera igual a 0, Si
después calculáramos un coeficiente de correlación entre las dos variables, el resultado seria exactamente el mismo que
el coeficiente phi descripto en el siguiente párrafo {no obstante, según qué categorías de cada variable hayamos trans
formado en 1 ó en 0, la correlación será negativa o positiva). Las regías de Cohén de tamaños del efecto pequeños, m e
dianos y grandes para el coeficiente phi, que se describen a continuación, también son exactamente las mismas que las
de un coeficiente de correlación.
rio, excepto que en lugar de dividir por N, se divide por el resultado de la m ultiplicación de N por
los grados de libertad del lado menor de la tabla (g/Menoc). Se expresa bajo la fórmula,
de Cramer = (14-5)
Í^O(á^Menor)
<\> d e C ram er =:
x2 fm f » V Ô Ô 8 = 0 ,2 8
W ) { g t U cn or) i (200)(l)
En el estudio de Steil y H ay acerca del sexo con el que hombres y mujeres profesionales se com
paraban a sí mismos, calculam os un chi-cuadrado de 8,78, y se entrevistó a 118 profesionales.
Lo s grados de libertad del lado más pequeño de la tabla (en este caso las columnas) era 1. E l phi
de Cram er es 0,27 (la raíz cuadrada de 8,78 dividido 118 es 0,27). Lo anterior se expresa bajo la
fórmula:
8 ,7 8
ò d e C ram er= = V 0 ^ 0 7 = 0 ,2 6
(ri)(gíjvfenor ) y (H 8 )(í)
L a s reglas de Cohén para el tamaño del efecto del phi de Cram er dependen de los grados de liber
tad del lado menor de la tabla. L a tabla 14-10 muestra las reglas de Cohén para el tamaño del
efecto del phi de Cram er (1988), correspondientes a tablas cuyo lado menor es 2 ,3 y 4. Cabe des
tacar que cuando el lado menor de la tabla es 2, el grado de libertad es 1 y, por lo tanto, los tama
ños del efecto que indica la tabla para esa situación son los mism os que para el coeficiente phi
ordinario. (Dado que m ultiplicar por 1 no produce ningún cambio, el cálculo también arroja el
mismo resultado, tal como sucede en los dos ejemplos que analizam os anteriormente).
Basándonos en la tabla, en el ejemplo del transporte existe un tamaño del efecto aproximada
mente mediano (0,28), es decir, una relación mediana entre el tipo de transporte utilizado y el he
cho de que se trate de una persona diurna o nocturna.
Tabla 14-10.
Reglas de Cohen para el phi de Cramer.
M en o r d im en sió n de
la ta b la de c o n tin g en cia T am añ o d el e fe cto
P equeño M e d ia n o G ra n d e
2 Q>Lfcttor ~ ^) OJO 0 ,3 0 0 ,5 0
2 lo^Víeaor ~ 2 ) 0,07 0,21 0,35
^ 0>(vfcnor - 3) 0 ,0 6 0J7 0 ,2 9
Potencia y tamaño de muestra necesarios
para ia prueba chi-cuadrado de independencia
L a tabla 14-11 muestra la potencia aproximada al nivel 0,05 de significación, para tamaños del
efecto pequeños, medianos y grandes y tamaños totales de muestra de 2 5 ,5 0 ,1 0 0 y 200. Se indi
ca la potencia para tablas con 1 , 2 , 3 y 4 grados de libertad.4
Por ejem plo, analicem os k potencia de un estudio planificado de 2 x 4 (gl - 3 ) con 50 per
sonas, con un tamaño del efecto esperado mediano (phi de Cram er - 0,30), que se realizará
con un nivel de 0,05. U tilizando la tabla 14-11, el estudio m encionado tendría una potencia de
0,40, es decir, que si la hipótesis de investigación en realidad es verdadera y el tamaño del
efecto real es m ediano, existe aproximadamente un 40% de posibilidades de que el estudio re
sulte significativo.
L a tabla 14-12 indica la cantidad total aproximada de participantes necesarios para obtener
una potencia del 80% , con tamaños del efecto pequeños, medianos y grandes, a un nivel 0,05 de
significación, para pruebas chi-cuadrado de independencia con 2 , 3 , 4 y 5 grados de libertad.3 Por
Tabla 14-11.
P o t e n c i a a p r o x im a d a p a r a u n a p r u e b a c h i- c u a d r a d o d e in d e p e n d e n c ia e n la q u e s e p r u e b a la
h ip ó te s is a í n iv e l 0 ,0 5 d e s ig n ific a c ió n .
P equeño M e d ia n o G ra n d e
($*0,10) Hy * 0 , 3 0 ) (4) = 0 ,5 0 )
Ì 25 0,08 0 ,3 2 0 ,7 0
50 0,11 0 ,5 6 0 ,9 4
100 0,17 0,85 £
0 ,2 9 0,9 9 íjí
200
3 25 0,07 0,21 0 ,5 4
50 0 ,0 8 0 ,4 0 0 ,8 6
100 0 ,1 2 0,71 0 ,9 9
200 0 ,1 9 0 ,9 6 *
4 25 0,0 6 0,19 0 ,5 0
50 0,08 0 ,3 6 0 ,8 2
100 0,11 0 ,6 6 0 ,9 9
200 0,17 0 ,9 4 *
*Casi i.
4 Cohen (1988, pp. 228-248) proporciona tablas más detalladas. Las tablas de Cohen se basan en un tamaño del efecto
denominado w, que es equivalente al phi pero no al phi de Cramer. En la página 222, Cohen ofrece también una útil ta
bla de conversión de phi de Cramer a w.
5 Cohen (1988, pp, 253-267) proporciona tablas más detalladas. Para utilizar esas tablas, debe tenerse en cuenta lo indi
cado en la nota al pie na 4. Además, Duniap y Myers (1997) han demostrado que, con una tabla 2 x 2, la cantidad apro
ximada de participantes necesarios para una potencia de 80 - 90% es 8/<f>2.
Tabla 14-12.
Cantidad total aproximada de participantes necesarios para una potencia del 80% en una prueba
chi-cuadrado de independencia, en la que se prueba la hipótesis al nivel 0,05 de significación.
g l T otal T am año d el efecto
P equeño M e d ia n o G ra n d e
(<$> = O J O) f<|> = 0 ,3 0 ) f<t> = 0 ,5 0 )
1 783 87 26
2 964 107 39
3 1.090 121 44
4 1.194 133 48
ejemplo, supongamos que planificamos un estudio con una tabla de contingencia 3 x 3 (gl~ 4),
que esperamos un gran tamaño del efecto y que utilizam os el nivel 0,05 de significación. De
acuerdo con la tabla, sólo necesitaríamos 48 participantes (aproximadamente 5 ó 6 por casilla).
CONTROVERSIAS Y LIMITACIONES____________________________________
H ace m edio sig lo , Lew is y Burke (1949) publicaron un trabajo memorable acerca de la u tili
zación inadecuada del chi-cuadrado. Enum eraron nueve errores comunes aparecidos en publi
caciones y dieron numerosos ejem plos de cada uno de ello s. Con una sola excepción, su obra
sigue vigente a través de los años. Lo s errores siguen com etiéndose, y aún siguen considerán
doselos errores.
L a única excepción de esa descripción crítica es el error que L ew is y B urke consideraban la
debilidad más común en la utilización del chi-cuadrado: frecuencias esperadas demasiado ba
ja s. E n la actualidad, aparentemente esperar cantidades pequeñas para las casillas puede no ser
un problema tan grave. Lew is y Burke, como la m ayoría de los autores de textos sobre estadís
tica de su tiempo, sostenían que cada casilla de una tabla de contingencia (y cada categoría de
una prueba de bondad de ajuste) debería tener una frecuencia esperada de tamaño razonable.
Recomendaban un m ínim o de 10, siendo 5 la cantidad lím ite inferior. Otros recomendaban ci
fras que iban del 1 al 20. Incluso S ir Ronald Fish er (1938) tomó partido, recomendando 10 co
mo mínim o. A sim ism o, otros recomendaban que el m ínim o debía ser una proporción del total,
o que dependía del hecho de que las frecuencias esperadas fueran iguales o no. (A propósito,
cabe m encionar que lo que se estaba debatiendo eran frecuencias m ínim as esp erad as, no fre
cuencias observadas)
Desde el año 1949, cuando Lew is y Burke publicaron su trabajo, han habido algunas investi
gaciones sistem áticas acerca de cuáles eran exactamente los efectos de pequeñas frecuencias es
peradas. (En esos estudios se aplican los métodos de M ontecario; véase cuadro 10-1). ¿C u ál es la
conclusión? A l igual que en la m ayoría de las áreas, la controversia aún no está totalmente defini
da. Sin embargo, una importante revisión de las investigaciones realizadas sobre el tema (Deiuc-
chi, 1983) plantea dos conclusiones principales:
El zapping (cambiar de canal muy rápidamente), la categoría dominada por el tipo de comportamiento
más activo, ocurrió con más frecuencia en el 33% de las sesiones (n - 18). La categoría pastoreo (cu
riosear los canales durante algunos períodos) dominó el 24% de las sesiones ( n - 13), y un 22% corres
pondía a cada una de las categorías de visión continua y prolongada (n = 12). Las diferencias no fueron
estadísticamente significativas (x2 = 1,79, gl~3,p> 0,05),
6 Supongamos que tenemos una tabla mayor a 2 x 2, con una categoría o casilla que tiene una frecuencia esperada ex
tremadamente pequeña (o incluso una frecuencia esperada moderadamente pequeña si la cantidad de participantes
también es pequeña). Una solución es combinar categorías relacionadas para aumentar la frecuencia esperada y redu
cir la cantidad total de casillas. S in embargo, la anterior es una solución de último recurso si la adaptación se realiza
basándose en los resultados del experimento. El problema es que se estaría capitalizando el hecho de conocer e l resul
tado. La mejor solución es agregar personas al estudio, pero si esto no fuera factible, a veces se puede aplicar un pro
cedim iento alternativo, denominado “prueba exacta de Fisher”, que se describe ea algunos textos sobre estadística de
nivel intermedio. .
mestre en la Universidad Me G ilí (tiempo 1). Algunos de estos alumnos teman parejas que vivían
en el área de M cG ill, otros teman parejas que vivían lejos de M e G ilí. Lo s investigadores se pusie
ron en contacto con los participantes nuevamente durante el semestre de otoño, preguntándoles por
el estado actual de sus relaciones de pareja (tiempo 2). E l siguiente es el informe de sus resultados:
De ios 69 participantes 55 estaban involucrados en relaciones a larga distancia y 14 en relaciones
locales (parejas que vivían dentro de los 200 km de donde vivían ellos). Coherentemente con nuestras
predicciones, 12 de las 14 relaciones locales estaban intactas al tiempo 2 (86%), mientras que sólo 28
de las 55 relaciones a distancia permanecían intactas (51%). x2( L Ñ =69) = 5,55, p < 0,02. (p. 108)
Aunque Lydon et a l no indicaron el tamaño del efecto deí resultado significativo, podemos calcu
larlo a partir de la inform ación proporcionada. E l cálculo estadístico apropiado para el tamaño del
efecto es el coeficiente phi, ya que se trata de una tabla chi-cu adrado 2 x 2 (local contra larga dis
tancia x intacto contra terminada). S i aplicam os la fórmula:
Resumen
La s pruebas chi-cuadrado son pruebas de hipótesis para variables nominales. E l chi-cuadrado m i
de el grado de discrepancia entre frecuencias esperadas y observadas de varios niveles o catego
rías. Se calcula encontrando la diferencia entre la frecuencia observada y la frecuencia esperada
de cada categoría o combinación de categorías, elevando esa diferencia al cuadrado (para elim i
nar signos positivos y negativos) y dividiéndola por la frecuencia esperada (para que las diferen
cias cuadráticas sean más proporcionales a las cantidades involucradas). Luego se suman los
resultados de todas las categorías o combinaciones de categorías. L a distribución chi-cuadrado es
una distribución conocida, y los puntos de cortes pueden encontrarse en una tabla estándar.
L a prueba chi-cuadrado de bondad de ajuste se utiliza para probar la hipótesis de que una dis
tribución de frecuencias de dos o m ás categorías de una variable nominal coincide con una distri
bución esperada. (Las frecuencias esperadas se basan, por ejemplo, en una teoría o en una
distribución de otro estudio o circunstancia). E n este tipo de pruebas, las frecuencias esperadas se
indican de antemano o se basan en algunos porcentajes esperados (como-por ejemplo, el mismo
porcentaje para todos los grupos). Lo s grados de libertad son la cantidad de categorías menos 1.
L a prueba chi-cuadrado de independencia se u tiliza para probar la hipótesis sobre la relación
entre dos variables nominales, es decir, si el esquema de repetición de los participantes en la cate
goría de una variable tiene el mismo patrón proporcional dentro de cada una de las categorías de
la otra variable. Lo s datos se exponen en una tabla de contingencia, en la que las dos variables se
cruzan y las cantidades de participantes de cada combinación se ubican dentro de cada una de las
casillas resultantes. L a frecuencia esperada para una casilla, si las dos variables son independien
tes, es el porcentaje de todas las personas en ja fila de la casilla m ultiplicado por la cantidad total
de personas en la columna de esa casilla. Lo s grados de libertad para la prueba de independencia
son la cantidad de columnas menos 1, m ultiplicada por la cantidad de filas menos 1.
E l tamaño del efecto estimado para una prueba chi-cuadrado de independencia (ei grado de
asociación), con una tabla de contingencia 2 x 2, es el coeficiente phi; y con tablas mayores, es el
phi de Cramer. Ptii es la raíz cuadrada del resultado de la división del chi-cuadrado calculado por
la cantidad de participantes. E l phi de Cram er es la raíz cuadrada del resultado de la división del
chi-cuadrado, calculado por el producto de la cantidad de participantes por los grados de libertad
de la dimensión más pequeña de la tabla de contingencia. Estos coeficientes v^n de 0 a 1; 0 indica
una independencia perfecta y 1 una relación perfecta. U n phi de 0,10 se considera un tamaño del
efecto pequeño, de 0,30 un tamaño del efecto mediano y de 0,50 un gran tamaño del efecto.
Las pruebas chi-cuadrado no tienen supuestos relacionados con las distribuciones normales
de sus variables, pero s í requieren que la categoría o casilla en la que se incluye a un participante
sea independiente de la categoría o casilla de cualquier otro participante.
L a frecuencia nnnima aceptable para una categoría o casilla ha sido tema de controversias.
Actualmente, el mejor consejo es tener en cuenta que, incluso pequeñas frecuencias esperadas, no
aumentan seriamente las posibilidades de un error Tipo X, siempre que haya al menos una canti
dad de individuos igual a cinco veces la cantidad de categorías (casillas).
No obstante, las pequeñas frecuencias esperadas reducen seriamente la potencia y deben evi
tarse siempre que sea posible.
Términos clave
- Variable categórica. - Prueba chi-cuadrado - Independencia.
- Distribución chi-cuadrado. de independencia. - Variable nominal.
- Chi-cuadrado (x 2). - Tabla de contingencia. - Frecuencia observada.
- Tabla chi-cuadrado. - Phi de Cramer. - Coeficiente phi (<f>).
- Prueba chi-cuadrado de - Frecuencia esperada.
bondad de ajuste.
oi
16
gunta sí la actividad de la clínica difiere entre
las distintas temporadas del año. El último año 10 16 10 10 16 16 10 16 10
ingresaron 28 nuevos pacientes en invierno, 33 16 10 10 16 10 16 16 10 16
en primavera, 16 en verano y 51 en el otoño.
Sobre la base de la información del año ante
rior, ¿el director debería concluir que existe 5. Un psicólogo especializado en educa
una diferencia entre las distintas estaciones? ción está interesado en saber si los alumnos
(Utilice un nivel de 0,05) a) Realice los cinco que utilizan máquinas de escribir o procesado
pasos de la prueba de hipótesis, b) Explique su res de texto (o ninguno de ellos) para escribir,
respuesta a una persona que nunca ha tomado cuando realizan tareas en sus hogares, tienden
un curso de estadística. (Nota: este ejercicio es a utilizar lapicera o lápiz cuando toman apun
similar al ejemplo de Harter et al., en el que se tes en clase. El investigador entrevista a 200
calcula un chi-cuadrado para una sola variable alumnos. Los resultados aparecen en la tabla
nominal. No se trata de una prueba chi-cuadra que sigue a continuación. ¿Existe una relación
do de independencia y no incluye tablas de significativa entre estas dos variables? (Utilice
contingencia). el nivel 0,05). a) Realice los cinco pasos de la
3. Foiwell et al. (1997) entrevistaron a un prueba de hipótesis, b) Calcule el phi de Cra
grupo de adultos, de 54 años o mayores, acerca mer. c) Explique su respuesta a una persona
de la relación que mantenían con sus herma que nunca ha tomado un curso de estadística.
nos. Una de las preguntas planteaba si había
ocurrido algún cambio en la proximidad emo Artefacto utilizado
cional a través de los años. Descubrieron que en sus hogares
43 de los entrevistados “percibieron cambios 1 e£ M á q u in a d e P r o c e s a d o r
N o han
H a n tr a ta d o t r a ta d o
p a c ie n te s c o n p a c ie n t e s c o n
T o ta l HTV/SWA HTV/SIDA
Nota: E s p o sib le que los porcentajes no sumen 100 debido aí redondeo. La mayoría de lo s entrevistados (51%)
brindaron servicios a menos de 10 pacientes con hív / sida , un 4% a 10-19 pacientes, un 1% a 20-29 pacientes, un 1% a
30-39 pacientes y un 3% a 4 0 ó más pacientes.
aLa variable se midió en una escala de 5 puntos que iba del 1 = nunca a 5 = siempre.
***£<0,01.
Puente: Sbi, L., et aí. (1997), tab. 1. “M édicos de atención primaria y barreras contra la atención a personas con
HTV/sTDA” . E va lu a ció n & P ro fe sio n e s rela c io n a d a s c o n la s a lu d (E va lu a ú o n & The H e a lth P ro fessio n s], 20, 164-187.
Copyright © 1997, por Sage Publícatíons, Inc. Reimpreso con autorización de Sage Publications.
que nunca ha tomado cursos de estadística. (118/300 - 4 0 = 0,45). A través de una prueba
chi-cuadrado que comparaba los porcentajes de
respuestas de los grupos experimental y de
Asistencia
control descubrió que el incentivo de $1 había
R egu lar O casion al mejorado de forma estadísticamente significa
O P latea 20 80 . tiva e l porcentaje de respuesta en comparación
3? -§ G alería prin cipal 20 20 .:.
os « d e p a lc o s con el grupo de control [x2( l , N - 5 2 1 ) = 16,0,
O -3 40 ;■ 80
G alería p <0tG01j.
E
suponer que las distribuciones poblacionales son siquiera aproximadamente norma
les. Al mismo tiempo, analizamos situaciones en las que no podemos cumplir con
otros requisitos de los procedimientos ordinarios de prueba de hipótesis, como por
ejemplo cuando las poblaciones no tienen las mismas varianzas. Primero, revisare
mos brevemente la función que cumplen los supuestos en los procedimientos estándar de prueba
de hipótesis. Luego, analizamos tres métodos utilizados por investigadores psicológicos cuando
los resultados de un estudio no cumplen con los supuestos usuales: transformaciones de datos,
pruebas de rango y orden y métodos intensivos por computadora.
1A l calcular la significación de la regresión (capítulo 4) suponemos que en la población, para cada nivel de la variable de
predicción, la variable dependiente es normal. También suponemos que la varianza de la variable dependiente es la
misma para cada nivel de la variable de predicción. En la correlación (capítulo 3), el requisito es aún más estricto, siendo
necesario que cada variable y las combinaciones de variables tengan distribuciones normales. Textos más avanzados pre
sentan métodos sofisticados para identificar si se cumplen los supuestos mencionados. Sin embargo, al menos podemos
considerar que los supuestos no han sido cumplidos si los datos de la muestra sugieren que en la población la distribuí
cíón general con respecto a la variable dependiente (en la regresión), o a ambas (en la correlación), no es normal. óó.
/V= 10, M —-0,18, SD = l,] i
S- ' .MI
4—
i i
"A: f e s í c ; '
IlMS : v "Íí:
-2,0 -{,5 -1,0 -0,5 Ó 0,5 {,0 í,5; :2,0;.:--y
o - ■■■
-2,0' - i.5 ~:l-.0 -0,5; 0- 0,5 4,0: 1,5. 2,0 Figura 15-2.
jV~ 10, ‘M * 0,04,52) =.¡,13 ■ Distribuciones coa casos atípicos en uno o arabos lados.
Figura 15-1.
Histogramas de varias muestras elegidas al azar,
tomadas cada una de una población normal con
|X = 0 y a = I.
TRANSFORMACIONES DE DATOS
Un procedimiento ampliamente utilizado cuando los valores de la muestra no parecen provenir de
una población normal ¡es cambiar los valores! Por supuesto que no se inventan, aunque eso puede
parecer antes de que expliquemos el procedimiento. El método consiste en que el investigador
aplique algún procedimiento matemático a cada valor, como calcular la raíz cuadrada, para hacer
que una distribución no normal se acerque más a lo normal. (Algunas veces este procedimiento
también logra que las varianzas de dos o más grupos se asemejen más). El proceso que describi
mos en el párrafo anterior se denomina transformación de datos. Una vez que hemos realizado
una transformación de datos, si se cumplen los otros supuestos podemos entonces calcular una
prueba t, un análisis de varianza o una correlación ordinaria y, así, obtener resultados precisos.
La transformación de datos tiene una ventaja importante con respecto a otros procedimientos
que aprenderemos para trabajar con poblaciones no normales; una vez que hemos realizado una
transformación de datos, podemos utilizar procedimientos familiares y sofisticados de prueba de
hipótesis.
Analicemos un ejemplo. Las medidas de tiempo de reacción usualmente son muy asimétricas
hacia la derecha. Hay muchas respuestas cortas (rápidas) y unas pocas, pero a veces muy extre
mas, largas (lentas). Es improbable que los tiempos de reacción que aparecen en la figura 15-3
provengan de una población que sigue una curva normal; en realidad es probable que la propia
población de tiempos de reacción sea asimétrica.
Sin embargo, supongamos que sacamos la raíz cuadrada de cada tiempo de reacción. La ma
yoría de los tiempos de reacción serán apenas afectados. Un tiempo de reacción de 1 segundo
continúa siendo 1; un tiempo de reacción de 1,5 segundos se reduce a 1,22. Pero los tiempos de
reacción muy lentos, los que crean la larga cola hacia la derecha, son reducidos sustancíalmente;
Por ejemplo, un tiempo de reacción de 9 segundos se reduce a 3, y un tiempo de reacción de 16
segundos (la persona realmente estaba distraída y se olvidó de la tarea que estaba realizando) se
reduce a 4. La figura 15-4 muestra el resultado después de sacar la raíz cuadrada de cada tiempo
de la distribución asimétrica representada en la figura 15-3. Después de una transformación raíz
cuadrada, parece mucho más probable que la distribución de ios tiempos de reacción provenga
de una población con una distribución normal (de valores transformados).
7 U n a v e z q u e s e com pleta un estu d io, y antes de realizar cualquier cá lcu lo estad ístico descriptivo o prueba d e signifi
ca ció n , lo s investigadores prim ero controlan cu id ad osam en te q u e toda !a inform ación haya sid o registrada correcta
m en te e ingresad a c o n precisión e n la com putadora. D esp u és controlan cada variable en cu an to a la form a de su d is
tribución, para ver s i su p ob lación difiere seriam ente d e lo norm al, p roceso qu e se denom ina “exp lo ra ció n d e datos”. La
exp loración d e datos es un trabajo ted ioso, y lo s investigadores están naturalm ente a n sio so s d e encontrar lo antes posi
b le la form a en la que fu nciona el estudio. S in em bargo, io s investigadores experim entados han aprendido que vale la
pena p osponer la prueba d e h ip ótesis para realizar ün bu en anáfisis exploratorio d e datos. E s m u y frustrante realizar
tod o tipo d e análisis y lu eg o descubrir qu e e l trabajo ha sid o un a pérdida d e tiem p o porque hab ía u n error en el ingreso
d e la in form ación o porque una d e las variables n ecesitab a ser transform ada. (D e h ech o , es peor q u e una pérdida de
tiem p o. E l investigador pu ed e entu siasm arse o desanim arse m u ch o co n su s supuestos resultados y lu e g o descubrir que
las c o n clu sio n es no tenían s en tid o y q u e d eb e co m en za r to d o e l p roceso nu evam ente).
F ig u r a 1 5 -3 .
Distribución asimétrica de tiempos de
reacción (datos ficticios).
F ig u r a 1 5 -4 .
Datos de la figura 15-3 después de ia
transformación raíz cuadrada.
dos grupos con respecto a la raíz cuadrada de sus ingresos, sino que lo importante es la diferen
cia en dólares reales.
Por otro lado, analicemos el cuestionario sobre autoestima. Las puntuaciones del cuestionan
rio no tienen ningún significado directo. Las puntuaciones más altas indican mayor autoestima; .
las puntuaciones más bajas, menor autoestima. Sin embargo, cada unidad de aumento en la prue
ba no necesariamente está relacionada con una cantidad igual de aumento en la autoestima de un .
individuo. Es verosímil que la raíz cuadrada de cada incremento de una unidad esté directamente:
relacionada con la autoestima de una persona. De modo similar, si analizamos el ejemplo utiliza
do anteriormente acerca del tiempo de reacción, medido en segundos, la medición parecería tener
un significado directo. Sin embargo, incluso en ese caso, la variable implícita, eficiencia del pro
cesamiento del sistema nervioso, puede no estar directamente relacionada con la cantidad de se
gundos. Probablemente es una operación compleja que sigue alguna regla matemática desconocida
(aunque siempre esperaríamos que los tiempos más cortos indicaran un procesamiento más efi
ciente, y tiempos más largos un procesamiento menos eficiente).
En los ejemplos anteriores, el “patrón” implícito de la variable es desconocido. Por lo tanto,'
no existe razón para pensar que la versión transformada sea un reflejo menos preciso de la reali
dad que la versión original. Y la versión transformada puede cumplir el supuesto de normalidad.
Figura 15-5.
Distribuciones a las que se les apli
can las transformaciones apropia
das: (a) moderadamente asimétrica
hacia la derecha, se aplica a la trans
formación raíz cuadrada; (b) marca
damente asimétrica hacia la derecha,
se aplica a la transformación iog, y
(c) extremadamente asimétrica hacia
la derecha, se aplica a la transforma
ción inversa.
¿Qué sucede si ia distribución es asimétrica hacia ei otro lado (hacia la izquierda)? En este ca
so, primero podemos reflejar todos los valores, es decir, restarlos a un número alto de modo que
todos se reviertan. Después de reflejar los valores, una distribución que era asimétrica hacia la iz
quierda se transforma en asimétrica hacia 1a derecha, y una transformación raíz cuadrada produ
cirá el efecto correcto. Sin embargo, cuando reflejamos los valores, al analizarlos resultados fina
les debemos recordar que hemos revertido la dirección de los valores. Lo que se solía considerar
un valor alto ahora es un valor bajo, y viceversa.
Otra transformación muy común es la transformación log. Una transformación log tiene él
mismo efecto general que la transformación raíz cuadrada. Hace que una distribución asimétrica
hacia ia derecha sea menos asimétrica hacia ia derecha. Pero ia transformación log es más severa.
Puede convertir en normal a una distribución incluso más extremadamente asimétrica. La figura
15-5b representa gráficamente la situación descripta.
El alumno seguramente recordará, de las clases de matemáticas de la escuela secundaria, que
un logaritmo es el exponente al que se debe elevar un número base (como por ejemplo 10) para
obtener el número original. Por ejemplo, el logaritmo d 100 de base 10 es 2; para obtener el nú
mero 100 debemos elevar 10 a la segunda potencia (lo elevamos al cuadrado). En otras palabras,
2 es el valor correspondiente a 100 después de una transformación log (utilizando logaritmos con
base 10). El logaritmo de 1.000 sería 3; 10 a la tercera potencia (al cubo) es 1.000; 3 es el valor
correspondiente a 1.000 después de una transformación log. El logaritmo de 10 es 1 (cualquier
número a la primera potencia es el mismo número) y el logaritmo de 1 es 0 (cualquier número ele
vado a 0 es I), El valor 10 se transforma en 1 y el valor 1 se transforma en 0. Los números inter
medios tienen logaritmos con cifras decimales. El logaritmo de 50 es 1,70; de 60 es 1,78; de 8 es
0,90, y de 328 es 2,52. Un rango de 1 a 1.000 se ha reducido a un rango de 0 a 3, siendo el efecto
mucho mayor cuanto más altos son los números.
No es necesario calcular logaritmos, el cálculo se realiza con cualquier calculadora. Uno de los
aspectos más importantes que debemos recordar es que una transformación log produce exacta
mente el mismo efecto que una transformación raíz cuadrada, sólo que en mayor grado. Se aplica
ría cuando la distribución de los datos fuera tan asimétrica hacia la derecha que una transformación
a ia raíz cuadrada tampoco puede convertir' la distribución en una distribución aproximadamente
normal.
Otro tipo común de transformación es la transformación inversa. En este caso, se toma el
número inverso al valor, es decir, se lo convierte en el denominador de una fracción en la que el
numerador es 1. El inverso de 10 es 1/10 (0,1); el inverso de 5 es 1/5 (0,2); el inverso de 1.000 es
1/1.000 (0,001). Lo importante es que una transformación inversa también produce el mismo
efecto que las transformaciones raíz cuadrada y log, pero es aún más extrema que la transforma
ción log. La transformación inversa es útil para datos demasiado asimétricos, incluso para ser
convertidos en normales poruña transformación log. La figura 15-5c representa gráficamente es
ta situación.
Además, la transformación inversa automáticamente revierte la dirección de los registros. Por
ejemplo, en términos de valores originales, 5 es menor que 10. Después de una transformación in
versa, el orden se revierte. La versión invertida de 5 es 1/5 (0,2), que es un número mayor a la ver
sión invertida de 10, que es 1/10 (ó 0,1). Para mantener los datos en orden, los investigadores al
gunas veces reflejan los valores antes o después de una transformación inversa. Como una doble
negación, el proceso reubica los datos en su dirección original.
Existen otras transformaciones. Por un lado, todas las transformaciones que hemos analizado
hasta ahora corrigen una distribución asimétrica. Otras transformaciones tratan problemas de cur-
tosis y de distribuciones “abultadas”. Las distribuciones basadas en proporciones o porcentajes a
menudo están lejos de ser normales, pero pueden corregirse con lo que se denomina una distribu
ción arco-seno. Se trata de una función trigonométrica disponible en algunas calculadoras y en iá
mayoría de los programas de estadística para computadoras. Otras transformaciones que pode-;-:
mos encontrar son las transformaciones “ logit” y “probíf\ al igual que transformaciones a distin-,
tas potencias, tales como transformaciones cuadradas o cúbicas.
No daremos ejemplos de todos estos otros tipos de transformaciones. Aprender las transfor
maciones cuadrada, log e inversa ayudará a captar el principio básico y, además, son las trans-'
formaciones más comunes. Lo principal acerca de los otros tipos de transformaciones es que to
das utilizan el mismo principio en cuanto a tomar cada valor y aplicarle algún cálculo aritmético,
usualmente para que la serie de valores sea más parecida a una distribución normal. Una vez
más, cualquiera sea la transformación utilizada, un valor que se encuentra entre otros dos valo
res siempre permanece entre esos, mismos dos valores.
Tabla 15-1.
Resultados de un estudio que compara niños altam ente y no altam ente sensibles con relación a ía
cantidad de libros leídos durante el año anterior (datos ficticios).
Altamente sensible
No Si
0 17
3 36
10 45
22 75
35 173
8 ,7 5 4 3 ,2 5
9 5 ,5 8 5 8 4 ,0 0
También podemos observar que las varianzas poblacionales estimadas sobre la base de las
dos muestras son significativamente diferentes, 95,58 contra 584, otra razón pará no querer pro
seguir con una prueba t ordinaria.
Sin embargo, supongamos que realizamos una transformación raíz cuadrada de las observa
ciones (tabla 15-2). El resultado es que ambas muestras son mucho más adaptables a una curva
normal, y la transformación también parece razonable en cuanto al significado de los números.
La cantidad de libros leídos pretende ser una medida del interés literario; por lo tanto, la diferen
cia entre 0 y 1 libro es una diferencia mucho mayor que la que existe entre 20 y 21 libros.
La tabla 15-3 muestra la prueba í utilizando los valores transformados. Como lo indica la ta
bla, la diferencia entre los grupos es significativa.3
Tabla 15-2,
Transformación raíz cuadrada de los registros de la tabla 15-1.
3 Si hubiéramos realizado el análisis utilizando los valores originales sin transformar, r sena igual a (43,25'- 8,75)/13,04
ó 2,65, un t levemente menor pero aún significativo. Por supuesto, no hubiera sido correcto realizar e l análisis de ese
modo. Si el análisis realizado con valores no transformados hubiera producido un resultado diferente, el resultado co
rrecto hubiera sido el logrado sobre la base de los valores transformados.
Tabla 15-3.
Cálculos de una prueba t para medias independientes aplicando la transformación raíz cuadrada a
los valores observados del estudio acerca de los libros leídos por niños altamente sensibles contra los
no altamente sensibles (datos ficticios).
Punto de corte f para nivel 0,05 de significación, g l = (4 - 1) + (4 - 1) = 6, una cola = -1 ,9 4 3 .
Altamente sensible
No
0,0 0 4,12
1,73 6,00
3,1 6 6,71
4,69 8,66
2: 9,58 2 5 ,4 9
M= 9 ,5 8 /4 = 2 ,4 0 2 5 ,4 9 /4 = 6,37
S> = 12,03/3 = 4,01 1 0,56/3 = 3,52
combinado"
3 ,7 7 /4 = 0,94 3 ,7 7 /4 = 0 ,9 4
¿Qué debemos hacer entonces con la distribución de la prueba de álgebra? Primero, en casos co
mo este, en los que hay un sólo y claro caso atípico, probablemente deberíamos controlar que ño
existan errores de calificación o intentar averiguar si ese individuo en particular era de algún mo
do atípico con respecto a la población bajo estudio (como por ejemplo, alguien que estuviera en
un programa acelerado de aprendizaje de matemática o cuya madre fuera una matemática famo
sa). Sin embargo, suponiendo que nada se sabe, ni se puede averiguar, la otra solución es transfor
mar las puntuaciones de la prueba para que no sean asimétricas. Además, la segunda alternativa
también resulta razonable en este caso, ya que no tiene ningún valor especial conocer la cantidad
original de los ítems correctamente respondidos en la prueba.
Los valores son asimétricos hacia la derecha, así que probablemente necesitemos utilizar una
transformación raíz cuadrada, log o inversa. Podemos comenzar intentando una transformación
raíz cuadrada. A través de la transformación mencionada, las puntuaciones de la prueba de álge
bra se transforman de 1,4,10 y 95 a 1,2,3,2 y 9,7. La situación ha mejorado pero continúa sien
do bastante asimétrica hacia la derecha. Se necesita una transformación más extrema. Podríamos
intentar una transformación log. Utilizando una calculadora (con tecla para logaritmo con base
10), calculamos los logaritmos para 1,4,10 y 95. Los resultados fueron 0,0,6,1 y 1,98. Esta vez
la distribución resultante es sólo levemente asimétrica hacía la derecha, y parece ser una probable
candidata a la muestra seleccionada de una población (de valores transformados a logaritmos), en
la que la mayoría de los valores se agrupan én el medio y hay una cantidad menor, pero pareja, de
valores en los dos extremos.
Habiendo encontrado una transformación adecuada, ahora podemos intentar nuevamente nues
tra correlación. La figura 15-7 muestra el diagrama de dispersión, y la tabla 15-5 muestra los cálcu-
F igura 15-6.
D iagram a de d isp ersión d e un e stu d io acerca
d e la nota d e n iv e l e sc o la r y la pu n tu ación en
una prueba de álgebra, (D a to s fic tic io s ).
Tabla 15-4.
Registros y cálculos de un estudio que correlaciona las notas de nivel escolar y las puntuaciones en
una prueba de álgebra (datos ficticios).
P u n tu a ció n e n la p ru eb a N o ta d e n iv el esc o la r P r o d u cto cru za d o
O r ig in a l O r ig in a l zr
1 - 0 ,6 8 4 -1 0 ,4 7 1,00
4 -0 ,6 0 6 -0 ,2 9 0,17
10 - 0 ,4 5 9 1,47 -0 ,6 6
95 10,73 7 0 ,2 9 0 ,5 0
no 26 1,01
27,5 6,5 r = 0,25
39,1 1.7
ios. La correlación calculada con ios valores transformados a logaritmos es de 0,65. La correlación
calculada utilizando valores no transformados, como lo muestra la tabla 15-4, es de sólo 0,25.
La tabla 15-5 también indica los cálculos de la significación del coeficiente de correlación (el
procedimiento está tomado del apéndice n del capítulo 3). Incluso con una correlación tan alta,
como de 0,65, con sólo cuatro participantes existe insuficiente potencia para rechazar la hipótesis
nula. (Cuando se trabaja con una correlación, la hipótesis nula establece que la correlación en la
población es 0). Sin embargo, al menos fue correcto calcular esta prueba t, en el sentido de que
habíamos cumplido el supuesto de distribuciones normales. (Supongamos que hubiéramos calcu
lado incorrectamente t para la correlación de 0,25 a partir de los valores sin transformar. El t hu
biera sido de sólo 0,37, contra 1,21 con los valores transformados).
Tabla 15-5.
Observaciones y cálculos de un estudio que correlaciona la nota de nivel escolar y las puntuaciones
en una prueba de álgebra transformadas a logaritmos (datos ficticios).
Puntuación en la prueba . Nota de nivel escolar Producto cruzado
O r ig in a l Zx O rig in a l zY
0 ,0 0 -1 ,2 5 4 -1 ,4 7 1,84
0 ,6 0 - 0 ,4 2 6 -0 ,2 9 0,12
1,00 0 ,1 4 9 1,47 0,21
1,98 1,50 7 0,29 0 ,4 4
3,5 8 26 2,61
0,9 0 6,5 r = 0,65
0 ,7 2 1.7
Prueba de significación:
res a 1,2,3 y 4; el 1 para el número más bajo del grupo, el 2 para el siguiente más bajo, y así su
cesivamente.
La única complicación de la transformación de rango y orden surge cuando existen dos o más
valores iguales. La solución usual.para Ios-casos en los que existen valores iguales es darle a cada
uno el promedio de los rangos correspondientes. Por ejemplo, a los valores 12, 81, 81,107 y 154
les corresponderían los rangos 1,2,5,2,5,4 y 5,
Convertir los valores en rangos es una especie de transformación de datos, pero a diferencia
de las transformaciones que hemos analizado hasta ahora, una transformación de rango y orden
no se utiliza para producir una distribución normal, aunque, en efecto, produce una distribución
particular. La distribución que se obtiene a partir de una transformación de rango y orden es rec
tangular, con la misma cantidad de valores (uno) para cada valor (la única excepción son los valo
res iguales). Los rangos producen el efecto de dispersar los valores en forma pareja.
Existen diversos procedimientos especiales de prueba de hipótesis que utilizan datos trans
formados en rangos. Se los denomina pruebas de rango y orden. También tienen otros dos nom
bres comunes: dado que los datos de una población con cualquier tipo de distribución pueden
transformarse en rangos, estas pruebas a veces se denominan pruebas libres de distribución; y
dado que la distribución de valores convertidos en rangos no es estimada sinó que se conoce con
exactitud, las pruebas de rango y orden no requieren la estimación de ningún parámetro (valores
de la población). (Por ejemplo, no hace falta estimar ia varianza de una población porque pode
mos determinarla exactamente si sabemos cuántos valores la forman y que esos valores han sido
transformados en rangos). Por eso, los procedimientos de prueba de hipótesis basados en rangos
también se denominan pruebas no paramétricas.
Los procedimientos ordinarios de prueba de hipótesis que hemos aprendido (prueba t y análi
sis de varianza) son ejemplos de pruebas paramétricas. El chi-cuadrado, al igual que las pruebas
de rango y orden, se considera una prueba no paramétrica; sin embargo, es libre de distribución só
lo en el sentido de que no existen supuestos sobre la forma de las distribuciones poblacionales. No
obstante, los términos Ubre de distribución y no paramétrico generalmente se utilizan en forma
indistinta; las sutilezas con respecto a la diferencia entre esos términos son materia de debate entre
los estadísticos.
Las pruebas de rango y orden tienen la ventaja adicional de poder utilizarse cuando los valores
reales del estudio son rangos; por ejemplo, un estudio que compara el nivel social de dos clases de
graduados. Además, algunas veces son cuestionables los valores numéricos exactos de los números
de una medida utilizada en determinado estudio. Por ejemplo, un investigador tiene la intención de
aplicar una medida numérica en el sentido usual, siendo 7 tan superior a 5 como 12 lo es de 10 (el in
vestigador pretende que ésta sea una “medición intervalar”; véase capítulo 1). Sin embargo, en reali
dad sólo está seguro de que los números están ordenados correctamente: 7 es mayor que 5,10 es ma
yor que 7, y así sucesivamente. En ese caso, el investigador podría utilizar una medición de rango y
orden para no sobrestimar la calidad del instrumento o procedimiento de medición.
En realidad, el tema es algo controvertido. Analicemos, por ejemplo, una escala en la que
1 = en desacuerdo; 2 = medianamente en desacuerdo; 3 = medianamente de acuerdo, y 4 = de
acuerdo. Los significados implícitos en los números, ¿están dispersos en forma pareja en la esca
la numérica? Queda claro que los resultados tienen sentido como datos de rango y orden -cierta
mente, 2 muestra más aprobación que 1, 3 más que 2 y 4 más que 3. Por eso, algunos psicólogos
sostienen que, en la mayoría de los casos, no deberíamos suponer que tenemos mediciones inter
valares, y deberíamos convertir nuestros datos en rangos y utilizar una prueba de significación de
rango y orden. Otros investigadores sostienen que las pruebas estadísticas paramétricas resultan
razonablemente precisas incluso con mediciones de rango y orden reales, y que al cambiar todos
los datos a rangos se puede perder información valiosa. La cuestión sigue sin resolverse.
4 E xiste una prueba no pararaétrica ampliamente utilizada, además de las pruebas chi-cuadrado, que no se basa en
registros de rango y orden. S e ia denom ina p ru eb a de sig n os. Una prueba de signos se utiliza en lugar de una prue
ba r para medias dependientes. Se crea la serie de valores diferenciales y luego se suman sólo los números positivos.
publicaciones científicas, y porque su lógica es la base de un procedimiento alternativo que sí en
señaremos a utilizar. Ese procedimiento alternativo tiene casi la misma función que las pruebas
de rango y orden, y es más parecido a las técnicas ya aprendidas.
Tabla 15-6.
Principales pruebas de rango y orden equivalentes a las principales pruebas paramétricas.
P r u e b a s p a r a m é tr ic a s o r d in a r ia s P r u e b a s d e r a n g o y or d e n e q u iv a len te s
Si no existe diferencia promedio, aproximadamente la mitad de ios valores diferenciales debería ser positiva y la mi
tad negativa. Si la cantidad de positivos es considerablemente mayor o considerablemente menor a la mitad, eí resul
tado estaría en contra de una hipótesis nula que establece que la verdadera población de valores diferenciales tiene
una diferencia promedio igual a cero. Los textos estadísticos de nivel intermedio usualmente incluyen una tabla don
de buscar los puntos de corte de significación de una prueba de signos.
Como se desprende de la tabla, en primer lugar determinamos el punto de corte de significa
ción, como haríamos en cualquier procedimiento de prueba de hipótesis-(el punto de corte se basa
en una tabla que no hemos proporcionado pero que se puede encontrar en la mayoría de los textos
de estadística de nivel intermedio). El siguiente paso fue ordenar los rangos de ipenor a mayor; des
pués, sumar el grupo que se espera que tenga el total más bajo. Luego, el total se compara con el pun
to de corte. En el ejemplo que analizamos, el total de los rangos del menor no fue mayor que el
punto de corte; por lo tanto, se rechaza la hipótesis nula.
Utilizamos la prueba de suma de rangos de Wílcoxon, aunque podríamos haber utilizado la
prueba U de Mann-Whitney, que da un resultado final matemáticamente equivalente y se basa en
la misma lógica. Sólo difiere en los detalles de cálculo.
Tabla 15-7.
Cálculos de una prueba de suma de rangos de Wücoxon basados en el estudio acerca de los libros
leídos por niños altamente sensibles en comparación con los leídos por niños no altamente sensibles
(datos ficticios).
Punto de corte: sum a m áxim a de rangos en e l grupo no altam ente sen sib le para un nivel 0 ,0 5 de significación,
una cola (de una tabla estándar) = 1 1 .
A lt a m e n t e s e n s ib le
No Si
X R ango X Rango
0 1 17 4
3 2 36 6
10 3 45 7
22 — 5 75 8
2: 11
C om paración con e l punto de corte: la sum a de rangos del grupo que s e predijo tendría lo s registros m ás bajos;
11, iguala pero no e x ced e al punto d e corte de significación.
C onclasión: se rechaza la hip ótesis aula.
desiguales. Y el problema se torna realmente inmanejable con diseños más complicados. Por eso /
se han desarrollado varias aproximaciones que utilizan las sumas de rangos en una fórmula q u é :
produce una puntuación Z, Si la puntuación Z se encuentra en la región superior sobre la cual es-:\¿
tá el 5% del área, bajo la curva normal (2,5% para una prueba de dos colas), el resultado se cón- -"
sidera significativo. Con frecuencia, cuando las publicaciones científicas informan las pruebas de
rango y orden indican la puntuación Z que mencionamos.
5 Un investigador particularmente preocupado por la precisión podría calcular í ó F utilizando los valores transforma
dos a rangos, y después convertir el resultado en el resultado exacto de una prueba de rango y orden, utilizando una fór
mula de conversión establecida por Conover e Imán (1981), Luego buscaría ese número en la tabla apropiada de prue
bas de rango y orden.
Tabla 15-8.
Cálcalos de ana prueba t para medias independientes utilizando rangos en lugar de los valores
originales del estudio acerca de libros leídos por niños altamente sensibles en comparación con los
leídos por niños no altamente sensibles (datos ficticios).
Punto de corte t para el nivel 0,05 de significación, gl = (4 - 1) + (4 - 1) = 6, una cola = -1,943
Altamente sensible
No Si
l 4
2 6
3 7
_£
2 11 25
M= 11/4 = 2,75 25/4 = 6,25
S’ = 8,75/3=2,92 8,75/3=2,92
Combinada ~
C2 —
oM~ 2,92/4 = 0,73 2,92/4 = 0,73
= °.73 + 0,73 = 1,46
= U1
í = (2 ,7 5 ~ 6 , 2 5 ) / l , 2 I = - 2 ,8 9
R esultados reales:
Altamente sensibles
Na Sí
0 17
3 36
10 45
22 75
35 173
8,75 43,25
Todas las divisiones posibles (70) de las ocho observaciones en dos grupos de cuatro cada uno:
Real
No V Si No Si No Si No Si No Si No 5/ No Si
.7.177 0 22 0 22 0 22 0 22 0 10 0 10
; 36 3 36 3 17 3 17 3 17 3 36 3 17
10 10 45 10 45 10 36 10 36 22 45 22 45
22 V-iZS.;: n 75 36 11 45 11 25 M 17 25 3 5 25
^SÍ-^No ■;K- 34,5 . 37 2 7 ,5 23 8 31 21,5
No Si No Si No Si No Si No Si No Si No Si
0 10 0 10 0 10 0 10 0 10 0 10 0 10
3 17 3 17 3 22 3 22 . 3 22 3 22 3 22
22 36 22 36 17 45 17 36 17 36 36 17 36 17
45 75 75 45 36 75 45 75 75 45 45 75 75 45
No 17 l 24 19,5 4 ,5.... 10 5
No Si No Si No Si No Si No Si No Si No Si
0 10 0 3 0 3 0 3 0 3 0 3 0 3
3 22 10 36 10 17 10 17 10 17 10 22 10 22
45 17 22 45 22 45 22 36 22 36 17 45 17 36
75 36 12 75 36 75 45 75 75 45 36 75 45 75
~ 9 ,5 2 7 ,5 18 13 ,5 „1 ,5 20,5 16
No Si No Sí No Si No Si No Si No Si No Si
0 3 0 3 0 3 0 3 0 3 0 3 0 3
10 22 10 22 10 22 10 22 22 10 22 10 22 10
17 36 36 17 36 17 45 17 17 45 17 36 17 36
75 45 45 75 75 45 7 5 . 36 36 75 45 75 75 45
1 6 ,5 - 3,5 -1 3 " ' 14,5 10
*Sl -5
No Si No Si No Si No Si No Si No Si No Si
0 3 0 3 0 3 0 3 0 3 0 3 0 3
22 10 22 10 22 10 17 10 17 10 17 10 36 10
36 17 36 17 45 17 36 22 36 22 45 22 45 22
45 75 75 45 75 36 4 5 . 75 75 45 75 36 75 17
0,5 - 1 4 ,5 . - 19 C 12"""'
^St“ ^No -1 6 ,5 -2 6 :
No Si No Si No Si No Si No Si No Si No Si
17 0 22 0 22 0 22 0 22 0 10 0 10 0
3 3 36 3 17 3 17 3 17 3 36 3 17 3:
10 10 45 10 45 10 36 10 36 10 45 22 45 22
22 22 Z5 17 75 36 75 45 áá 75 75 17 75 36
Ms r MN -34,5 -37 -2 7 ,5 23 -8 •31 -2 1 ,5 •
No Si No Si No Si No Si No Si No Si No Si
10 0 10 0 10 0 10 0 10 0 10 0 10 0
17 3 17 3 22 3 22 3 22 3 22 3 22 3
36 22' 36 22 45 17 36 17 36 17 17 36 17 36
75 45 45 75 75 36 75 45 45 75 75 45 45 75
Msi -1 7 -2 -24 -1 9 ,5 - 4 ,5 ■10 5
No Si No Si No Si No Si No Sí No Si No Si
10 0 3 0 3 0 3 0 3 0 3 0 3 0
22 3 36 10 17 10 17 10 17 10 22 10 22 10
17 45 45 22 45 22 36 22 36 22 45 17 36 17
36 75 75 17 75 36 . 75 45 45 75 75 36 75 45
M s¡ - M No 9 ,5 - 2 7 ,5 -18 -1 3 ,5 1,5 - 2 0 ,5 •16
No Si No Si No Si No Si No Si No Si No Si
3 0 3 0 3 0 3 0 3 0 3 0 3 0
22 10 22 10 22 10 22 10 10 2 2 10 22 10 22
36 17 17 36 17 36 17 45 45 17 36 17 36 17
45 75 75 45 45 75 36 75 75 36 75 45 45 75
-1 “ ” ■ 6 ,r 8,5““ 13 - 1 4 ,5 -10 5 ’
No Sí No Si No Si No Si No Si No Si No Si
3 0 3 0 3 0 3 0 3 0 3 0 3 0
10 22 10 22 10 22 10 17 10 17 10 17 10 36
17 36 17 36 17 45 22 36 22 36 22 45 22 45
75 45 45 75 36 75 75 45 45 75 36 75 17 75
M S¡ ~ ^N o -0 ,5 14,5 19 -3 12 16,5 26
Conclusión: ía diferencia media real se ubica entre las tres superiores. Se rechaza la hipótesis nula.
6, Comparar el punto de corte con el lugar en donde se ubica la diferencia real dentro de la lis
ta ordenada, para determinar si se rechaza o no la hipótesis nula. En el ejemplo que analizamos, la
diferencia real de +34,5 es la segunda superior, ubicándose en un lugar entre las tres superiores,
tal como se requería. Podemos rechazar la hipótesis nula.
Correlaciones de todas las posibles combinaciones en«e las opa (Observaciones de pruebas de álgebra) y
os NE (Niveles escolares).
Real
OPA .NE OPA NE OPA NE OPA NE OPA NE
1 ■ 4 1 6 1 9 1 7 1 9
4 9 4 7 4 4 4 6
10 7 10 4 10 6 10 7
95-•' 7 95 4 95 6 25____ 2 25. 4
-, r = 0,25. r - -0,79 r = -0,24 r = 0,79 r ~ -0,82
r=
OPA NE OPA NE OPA NE OPA NE OPA NE
1 6 1 6 1 9 1 9 1 7
4 9 4 7 4 4 4 7 4 9
10 4 10 4 10 7 10 6 10 6
95 7 95 ___2 21. 6 95 4 21 4
O
-0,84, -0,84, -0,82, -0,79, -0,76,-0,24, -0,22, -0,18, -0,11, -0,08, 0,11, 0,11, 0,12,0,18, 0,22,E p ] 0,52,
0,75,0,76,0,79, 0,82, 0,82,0,82,0,84
COMPARACIÓN DE MÉTODOS
Hemos analizado tres métodos para realizar pruebas de hipótesis cuando las muestras parecen
provenir de poblaciones no normales: transformación de datos, pruebas de rango y orden y méto
dos intensivos por computadora, tales como las pruebas de aleatorización. ¿Cómo decide un in
vestigador el método a utilizar?
Las transformaciones de datos tienen la ventaja de permitir aplicar las técnicas paramétricás
familiares a los valores transformados. Pero las transformaciones no siempre funcionan. Es decir,
puede no existir ninguna transformación razonable que produzca valores normales en todos los
grupos. Además, las transformaciones pueden distorsionar las observaciones de modo que se
pierda el significado original.
Los métodos de rango y orden pueden aplicarse independientemente de las distribuciones.
Son especialmente adecuados cuando las observaciones originales son rangos, y también son úti
les cuando las observaciones no siguen claramente un patrón numérico simple (medición interva
lar), situación que algunos psicólogos consideran bastante común. Más aún, la lógica de los mé
todos de rango y orden es simple y directa, y no requiere construcciones elaboradas de distribu
ciones hipotéticas o parámetros estimados.
Sin embargo, los métodos de rango y orden no son tan familiares para aquellos que leen pu
blicaciones científicas, y tampoco han sido desarrollados para muchas situaciones complejas.
Otro problema es que la lógica simple de las pruebas de rango y orden se pierde si existen mu
chos rangos iguales. Finalmente, al igual que los métodos de transformación de datos, los méto
dos de rango y orden distorsionan los datos originales, perdiéndose información. Por ejemplo,
en la misma muestra, una diferencia entre 6,1 y 6,2 podría ser un rango, pero la diferencia entre
3,4 y 5,8 también podría ser un rango.6
Los métodos intensivos por computadoras, tales como las pruebas de aleatorización aproxi
mada, no requieren ninguno de los dos supuestos principales de las pruebas paramétricas ordina
rias. Más aún, al igual que las pruebas de rango y orden, tienen una lógica directa propia que es
muy atractiva, evitando todo el proceso de construcción de distribuciones estimadas de pobla
ción, distribuciones de medias, etc. Los métodos intensivos por computadora son también extre
madamente flexibles. Se los puede utilizar en casi cualquier situación imaginable en la que pudie
ra aplicarse una prueba de hipótesis. Por lo tanto, frecuentemente pueden utilizarse cuando no
existen otros tipos de pruebas disponibles, paramétricas o de cualquier otro tipo.
La principal desventaja de los métodos intensivos por computadora es que son bastante nue
vos; por lo tanto, los detalles y ventajas relativas de varios de los métodos no han sido bien apro
vechados. Más aún, por ser nuevos, en la mayoría de los casos los paquetes estadísticos estándar
para computadoras no los incluyen. Los métodos intensivos por computadora recién están em
pezando a aparecer en las publicaciones científicas, pero es probable que su aplicación aumente
con rapidez.
6 Otra ventaja tradicional de las pruebas de rango y orden ha sido su facilidad de cálculo, Excepto por el trabajo de con
vertir las observaciones en rangos, los cálculos reales de la mayoría de estos procedimientos son muy sim ples, compa
rados con los de las pruebas paramétrícas. Actualmente, con la utilización de las computadoras, es igualmente fácil cal
cular cualquier tipo de procedimiento. Con algunos paquetes estadísticos estándar para computadoras, es realmente
mucho menos problemático calcular las pruebas paramétricas. Además, a veces ia prueba de rango y orden apropiada
puede no estar disponible.
Cuadro 15^r. -
¿D e d ó n d e provienen los núm eros aleatorios?
Para ser aleatorios, los números deben ser Más tarde, se hicieron comunes solu- A;
obtenidos teniendo todos la misms proba ciones físicas más sofisticadas. Una de éllas '7
bilidad de ser seleccionados. Es decir, la consistía en hacer brillar un rayo dé luz
posibilidad de que surja cuálquier número a intervalos regulares sobre un disco gira- A;
debe ser totalmente independiente de las torio dividido en secciones. Otro método
posibilidades del número que surja con an utilizaba la radiación de sustancias rádioacA:(I
terioridad o posterioridad a él. Una de las üvas: registraba la cantidad de partículas'í:
muchas aplicaciones importantes de los nú detectadas durante cierto periodo; si la cantil
meros aleatorios son los métodos estadísti dad era impar, establecía el contador én 1;:?:^
cos intensivos por computadora, tal como si era par, en; 0, y luego generaba listas de. Lj
lo hemos visto en este capítulo. También números a. partir de agrupaciones de esos 7?;
son fundamentales para los estudios Mon- dígitos binarios. Un tercer sistema emplea-- i;
tecarlo (véase cuadro 10-1), estudios que ba una válvula electrónica que emitía un .
se utilizan para probar el efecto del incum sonido que podía ser amplÍficado;los vaio-A-.
plimiento de la normalidad y otros supues res fluctuantes de la potencia de salida eran. \i
valores aleatorios.
tos de las pruebas estadísticas paramétricas,
Todos estos métodos físicos eran una A
y que constituyen uno de los medios con
incomodidad: era necesario guardar los nú- . ;
los que cuentan los psicólogos para saber
meros si iban a ser reproducidos o utiliza- A
si necesitan utilizar los métodos descriptos
dos nuevamente, y todos los aparatos uüli-, .i
en este capítulo. Sin embargo,'los números
zados eran difíciles de mantener. Por eso, •
aleatorios son, en sí mismos, un tema inte
en la actualidad, con frecuencia se utilizan A
resante. computadoras para crear “números seudo- A
La primera tabla de números aleatorios aleatorios”, utilizando alguna ecuación es- : ¡
se creó en 1927. Con anterioridad a esa fe pedal, como elevar grandes números al v
cha, se utilizaban métodos mecánicos tales cuadrado y tomar un grupo central de los
como dispositivos para mezclar. El alumno dígitos resultantes. Pero estos números, en ; ¡
seguramente recordará a William S. (“Óf«~ un sentido muy sutil, no son aleatorios sino ^
denf) Gosset (cuadro 9-1). Para obtener sus predecibles por el propio hecho de que ha- :
números aleatorios, Gosset mezcló y extra bía una intención en el diseño de la ecua- ■■
jo números de un mazo de 3.000 cartas. ción: crear azar (vaya paradoja). También
Luego, en 1927, Karl Pearson incentivó existe el inconveniente de que las ecuacio
a L. H, C. Típpett para que publicara cierta nes puedan “degenerarse” y comenzar a re- ;
tabla. Típpett consideraba que extraer cartas petir secuencias. Finalmente, no importa
numeradas de una bolsa era “insatisfacto cómo se genere la lista. Existe controversia :'
rio”; por eso seleccionó dígitos del censo acerca de las consecuencias de la utiliza
de 1925. Más tarde, en 1938, R. A, Fisher y ción reiterada de la misma tabla.
Fraak Yates publicaron una lista basada^ en El tema de la dificultad de crear algo
logaritmos. Casi al mismo tiempo, también libre de orden o inteligencia parece estar
fue presentada una cantidad de métodos de indicando algo. Dejaremos que el alumno :
control de aleatoríedad. lo decída.
rían según el tipo de distribución de que se trate. Incluso, para determinado tipo de distribución,
una técnica podría resultar mejor cuando los grupos tienen las mismas cantidades y otra cuando
las cantidades en cada grupo son distintas; o bien, un método podría ser mejor con un gran tama
ño de muestra y otro con una muestra pequeña. Más aún, al comparar grupos, las distribuciones
de los grupos pueden incluir diferentes tipos de distribuciones no normales.
Aunque se han realizado muchos estudios comparando los distintos métodos (véase cuadro
10-1 acerca de los estudios Montecarlo), aún sabemos muy poco sobre la efectividad relativa de
estos métodos en la mayoría de los casos. Aún peor, en muchas situaciones, un investigador pue
de tener la noción de que una muestra no proviene de una población normal, pero no de qué tipo
particular de población no normal se trata. Por lo tanto, incluso los estudios que se han realizado
comparando los distintos procedimientos con determinadas formas de población no normal, pue
den no ser demasiado útiles al momento de enfrentar los resultados de un estudio real.
Es posible que algún día se realice la suficiente investigación que abarque las suficientes can
tidades de situaciones como para que surjan patrones que nos den pautas prácticas adecuadas. Por
el momento, según nuestra opinión, los investigadores deben confiar en otros criterios (como los
presentados en este capítulo) para seleccionar entre las distintas alternativas, cuando los supues
tos no se han cumplido. Sin embargo, desde el punto de vista de la lectura de investigaciones (un
tema que trataremos a continuación), lo que necesitamos es poder comprender la lógica del pro
cedimiento en particular que ha elegido el investigador. Decidir si fue elegido correctamente, tal
vez sea una tarea que exceda los conocimientos del alumno en esta instancia, razón por la que
puede relajarse hasta los próximos cursos y futuros avances en el área.
CONTROVERSIAS
Todos los temas tratados en este capítulo son controvertidos, especialmente, la conveniencia de
las transformaciones de datos, los riesgos de utilizar procedimientos paramétricos cuando se
desconocen las distribuciones poblacionales, hasta qué punto es apropiado tratar a las medidas
típicas en psicología como si produjeran mediciones de intervalares y las ventajas y desventa
jas de los métodos intensivos por computadora. (Judd et al. 1995 nos ofrecen una revisión re
ciente de las controversias).
Ejercicios
Los ejercicios implican la realización de cálcu 2. ¿Cuáles de las siguientes distribuciones
los (con la ayuda de una calculadora). La ma muéstrales sugieren que la distribución pobla-
yoría de los problemas estadísticos reales se cional probablemente no es normal? Explique
resuelven por computadora, pero aunque exis por qué.
ta la posibilidad de utilizarla, es conveniente a) 41,52,74,107,617
realizar estos ejercicios manualmente para in b) 221,228,241,503,511,521
corporar el método de trabajo. c) 0,2,0,3,0,5,0,6,0,7,0,9,0,11
Para adquirir práctica en la utilización de d) -6, -5 ,-3 ,1 0
una computadora, para resolver problemas esta e) 11,20, 32,41,49,62
dísticos, se puede utilizar la sección de compu 3. Un Investigador compara el tamaño tí
tación de cada capítulo, publicada en la Guía de pico de familia en 10 culturas, 5 del grupo
estudio y libro de tareas de computación para el idiomàtico A y 5 del grupo idiomàtico B. Los
alumno [Student’s Study Guide and Computer números correspondientes a las culturas del
Workbook] que acompaña este libro. grupo A son 1,2,2,5,4,3,3,8 y 7,2. Los núme
Todos los datos de esta sección son ficti ros correspondientes a las culturas del grupo B
cios (a menos que se especifique lo contrario) son 2,1,9,2,5,7,6,7 y 4,8. Sobre la base de es
Las respuestas a los ejercicios de la serie Itas 10 culturas, ¿difiere el tamaño típico de la
se encuentran al final del libro. familia en las culturas de diferentes grupos
idiomátícos? Utilice el nivel 0,05. a) Realice
una transformación raíz cuadrada (para sim
SERIE I plificar las cosas, redondee los valores trans
formados para que tengan un sólo decimal),
1. Para la distribución de los 30 valores
b) Realice una prueba f para medias indepen
que aparecen abajo, a) trace un histograma (ba
dientes utilizando los valores transformados
sado en frecuencias agrupadas) de los valores
(muestre su trabajo), c) Explique lo que ha he
tal como aparecen; b) realice una transforma
cho y por qué a una persona que está familiari
ción raíz cuadrada y un histograma (de fre
zada con la prueba t pero no con la transfor
cuencias agrupadas) de los valores transfor
mación de datos.
mados, y c) convierta los valores originales en
4. Un investigador asigna participantes al
rangos y trace un histograma (agrupado) de-los
azar para que observen uno de tres tipos de pe
mismos,
lículas: una tiende a entristecer a las personas,
9,28, 4,16,0,7,25,1,4,10,4, 2,1,9,16,11, otra tiende a alegrar a las personas y una terce
12, 1, 18,2, 5,10,3,17,6,4,2,23,21,20 ra tiende a poner furiosas a las personas. Des-
pués se pide a los participantes que califiquen L o s in fo rm es p rop ios in d ica d o s en e l ín d i
unas series de fotos de individuos en cuanto al c e de a te n c ió n a alternativas y e l tiem p o
nivel de honestidad que reflejan. Las califica* efe ctiv a m e n te transcurrido analizan do las
ciones dei grupo que vio la película que causa d iap ositivas atractivas d el se x o o p u esto
tristeza fueron 201, 523 y 614; las calificacio £...] eran p o sitivam en te asim étricos; por lo
nes del grupo que vio la película que causa tanto, lo s d atos fu eron transform ados a lo
enojo fueron 136, 340 y 301 y las calificacio garitm os (p. 7 6 0 ).
nes del grupo que vio la película que causa ale Explique lo que aquí se describe (y por qué
gría fueron 838,911 y 1.007. a) Transforme las se realiza) a una persona que comprende la
observaciones en rangos, b) Realice un análisis estadística paramétrica ordinaria pero que
de varianza de un criterio con los valores trans nunca a escuchado hablar de transformacio
formados en rangos (utilice el nivel 0,05 de nes de datos.
significación y muestre su trabajo), c) Expli
que lo que ha hecho y por qué a una persona que
comprende el análisis de varianza pero no las SERIE II
transformaciones a rango o las pruebas no para L Con la distribución de 20 valores que
métricas. aquí presentamos a) realice un histograma
5. Un estudio compara el rendimiento de
(basado en frecuencias agrupadas) de los valo
personas en la realización de una tarea origi res tal cual los presentamos; b) realice una
nal: si la realizan a solas o en presencia de un transformación log y un histograma (de fre
amigo. Los valores correspondientes a los par cuencias agrupadas) de los valores transfor
ticipantes que están solos son 9,5 y 4; los valo mados, y c) transforme los valores originales
res correspondientes a los participantes que en rangos y realice un histograma (agrupado)
realizan la tarea frente a un amigo son 3,1 y 0, de los mismos. (Nota; para realizar la trans
a) Realice una prueba de aleatorización com formación log utilice una calculadora con la
parando los dos grupos. (Utilice p < 0,05, una función log para calcular logaritmos o una
cola, prediciendo mayores valores para los que computadora).
realizan la tarea a solas), b) Explique lo que hi
zo a una persona que nunca ha asistido a un 2, 2 0 7 , 8 9 4 , 107, 11, 7 9 , 1 1 2 , 9 3 8 , 7 9 1 , 3 , 1 3 ,
curso de estadística. 8 9 ,1 .0 0 4 ,9 2 ,1 .0 1 6 ,1 0 7 ,8 7 ,9 1 ,8 7 0 ,9 2 1
Nota: con tres participantes en cada grupo, 2. ¿Cuál de las siguientes distribuciones
existen 20 formas diferentes de realizar dos muéstrales sugiere que la distribución pobla-
agrupaciones con los seis registros: cional probablemente no es normal? ¿Por qué?
9 3 94 94 94 9 3 9 5 9 5 9 3 95 9 5 a) 281,283,287,289,291,300,302
5 1 5 1 5 3 33 4 1 4 3 4 3 3 4 34 14 b ) 1 , 4 , 6 , 6 , 7 , 7 , 9 , 13
4 0 3 0 1 0 0J 3j0 LP P 1 JLp CU. 0_3 c) 7,104,104, 104,1.245,1.247,1.248,
1.251
3 9 4 9 49 4 9 5 9 5 9 59 5 9 39 5 9 d) 68,74,76,1,938
1 5 15 3 5 3 5 14 3 4 34 4 3 43 4 1
0 4 0 3 0 1 10 0 3 0 1 i 0 01 10 3 0 e) 407,2,407,5,407,6,407,9
3. Un psicólogo realiza un estudio a seis
6. Miller (1997) realizó un estudio acerca electricistas desempleados, correlacionando la
del compromiso en una relación amorosa y la cantidad de semanas sin empleo con la satis
atención prestada a alternativas atractivas. En facción marital. Los resultados aparecen abajo,
el estudio, se le mostró a los participantes una a) Realice un diagrama de dispersión y calcule
serie de diapositivas de personas atractivas. Al la correlación entre los valores dados, b) Reali
comienzo de la sección de Resultados, Miller ce una transformación a la raíz cuadrada de los
observa: valores correspondientes a las semanas sin em
pleo. c) Realice un diagrama de dispersión y 9 4 14 14 14 04 0 4 0 4 04 0 4 0 4=.
calcule la correlación utilizando los valores 3 0 30 9 0 9 0 31 91 91 19 19 1 3 1
transformados, d) Compare los resultados de 9j .:
los dos métodos. (Nota: el ejercicio supone que 5. Un estudió comparó a los alumnos del ■
el alumno ya ha estudiado el capítulo 3). primer y segundo año de facultad en cuanto a :
Semanas desetnpleado Satisfacción marital la cantidad de amigos íntimos. Los investiga
dores predijeron que los alumnos de segundó :
2 8 año tendrían más amigos íntimos. Los cinco :
1 9
9 6 alumnos de primer año que participaron de la ;
16 3 prueba informaron 2, 0, 2, 1 y 1. Los cinco
25 5 alumnos de segundo año que participaron de
4 7
la prueba informaron. 3, 4, 1, 2 y ó. Realice
una prueba de aleatorización aproximada con
4. Un investigador realizó un experimentoestos datos de la siguiente manera: a) Calcule
organizado en tomo a un importante discurso
la diferencia de medias entre los dos grupos
televisado del presidente de los e e . u u . Inme
reales, b) Escriba la cantidad de amigos íntimos
diatamente después del discurso, tres partici
para cada participante en una tarjeta, c) Mezcle
pantes fueron asignados al azar para escuchar
las 10 tarjetas y colóquelas boca arriba en dos
los comentarios del comentarista político del
grupos de cinco. Calcule la media de las prime
canal de televisión. A otros tres se les asignó
ras cinco y calcule la diferencia con la media
pasar el mismo tiempo con la televisión apaga
de las segundas cinco, y luego anótela, d) Vuel
da, reflexionando tranquilamente sobre el dis
va a mezclar y repita ese proceso 40 veces,
curso. Después, los participantes de ambos gru
e) Determine cuántas de las 40 veces obtuvo
pos completaron un cuestionario que evaluaba
cuánto del contenido del discurso recordaban diferencias de medias tan altas como la mues
con precisión. El grupo que escuchó a los co tra real.
mentaristas presentó los valores 4,0 y 1. El gru 6. Carey et al. (1997) desarrollaron un pro
po que reflexionó tranquilamente presentó los grama diseñado para mejorar la motivación
valores 9,3 y 8. con el fin de evitar los riesgos de infección con
Escuchar a los comentaristas ¿afectó el re Htv. Después, analizaron su efectividad con un
cuerdo del discurso? Utilice el nivel 0,05, una grupo de mujeres de ciudad de baja posición
cola, prediciendo mayores valores para el gru económica que fueron asignadas al azar para
po que reflexionó tranquilamente sobre el dis recibir el programa o formar parte del grupo de
curso. a) Realice una prueba t para medías control. Todas las mujeres fueron medidas an
independientes, b) Realice una prueba de alea- tes, 3 semanas después y 12 semanas después
torización con los datos, c) Compare los resul de que el grupo experimental participara del
tados utilizando los dos métodos, d) Explique programa. Una de las medidas aplicadas en el
lo que ha hecho y los resultados a alguien que estudio se refería a la comunicación sexual, co
está familiarizado con la prueba t pero no con mo por ejemplo, hasta qué punto las mujeres,
pruebas de aleatorización. según lo que ellas informaban, habían hablado
Nota: las 20 formas diferentes de formar con sus parejas sobre sexo seguro y pruebas de
dos agrupaciones con estos seis valores son las Htv, Antes de describir los análisis sobre esta
siguientes: variable, Carey et al. observaron lo siguiente:
“Los valores de comunicación eran positiva
4 9 41 41 4 1 4 0 4 0 4 0 40 4 0 4 0 mente asimétricos en las tres ocasiones; trans
0 3 03 09 0 9 13 1 9 1 9 9 1 9 1 3 1 formaciones log 10 (x + 1) fueron la mejor
JJS 2 1 1 1 1 1 9J 3_8 1 1 1 1 8 9
11 corrección para lograr normalidad y fueron
utilizadas en análisis sucesivos” (p.536), Ex lo informativo le explicamos que los investiga
plique qué es lo que se describe aquí (y por qué dores sumaron un 1 a cada valor antes de reali
se realiza) a una persona que comprende la es zar la transformación íog porque algunos valo
tadística paramétrica ordinaria pero que nunca res de comunicación eran .igual a 0, y no se
ha oído hablar sobre transformaciones de da puede calcular el logaritmo de 0).
tos. (Puede ignorar la parte del “x + 1”. A títu
Integración
de contenidos:
el modelo
lineal general
Breve revisión de correlación > La prueba t como caso especial de la
y regresión múltiples, prueba de significación de! coeficiente
> Relación entre los principales de correlación.
métodos estadísticos, ^ El análisis de varianza como caso ^
> Revisión de los principios especial de la prueba de significación
de la regresión y la correlación coeficiente de correlación múltipla*
múltiples, ► Elección de pruebas estadísticas,
N- Introducción al modelo lineal general. ►Los supuestos y el modelo lineal general.
!►. El modelo lineal general y ►' Controversias y limitaciones.
la regresión / correlación múltiples. ►Resumen, :
P- Regresión y correlación bivariadas ►Términos clave,
como casos especiales de ^ Ejercicios,
regresión / correlación múltiple.
^ La prueba t como caso especial
del análisis de varianza.
Por lo tanto, vamos a concentramos en los cuatro grandes, todos ellos casos especiales del modelo
lineal general y, por ello, sistemáticamente relacionados. Es posible que en el proceso emerjan mu
chas de las intuiciones que habíamos percibido parcialmente con respecto a lo aprendido.
Para expresarlo en forma breve (y luego profundizar sobre el tema), la técnica más general es la
regresión/correlación múltiples (capítulo 4), siendo la correlación bivariada (capítulo 3) un caso es
pecial de la misma. Finalmente, la prueba t (capítulos 9 y 10) deriva directamente de la correlación
bivariada o del análisis de varianza. La figura 16-1 representa gráficamente las vinculaciones men
cionadas.
Cuando decimos que un procedimiento es un caso especial de otro, queremos decir que el pri
mero puede deducirse de la fórmula del segundo. Por eso, cuando utilizamos los procedimientos
más especializados obtenemos el mismo resultado que hubiéramos obtenido con el procedimien
to más general. Para ser más concretos, si viajáramos a una isla desierta a realizar una investiga
ción psicológica y sólo pudiéramos llevar un programa de computación para realizar las pruebas
estadísticas, nos convendría elegir uno que realizara correlacíón/regresión múltiples. Con ese
programa podríamos lograr todo lo que se obtiene con programas más especializados de correla
ción bivariada, pruebas f y análisis de varianza.
En este capítulo investigamos tales vínculos. Primero, revemos brevemente la idea de regre-
sión/correlación múltiples que presentamos en el capítulo 4, y en ese contexto analizamos una de
finición formal del modelo lineal general. Después, examinamos cada uno de los vínculos: la
regresión / correlación múltiples con la correlación bivariada; el análisis de varianza con la prue
ba í, y la regresión / correlación múltiples con el análisis de varianza.
+ (0 ,0 6 ruido m e d id o en d e c ib e le s )
Así, si un presunto gerente fuera a supervisar sólo a cuatro personas en un área con 50 decibeles
de mido, y tuviera sólo un plazo a cumplir por mes, el nivel de estrés predicho sería calculado de
la siguiente manera:
La predicción del nivel de estrés del gerente sería muy baja (1,40).
También es posible describir el grado general de relación entre la variable dependiente y la
combinación de variables de predicción. Este dato se denomina coeficiente de correlación múl
tiple y se simboliza con una R. R debe ser al menos tan grande como la correlación bivariable
más pequeña entre cualquiera de las variables de predicción y la variable dependiente. R2 es la
reducción proporciona! del error cuadrático lograda utilizando la regla de predicción para re
gresión múltiple, en contraposición con la simple predicción de la variable dependiente a partir
de su propia media.
Finalmente, se puede probar la significación de una correlación múltiple (y de la correspon
diente reducción proporcional del error) utilizando un procedimiento en el que la hipótesis nula
establece que la correlación múltiple de la población es 0,
En este capítulo, nos referiremos a todo el procedimiento de regresión múltiple y correlación
múltiple en su conjunto como “regresión/correlación múltiples”. Es una costumbre ampliamente
utilizada y simplifica la exposición.
1 Existen métodos ingeniosos de introducir furtivamente términos elevados al cuadrado o a mayores potencias en los
procedimientos del modelo lineal. Por ejemplo, podríamos crear una variable nueva, transformada, en la que cada valor
estuviera elevado al cuadrado. Luego se podría utilizar esa variable transformada en una ecuación de modelo lineal co
mo una variable original. Así, en la ecuación no aparecería en realidad ningún término elevado al cuadrado. Este peque
ño truco resulta extraordinariamente valioso. Por ejemplo, ciertos textos sobre regresión múltiple (p. ej, Cohen &
Cohen, 1983; Darlington, 1990) muestran la forma de utilizar ese tipo de procedimientos para trabajar con relaciones
curvilíneas a través de métodos estadísticos diseñados para relaciones lineales.
Tanto la prueba t como el análisis de varianza son procedimientos para probar ía diferencia ; •
entre medias de grupos. La prueba t se utiliza cuando existen sólo dos grupos.2 El análisis de va- ..
danza con razón F, se utiliza generalmente sólo cuando existen más de dos grupos. Sin embargo,
no existe motivo para no utilizar un análisis de varianza sólo con dos grupos. Cuando existen sólo
dos grupos, la prueba t y el análisis de varianza producen conclusiones idénticas.
r y F son estrictamente idénticos sólo cuando se trabaja con dos grupos. Cuando existen más
de dos grupos, no podemos realizar una prueba t ordinaria. Por eso decimos que la prueba t es un 7
caso especial del análisis de varianza. La prueba-íes matemáticamente idéntica al análisis de va
rianza en el caso particular en el que existen sólo dos grupos (pronto analizaremos un ejemplo). :
1En este capítulo, nos concentramos en la prueba de hipótesis para medias independientes (y también en el análisis de
varianza para diseños intersujetos). Sin embargo, las conclusiones finales son las mismas que con respecto a la prue
ba t para medias dependientes. Se trata de un caso especial de análisis de varianza de medidas repetidas. Además, tan
to la prueba r para medias dependientes c o m o el análisis de varianza de medidas repetidas, son casos especiales de
regresión i correlación múltiples. De todos modos, el vínculo entre estos métodos y la correlación múltiple involucra al
gunos niveles extra de lógica que no analizamos aquí, para concentramos en las ideas principales del capítulo.
• Cuadro 16-1.
~La época dorada de la estadística: cuatro muchachos en Londres.
Tabla 16-1.
Algunos vínculos de la prueba t para medias independientes y el análisis de varianza.
E l denom inador de t s e basa, en parte, El denom inador de F se calcula com binando las estim a-
e n la com bin ación d e las estim aciones de varianza cio n es de varianza poblacional calculadas a partir de cada
poblacional calculadas a partir de cada grupo grupo.
3 Otras diferencias aparentes (tal como la supuesta diferencia entre el numerador de la razón F, que se basa en una esti
mación de varianza, y el numerador dei punto t, que es una simple diferencia entre medias) presentan una unidad sub
yacente similar. Pero aquí no trataremos esos temas.
T a b la 1 6 -2 ,
C á lc u lo s d e la p r u e b a t y el a n á lis is d e v a r ia n z a c o r r e s p o n d ie n te s a u n e x p e r im e n to a c e r c a d e la e fe c
tiv id a d d e u n n u e v o p r o g r a m a d e c a p a c ita c ió n la b o r a l (d a to s fic tic io s ).
X, ( W *2 x 2- m 2 (X2-A Í/
6 0 0 6 3 9
4 -2 4 1 -2 4
9 3 9 5 2 4
1 1 1 3 0 0
7 1 1 1 -2 4
3 -3 9 1 -2 . 4 ■
6 Ò 0 4 1 1
X 42 0 24 21 0- 26
M¡ = 6 S ] = 2 4 /6 =4 . m 2= 3 $|-= 2 6 /6 = 4 ,3 3
^ =7 1=6 . n 2= 7 . ^ 2= N 2 - l = 6
C á lcu lo s d e la p r u e b a t C álcu los d e l anova
N um erador
X (M - G M ? = (6 - 4,5)2 + (3 - 4 ,5 )3
' = 1 ,5 * + -1 ,5 « ‘
= 2 ,2 5 + 2 ,2 5 = 4 ,5 -
D e n o m in a d o r
C2 <4) + ( - ~ - |( 4 ,3 3 )
combinada
12
= (0 ,5X 4) + (0 ,5 )(4 ,3 3 ) = 2 ,0 0 + 2,17 = 4 ,1 7
gì sf+s l + + 4 + 4,33
^diferencia " + $M2 ~ ^ o m iñ n a ó J ^ O + ^combinada^ " 1 dentro ÓCM,
= (4 ,1 7 /7 )+ (4 ,1 7 /7 ) Grupos
= 0 ,6 0 + 0 ,6 0 = 1 ,2 0 8,33
■= 4 ,1 7
W i a =^ “ ^ = U 0
G r a d o s d e L ib e r ta d
t = ( M l - M 2) / SD m . = (6 ,0 0 - 3 .0 0 V U 0 = 3 ,0 0 /1 , 10 = 2,73
55
Conclusiones
Se rechaza ía hipótesis nula. Se rechaza la hipótesis nula.
Se sostiene la hipótesis de investigación. Se sostiene la hipótesis de investigación.
Tabla 16-3.
Cálculo del coeficiente de correlación y de una prueba de hipótesis sobre el coeficiente de correlación
con los datos de la tabla 10-3 (y tabla 16-2), en el que se convierte la variable de predicción (indepen
diente) en una variable numérica con los valores 1 (para el grupo experimental) ó 2 (para el grupo de
control).
Figura 16-2.
Diagrama de dispersión y recta de regre
sión del ejemplo acerca de la capacidad
laboral, originalmente analizado con una
prueba t para medias independientes, con
un valor de 1 para el grupo experimental
y 2 para el grupo control
través de! medio de cada serie de puntos. En realidad, si a! realizar un diagrama de dispersión con
los resultados de una prueba t, calculáramos la recta de regresión, esa recta siempre caería exacta
mente en la media de cada serie de puntos. Es decir, la recta de regresión pasa por la ubicación
que representa la media de cada grupo, ya que en cada serie de observaciones, el mejor número de
predicción es siempre la media (en el sentido de producir el mínimo error cuadrático).
Ahora analicemos algunos patrones posibles en este tipo de diagrama de dispersión. La figu
ra 16-3a representa un caso en el que las dos medias son casi iguales. En ese caso, la pendiente de
la recta de regresión es prácticamente 0; la correlación es baja y no es significativa. De hecho, con
los datos del ejemplo, la correlación es 0,10. Utilizando la fórmula de la prueba t para el coefi
ciente de correlación, con 20 participantes, el resultado es un t de 0,43;
t = r ^ Ñ - 2 / C 7 = 0 ,lV 2 0 ~ 2 /v 'l-Q ,12 - 0,43.
Figura 16-3.
Tres posibles diagramas de dispersión de datos analizados con una prueba t para medias independientes, en
los que las medias de los dos grupos son (a) casi iguales; (b) diferentes pero con datos que están muy disper
sos (gran varianza combinada o gran desvío estándar de la distribución de la diferencia de medias maestra
les), y (c) muy diferentes, con datos que no están ampliamente dispersos.
Del mismo modo, pensando en términos de una prueba t para medias independientes, habien
do tan poca diferencia entre las medias de los dos grupos, la prueba t tampoco será significativa.
Los datos del ejemplo presentan una diferencia de media de 7,39 -1 ,6 0 = 0,21. Con un desvío es
tándar de la distribución de diferencias entre medias de 0,48, el t es de -0,44: í =,(Ml -.M2)/SDifcrejlcia
= (7,39 - 7,60)/0,48 = -0,44. Con diferencia de redondeo (e ignorando el signo), es el mismo re
sultado que obtenemos utilizando el método de la correlación.
La figura ló-3b representa un caso en el que las medias de los dos grupos son algo diferentes
pero en donde los puntos de cada grupo están aún más dispersos. En ese caso, nuevamente la rec
ta de regresión es un elemento de predicción muy pobre. Una vez más, el coeficiente de correla
ción, aunque no es igual a 0, de todos modos sería bastante bajo y no significativo. De hecho, con
los datos del ejemplo, r - 0,10, el cuál no es estadísticamente significativo. En la prueba t para
medias independientes realizada con estos mismos datos, el efecto de la dispersión de los puntos
es una mayor varianza poblacional estimada para cada grupo. A la vez, lo anterior causa una esti
mación de varianza combinada considerable y un gran desvío estándar de la distribución de dife
rencias entre medias. Dado que en una prueba t se divide la diferencia de medias por el desvío
estándar de la distribución de diferencias entre medias, cuanto más grande es el desvío estándar,
menor será el t que resulte. Los datos del ejemplo arrojan una diferencia de medias de 0,52 y un
desvío estándar de la distribución de diferencia de medias de 1,21. El resultado es un t de 0,43
que, claramente, no es significativo.
Por el contrario, la figura 16-3c representa un caso en el que existe una gran diferencia entre
las medias con una variación relativamente pequeña entre los puntos que rodean a cada media.
Como resultado, la línea de regresión es muy útil como elemento de predicción, dando un alto
coeficiente de correlación. (Aplicando los datos del ejemplo, r = 0,65 y t = 3,63, según se calcula
a partir de r para probar su significación). Asimismo, la gran diferencia de media y la pequeña va
rianza dentro de cada grupo contribuyen a un gran t cuando se calcula utilizando una prueba t pa
ra medias independientes. En este ejemplo, la diferencia media es -2,17 y el desvío estándar de la
distribución de diferencias entre medias es 0,59; por lo tanto, t es -3,68 (la diferencia con el t cal
culado utilizando r se debe al redondeo).
El principio representado gráficamente por las figuras que acabamos de analizar es que la
prueba t para medias independientes y la prueba de significación del coeficiente de correlación
dan los mismos resultados, porque ambas son mayores cuando la diferencia entre las dos medias
es grande y■la variación entre las observaciones de cada grupo es pequeña.
2 - S S * or = 50
Suma de cuadrados utilizando la media general
como regla de predicción (no se muestra el cálculo): SSTotaJ= 81,5
GM = 4,5
Grupo experimental Grupo de control
(programa especia!) (programa estándar)
*i x- GM X - AÍ M- GM X X - GM X - M M - GM
D esv D esv7 Dcív D esv7 D esv D esv1 D esv D esv2 ■D e s v D e sv 1 D esv D esv1
6 1,5 2,25 0 0 1,5 2,25 6 1,5 2,25 3 9 -1,5 2,25
4 -0,5 0,25 -2 4 1,5 2,25 1 -3,5 12,25 -2 4 -1,5 2,25
9 4,5 20,25 3 9 1,5 2,25 5 0,5 0,25 2 4 -1,5 2,25
7 2,5 6,25 1 1 1,5 2,25 3 -1,5 2,25 0 0 -1,5 2,25
7 2,5 6,25 1 1 1,5 2,25 1 -3,5 12,25 -2 4 -1,5 2,25
3 "1,5 2,25 -3 9 1,5 2,25 1 -3,5 12,25 -2 4 -1,5 2,25
6 1,5 2,25 0 0 1,5 2,25 4 -0,5 ,25 1 1 -1,5 2,25
X: 39,75 24 15,75 X: 41,75 26 15,75
cativa entre los tres estilos de relación (la variable independiente o de predicción) con respecto a
los celos (la variable dependiente). Por el contrario, un enfoque correlacional describiría este re
sultado como una asociación significativa entre la variable del estilo de relación y la variable de
los celos.
Tabla 16-5.
E jem p lo de codificación n om in al para la n acion alid ad d e d iez p articip an tes en u n e stu d io ficticio de
p articip an tes de cuatro n a cio n alid ad es cen troam erican as.
1 G uatem alteca 0 1 0
2 N icaragüense 0 0 1
3 Salvadoreña 0 0 0
4 N icaragüense 0 0 1
5 C ostarricense 1 0 0
6 C ostarricense 1 0 0
7 Salvadoreña 0 0 0
8 N icaragüense 0 0 1
9 C ostaricense 1 0 0
10 Guatem alteca 0 1' 0
Tabla 16-6.
E je m p lo d e c o d ific a c ió n n o m in a l p a r a la c o n d ic ió n e x p e r im e n ta l d e q u in c e p a r t ic ip a n t e s d e l eje m p lo
d e a n te c e d e n te s d e lic tiv o s (d a to s fic tic io s ).
participante nicaragüense tendría ceros en las opciones costarricense y guatemalteca. Cada partici
pante salvadoreño tendría ceros en las tres variables. (A propósito, puede utilizarse cualquier par de
números para cada variable nominal de dos valores; utilizamos 1 y 0 sólo por conveniencia). La ta
bla 16-5 muestra el funcionamiento de esta codificación aplicada a 10 participantes ficticios.
Todo el procedimiento descrípto se denomina codificación nominal. (Convertir en 1 y 2 a los
niveles del ejemplo de la prueba t, para calcular un coeficiente de correlación, también fue un ca
so de codificación nominal para una variable nominal de dos categorías). En el ejemplo que esta
mos analizando ahora, el resultado de la codificación nominal es que la variable de predicción, en
lugar de ser una variable nominal con cuatro categorías, ahora se ha convirtido en tres variables
numéricas pero, con sólo dos valores cada una. Crear una serie de variables numéricas con dos va
lores, tal como acabamos de describir, evita e! inconveniente de crear una jerarquización falsa de
los cuatro niveles.
La tabla 16-6 muestra otro ejemplo de codificación nominal, esta vez aplicado a los participan
tes del ejemplo relacionado con los antecedentes delictivos. El resultado es que la variable de pre
dicción, en lugar de ser una variable nominal con tres categorías, ahora se transformó en dos
variables numéricas (con sólo dos valores cada una, 0 ó 1). Generalizando, en un análisis de varian-
za se puede codificar toda variable independiente nominal para convertirla en una serie de variables
numéricas de dos valores. La serie estará formada exactamente por una variable menos que la canti
dad de niveles que tenía la variable nominal. (No es coincidencia que resulte el mismo número que
los grados de libertad de la estimación íntergrupal de varianza poblacional).
Esa capacidad para codificar una variable nominal independiente, y convertirla en una serie
de variables numéricas de dos valores en el análisis de varianza, es una transición importante que
hace posible la realización de un análisis de correlación múltiple. Tomemos nuevamente el ejem-
pío de los antecedentes delictivos. Habiendo realizado la codificación nominal, ahora podemos
calcular la correlación múltiple de las dos variables numéricas de predicción junto con la variable
dependiente, el nivel de culpabilidad. El resultado final (en términos de nivel de significación y
R2) será idéntico al del análisis de varianza.
El procedimiento de codificación nominal que hemos descripto aquí implica la conversión de
una variable nominal de predicción de un análisis de varianza, en distintas variables numéricas de
dos niveles para una correlación múltiple.
Este procedimiento es extremadamente flexible y puede extenderse a los casos más comple
jos del análisis factorial de varianza. En verdad, lo importante no es que podamos realizar una co
dificación nominal; en la mayoría de los casos, una computadora lo hará por nosotros. Lo
realmente importante es comprender el principio que hace posible la conversión de un problema
de análisis de varianza en un problema de regresión múltiple. (Si el alumno está interesado en el
tema de la codificación nominal, véase Cohén & Cohén, 1983, capítulo 5. Incluye una descrip
ción detallada y de fácil lectura).
Uno de los textos de estadística avanzada abarcaban has ta el análisis de varían- :■;;!íí
más útiles escritos hasta el momento, es el za. Pero en esa época, a nadie sé íe .
libro Utilizando estadística muítivariada enseñaba el análisis de varianza muí- - V, U
lUsing Multivariate Statistics], de Bárbara tivariadb. Los paquetes estadísticos'
Tabachnick y Linda Fidell (1996), dos psi~ que realizaban ese tijpó dé' análisis ' ’
cólogas de la Universidad del Estado de Ca llegaron posteriormente pero, ¿cómo "yUyj
■ comprenderlos? " , '
lifornia en Northridge dedicadas a la inves
(En el capítulo 17 'presentaremos el iéma£í
tigación. Estas dos mujeres se conocieron
del análisis mültivánadó de varianza),. '
durante un almuerzo en la facultad poco des
pués de que Tabachnick fuera contratada. Fi Tanto Fidell como Tabachnick habían: ;i.i
dell recuerda que acababa de terminar un investigado y aprendido por su cuenta,, asisV: ,;
curso de francés y otro de álgebra matri- . tiendo a los cursos necesarios,: leyendo, pre-T ••
ciaí, sólo por el placer de aprender (“En esa guntando a otros que conocían, mejor los, -;'
época era una persona muy seria”). Se pre programas, probando qué sucedía si hacían ;!;;
guntaba qué actividad emprender cuando esto o aquello con los datos. Ahora las dos 14
Tabachnick sugirió que tomaran juntas cía- ■ mujeres se preguntaban por qué resultaba .■i
ses de danzas árabes. Fidell pensó “no está - todo tan difícil, y si otros estarían volvienT
mal algo frívolo para variar”. Se equivocaba." ■' do a inventar esa misma rueda en ése’litisf;
Así comenzó la colaboración éntre ellas; : . mo momento; Decidieron volcar su propia;. '.:
Después de las lecciones de danza, martte- invención de la rueda en un libro; .
nían largas discusiones sobre estadística. Eii “Y así comenzaron quince años de cd-
particular, descubrieron que compartían la- laboración sin conflictos” informa Fidell: : ■
fascinación, y consternación, por los nove- ' (Hecho que merece compararse con las ene-;;/
dosos cálculos estadísticos posibles a través mistades narradas en otros cuadros de esté-;■!;
de los nuevos paquetes estadísticos para ■ mismo libro). Las autoras no tuvieron focon-;/.
computadoras. El problema era dar sentido veniente en encontrar un editor, y el libro, ‘
a los resultados. que actualmente'vapor la tercera edición,;&/ • 1
Fidell describió la situación de la si "ha vendido “muy bien”.'(Á pesar del hecho .; '
guiente forma: . de que sus títulos preferidos, tales como ¿Yy ;
Tenía esta enorme serie de datos ,para libro de estadística, multivdriddo. de Fátinía “ :
analizar y surgieron una cantidad enór- ; "yScheherazade; Las mil y una variables? Elyd
me de bonitos números ordenados en libro rosa, borroso de estadística; Pieñia\pfe*d-'.
pequeñas y prolijas columnas, pero no so con la estadística muítivariada,. fueron ,
estaba segura del significado de todos desechados, por el editor. Sin .embargó, sí
ellos, e incluso no sabía si mi informa-'
uno observaba con atención la portada de la
ción había violado algún supuesto crí
primera edición, podía ver una bailarina ára
tico, Sabía que existían algunos, pero
no sabía nada acerca de ellos. Lo ante be oculta en el diseño). ■
rior ocurrió en 1975. Yo me había ca Fidell subraya que tanto ella como Ta- .
pacitado en la Universidad de Michigan bachnick se consideran analistas de datos y-
y mis conocimientos sobre estadística profesoras: no son estadísticas teóricas o
prácticas, no han creado métodos, simple- , do conquistarlos, y sí me dan mèdia opér-r- :
mente ios h a n :popularizado haciéndolos ^n idad| lp iógraré”.
■- más accesibies; ¡Sin embargo;.pueden nom~- • Cualquiera sea la razón.; la/estádístíca^-.
. bráf docenas de miijéres. qué- han tenido v es una- rama de la matemática qué, .según • '
• éxito como estadísticas teóricas. Según. Hv. ■ .Fidéíl, las mujeres -con frecuencia, conside^;^
delly lá. estadística, és' un área en la que l a : r p “jpérféctaménte lÓgicaj perfectamente ra- ;
■'■mujer- ptóicuíármérite parece- destacarse y. zpñabíé, y luego; cori el tiempo, algo que:
sentirse cómoda.-AI enseñar a alumnos núe- realmente-pueden disfrutar”. Seguramente ;•
. vos, .éspeciaimérite a aquéllois intiriüdadós • son buenas nottó múchás. lectoras; •
. por la matemática, .descubren que’por una-
.. vez puede hácer. que “se relajen”, debido a
.. que; frecuentemente descubren que disfru-
.: :tan; de la estadística. Ella les dice, “pretén-;■ v k e f& re n c iá : Èritrèvìs.tà‘;É)èrsoààÌ; cònvLmda;Fidéliy.: :
resultado signiñeativo, sustenta la existencia de una asociación entre las dos variables, pero no
indica cuál de las variables es causal de la otra (o si alguna tercera variable en común podría estar
causando ambas).
Generalmente, los verdaderos diseños experimentales de investigación involucran la asigna
ción, a dos o más niveles de la variable de predicción. Tradicionalmente, estos experimentos han
sido analizados utilizando una prueba t o un análisis de varianza. De hecho, hasta hace poco tiem
po atrás, en muchos casos no se enseñaba la regresión / correlación múltiples a los psicólogos ex
perimentales como parte de su capacitación profesional. Eran experimentalisfas y no debían
condescender a la correlación.
Los diseños correlaciónales de investigación se utilizan comúnmente cuando no es posible
realizar experimentos. Con frecuencia miden la respuesta de determinadas personas con respecto
a dos o más variables numéricas, sin tener la posibilidad de que esas personas experimenten com
pletamente una de las variables. (La edad, el nivel de ingresos, el nivel de educación, etc., son
ejemplos de variables con las que no es posible poner en práctica la asignación aleatoria). Asimis
mo, a los sociólogos, economistas y otros científicos sociales no se les enseña la prueba t ni el
análisis de varianza como parte de su capacitación, debido a que la regresión / correlación es el
método apropiado de análisis del cual dependen por completo.
Los diseños experimentales son claramente ventajosos. Por asociación, tanto los diseños co
mo la estadística correlaciónales provocan una menor impresión y, fácilmente, se los confunde.
Sin embargo, no existe razón para que un verdadero experimento no pueda asignar personas al
azar a varios niveles numéricamente diferentes de una variable numérica de predicción. (Utiliza
mos un ejemplo de este tipo en el capítulo 3, en el que las personas eran asignadas a diferentes
cantidades de exposición de una palabra). Un experimento real de ese tipo se analiza adecuada
mente sólo con un coeficiente de correlación (y la correspondiente prueba de significación). Si se
intentara reducir esos niveles de exposición a dos grupos, por ejemplo la comparación de aquellos
con gran cantidad de exposiciones de las palabras con aquellos con poca cantidad de exposicio
nes, se perdería información y sería un método estadístico más deficiente (entre otros aspectos, el
análisis tendría menos potencia).
Asimismo, existen estudios que utilizan diseños correlaciónales de investigación en los que, sin
embargo, una de las variables tiene sólo dos niveles, como por ejemplo, el género. O podríamos
realizar un estudio con una variable con categorías, con más de dos niveles, como por ejemplo la
nacionalidad. En esos casos, seguramente podríamos analizar los resultados utilizando una prueba í
o un análisis de varianza, pero eso no cambiaría el hecho de que los estudios hayan utilizado dise
ños de investigación correlaciónales, en los que resulta difícil discernir la causa y el efecto.
Cabe recalcar que cuando los investigadores seleccionan un método estadístico en lugar
de otro, es posible que la decisión esté más relacionada con la costumbre, lo que se “ve
bien”, e incluso con una confusión, que con cualquier diferencia matemática o lógica entre
los procedimientos.
Existe una gran ventaja en utilizar la correlación (o la regresión / correlación múltiples sí es
necesario) en lugar de la prueba t o el análisis de varianza. El método correlaciona! proporciona
información directa acerca del grado de relación entre la(s) variable(s) de predicción y la variable
dependiente, a la vez que permite realizar una prueba de significación. La prueba t y el análisis dé
varianza sólo brindan la significación estadística. (Sí bien con cualquiera de los procedimientos
recién mencionados podemos calcular el tamaño del efecto, con un coeficiente de correlación o
un coeficiente de correlación múltiple se obtiene automáticamente una indicación del tamaño del
efecto con el coeficiente de correlación o regresión en sí mismo).
Otra ventaja de la correlación (y la regresión / correlación múltiples) es que maneja automáti
camente el tema de las distintas cantidades de participantes en los grupos que se comparan. Con
un análisis de varianza de un criterio, cuando las cantidades de participantes en ios grupos son de
siguales necesitamos utilizar procedimientos más complicados. Pero, al menos en estos casos, el
análisis de varianza de un criterio proporciona resultados precisos.
Por el contrario, al realizar un análisis de varianza de dos o más criterios, si en las casillas hay
distintas cantidades de participantes, los procedimientos estándar del análisis de varianza realr
mente fallan, en el sentido de que su aplicación distorsiona los resultados. En la mayoría de los
casos, la mejor solución es replantear el problema a modo de regresión / correlación múltiples.*4
4 La mayoría de los programas para computadoras realizan el proceso mencionado automáticamente cuando se Ies indi
ca ejecutar un análisis de varianza factorial en el que las cantidades de registros en las casillas no son iguales. Sin em
bargo, en algunos programas debe darse especialmente la orden para que realicen e l proceso mencionado o, de lo
contrario, utilizan las fórmulas del análisis de varianza ordinario y arrojan resultados engañosos.
debería ser igual en cada punto a lo largo de la recta. Por ejemplo, supongamos que las observa
ciones de los niveles inferiores de una variable de predicción tuvieran mucha variación en la va
riable dependiente, pero que las observaciones en los niveles altos de la variable de predicción
tuvieran muy poca variación en la variable dependiente. Esto violaría el principio de igualdad de
las varianzas poblacionales. El principio general de igualdad de las varianzas poblacionales, a to
dos ios niveles de una de las variables, se denomina “homoscedasticidad”,
En el caso de la correlación y la regresión, el supuesto que se refiere a las distribuciones nor
males de población se convierte en el requerimiento de que, cada variable, y todas en conjunto,
están normalmente distribuidas (lo que se denomina “distribución normal bivariad a”).
Como hemos visto, todas las técnicas del modelo lineal general arrojan resultados bastante
precisos en una amplia gama de situaciones, excepto cuando la cantidad de participantes es muy
pequeña o cuando se violan significativamente los supuestos. En verdad, estos distintos métodos
constituyen las principales herramientas de la investigación psicológica.
CONTROVERSIAS Y LIMITACIONES
El modelo lineal general, en sí mismo, no es muy controvertido; es simplemente una enuncia
ción matemática de una relación entre variables. De hecho, su papel como base de las técnicas
estadísticas más importantes aún no ha sido ampliamente comprendido por los investigadores
en ejercicio.
Sin embargo, el método de los cuadrados mínimos dentro del modelo lineal general es un po
co más controvertido. Una alternativa es minimizar el error absoluto en lugar del error cuadrático.
(Una ventaja del método mencionado es que, en lugar de utilizar la raíz cuadrada dei promedio de
los desvíos cuadráticos como la medida más común de variación, usaríamos simplemente el pro
medio de los valores absolutos de los desvíos, dando así mucha menos influencia de distorsión a
los valores atípleos).
De todos modos, las principales críticas relacionadas con el modelo lineal general son las que
involucran la prueba de hipótesis. Son las criticas que hemos estado tratando a lo largo del libro,
incluso su carácter robusto por el incumplimiento de los supuestos y la importancia del tamaño
del efecto o la prueba de significación.
Existen también críticas en otro sentido, que valen la pena mencionarlas aquí. Se trata de crí
ticas que están relacionadas con el papel que juega la estadística en la ciencia en general, pero
que, en la práctica, se formulan más frecuentemente en el contexto de los procedimientos más im
portantes basados en el modelo lineal general. Se trata de la causalidad. Hemos tratado el tema
hasta cierto punto en el capítulo 3 y nuevamente en este capítulo, cuando analizamos el problema
de deducir una dirección de causalidad a partir de un estudio que no utiliza asignaciones aleato
rias a los distintos grupos. Pero existe una cuestión aún más profunda con respecto a este tema;
¿Cuál es el significado de causalidad?
Baumrind (1983) ha delineado dos interpretaciones de la causalidad que se utilizan en la
ciencia. Una, a la que denomina teoría de la causalidad basada en la “regularidad”, encuentra sus
raíces en filósofos tales como David Hume y John Stuart Mili (al igual que en antiguos científi
cos, incluyendo a Galileo). Esta perspectiva sostiene que consideramos a X causa de Y si a) X e Y
están relacionadas regularmente, b) X precede a Y y c) no existen otras causas anteriores a X que
pudieran causar a X y a Y. En psicología, abordamos el punto a buscando una correlación signifi
cativa entre X e Y; abordamos el punto b, si es posible, a través de nuestro conocimiento de la si
tuación (en una correlación entre ser el primogénito de una familia y sufrir luego de angustia,
podemos excluir la posibilidad de que la angustia sufrida más tarde durante la vida de una perso
na sea la cansa de que esa persona sea primogénita) o diseñando un experimento para averiguarlo
(manipulando X antes de medir y). El punto c) está relacionado con el tema de la correlación en
tre X e Y, debido a una tercera variable que es causa de las dos primeras. Lo ideal sería abordar el
tema a través de la designación aleatoria a los grupos, pero si no es posible solucionar el tema de
este modo, se utilizan como estrategia substituía varios métodos estadísticos para igualar a los
grupos con respecto a terceros factores propuestos. (En el capítulo 1? analizamos algunas de esas
estrategias).
Como psicólogos, sólo a veces nos encontramos en posición de realizar el tipo de investiga
ción experimental rigurosa que nos proporciona una fuerte base para sacar conclusiones con res
pecto a la causa y el efecto. Así, gran parte de la crítica y de la controversia relacionada con la
investigación de aplicación práctica, 'en la que generalmente es más difícil aplicar métodos rigu
rosos, frecuentemente gira alrededor de esos temas. Por ejemplo, si el matrimonio y la felicidad
están correlacionados, ¿el matrimonio hace más felices a las personas, o las personas felices se
casan y permanecen casadas?
Existe otra visión de la causalidad, una visión aún más exigente que considera las condicio
nes de la teoría de la regularidad como requisitos previos para determinar una causa, pero esas
condiciones no son suficientes por sí mismas. Esta segunda visión, a la que Baumrind llama teo
ría “generativa” de la causalidad, encuentra sus raíces en Aristóteles, Tomás de Aquino e Imma-
nuei Kant. La visión generativa se enfoca en la dinámica con que X afecta Y, el proceso intrínseco
por el cual una está conectada con la otra. Es el modo en que interpretan la causalidad la mayoría
de las personas no relacionadas con la ciencia (o la filosofía). La idea misma de causalidad puede
haber surgido como metáfora de experiencias tales como desear que mi brazo se mueva (evento X),
y se mueve (evento Y). Los científicos también toman muy seriamente esta visión de causalidad,
aun si ofrece desafíos mucho más complejos. Se aborda principalmente a través de la teoría y del
análisis cuidadoso de procesos intermedios. Pero incluso aquellos que recalcan la importancia de
esta segunda visión reconocerían que demostrar una conexión confiable entre X e Y (a través de lá
significación estadística, por ejemplo) es importante, al menos, para identificar los vínculos que re
quieren investigación para determinar la verdadera conexión causal.
Finalmente, también existen aquellos que sostienen, con algunos buenos argumentos, que de
mostrar la causalidad no debería ser un objetivo de la psicología científica. Pero ya hemos tenido
suficiente controversia para un capítulo.
Resumen
El modelo lineal general equipara el valor de una variable para cualquier individuo con la suma
de una constante, más la influencia parcial y ponderada de cada una de otras variables, más el
error. El coeficiente de correlación y la regresión / correlación múltiples (y las correspondien
tes pruebas de significación), ía prueba t y el análisis de varianza, son todos casos especiales
del modelo lineal general.
La regresión / correlación múltiples es prácticamente idéntica al modelo lineal general, y la
regresión y correlación bívariadas son casos especiales de regresión / correlación múltiples, en
los que existe sólo una variable de predicción.
La prueba t para medias independientes se puede deducir matemáticamente del análisis
de varianza. Es un caso especial del análisis de varianza en el que hay sólo dos grupos. La
puntuación t es la. raíz cuadrada de la razón F, calculados con los mismos datos. Existen
muchas similitudes en las formas de realizar los dos procedimientos: los numeradores de t y
F se construyen sobre las diferencias entre las medias de los grupos; los denominadores de
ambos se construyen sobre la varíanza interna de los grupos; el denominador de t incluye la
división por la cantidad de participantes y el numerador de F incluye la multiplicación por
la cantidad de participantes; y los grados de libertad de t son iguales a los-grados de libertad
del denominador de F.
La prueba t para medias independientes también es un caso especial de la prueba de signifi
cación del coeficiente de correlación. Una correlación mide el grado de relación de una varia
ble de predicción o independiente con una variable dependiente. Del mismo modo, al indicar la
diferencia entre las medias de los grupos, la prueba t identifica una relación entre la variable cu
yos grupos están divididos, es decir, la variable independiente o de predicción con la variable
dependiente. Si asignamos el valor 1 a cada participante en uno de los dos grupos y el 2 a cada
participante en el otro grupo (o dos números diferentes cualesquiera), y después calculamos
una correlación de esos valores con la variable dependiente, la significación de la correlación
será igual que la producida por la prueba t. Si dibujamos un diagrama de dispersión con los da
tos mencionados obtendríamos una columna de valores observados para cada grupo, y la línea
de regresión pasaría por las medias de cada uno de ellos. Cuanto más diferentes sean las me
dias, mayor será la reducción proporcional del error con respecto a utilizar la gran media, y ma
yor será la puntuación basada en una comparación de las medias de los dos grupos.
El análisis de varíanza y la correlación / regresión también presentan muchas similitudes.
5CTot3Í, en la regresión y en el análisis de varíanza, se refiere a ios desvíos de cada observación
con respecto a la media de todas las observaciones de la variable dependiente. Las medias grü-
pales en un análisis de varíanza son los valores predichos para cada individuo en la regresión;
así, SC£no( y SCD(¡ntc0 son iguales. La reducción de error cuadrático (SCTojal - SCEm[) en la re
gresión es igual a la suma de los desvíos cuadráticos de las medias de los grupos de observacio
nes con respecto a la gran media j) en el análisis de varíanza. Finalmente, la
reducción proporcional del error de la regresión (r2 o R2), en la regresión, es igual a la propor
ción de varíanza explicada (R2 o eta2) por el tamaño del efecto en el análisis de varíanza.
Todo análisis de varíanza puede plantearse como una regresión múltiple, transformando las
categorías que representan los diferentes grupos en una o más variables numéricas dicotórni-
cas. En sentido estricto, el análisis de varíanza es un caso especial de regresión múltiple, en el
que las variables de predicción se establecen del modo descripto precedentemente.
Todos ios métodos mencionados comparten los mismos supuestos en cuanto a que las dis
tribuciones de la población son normales y tienen igual varíanza en todos los niveles de la va
riable de predicción.
La prueba í, ei análisis de varíanza y ia correlación pueden plantearse como regresión / co
rrelación múltiples; sin embargo, la práctica convencional hace que estos procedimientos con-
ceptualmente idénticos se utilicen en diferentes contextos de investigación, como si en realidad
fueran diferentes.
Con respecto a la causalidad, la teoría de la regularidad identifica a X como causa de Y, si X
e Y están relacionadas, X precede a Y, y no existe un tercer factor que preceda a X y pudiera
causar ambas. La teoría generativa sostiene que, además, debe comprenderse claramente el me
canismo por el cual X afecta Y. Los procedimientos estadísticos pueden demostrar una relación
entre X e Y, e incluso a veces pueden contribuir con evidencia contra una tercera variable pro
puesta como causa de X e Y, Toda otra prueba de que X sea causa de Y depende del conocimien
to de ia situación, del diseño experimental y del análisis teórico.
Términos clave
- M odelo lineal general. - Modelo de cuadrados - Codificación nominal.
mínimos.
Ejercicios
Lo s ejercicios im plican la realización de cálcu de corte t al cuadrado y anótelo al lado del t, c)
los (con la ayuda de una calculadora). L a ma Busque y anote, al lado de los í cuadráticos, los
yoría de los problemas estadísticos reales se puntos de cortes para distribuciones F con 1
resuelven por computadora, pero aunque exis grado de libertad en el numerador y 5 ,1 0 ,1 5 y
ta la posibilidad de utilizarla, es conveniente 20 grados de libertad como denominadores.
realizar estos ejercicios manualmente para in (Lo s resultados deberían ser iguales, con dife
corporar el método de trabajo. rencias de redondeo).
Para adquirir práctica en la utilización de 2. A continuación aparecen tres series de da
una computadora, para resolver problemas es
tos. E n el caso de las prim eras dos series de
tadísticos, se puede utilizar la sección de compu
datos, además de las medias y las varianzas po-
tación de cada capítulo, publicada en la Guía de
biacionales estimadas, incluim os la informa
estudio y libro de tareas de computación para
ción correspondiente a la prueba t. En el tercer
el alumno [Student's Study Guide and Compu
ter Workbook] que acompaña este libro. caso debe calcular usted m ism o esa ultim a in
Todos los datos de esta sección son ficti formación. Adem ás, para cada caso, calcule un
cios (a menos que se especifique lo contrario). análisis de varianza de un criterio. Observe las
La s respuestas a los ejercicios de la serie I sim ilitudes entre a) el gláety el gl del deno
se encuentran al final del libro. minador de F, b) el punto de corte t y la raíz
cuadrada del punto del corte F , c) >^Comb¡nada y
Grupo Grupo
experimental control Prueba t
N M S2 N M §1 t n e c e s a r io S2 t
v combinada
(0 30 12,0 2,4 30 n ,i 2,8 58 2,004 2,6 2,16
(ii) 36 100 40 36 104 48 70 1,995 44 2,56
(Üi) 16 73 8 16 75 6
3. E l grupo A está formado por 10 perso 6. Explique los vínculos principales entre
nas, cuyos valores observados presentan una la regresión múltiple y el análisis de varianza.
media de 170 y una estimación de la varianza
de 48. E l grupo B también está formado por 10
SERIE li
personas: M = 150, S2 = 32. Realice una prueba
t para medias independientes (dos colas) y un 1. a) Busque y anote el punto de corte F al
análisis de varianza; calcule los dos procedi nivel 0,01 para distribuciones con 1 grado de li
mientos en las mitades de una misma página y bertad en el numerador y 1 0 ,2 0 ,3 0 y 60 grados
disponga los cálculos de forma paralela uno al de libertad en el denominador, b) Calcule la
lado del otro. (E s decir, cree una tabla sim ilar, raíz cuadrada de cada uno y anótela al lado del
en cuanto a diseño, en la parte inferior de la ta corte, c) Busque los puntos de corte de la distri
bla 16-2). U tilice el nivel 0,05. bución t al nivel 0,01 (dos colas), utilizando,
4. C alcule un análisis de varianza con los 1 0 ,2 0 ,3 0 y 60 grados de libertad, y anótelos al
valores que se enumeran a continuación; luego lado de las correspondientes raíces cuadradas
calcule un análisis de regresión, incluyendo el de F. (Lo s resultados deberían ser idénticos, te
correspondiente diagrama de dispersión (y la niendo en cuenta las diferencias de redondeo).
recta de regresión) indicando el coeficiente de
2. A continuación enumeramos tres series
correlación (entre el grupo en el que se encuen
de datos, todos ellos tomados del ejercicio 2,
tran los sujetos y sus valores observados), de
serie II, del capítulo 10. S i no calculó antes las
terminando la reducción proporcional del error
pruebas t para estos datos, hágalo ahora, pero
a través del método extenso en el que se calcu
esta vez utilizando el nivel 0,01 de dos colas.
lan los valores predichos y se determina el error
Luego, en cada caso, calcule además un análi
cuadrático medio utilizando esos valores; por
sis de varianza de un criterio (también al nivel
últim o, confeccione un cuadro que indique las
0,01). Observe las sim ilitudes entre a) e lg í de t
coincidencias de los resultados.
y el gl del denominador de F , b) el punto de
corte t y la raíz cuadrada del punto de corte F ,
G rupo A G rupo B
c > ^Combinada y CM Demro y d > e l v a lo r f y la raíz
13 11 cuadrada de la razón F .
16 7
19 9
18 G ru p o G ru p o
19 ex p e rim e n ta l con trol
5 . C o n lo s v a lo r e s q u e s e e n u m e r a n a c o n t i N M S2 N M S2
L
más de los procedimientos que hemos aprendido a través de este libro. Sin embargo,
a veces aparecerán procedimientos que no se enseñan sino en cursos de estadística
más avanzados. Afortunadamente, esos procedimientos son, por lo general, exten
siones directas de lo que ya hemos aprendido; tal vez no tan directas como para en
tender todos sus detalles y lim itaciones, pero s í para poder comprender la idea general de lo que
se está realizando con los datos resultantes del estudio.
Podemos dividir esos procedimientos estadísticos avanzados en aquellos que se concentran
en las asociaciones entre variables y aquellos que se concentran en las diferencias entre los gru
pos (aunque, tal como hemos aprendido en el capítulo 16, esa distinción es algo artificial). Lo s
procedimientos que trataremos primero se concentran en asociaciones entre variables. Todos
ellos son básicamente extensiones y elaboraciones de lo aprendido en los capítulos 3 y 4 sobre
correlación y regresión. Después de una breve revisión de la regresión m últiple como base de los
demás procedimientos, presentamos las regresión m últiple jerárquica y la gradual, la correla
ción parcial, la conñabilidad, el análisis factorial y el modelo causal. Luego nos abocamos a las
técnicas que se concentran en las diferencias entre grupos. Se trata básicam ente de extensiones
o elaboraciones de lo aprendido en los capítulos 11. a 13 sobre el análisis de varianza. Incluim os
en este grupo a los procedim ientos de análisis de covarianza, análisis de varianza m uitivariado y
an álisis de covarianza m ultivariado. L a controversia del capítulo cuestiona si la estadística de
bería ser controvertida. Finalm ente, concluim os el capítulo con una exposición acerca de cómo
actuar cuando encontramos publicaciones científicas que utilizan técnicas estadísticas que no
conocemos.
BREVE REVISIÓN DE LA CORRELACIÓN Y LA REGRESIÓN MÚLTIPLES
E n el capítulo 4 hemos aprendido la correlación y la regresión m últiples (y en el capítulo 16 he
mos repasado esas técnicas brevemente). L a correlación m últiple se basa en la relación de una va
riable dependiente con la combinación de dos o más variables de predicción. En un ejemplo :
ficticio que utilizam os en el capítulo 4, existía una correlación m últiple (i?) de 0,96 entre el nivel
de estrés experimentado por varios gerentes y la combinación de la cantidad de empleados que
supervisaban, el nivel de ruido en el lugar de trabajo y la cantidad de decisiones que debían tomar
cada mes.
También aprendimos que la regresión m últiple es la predicción de una variable dependiente
sobre la base de dos o más variables de predicción. (Cabe recordar que la regresión es simplemen
te la forma de predicción de la correlación). L a reglas de predicción de la regresión m últiple pre
senta un coeficiente de regresión para cada variable de predicción. S i se conoce el valor obser
vado de una persona en las variables de predicción, se m ultiplica ese valor de cada variable de
predicción por el coeficiente de regresión de esa variable. L a suma de los productos será el valor pre
dicho para esa persona en la variable dependiente. Cuando se trabaja con puntuaciones Z , los coe
ficientes de regresión son coeficientes de regresión estandarizados, denominados valores
ponderados beta (p). Por ejemplo, con tres variables independientes, la ecuación de la regla de
predicción es la siguiente:
¿ r -M ^ J +MzxJ+M zx,)
E n el ejemplo del estrés sufrido por ios gerentes, la regla de predicción de regresión m últiple con
puntuaciones Z era la siguiente:
Cuando se trabaja con puntuaciones originales, el coeficiente de regresión para puntuaciones ori
ginales (b) se m ultiplica por la puntuación original en cada variable de predicción, y se suma la
constante de regresión de puntuaciones originales (a). L a siguiente es la fórmula con tres varia
bles independientes:
E n el ejemplo del estrés de los gerentes, la regla de predicción de regresión m últiple con puntua
ciones originales era la siguiente:
Y = - 4 , 7 0 + ( Ü ,5 6 ) ( E m p le a d o s ) + ( 0 ,6 ) ( R u id o ) + ( 0 , 8 6 ) ( D e c is io n e s )
T a b la 1 7 - 1 .
Coeficientes de regresión, valores R2y cambio en R2, correspondientes a la exposición al combate,
las variables de experiencias en Vietnam y la raza, que predicen el ptsd .
Raza6 -0 ,0 2 4
R2 0,0 7 0 * * * 0 ,171** 0,171**
C a m b io en R 2 0 ,100* 0,001
Tabla 17-2
Predicción del efecto de determinado tratamiento a través de la regresión m últiple jerárquica.
M o d e lo y p a so R 2 T otal gl F P R 2A
Nota,- a j « actividad de las jaquecas; cbcl = Lista de verificación del comportamiento infantil; f e s = Escala de ambien
te familiar.
*p < 0,05.
Fuente: Hermann, C., Blanchard, E. B., & Flor, H. (1997), tab. 5. 'Tratamiento de biorretroalimentacióa para la migra
ña: predicción del efecto del tratamiento”. R e v ista cien tífica d e p s ic o lo g ía d e a seso ra m ien to y c lín ic a (J o u rn a l o f C on
su ltin g a n d C lin ical P sy ch o lo g y ] 65, 611-616. Copyright, 1997, por la Asociación Americana de Psicología, Reimpreso
con autorización.
U tiliza n d o la reg resió n m ú ltip le jerárq uica, s e evalu aron in d ep en d ien tem en te las características
d e l n iñ o (m o d e lo i ) y e l a m b ien te fa m ilia r (m o d e lo 2 ) c o m o fa cto res d e p red icción d el e fe c to del
tratam iento. Para controlar la s d iferen cia s d e la lín ea d e b a se, se in g r e só prim ero la a j previa a la
lín e a d e b a se. L as variables qu e reflejan la s características d el n iñ o y lo s a sp ectos d el fu n c io n a
m ien to fa m ilia r resp ectiv a m en te, fu eron in g resa d o s c o m o ser ie s en e l p a so 2 . . . (pp. 6 1 3 -6 1 4 )
S e c a lc u ló una regresión gradual [...] c o n fin e s e x p lo ra to rio s, com p aran d o en form a d irecta tod as
las variables d e p re d ic c ió n en tre s í, e x c e p to la aj p rev ia a la lín ea d e base. C o m cid en tem en te c o n
e l m o d e lo 1, la e d a d ( j i = 0 , 3 8 ) y la s a flic c io n e s p sic o so m á tic a s (|3 = 0 ,3 9 ) resultaron variab les e x i
tosas para la p re d ic c ió n d e l e fe c to d e l tratam iento, ju stific a n d o e l 35% d el m ism o , F ( 3 , 2 8 ) = 4 ,9 ,
p < 0 ,0 1 (p. 6 1 4 ).
Lo que los autores quieren decir es que, de las diversas variables de predicción (que eran siete), la
proporción de varianza justificada por dos de ellas (edad y aflicciones psicosom áticas) no era au
mentada significativam ente al in cluir también cualquiera de las variables restantes.
1 Técnicamente, lo descripto es una “regresión por pasos hacia adelante". Algunos investigadores prefieren comenzar
con una regla de predicción que incluya todas las variables de predicción para observar luego cuánta capacidad de pre
dicción se pierde al eliminar el factor de predicción menos útil. S i no se pierde mucha capacidad de predicción, se eli
mina la siguiente variable menos útil, y así sucesivamente. El proceso continúa hasta que queda una pequeña serie de
variables cuyo poder de predicción se reduce significativamente al eliminar e l factor de predicción menos útil. Este
procedimiento alternativo se denomina “regresión por pasos hacia atrás". En la mayoría de los casos, las regresiones
por pasos hacia adelante o hacia atrás producen aproximadamente ios m ism os resultados; realmente, la utilización de
uno y otro proceso no denota gran diferencia sino que se trata más bien de una cuestión de preferencia del investigador.
Tabla 17-3.
Proceso de regresión múltiple gradual.
E s preciso hacer ana advertencia en cuanto a la regresión gradual: la fórm ula de predicción re
sultante es el grupo de variables que m ejor predice la variable dependiente, basándose en la
m u estra a n a liza d a . Sin embargo, sucede con frecuencia que cuando se analizan las mismas
variables con una nueva muestra, la m ejor com binación de variables resulta ser, en cierto mo
do, diferente.
CORRELACIÓN PARCIAL
L a co rrelació n p a rcia l es otra técnica ampliamente utilizada en ía psicología de la personalidad
y del desarrollo, en la psicología clín ica y social y en varias otras áreas aplicadas a la psicología.
L a correlación parcial es el grado de asociación entre dos variables, por encim a de la influencia
de otra u otras variables. Supongamos que un investigador necesita saber hasta qué punto el estrés
sufrido por una persona en la vida marital está relacionado con el tiempo que esa persona ha esta
do casada. Sin embargo, el investigador es consciente de que parte de lo que podría relacionar al
estrés marital con el tiempo de casado, es que las personas que llevan más tiempo casadas proba
blemente tengan hijos, y ese hecho podría causar estrés m arital. Por lo tanto, calcular simplemen
te la correlación entre el estrés m arital y el tiempo de m atrim onió sería engañoso; lo que el
investigador necesita saber es la relación que existiría entre el estrés y el tiempo de matrimonio si
todas las parejas tuvieran la misma cantidad de hijos. O , para decirlo de otra manera, el investiga
dor necesita que, de algún modo, la inform ación derivada del estrés y el tiempo de matrimonio no
incluya lo aportado por la cantidad de hijos de ese matrimonio. Lo anterior se logra mediante la
correlación parcial.
En el caso mencionado anteriormente, el investigador calcularía una correlación parcial entre
el estrés m arital y el tiempo de matrimonio m anteniendo constante la cantidad de hijos. E l pro
cedimiento también se describe como exclusión o control de la cantidad de hijos (los términos
“mantener constante” , “excluir” y “controlar” tienen el mismo significado y pueden utilizarse in
distintamente). E l cálculo estadístico real de la correlación parcial se denomina coeficiente de
co rrelació n p a rcia l. Este presenta valores desde el -1 al +1 y se considera igual a una corre
lación común entre dos variables, excepto por el hecho de que existe una tercera variable que es
tá siendo controlada.
E l siguiente es otro modo de ver la correlación parcial: en el ejemplo que hemos estado men
cionando, el investigador podría calcular la correlación entre el estrés y el tiempo de matrimonio
utilizando sólo personas que no tuvieran hijos; luego podría calcular la misma correlación sólo con
aquellos que tienen un sólo hijo, y así sucesivamente. Cada una de esas correlaciones analizadas
independientemente no se ven afectadas por las diferentes cantidades de hijos, ya que entre las
personas estudiadas en cada una de las correlaciones no existe esa diferencia. Después, el investi
gador podría calcular algún tipo de promedio entre las diferentes correlaciones, ninguna de las
cuales ha sido afectada por la cantidad de hijos. E l promedio entre esas correlaciones es la correla
ción parcial. Se trata literalmente de una correlación que mantiene una cantidad constante de hijos.
En realidad, los cálculos de una correlación parcial son bastante directos, y no es necesario
realizar todas esas correlaciones individuales ni el promedio de ellas. Sin.em bargo, el resultado
del proceso es el mismo que si se realizaran esos cálcu lo s.2
L a correlación parcial, en líneas generales, se utiliza para seleccionar una de varias explica
ciones teóricas alternativas de las relaciones entre variables. Supongamos que un investigador
descubre una correlación común entre el estrés marital y el tiempo de matrimonio, y está interesa
do en utilizar ese resultado para sustentar la teoría de que el paso del tiempo hace que las personas
se sientan más estresadas con respecto al matrimonio, ya que cada miembro de la pareja da por
sentado al otro. Sin embargo, el investigador también es consciente de que otra explicación posi
ble sería que cuando las personas llevan más tiempo de casadas, probablemente tienen más hijos,
y el hecho de tener hijos podría crear estrés en el matrimonio. S i se descubre una correlación en
tre el estrés y el tiempo de matrimonio, aun después de controlar la cantidad de hijos, la últim a ex
plicación alternativa referida a la cantidad de hijos se toma improbable.
2 La correlación parcial está muy relacionada con la regresión múltiple. Por ejemplo, un coeficiente de regresión indica
en qué medida una variable en particular es adecuada para predecir la variable dependiente, dado cualquier nivel de to
das las otras variables de ia ecuación. Además, en la regresión múltiple jerárquica, la contribución que surge ai agregar
una variable a aquellas ya incluidas en la ecuación, indica, en efecto, lo que esa variable aporta independientemente de
todas las demás. (El nombre formal de lo que una variable aporta en una regresión- múltiple jerárquica es ia “correlación
semiparciar*), Para comprender de manera general una publicación científica, digamos que la correlación parcial, ei
coeficiente de regresión y ia cantidad aportada por una variable en la regresión jerárquica, indican algo similar: la rela
ción entre dos variables independientemente de otra u otras variables.
T a b la 1 7 -4 .
C o r r e la c ió n b iv a r ia d a y p a r c ia l q u e in d ic a n la s r e la c io n e s e n tr e la s e s c a la s d e r e p r e s ió n e in s e g u r i
d a d y la s p r e o c u p a c io n e s a u to c r ític a s e in t e r p e r s o n a le s .
r B iv a ria d a r P a r c ia l
E sc a la I n te r p e r s o n a l A u to c r ític a I n te r p e r s o n a l A u to c r ític a
R epresión
Padres 0 ,1 2 0 ,2 3 * * * 0 ,0 0 0,18**
M adres 0,08 0 2 3 * ** -0 ,1 2 * 0,14*
inseguridad
Padres 0,2 4 * * * 0,13 0,20** 0 ,0 2
M adres 0 ,3 3 * * * 0,12* 0,29*** - 0 ,0 7
N ota; Análisis de correlaciones parciales que evalúan las relaciones entre la represión {o inseguridad) y las inquietudes ■:
depresivas con control de la inseguridad (o represión) y de la depresión adolescente.
*p < 0,05; * * p < 0 ,0 1 ; ***/? < 0,001.
Fuente: Frank, S. J., Poorman, M. O., & Van Egeren, L. A. (1997), tab. 5. “Percepción con respecto a las relaciones con
sus propios padres por parte de adolescentes internados con preocupaciones depresivas y estado de depresión". Revista'-,
cien tífica d e p s ic o lo g ía clín ic a infantil [J o u rn a l o f C lin ic a l C h ild P sy c h o lo g y ], 26, 2 05-215. Copyright © 1997 por
Lawrence Erlbaum A ssociates, Inc. Reimpreso con autorización.
E l siguiente ejemplo fue tomado de una investigación real: Frank y sus colegas (1997) realizaron
un estudio de las inquietudes depresivas de adolescentes y su relaciones con sus propios padres.
Los investigadores se concentraron en dos aspectos de las inquietudes depresivas: la preocu
pación autocrítica y la preocupación interpersonal. También se concentraron en dos aspectos de
lo que denominaron “conflicto de separación-individuación” con los padres, es decir, en qué me- :
dida los adolescentes percibían represión por parte de sus padres (ejerciendo un fuerte control so
bre sus comportamientos) y hasta qué punto los adolescentes se sentían inseguros con respecto a
sus padres. Frank et al. informaron el resultado de los análisis de la siguiente forma:
D e sp u é s c o rrela cio n a m o s las esca la s d e p ercep ción -in seguridad y rep resión, referid as a lo s pa-
. dres y las m adres, co n lo s valores d e in q u ietu d es autocríticas e in terp erson ales. L a tabla [1 7 -4 ] re
su m e lo s a n á lisis d e correlación bivariada y parcial, E n lo s an álisis p arciales s e co n tro ló un
a sp ecto d e l c o n flic to d e sep aración rín d ivid u acíón [....] y c a d a tip o d e inq uietud d epresiva.
A u n q u e la m a g n itu d d e las co rrela cio n es no e s tan am p lia, e l patrón gen eral d e io s resu ltad os que
m u estra [la] tabla e s sig n ifica tiv o . L o s a d o le sce n tes q u e percib ían q u e lo s padres reprim ían su s in
ten tos d e sep aración presentaban m ás prob ab ilid ad es d e tener in q u ietu d es au tocríticas, m ientras
q u e lo s a d o le sce n tes que reco n o cía n qu e e llo s m ism o s estaban ex p erim en tan d o tem o res y an sie
dades c o n resp ecto a la sep aración presentaban m ás probab ilidad es d e preocu pares por inq uietu
d es interperson ales (p. 2 1 1 ).
CONF1ABIUPAP_________
E s poco común que, en psicología, las medidas sean perfectamente precisas. (Tratamos breve
mente el tema en el capítulo 3 y lo analizamos con más detalle en el apéndice A ). E l grado de co
herencia o estabilidad de una m edición se denomina conñabUidadL En líneas generales,- la
confiab ilid ad im plica hasta qué punto se obtendría el mismo resultado si se hiciera la misma me
dición nuevamente a la misma persona bajo las mismas circunstancias. Calcular la confiabiiidad
de un procedimiento de medición es un tema clave en casi todas las áreas de investigación psico
lógica, sin importar si los procedimientos son cuestionarios, entrevistas, observaciones de com
portamientos, reacciones fisiológicas u otros. Lo s cálculos estadísticos de la confiabiiidad aparecen
con frecuencia en las publicaciones científicas.
Una forma de evaluar la co nfiab iiidad de una m edición es hacerla dos veces con el mismo
grupo de personas, y la correlación entre esas dos pruebas se denomina confiabiiidad por p ru e
ba-reprueba, Sin embargo, este método comúnmente no resulta práctico o apropiado. Por ejem
plo, el método no sena aplicable si, al realizar la pnieba una vez, influye en la realización de la
prueba por segunda vez (como sería el caso de una prueba de inteligencia).
Con muchas m ediciones, tales como la m ayoría de los cuestionarios, también se puede
evaluar la co n fiab iiid ad , correlacionando el valor promedio de una m itad de los ítem s con el
valor promedio de la otra mitad, Por ejem plo, se podría correlacionar el valor de todos los
ítem s im pares con el valor de todos los ítem s pares. S i la persona está respondiendo coheren
temente, deberíamos obtener una correlación alta. Este procedim iento se denomina co nfiab i-
. iid a d p o r d ivisió n en m itades
E l problem a que surge al u tilizar e l método de m itades es el modo en que se las divide.
E n m uchos casos tiene sentido d ivid ir los ítem s en pares e im pares, pero podría ocurrir que
por casualidad esta división diera una correlación dem asiado baja o demasiado alta. A fortu
nadamente, existe una solución más general; se puede d ivid ir la prueba en m itades, de todas
las form as posibles, y calcu lar la correlación utilizando cada una de las d ivisiones. E l prome
dio de esas correlaciones se denomina alfa de C ro n b a ch (a ). (E x iste una fórm ula no dema
siado com pleja para realizar ese procedimiento, que produce el mismo resultado que prom ediar
todas las posibles correlaciones entre m itades. Por supuesto, en la actualidad, alfa ca si siem
pre se calcu la con una computadora).
E l alfa de Cronbach es la medida de co n fiab iiid ad más ampliamente utilizada, y también
se la puede considerar como la descripción del grado en que cada ítem está asociado con cada
uno de los otros ítem s. D escribe la coherencia general de la prueba, es decir, en qué m edi
da las respuestas altas coinciden con las altas y las bajas con las bajas en todos los ítem s de la
prueba.
Generalm ente, en psicología una prueba debería presentar una co n fiab iiid ad (m edida a
través del alfa de Cronbach) de al menos 0 ,7 , y preferentem ente cercana a 0,9, para que la
prueba sea útil. Sin embargo, algunas veces se consideran adecuadas alfas de 0,6 ó m enores.
U n contexto en el cual la co n fiab iiid ad es casi siem pre discutida es en e l de las publica
ciones cien tíficas, cuyo objetivo es, principalm ente, la creación de una nueva m edida. Por
ejem plo, Sellers y sus colegas (1997) desarrollaron un cuestionario para evaluar la identidad
de la raza negra entre am ericanos africanos. A l desarrollar la escala identificaron una canti
dad de aspectos de la identidad de la raza negra, creando un M I8I (Multidimensional Inven
tory of Black Identity, Inventario m ultidim ensional de identidad de la raza negra) que incluye
diversas sub-escalas. Uno de lo s distintos métodos que utilizaron para evaluar la solid ez de la
escala como medida fue determ inar la co n fia b iiid a d de cada sub-escala y, tam bién, hacerlo
con alum nos africanos am ericanos tanto en una universidad para alumnos de raza negra co
mo en otra universidad en la que predom inaban los alum nos de raza blanca. L a tabla 17-5 in
dica los resultados de ese aspecto del estudio. (L a lín ea correspondiente al “interés por lo
público” está en blanco en la tabla, porque era una sub-escala que incluyeron originalm ente
pero luego descartaron durante el proceso de desarrollo de la m edida). Sellers et al. resum en
del siguiente modo los descubrim ientos que presenta la tabla; “L a s versiones revisadas de las
escalas y sub-escalas del m i b i mostraron una adecuada coherencia interna [...] L o s alfas de
Cronbach de las sub-escalas iban desde un 0,60 bajo (aspecto privado) a un 0,79 (nacionalis
m o). L o s alfas eran sim ilares en cada una de las facultades” (p. 810).
T a b la 1 7 -5 .
E s t a d ís tic a d e s c r ip tiv a p a r a el m ibi p o r fa c u lta d y p a r a la m u e s tr a c o m p le ta .
E sc a la a d e C ro n b a ch M SD a d e C ro n b a c h M SD (X d e C ro n b a ch M SD
P osición central 0,77 5,23 1,08 0,78 5,20 1,14 0,75 5,28 0,98
Interés priv. 0,6 0 6,2 5 a 0,7 0 0,55 6,38 0,59 0,61 6,05 0,81
Interés púb. — — — — — — — —
Integración cultural 0,73 4,9 2 a 0,91 0,66 5,16- 0 ,8 0 0,74 4,55 0,94
Hum anista 0 ,7 0 5 ,1 5 a 0,84 0,68 5,33 0 ,8 0 0,69 4,87 0,81
M inoría 0,76 4 ,7 8 a 0 ,8 2 0,75 4,82 0,80 0,77 4,70 0,86
N acionalism o 0,79 4 ,2 7 a 0,99 0,78 4,02 0,96 0,74 4,67 0,90
ANALISIS FACTORIAL
E l a n á lisis fa cto ria l se u tiliza cuando el investigador ha m edido a los participantes con res
pecto a una gran cantidad de variables. E l an álisis factorial índica ai investigador qué varia
bles tienden a agruparse, es decir, qué variables tienden a correlacionarse entre s í y no con
otras. Cada agrupación de ese tipo (grupo de variables) se denom ina facto r. L a conexión rela
tiva de cada una de las variables originales con un factor es la carg a fa c to ria l de esa variable
en ese factor. (L a s variables presentan cargas en todos los factores, pero generalm ente tendrán
cargas altas sólo en uno). L a s cargas factoriales pueden considerarse co'mo la correlación de la
variable con el factor y, al igual que las correlaciones, van desde - 1 , asociación negativa per
fecta con el factor, pasando por 0, ausencia de relación con e l factor, hasta +1, correlación
positiva perfecta con el factor. Normalmente, se considera que una variable contribuye sig n ifi
cativam ente en un factor sólo si presenta aproximadamente una carga de 0,3 ó m ayor (ó de
-0 ,3 ó menor). Algunos investigadores utilizan lo s niveles 0 ,3 5 ,0 ,4 0 , e incluso niveles más al
tos, como norma para decidir si una carga factorial es lo suficientem ente importante como pa
ra considerar que la variable forma parte del factor.
E l análisis factorial en s í mismo incluye una serie de fórmulas relativamente com plejas que
comienzan con las correlaciones entre todas las variables y terminan con una serie de cargas fac
toriales, así como también otros datos, tales como la cantidad de varianza, del total de variación
entre las variables, que son explicadas por cada factor. En realidad existen varios métodos, de al
gún modo diferentes, para realizar un análisis factorial; así, el investigador cuenta con cierta li-
Tabia 17-6,
C argas fa ctoriales de ítem s de la s cu atro su b -esca ia s ideológicas*
N ota: sólo se enumeran las cargas mayores a 0,30, con excepción de los ítems Humanista 9 y Nacionalista 8. Los valo
res en negrita son los predichos por e l mcbi.
Fuente: Sellers, R. M ., et al. (1997), tab. 1. “Inventario muítídimensional de identidad de la raza negra, investigación
preliminar de confiabilidad y validez de constructos”. R e v ista cien tífica d e p s ic o lo g ía so c ia l y d e la p e r s o n a lid a d [ J o u r
n a l o f P erso n a lity a n d S o c ia l P s y c h o lo g y ], 7 3 ,8 0 5 -8 1 5 . Copyright, 1997, por la Asociación Americana de Psicología.
Reimpreso con autorización.
bertad para seleccionar entre una variedad de métodos, cada uno de los cuales puede dar resulta
dos levemente diferentes.
Sin embargo, la parte más subjetiva del análisis factorial reside en el nombre que se le da al
factor. A l leer una publicación científica que inform a acerca de un análisis factorial, primero de
bería analizarse si el nombre que el investigador da a un factor describe adecuadamente las varia
bles que lo conforman. ...
E n el caso del estudio que acabamos de analizar, Sellers et al. también realizaron varios aná
lisis factoriales como parte del desarrollo de su medida de identidad de la raza negra. L a tabla
17-6 indica resultados de un análisis factorial de los ítems de sus cuatro escalas ideológicas. Los
investigadores describen el análisis de la siguiente forma:
La tabla [17-6] presenta la solución con cuatro factores del análisis factorial de las sub-escalas
ideológicas. Debido al modo en el que se realizaron las operaciones con la escala ideológica,
planteamos la hipótesis de que cada sub-escala ideológica se agruparía como un factor único, pero
que podría haber cierta superposición en la solución final y las cargas serían moderadas [...] Para
ser coherentes, y como método para reducir los ítems, se conservaron las nueve cargas superiores
de cada sub-escala. Todas las cargas resultantes, excepto dos, fueron superiores a 0,30, ubicándo
se la mayoría en un rango moderado (de 0,40 a 0,65). En muchos casos, los ítems presentaban car
gas en dos factores, pero la serie de factores de la solución final tenía cargas adecuadas para cada
uno de los ítems de la sub-escala. Los cuatro factores explicaban aproximadamente el 56% de la .
varianza. En unos pocos casos, ítems que tenían cargas adecuadas en los factores de forma cohe
rente con nuestro modelo presentaban, en efecto, una carga más alta en otro factor (p. ej. integra
ción cultural 7, integración cultural 8). E l análisis de los contenidos del ítem sugiere que esos
ítems representan actitudes políticas coherentes con nuestra teoría acerca de las dos ideologías y,
probablemente, presenten cargas altas en ambos factores en estudios subsiguientes (pp. 809-810).
Análisis de senderos
En el an álisis de senderos, el investigador crea un diagrama con flechas que conectan las varia
bles. La s flechas o senderos indican las conexiones causa-efecto entre las'variables según la teo
ría del investigador. Después, el investigador calcula coeficientes de senderos para cada uno de
los senderos. E l coeficiente de senderos es sim ilar a beta en la regresión m últiple: índica en qué
medida un cambio en la variable al comienzo de la flecha se relaciona con un cambio en la varia
ble al final de la flecha. (E l coeficiente se calcula de forma tal que excluye la influencia de cual
quier otra variable que tenga flechas hacia la variable ubicada al final de la misma flecha).
Analicem os el siguiente ejemplo: M acKinnon-Lew is y sus colegas (1997) realizaron un estu
dio examinando las variables de predicción de la aceptación social, por parte de sus pares, de ni
ños de 8 a 10 años de edad. La s principales variables de predicción que utilizaron fueron las
calificaciones de los niños en cuanto a la aceptación o al rechazo de sus padres, las calificaciones
de los pares en cuanto a aceptación y agresión, y los conflictos con hermanos según se observaron
en una interacción experimental. Probaron varios modelos causales diferentes y llegaron a la con
clusión de que el más apropiado era el que llamaron “modelo 1” .
L a figura [1 7 -1 ] rep resen ta grá fica m en te lo s c o e fic ie n te s de sen d ero s estandarizados d el m o d elo
L e in d ic a q u e los herm anos en cu y a s m adres se p ercib ía y o b servab a m ayor rechazo, se reporta
ban y observaban m ás a g resiv o s entre s í qu e a q u ello s herm anos cu y a s m adres m ostraban m enor
r ech a zo . M ás aún, lo s niñ os qu e experim entaban rela cio n es entre herm anos m ás,,agresivas tenían
m ayo res probab ilidad es d e qu e sus pares lo s consideraran a g resiv o s y eran m en o s acep tad os por
e llo s . A u n q u e no s e r ev e ló una in flu en cia paterna directa en la agresivid ad entre herm anos, s í se
e v id e n c ió un e fe c to ind irecto c o m o resultado d el h e c h o d e q u e un a m enor a cep tación paterna esta
ba r ela cio n a d a c o n un m ayor rech a zo por parte d e la m adre (p. 1027).
sólo lo que tienen en común entre sí. L a idea es que lo que tienen en común es el verdadero valor con
respecto a aquéllo de lo cual todas reflejan una parte. (Una variable latente es, en realidad, sim ilar a
un factor en el análisis factorial, en el sentido de que el factor no se mide directamente sino que repre
senta una combinación ponderada de las diferentes variables que lo componen).
Tal como lo indica el ejemplo de la figura 17-2, en el diagrama de senderos de un modelo de
ecuación estructural las variables que realmente se miden por lo general se representan en cuadra
dos o rectángulos, y las variables latentes en círculos u óvalos. Cabe destacar que en la figura las
flechas van desde las variables latentes (las que se encuentran dentro de los círculos) hacia las va
riables medidas (aquellas dentro de los recuadros), para reflejar ia idea de que la variable latente
es la causa im plícita de las variables medidas, siendo estas últim as la m ejor forma posible de me
dir la verdadera variable latente.
También es importante observar que todas las otras flechas conectan variables latentes. En la
m ayoría de los casos, el modelo de ecuación estructural funciona de la siguiente manera: las va
riables medidas se utilizan para suplir las variables latentes, y el análisis se concentra en las rela
ciones causales (los senderos) entre estas últimas. (Finalmente, con respecto a las pequeñas flechas,
que parecen no provenir de ningún lado, diremos que reflejan la existencia de cierto error (otras
causas que no foeron medidas) que también afecta ía variable. Son flechas de “error71o “alteración”
que generalmente se omiten en las publicaciones científicas para que la figura resulte más simple,
pero que de todos modos están im plícitas).
Figura 17-2.
Diagrama de senderos de
un modelo de ecuación estructural
ANÁLISIS DE COVARIANZA
Hasta este punto del capítulo hemos analizado procedimientos estadísticos que hacen hincapié en
las asociaciones entre variables, los cuales son básicamente elaboraciones sofisticadas de la co
rrelación y la regresión. Ahora nos dedicaremos a los procedimientos que se basan en las diferen
cias entre las medias grupales, y que son esencialm ente elaboraciones del análisis de varíanza.
Entre los análisis mencionados anteriormente, una de las elaboraciones más ampliamente uti
lizadas es el a n c o va . En este análisis, el investigador realiza un análisis de varíanza común, pero
antes ajusta las variables de modo de librarse del efecto de algunas variables adicionales no de
seadas. E s decir, el a n c o v a es al análisis de varíanza lo que la correlación parcial es a la correla
ción ordinaria. L a variable controlada o excluida se denomina covariable. E l resto de los
resultados se interpretan como cualquier otro análisis de varíanza.
Analicem os un ejemplo. Capaldi y Patterson (1991) realizaron un estudio acerca de la adap
tación de niños al colegio primario, comparando la adaptación de niños que, desde su nacimiento,
habían experimentado diferentes niveles de “transiciones paternas”. Lo s diferentes niveles de
transición paterna eran los siguientes: ausencia de transición, pérdida del padre, nuevo padrastro
y dos o más padrastros nuevos. Los autores informan, “un a n o v a mostró que existían diferencias
significativas entre los grupos de transición, F(3 ,1 7 0 ) = 7,53, p < 0,001”. (E l patrón formado por
las medias de los cuatro niveles coincidía con lo predicho en cuanto a que, a mayores transiciones
paternas, más insatisfactoria era la adaptación del niño).
Sin embargo, los investigadores eran conscientes de que las fam ilias de los niños que forma
ban los cuatro niveles de transición pertenecían a diferentes s s e (situaciones socio-económ icas) y
tenían diferentes niveles de ingreso. ¿Podrían estas .diferencias, y no las diferencias en cuanto a
niveles de transición, ser la causa im plícita de las diferencias de adaptación?
D e sp u é s, prob am os la h ip ó te sis d e que la s d iferen cias entre lo s grupos d e transición eran funda
m en ta lm en te una fu n c ió n d e las diferencias d e sse e in g r e so s. Para probar e sa p resu n ción s e reali
z ó un anova c o n la s covariab les de sse e in g reso per cápita. La d ifer e n c ia en tre lo s grupos d e
transición co n tin u ó sien d o sig n ifica tiv a , F(5 ,1 6 7 ) = 4 ,0 , p <0 ,0 1 (p p. 4 9 2 -4 9 3 ).
(E l patrón de medias fue el mismo en este análisis que en el original). Aunque ellos no utilizaroh
el término específico, un a n o v a con covariables es un anáfisis de covarianza.
S e realizaron a n á lisis d e varianza m u ltiv a ria d o y u n ivariado c o n lo s in d ica d o resjd e resp ald o de
a sp e c to s n eg a tiv o s y d e in tim id a d c o n r esp e c to a a m ig o s c er c a n o s, fam ilia res y parejas d e c o n v i
v e n c ia . L a tab la [1 7 -7 ] in d ic a lo s v a lo r e s m e d io s , la s p ruebas d e d ife r e n c ia s y lo s con trastes s ig
n ifica tiv o s.
S e encontraron diferencias significativas entre los tipos de relación manova de los indicadores,
F(20,254) = 4,10,P < 0,001 (p. 340).
T a b la 1 7 -7 .
Medias y desvíos estándar de los indicadores de constructo según el tipo de relación con el confidente.
N ota: rts = 6 5 ,3 3 y 40 para cada tipo de relación, es decir, amigos, familiares y parejas respectivamente.
**p <0,01; ***p < 0,001.
Fuente: DeGarmo, D. S., & Forgatch, M . S. (1997), tab. 2. “Determinantes del respaldo observado en el confidente hacia
Jas madres divorciadas”: R ev ista C ien tífica d e P sic o lo g ía S o c ia l y d e la P e r so n a lid a d ( J o u rn a l o f P erso n a lity a n d S o c ia l
P sy c h o lo g y ), 7 2 ,3 3 6 -3 4 5 . Copyright, 1997, por la Asociación Americana de Psicología. Reimpreso con autorización.
DeGarm o y Forgatch debatieron después los resultados del análisis de varianza univariado y los
contrastes subsiguientes. Por ejem plo, observaron que el “análisis de varianza mostró un patrón
según ei cual se observaba que las parejas proporcionaban menor respaldo” (p. 340).
Un análisis de covarianza en el que existe más de una variable dependiente se denomina ,
mancova . L a diferencia entre un m a n c o v a y un análisis de covarianza común es, precisamente,
Tabla 17-8,
Principales técnicas estadísticas.
A so c ia c ió n C a n tid a d de C a n tid ad de ¿ S e co n tr o la
0 V ariables V ariables a lgu n a N om bre de
d iferen cia in d ep en d ien tes d ep en d ien tes variab le? la té c n ic a
A sociación 1 1 No Correlación/regresión
bivaribles
A so cia ció n M uchas, con patrones causales esp ecificad os A nálisis de senderos
D iseño de ecuación
Demos una última mirada a la historia del de Pearson, con el ñn de acariciar las plu- L
desarrollo de métodos estadísticos en el mas del pájaro que se retiraba. Q v Lí
área de la psicología. D e esta manera será , - : Por más firm eza que Pearson y su ami-
posible agregar algunos datos interesantes,. ■ > go Neyman hayan puesto para intentar eyi-'::.-?y=
Y a dijim os en el cuadro 1.1-1,. que, S ir Ro- .. tar la continuación de la vieja enemistad
nald Fish er prácticamente inventó él méto entre S ir Ronald y su colega de m ayor edad. ;
do experim ental tal. cómo se utiliza en la Pearson, pronto, el. enfrentamiento se tomó '
actualidad; que el método surgid de su tra ipás punzante qpe nunca. E n realidad, Pearr .
bajó en la agricultura (principalmente so- . son y N eym aii estaban , mucho más dé C
bre la fertilidad deí suelo, el peso de los acuerdo en .muchos aspectos con las ideas ;
cerdos y el efecto deí abono en lás planta-, de Fisher que con las de K a rl Pearson, pe- L :
clones de papas); que era un hombre con ■. ro sus extensiones y elaboraciones de los •
métodos de Fisher, aunque pretendían' ser. . •
quien resultaba d ifícil congeniar, y que F is- ■
cordiales, enfurecían al malhumorado Sir :
her y otro gran estadístico británico, K arl
Ronald (después de todo, el alumno no que- é:
Pearson, eran enemigos, y. :;;) ':, (y f,
■■
■' rrá cam biar su especializáción por historia, .
Bien. Pearson tenia un hijo, Egon, quien , :
¡recordar correctamente estos nombres es ■ .
trabajaba en e! Laboratorio Galton, precedi-
. al menos tan. d ifícil com o;lo fue aprender'
do por su padre, en la Facultad de la Univer-
estadística!). '' . ’. ■(
sidad,:en Londres. E n 1925, el joven Egon -,
' : ■ ¿ Qué se discutía? Para sim p lificar una
formó una amistad, perdurable con Jerzy ■
serie de ideas m uy com plejas, diremos que
Neyman, un joven catedrático de la Univer
' Fisher había rechazado lo que se denomina
sidad de Varsovia que acababa de llegar al. ; la teoría bayesiana, un enfoque global so-
Laboratorio Galton. En los años siguientes, , bré la estadística que hemos mencionado en
los dos trabajarían muy estrechamente; /■ ■v;' -;/-; ■
' ^ el capituló 5, el cual sostiene que la inves- ''1
E n 1933, Karl-Pearson se retiró..Iróni ligación científica se realiza para adaptar
camente, Fisher recibió el antiguo puesto opiniones preexistentes en vista de las nue- '
de Pearson como jefe del Departamento de vas evidencias a medida que se recolectan, •
Eugenesia, originalmente fundado por G al ' E n desacuerdo, Fisher sostenía que la infe- ;
ton. Como resultado dé la enemistad entre rencía inductiva se realiza principalm ente ,'
Fisher y su colega de mayor edad, Pearson, . desaprobando objetivamente la hipótesis
se creó un nuevo Departamento de Estadís- :■ nula, y no probando probabilidades previas
tica que estaría al mando de Egon, el hijo . a las que se había arrivado subjetivamente.
Fisher era excepcionalmente dogmático con. de un plan quinquenal p a ra la nación”- y,
respecto a sus-'ideas, refiriéndose a su méto además, comentó sarcásticamente después',
do como “absolutamente riguroso” y “per- . de qué Neyman finalizara su discurso fren
fectamente riguroso”; lo llamaba el único te a la Royal Statìstica! Society (R eal So
caso de “inferencia inequívoca” ; tema, una ciedad de Estadística) en Londres, que
gran mente y escribió muchísimo, haciéndo Neym an1 debería haber elegido., un téma.-;:
se muy influyente en el mundo entero, “sobre el cual pudierá hablar con autori
Pearson y Neyman también rechazaron dad”. Neyman, por su parte, declaró que
la teoría bayesiana, pero propusieron el los métodos de prueba de Fishér eran “en
método de prueba de dos hipótesis opues un sentido matemáticamente éspecificable,
tas en lugar de una sola hipótesis .nula. C o peores que inútiles”, jA h, qué.racíonal! ;
mo resultado de esa innovación, habría dos , S i bien el debate actual acerca del rol
tipos de errores: los errores Tipp I serían ■de la prueba de significación en el área de ■
aquellos en los que la hipótesis nula sé re- .; la psicología {véase las; secciones de^Con-y
chaza aun cuando es verdadera (y á la pro-:. : troversias” de los' capítulos 6r8) no es.ian ..
habilidad de ese error la denominarón alfa: estridente,: sí conserva algo de la résoriaii-
o nivel de sigm ficáción, ¿resülta fam iliär?) eia de los viejos tiem pos; Por ejemplo, dos -
Lo s errores Tipo I I serían aquellos en los '.
de los principales contendientes (Schm idt
que la hipótesis de investigación sé rechaza
& Hunter, 1997) comentan que “todas, tes
aun cuando es verdadera (y la probabilidad
objeciones” a los argumentos a favor de ,
de ese error era beta. ¿Esto.tam bién reáúlta .
su posición “son lógicamente deficientes.”
fam iliar? E l impacto de cada tipo de error, ,
. (p. 3 8) y ,que, '‘aunque cada una dé estas; ¡
en el objetivo del investigador, indicaría
o.bjeciones parecé plausible.e inélusó con
cuál de ellos era preferible miniinizar, yaque
vincente para, muchos investigadores, en ,..
Neyman y Pearson pensaban con ffecüénciá
realidad son un fracaso lógica; e íntelécr .
en términos de investigación aplicada. Fisher
tüalmente” (pp. 61-62). En un artículo puy::
nunca mencionó ninguna hipótesis excépto
biicádó casi ai mismo tiempo, dos de. lo s .
la nula y, por lo tanto, nunca tuvo en cuenta
. principales contendientes del lado opuesto
ios errores Tipo II. ■
(Cortina & Dunlap, 1997) describieron los . :
Ahora queda claro lo qué sucedió: la é s - .
tadística es un híbrido de las ideas de Fisher argumentos del otro lado cómo “construi
con las de Pearson y Neyman, las. últimas dos sobre supuestos defectuosos, ejemplos'
agregadas cuando ya no pudieron i^riorarsé. •. engañosos y errores en cuanto. a : cierto s;
E l concepto de probar la hipótesis nula pro : conceptos críticos” (p ; 170)..Lo s comentar
viene dé Fisher; los conceptos algo menós . :rio s que hemos escuchado dé ambos, ládós; F
influyentes de error Tipo II, bétá, poteheia • en ambientes menos forinales, han sido aún.
y tamaño del ¿fécto/de sus enemigós más menos contenidos: ■.. -‘ v / •:.■; . ■? ;; • ): •
jó ven es.-. v■ : Como- puede observarse,, a. través de ,
Fue una asociación que probablem en las historias relatadas en los cuadros de es- ■
te ninguno de ellos hubiera ápróbadoV ya te libro, la estadística es, pára bien o para
que, con el tiempo, ambos: lados conside m alj producto del intelecto y dq las pasió- ”
raron sus propios métodos fundamentalmen nes humanas funcionando en forma con-
te opuestos a los del otro. Fisher comparaba ' junta (idealmente, por el bien dé la ciencia,
a Neyman y a Pearson con el estereotipo de aunque la últim a en menor grado). Lo s re
los soviéticos de su tiempo, en cuanto a su sultados no siempre han sido perfectos,
determinación de reducir la ciencia a la tec pero pueden resultar mucho más interesan
nología '‘en el amplio esfuerzo, organizado. ■ tes de. lo. que parecerían á primera vista. :
CÓMO LEER RESULTADOS EN PUBLICACIONES CIENTÍFICAS
QUE INCLUYEN TÉCNICAS ESTADÍSTICAS QUE NO NOS
RESULTAN FAMILIARES
Sobre la base de lo aprendido en este capítulo y en todo el libro, el alumno debería estar bien pre
parado para leer y comprender, al menos en forma general, los resultados de la m ayoría de las pu
blicaciones científicas psicológicas. Sin embargo, de cuando en cuando se encontrará con nuevas
técnicas (y a veces nombres no fam iliares para viejas técnicas). L e sucede incluso a investigado
res experimentados. ¿Qué debemos hacer entonces cuando nos encontramos con elementos de los.
que nunca hemos escuchado hablar?
E l prim er paso es no desesperarse. En la m ayoría de los casos puede deducirse la idea básica.
C a si siempre se establecerá el nivel p y debería indicarse claram ente el patrón de resultados que
se considera significativo o no. Además, generalmente habrá algún indicio acerca del tamaño del
efecto, del grado de asociación o de ía magnitud de la diferencia. S i la técnica estadística se refie
re a la asociación entre algunas variables, probablemente sea más fuerte a medida que el resultado
se acerque a 1, y más débil a medida que el resultado se acerque a 0. E n una situación de este tipo
no debemos esperar comprender cada palabra, sino intentar captar lo que sea posible con respec
to al significado del resultado.
Analicem os un ejemplo. Biem at y Wortman (1991) realizaron un estudio acerca de la vida
hogareña de mujeres profesionales. Cerca del comienzo de la sección de resultados, los investiga
dores mencionan que, en algunos de sus análisis, compararán m ujeres académicas con mujeres de
negocios. Por lo tanto, explican, controlaron si las variables a comparar aparentemente cumplían
el supuesto de iguales varianzas poblacionales. Con respecto a una variable, comentaron: “L a va
riabilidad en la educación era mayor en el caso de las m ujeres de negocios (SD = 1,26) que en el
de las mujeres académicas (SD ~0,12), C de Cochran (2 ,1 3 6 ) = 0,99, p <0,0001”. (p. 848)
Probablemente, el alumno que se encuentre con el inform e anterior nunca haya escuchado
hablar de la “ C de Cochran” . Sin embargo, por el contexto, puede im aginarse que se trata de
una prueba de significación que compara la variabilidad de dos grupos. Probablemente no pue
da calcu lar lo que significan exactamente las cifras entre paréntesis despúes de C de Cochran, o
a que se refiere el 0,99, pero sí puede comprender e l *‘p < 0,0001”, que indica que la diferencia
de variabilidad entre los dos grupos es significativa. Podría llegar aún más lejos y observar di
rectamente los dos desvíos estándar, que dan una idea bastante clara de lo muy diferentes que
son las variabilidades en los dos grupos,
Supongamos que el alumno realmente no pueda captar absolutamente nada de una técnica es
tadística utilizada en una publicación científica. En ese caso, puede intentar buscar el procedi
miento en un libro de estadística. Los libros de estadística intermedia y avanzada a veces son una
buena opción, aunque hay que ser conscientes de que intentar comprender un texto de nivel inter
medio, sin ayuda, puede resultar d ifícil. M uchos de esos textos tienen una orientación fundamen
talmente matemática, incluso los textos más accesible utilizarán cada uno sus propios símbolos;
por lo tanto, puede resultar d ifícil comprender sus descripciones de un método en particular sin
haber leído todo el libro. Una mejor solución, en este caso, tal vez sea pedir ayuda a un profesor o
alumno graduado en el campo en cuestión. S i el alumno conoce los principios básicos aprendidos
a través de este libro, estará preparado para comprender los principios fundamentales de las expli
caciones que reciba.
S i el alumno se encuentra a menudo con técnicas estadísticas que no comprende, la mejor so
lución es asistir a otros cursos de estadística. E l siguiente curso, en la mayoría de los programas,
en el área de la psicología, es un curso intermedio que se concentra principalmente en el análisis
de varíanza, y puede llegar a abarcar hasta cierto nivel de la regresión múltiple. Estos tipos de cur
sos serán particularmente útiles para ios alumnos que tengan intenciones de realizar un posgrado
en psicología, en donde la estadística será una herramienta crucial en todas las investigaciones
que realicen. Cursos de ese tipo los ayudarán a prepararse para el posgrado. Adem ás, un buen de
sempeño en ese tipo de cursos produce una im presión extremadamente bugna en aquellos que
evalúan las solicitudes de ingreso a los mejores programas para graduados. (También podemos
decir que, según nuestra experiencia, lo más probable es que el alumno disfrute con los otros estu
diantes que conozcan en esos cursos. Lo s alumnos que asisten a cursos intermedios de estadística
aplicada a la psicología no son todos fenómenos de las estadísticas, pero casi siem pre son alum
nos m uy motivados y brillantes que seguramente compartirán los objetivos del lector). D e hecho,
a algunas personas, la estadística le resulta tan fascinante ;que deciden hacer de ella una carrera!
E n líneas más generales, constantemente se están inventando nuevos métodos estadísticos.
Todos los psicólogos encuentran en las publicaciones científicas que leen números y símbolos
que no le son fam iliares; pero finalmente los resuelven del mismo modo que lo hará el lector. Y
tenemos plena confianza en ello debido a que ha llegado ileso y bien preparado a las útlimas pági
nas de este libro. Ha dominado la introducción detallada de un tema com plejo; por ello, debería
confiar en que con un poco de tiempo y esmero será capaz de comprender cualquier otro tema de
estadística más avanzado. Por eso queremos felicitar al lector por sus logros. ■
Resumen
En la regresión múltiple jerárquica, las variables de predicción se incluyen en la regla de predic
ción en forma planificada y secuencial, permitiendo al investigador determinar la contribución re
lativa de cada variable siguiente por encim a de aquellas ya incluidas. L a regresión m últiple por
pasos es un procedimiento de exploración en el que se examinan las potenciales variables de pre
dicción para encontrar la mejor variable de predicción; luego se examinan las variables restantes
para encontrar la variable de predicción que, en combinación con la prim era, produce la m ejor
predicción. E l proceso continúa hasta que agregar la m ejor variable restante no aporta ninguna
mejora significativa.
L a correlación parcial describe el grado de correlación entre dos variables a la vez, que man
tiene constante otra u otras variables.
L o s coeficientes de confiabilidad indican en qué medida las puntuaciones de una prueba son
internamente coherentes (usualmente con el alfa de Cronbach) o coherentes a través del tiempo
(confiabilidad por prueba y reprueba).
E l análisis factorial identifica agrupaciones de variables que se correlacionan en el máximo
grado posible entre sí, y en el mínimo grado posible con otras variables.
E l análisis causal examina si las correlaciones entre diversas variables son coherentes con un
patrón sistem ático e hipotético de relaciones causales entre ellas. E l análisis de senderos describe
esas relaciones con flechas que van desde la causa al efecto, con un coeficiente de senderos para
cada flecha que indica la influencia de la hipotética variable causal en la hipotética variable de
efecto. E l modelo de ecuación estructural es una versión avanzada del análisis de senderos, que
incluye variables latentes teóricas que no son medidas (cada una de las cuales está formada por
los elementos comunes de diversas variables m edidas). E l modelo también ofrece medidas de la
concordancia general de los datos con el patrón causal hipotético.
E l an álisis de covarianza es un an álisis de varianza que controla una o más variables. E l
an álisis de varianza m ultivariado es un an álisis de varianza con dos o más variables depen
dientes. E l an álisis de covarianza m ultivariado es un an álisis de covarianza con dos o más va
riables dependientes.
E n los últimos años, los psicólogos han comenzado a reexam inar ios principios básicos de la esta
dística que utilizam os creando la posibilidad de controversia acerca de aquello que, con frecuen
cia, había sido considerado incontrovertible en el pasado.
E n general, es posible captar la idea principal de un procedimiento estadístico no fam iliar te
niendo presente que probablemente se refiere a asociaciones entre variables o diferencias entre
grupos, que el valor p indica la significación de esa asociación o diferencia, y que probablemente
el procedimiento incluya algunos números a partir de los cuales podamos tener una idea del grado
de asociación o diferencia,
Términos clave
- ANCOVA.. - Mantener constante. -A n á lis is de senderos.
- Controlar. -V a riab le latente. - Coeficiente de senderos.
- Covariable. - L isre l. - Confiabilidad.
- A lfa de Cronbach (a ). - MANCOVA. - Confiabilidad por
~ Factor. - MANOVA. división en mitades.
- A nálisis factorial. - Estadística multivariada. - Regresión m últiple gradual.
- Carga factorial. - Correlación parcial. - Modelo de ecuación
~ índice de concordancia. - Coeficiente de estructural.
- Regresión múltiple correlación parcial. ~ Confiabiiídad por
jerárquica. - Exclu ir. prueba y reprueba.
Ejercicios
E n los ejercicios 1 al 5 de la serie I, y en los vida social de niños en edad preescolar. En el
ejercicios 1 al 4 de la serie II, se espera que elestudio, cada niño o niña era observado inte
alumno explique sólo el significado general ractuando con su padre en una situación es
de los resultados en la forma en que los dife tandarizada. L a s interacciones se clasificaban
rentes métodos fueron descriptos a lo largo de forma tal que producían m edidas sobre
del capítulo. Por supuesto que no se espera quién in iciab a las actividades de juego ade
que el alumno describa la lógica de los proce más de la reciprocidad (equilibrio) en el cum
dimientos estadísticos tratados aquí del m is plim iento de la in iciativa de juego del otro.
mo modo en el que lo ha estado haciendo en Lo s investigadores también pidieron a los m aes
los capítulos anteriores. tros del niño que calificaran la capacidad de
E n la últim a parte del libro se indican las cada niño para integrarse a la vida social con
respuestas a la serie I de ejercicios. los otros niños de la ecuela. Descubrieron co
rrelaciones entre la reciprocidad padre-hijo y
la capacidad del niño para integrarse a la vida
SERIE I
so cial. Sin embargo, íes preocupaba saber
1. Parte de un estudio realizado por Lin hasta
d- qué punto la medida de reciprocidad po
zey et al, (1997) examinaba de qué modo la dría estar m ezclada con el grado en el que los
reciprocidad en la interacción entre padre e niños y los padres tomaban la in iciativa indi
hijo predecía la capacidad de integrarse a la vidualmente.
Por ende, realizamos una serie de análisis traumáticos que habían experimentado (p. ej.
de regresión jerárquica para analizar si el cum torturas). Como se esperaba, la cantidad de sín
plimiento recíproco de padre e hijo [...] aporta tomas p t s d estaba correlacionada con la canti
ba contribuciones únicas a la predicción de la dad de hechos traumáticos. En un análisis
capacidad del niño para adaptarse a la vida so más amplio del patrón de síntomas (qué sínto
cial después de tener en cuenta el comporta mas se agrupan entre sí), realizaron un análi
miento de cada individuo [...] Los índices de sis factorial a través del cual obtuvieron cuatro
iniciativa del padre y del niño fueron ingresa factores.
dos en primer lugar y justificaban el 3% de la De acuerdo con el d s m - i v , los primeros
varianza (p = 0,57). El cumplimiento recíproco tres factores representaban dimensiones de an
de padre e hijo fue ingresado en segundo lugar siedad, evación y repetición de la experiencia
y justificaba un significativo 18% adicional respectivamente {véase tabla [17-9]. Sin em
(p = 0,01) de la vari.anza de la calificación rea bargo, en contraposición con las sub-catego-
lizada por ios maestros en cuanto a la capaci rías definidas en el d s m - i v , según las cuales la
dad de los niños para integrarse socialmente, evación representa una dimensión de sintoma-
ípp. 532-533). tología, en esta muestra, la evación parecía es
Explique el método y el resultado a una tar separada en dos factores. El segundo factor
persona que en general está familiarizada con reflejaba la evación relacionada con el replie
la regresión múltiple común pero que nunca ha gue general o el entorpecimiento de la sensibi
escuchado hablar de la regresión múltiple je lidad, con altas cargas factoriales en los ítems
rárquica. “incapacidad de sentir emociones” y “menor
2. Boyd y Gullone (1997) realizaron un es interés en las actividades diarias”. El cuarto
tudio acerca de la angustia y la depresión con factor reflejaba evación de estímulos relacio
una muestra de 783 adolescentes que asistían a nados con el o los hechos traumáticos (p. 104).
la escuela en Melboume y sus alrededores, en Explique los resultados a una persona que
Australia. Para medir la angustia utilizaron la está familiarizada con la correlación pero no
R C M A S (Revísed Children's Manifest Anxiety sabe nada acerca de análisis factorial.
Scale, Versión revisada de la escala de angustia 4. Aron et al. (1998) realizaron un estudio
manifiesta en niños). Al tratar la medida en la acerca de las experiencias del amor no corres
sección Métodos, los investigadores realizaron pondido, es decir, amar a alguien que no nos
la siguiente observación; “Las estimaciones de ama. Una de las predicciones se concentró en
confiabiüdad del coeficiente alfa, en cuanto a la intensidad.de la experiencia (cuánto piensa
la coherencia interna de la r o m a s , iban de 0,42 uno en ello, cuánto altera nuestras vidas). Los
a 0,87” (p. 192). Explique los resultados a al investigadores elaboraron la hipótesis de que la
guien que está familiarizado con la correlación intensidad podría predecirse a través de la cali
pero que nunca ha escuchado hablar de la con dad de deseable de la relación (en qué medida
fiabilidad o de los cálculos estadísticos relacio la persona enamorada percibía que sería mara
nados con ella. villoso tener una relación con la persona amada),
3. Fawzi et al. (1997) realizaron un estudio la probabilidad (en qué medida el enamorado
para evaluar si la manera usual de conceptuar sentía que el ser amado lo había llevado a creer
el p t s d , tal como lo describe la cuarta edición que podría desarrollarse una relación) y el
del Manual estadístico y de diagnóstico de deseo del estado (en qué medida el enamora
trastornos mentales [Diagnostic and Statisti- do sentía que era deseable estar enamorado,
cal Manual o f Mental Disorders] ( d s m - i v ) , se aun cuando ese amor no fuera correspondi
aplica a refugiados vietnamitas en los Estados do). Además, los investigadores plantearon la
Unidos. Como parte del estudio, se entrevista hipótesis de que el patrón de relación de las
ron 74 refugiados (en su lengua nativa) con tres variables con la intensidad variaría con
respecto a varios síntomas p t s d y a los hechos forme al estilo usual de vinculación afectiva
del enamorado (seguro, evasivo o ansioso-am- amenazas, aceptación de la situación y arbitra
bivalente, según lo tratado en el capítulo 11). je (p. 41),
Aron et al. realizaron un análisis de cada grupo Explique los resultados a alguien que com
a través del modelo de ecuación estructural. La prende el análisis factorial de varianza pero no
figura 17-4 indica los resultados. el análisis multivariado de varianza,
a) Explique el patrón de resultados, b) Uti ó. ¿Cuál seria la técnica estadística más
lizando este diagrama como ejemplo, explique apropiada para cada uno de los siguientes estu
los principios generales de la interpretación de dios ficticios?
un diagrama de senderos (incluso las limitacio a) Un estudio en el que el investigador sos
nes) a una persona que comprende la regresión tiene una compleja teoría sobre el patrón de
múltiple en general pero no conoce los diagra causa y efecto entre diversas variables.
mas de senderos o los modelos de ecuación es b) Un estudio del grado de asociación en
tructural. tre dos variables.
5. Gire (1997) analizó los métodos preferi c) Un estudio para determinar si una medi
dos para la resolución de conflictos, compa da es internamente coherente y consistente a lo
rando personas de culturas individualistas con largo del tiempo en cuanto a dar el mismo re
otras de culturas colectivistas. Los participan sultado.
tes eran 90 nigerianos (Nigeria fue considerada d) Un diseño factorial de 3 x 2 con tres va
un ejemplo de sociedad relativamente colecti riables dependientes.
vista) y 95 canadienses (Canadá fue consi e) Un estudio en el que se han medido siete
derada un ejemplo de sociedad relativamente
variables que se consideran variables de pre
individualista). Todos los participantes contes
dicción de determinada variable dependiente y
taron preguntas acerca de sus preferencias en
el investigador desea determinar qué variables
cuanto a cada uno de cinco métodos de reso
contribuyen significativamente a la predicción
lución de conflictos. La mitad de los partici
(pero no tiene ninguna teoría acerca de cuáles
pantes de cada país contestó las preguntas
tienen mayores probabilidades de ser las más
referidas a un conflicto interpersonal (un con
significativas).
flicto entre dos vecinos) y, la otra mitad, tas re
f) Un estudio en el que el investigador
lacionadas con un conflicto íntergrupal (entre
dos grupos de vecinos). El resultado del proce mide 16 variables en una gran cantidad de
dimiento fue un diseño factorial 2 (culturas) x 2 participantes y desea averiguar si existen
(conflicto interpersonal vs conflicto intergru- agrupaciones de variables implícitas más
pal), con cinco medidas de preferencias para la simple,
resolución de conflictos. g) Un estudio en el que se comparan un
Los datos fueron analizados utilizando grupo experimental y un grupo de control se
m a n o v a , El m a n o v a reveló en dos sentidos un
gún una sola variable dependiente,
efecto esencial significativo de ía cultura F(5, h) Un estudio que compara cinco grupos
173) = 6,37, p < 0,001. El estudio del análisis de individuos conforme a una sola variable de
unívariado y de las medias sugiere que los ni pendiente.
gerianos preferían la negociación mucho más i) Un estudio en el que el investigador es
que los canadienses, mientras que ocurría lo tá analizando el efecto de diversas variables
contrario con el arbitraje, conforme a lo que se de predicción en una sola variable dependien
había predicho. También hubo un resultado te, tiene una teoría específica acerca de la im
significativo de la cultura por tipo de interac portancia relativa de dichas variables, y desea
ción conflictiva, F(5 ,173) ~ 3,84, p < 0,002. El verificar si cada variable de predicción agre
análisis unívariado y las medias, que se indican gada sucesivamente aporta algún elemento a
en la tabla [17-10], revelan que existieron dife la predicción lograda a través de las variables
rencias significativas en tres procedimientos: anteriores.
Tabla 17-9.
Cargas factoriales del análisis de los componentes principales de los síntomas de rao,
según el d s m - i v , en 74 refugiados vietnamitas.
Carga -i
Dimensión sintomática Factorial
Ansiedad
Pesadillas recurrentes 0,79
D ificultad para concentrarse 0,78
Irritabilidad/ataques de ira 0,77
Incapacidad a recordar partes de lo s h echos m ás traumáticos 0 ,7 4
Problem as de in som io 0,73
Evitar actividades que recuerdan e l h ech o traumático OJO
N erviosism o, facilidad para sobresaltarse 0,67
Evasión/abstinencia
Incapacidad a sentir em ociones 0,79
M enor interés en las actividades diarias 0 ,7 0
Sentim iento de indiferencia o abstinencia 0,65
N erviosism o, facilidad para sobresaltarse 0,51
Sensación d e qu e uno no tiene futuro 0,51
R epetición de la experiencia
Pensam ientos o recuerdos recurrentes de lo s hechos más terribles 0,83
Sensación de que e l hecho está suced ien do nuevam ente 0,83
R eacción em ocional o física repentina cuando se íe recuerdan
lo s hechos más traumáticos 0,57
Fuente: Fawzi, M . C. S., et al. (1997), tab. 1. “Validez del estrés postraumático entre refugiados vietnamitas”. R ev ista
C ien tífica d e Estrés T raum ático [J o u rn a l o fT ra u m a tic Stress}, 10,105. Copyright, 1997, por la Sociedad Internacional
de Estudios del Estrés Traumático. Reimpreso con autorización.
Figura 17-4.
[Figura 2 de Aron et al.
(en impresión),
“M otivaciones para el
amor no correspondido”
B o le tín d e P s ic o lo g ía
s o c ia l y d e la p e r s o n a li-
d a d . [P e r s o n a lity a n d
S o c ia l P s y c h o lo g y B u l
letin. ]
ISlilllI
:íÍlS:llIfilI
SERIE H te r e s a d o s e n sa b e r s i la r e la c ió n e n tr e la e s
c a la pas y d iv e r sa s s e n s ib ilid a d e s e s p e c íf ic a s
1. Aron & Aron (1997) realizaron un estu
p e r m a n e c e r ía a u n d e s p u é s d e c o n t r o la r la
dio concentrándose en las personas altamente
e m o c i o n a l i d a d e n g e n e r a l^ y a d e m á s s i la r e
sensibles a la estimulación. Los individuos l a c i ó n d e l a e m o c i o n a l i d a d c o n r e a c c i o n e s
mencionados tienden a descubrir sutilezas y e m o c i o n a l e s e s p e c í f i c a s p e r m a n e c e r í a d e s
notar cosas que otros pasan por alto, por lo p u é s d e c o n t r o l a r l a s e n s i b i l i d a d .
cual puede encontrárselos en mayor medida Como lo indica la tabla [17-11], la ma
entre los artistas y otros tipos de personas yoría de las correlaciones entre las variables
talentosas. Por otro lado, esa misma sensibi relacionadas con la sensibilidad y la escala
lidad hace que estos individuos sufran, con p a s continuaron siendo significativas o casi-
más facilidad, de exceso de ansiedad. Lo que significativas después de excluir la medida
para las personas en general es un nivel nor de emocionalidad [,..] Además [...] diver
mal de estimulación, con frecuendia resulta sas variables pertinentes (p. ej. sentimien
estresante para los individuos altamente sen tos emergentes) presentaban asociaciones
sibles. Aparentemente, como resultado de lo únicas o exclusivas con la emocionalildad)
anterior, algunas p a s presentan niveles de (p. 354).
emocionalidad (angustia y depresión) más Explique el método y el resultado des-
altos que lo usual. Como parte del estudio en criptos anteriormente a una persona que está
cuestión, los investigadores deseaban inves familiarizada con la correlación y, en forma
tigar si la sensibilidad era independiente de general, con la regresión múltiple común,
la emocionalidad. Por lo tanto, hicieron que pero que nunca ha oído hablar de la correla
un gran grupo de participantes completara ción parcial.
cuestionarios acerca de sensibilidad y emo 2. Shapiro et al. (1997) realizaron un estu
cionalidad, junto con una serie de preguntas dio para desarrollar una medida de las actitudes
sobre diversas sensibilidades específicas y de los niños hacia las armas y la violencia. La
reacciones emocionales también específicas. primera medida que desarrollaron tema 61
Los investigadores estaban especialmente in ítems, e informaron que ios análisis que reali-
Tabla 17-10.
Preferencias en cuanto a método como función de la cultura y el tipo de conflicto
Nigerianos Canadienses
M éto d o IP IG IP IG
A m enazas* 2 ,0 9 1,50 1,35 1,61
A ceptación déla situación* 2 ,7 2 3 ,1 6 3,43 2,71
N eg o cia ció n 6,07 6,11 5 ,5 6 5 ,6 4
M ediación 4 ,7 0 4,77 4,87 5,13
Arbitraje* 3,05 4 ,9 0 5,20 5,42
N ota: Un asterisco {*) índica que las medias de ta cultura por tipo de interacción conflictiva en cuanto a determinado
método fueron significativas al nivel p < 0,05. A mayor número, mayor la preferencia por el método. íp (Interpersonal
Conflict, Conflicto Interpersonal); IG ( Intergrupal Conflict, Conflicto intergrupal).
Fuente: Gire, J. T. (1997), tab. i. “El efecto variante de! individualismo-colectivismo con respecto a los métodos prefe
ridos para la resolución de conflictos”. Revista Científica Canadiense de la Ciencia del Comportamiento [Canadian
Journal ofBehavioural ScienceJ, 2 9 ,3 8 -4 3 . Copyright, 1997, por la Asociación Canadiense de Psicología. Reimpreso
con autorización.
zaron "indican un nivel altamente satisfacto obtenía a costa de perder coherencia inter
rio de coherencia intema del cuestionario... na... el alfa de Cronbach de la medida reduci
(el a de Cronbach = 0,94)” (p. 314). Con el da fue de 0,88 (vs 94)” (p. 314). Explique los
fin de crear una medida más breve y práctica, resultados descriptos a alguien familiarizado
redujeron la escala a 23 ítems, y luego expli con la correlación pero no con la confiabili-
caron: "Realizamos diversos análisis para de dad o el alfa de Cronbach.
terminar si la disminución de la longitud se
Tabla 17-11.
Correlaciones y correlaciones parciales de la sensibilidad y la emocionalidad con variables relacio
nadas con la sensibilidad. Estudios 2-4.
Correlaciones parciales
N ota: e l estudio 2 incluyó 313 alumnos de la Universidad de California, Santa Cruz; el estudio 3 incluyó datos de 285
alumnos universitarios norteamericanos no graduados: el estudio 4 incluyó datos tomados de 301 personas a través de
una encuesta telefónica pública de discado aleatorio, pas = Persona altamente sensible.
a El ítem así señalado (“¿Le surgen sentimientos muy intensos sin razón aparente?”} fue contestado sólo por 211 partici
pantes.
b Los ítems así señalados fueron completados sólo por 1Q7 participantes.
*p < 0,05; * * p < 0 ,0 1 ; t p < 0 ,1 0 .
Fuente: Aron, E. N ., & Aron, A. (1997), tab. 3. "Sensibilidad del proceso sensorial y su relación con la introversión y la
emocionalidad”. Revista Científica de Psicología Social y de la Personalidad [Journal of Personality and Social Psy-
chology), Ti, 34 5 -3 6 8 . Copyright, 1997, por la A sociación Americana de Psicología. Reimpreso con autorización.
3. tamente, pero la “agresión a través de relacio
Crick et al. (1997) realizaron un estudio
para desarrollar una medida, por parte de nes” daña a otros a través del perjuicio a las re
maestros, de la “agresión a través de relacio laciones de éstos con sus pares (p. ej. uti
nes" en niños de edad preescolar. Comúnmen lizando la exclusión social o esparciendo ru
te, la agresión manifiesta daña a otros direc mores como una forma de represalia) (p. 579).
Tabla 17-12
Cargas factoriales de la medida de comportamiento social evaluado por maestros ( p s b s - t ) .
Como parte del estudio, en primer lugar for vés de relaciones surgiría como un factor
mularon una escala con 23 ítems para la separado independiente de la agresión
valoración por parte de los maestros del com manifiesta. El análisis produjo los cuatro
factores predichos: agresión a través de
portamiento social de niños en edad prees relaciones, agresión manifiesta, compor
colar. Los investigadores describieron de la tamiento prosocial y alteración depresi
siguiente manera el análisis principal de la va (p. 582).
medida mencionada: La tabla 17-12 indica las cargas factoriales.
En primer lugar, se realizó un análisis Explique los resultados a una persona que es
factorial de componentes principales tá familiarizada con la correlación pero no
[...] para evaluar si [...] la agresión a tra- conoce el análisis factorial.
4. DeGarmo y Forgatch (1997) realizaron que se aplique uno de los procedimientos esta
un estudio acerca del apoyo social recibido por dísticos descriptos en este capítulo. Redacte un
madres divorciadas de parte de sus confidentes breve resumen del estudio que encontró refi
más cercanos. Como parte del estudio, midie riéndose específicamente arios cálculos esta
ron una cantidad de variables y después anali dísticos. Con su respuesta incluya una foto
zaron las relaciones predichas entre las copia de la publicación, marcando claramente
variables, utilizando el modelo de ecuación es las partes en las que se informan los procedi
tructural. La figura 17-5 representa gráfica mientos estadísticos por usted descriptos.
mente los resultados.
6. En la biblioteca, busque en una publica
a) Explique el patrón de resultados, b) Utili
ción reciente de alguna revista científica especia
zando como ejemplo el diagrama presentado,
lizada en un área de la psicología, algún ar
explique los principios generales de la interpre
tículo que le interese especialmente y en el que
tación de un diagrama de senderos (incluso las
limitaciones) a una persona que comprende la se aplique un procedimiento estadístico que no
regresión múltiple en líneas generales pero no haya sido tratado en este libro. Redacte un breve
conoce los diagramas de senderos o el modelo resumen del estudio que encontró refiriéndose
de ecuación estructural. específicamente a los cálculos estadísticos. Con
5. En la biblioteca, busque en una publi su respuesta incluya una fotocopia de la publica
cación reciente de alguna revista científica es ción, marcando claramente las partes en las que
pecializada en un área de la psicología, algún se informan los procedimientos estadísticos por
artículo que le interese especialmente y en e! usted descriptos.
Comprensión de los procedimientos estadísticos avanzados que aparecen en publicaciones científicas 593
¡SjiliiiMMIIIl
Repaso de la lógica
A y de la term inología
relacionadas con
la investigación psicológica
1Algunas veces se realizan investigaciones con otros fines, tales como explorar relaciones entre varias medidas, deter
minar la incidencia de alguna característica de la población, o desarrollar una medida o técnica para utilizar en otra
investigación. Sin embargo, la lógica básica de la forma usual de investigación (tema central de este apéndice) sirve de
apuntalamiento del modo en que ios psicólogos abordan la mayoría de las investigaciones sistemáticas.
(el “verdadero experimento”), la terminología clave relacionada con él y, por último, nos dedica-
remos a cuatro áreas clave en las que los estudios se aproximan o no a ese ideal: equivalencia de
participantes entre grupos experimentales, equivalencia de circunstancias entre grupos experi
mentales, legitimidad de la generalización y suficiencia de la medición.
El experimento verdadero
El procedimiento de investigación que usualmente conduce al menor nivel de ambigüedad es el
experimento verdadero. Es el estándar con el que se comparan todos los otros métodos. Par
tiendo de la hipótesis “cambiar eí nivel de X provoca un cambio en el valor de Y \ el experimen
to real varía sistemáticamente el nivel de X t manteniendo igual todos los demás aspectos, y
observando el efecto en 7. Por ejemplo, supongamos que un investigador está interesado en ave
riguar si el hecho de que haya luces centelleantes en el aula afecta las calificaciones de las perso
nas en una prueba de matemática, en donde X representa la existencia de luces centelleantes en
el aula e Y las calificaciones en la prueba de matemática. En un experimento real, se tomaría la
prueba a cada alumno de un determinado grupo en un aula con luces centelleantes. A otro grupo
de alumnos, inicialmente idéntico, se le tomaría la prueba bajo condiciones completamente
idénticas, pero sin la presencia de luces centelleantes en el aula. Así, ia única diferencia entre los
dos grupos sería el nivel de X, es decir, la presencia o ausencia de luces centelleantes en el aula.
Si los alumnos del aula con luces centelleantes obtienen calificaciones menores en la prueba de
matemática (30- la causa tiene que ser la iluminación. (Si obtienen mejores calificaciones, tam
bién sería a causa de la iluminación).
2Con frecuencia, los psicólogos utilizan el término “sujeto”. Sin embargo, nosotros utilizamos la palabra “partici
pante”, aquí y a lo largo de todo el libro.
Como ejemplo, imaginemos que un investigador tiene dos latas idénticas de gaseosa. La hi
pótesis que se plantea para este caso es: “Al calentar una lata de gaseosa, ésta explotará”.
(¡No se debe probar el experimento en casa!). En otras palabras, el aumento de calor causa
rá una explosión. El investigador podría poner un fósforo bajo una lata (la lata experimental) y
no ponerlo bajo la otra (la lata control). Si la lata experimental explota y la lata de control no, se
confirma la hipótesis. Cada lata es un participante; el calentamiento es la variable independien
te; la explosión de la lata es la variable dependiente, y las dos latas son las muestras, respectiva
mente, de las poblaciones de todas las latas de gaseosas calentadas y no calentadas (véase
figura A -1).
EQUIVALENCIA DE PARTICIPANTES EN
LOS GRUPOS CONTROL Y EXPERIMENTAL
Comúnmente, lo primero que se tiene en cuenta al evaluar si los resultados de un estudio llevan a
conclusiones inequívocas es la equivalencia de participantes en los grupos control y experimen
tal. Por ejemplo, supongamos que no estuviéramos seguros de que la capacidad en matemática de
los miembros del grupo en el aula con las luces centelleantes fuera inicialmente la misma que la
de aquellos en el aula sin luces centelleantes. Por lo tanto, cualquier diferencia en las calificacio-
F ig u ra A -1 .
U n ex p erim en to ideal: se calien ta una de
d o s latas d e g a se o sa id én tica s, y e l in v esti
gad or ob serva si e x p lo ta m ientras que la
otra no lo hace.
nes matemáticas entre los dos grupos, al finalizar el estudio, tendría un significado ambiguo. La
diferencia podría ser el resultado de a) la manipulación de la variable independiente (tener o no
luces centelleante), o bien de b) las diferencias iniciales en cuanto a la capacidad. Para evitar tales
resultados ambiguos, ios investigadores buscan una equivalencia estricta entre los grupos control
y experimental Se emplean cinco estrategias principales; asignación aleatoria a los grupos, dise
ño de grupo control equivalente, diseño de medidas repetidas, diseño de investigación correlacio
na!, e investigación de sujeto único.
EQUIVALENCIA DE CIRCUNSTANCIAS EN
LOS GRUPOS EXPERIMENTAL V DE CONTROL
El estudio ideal no sólo requiere grupos idénticos sino también que las circunstancias de prueba
sean idénticas.
En la práctica, es bastante difícil probar dos grupos bajo circunstancias en las que la única di
ferencia es la manipulación de la variable independiente. En un laboratorio de física es posible lo
grar esa equivalencia, pero al realizar investigaciones con humanos las circunstancias nunca son
equivalentes. Una estrategia diseñada para maximizar la equivalencia es utilizar un lugar aislado,
como por ejemplo un compartimiento de un edificio de estudios psicológicos, minimizando las
influencias externas e interrupciones que podrían hacer que una sesión del experimento fuera di-
Tabla A -l.
Principales diseños de investigación, sus ventajas y desventajas.
Grupo control equivalente Controla diferencias obvias entre Los grupos pueden diferir
(sin asignación aleatoria). condiciones. Puede ser el más sistemáticamente con respecto
práctico con grupos intactos. a variables en las que no han sido
equiparados.
Grupo control equivalente Controla con bastante fuerza Las diferencias sistemáticas
con prueba previa y posterior. las diferencias iniciales entre entre los grupos pueden influir
participantes. Con frecuencia en el impacto.
resulta práctico cuando El procedimiento de medición
la asignación aleatoria no lo es. previo a la prueba puede confundir
los resultados.
ferente de otra. Un método relacionado con el tema mencionado consiste en estandarizar la situa
ción al máximo; por ejemplo, las instrucciones para los participantes podrían estar grabadas.
Sin embargo, con respecto a la equivalencia de circunstancias existen dos inconvenientes es
peciales que condicionan la mayoría de las investigaciones de las ciencias sociales, particular
mente la investigación aplicada: nos referimos a los efectos del experimentador y a los efectos
placebo o Hawthome.
REPRESENTAT!VIDAD DE LA MUESTRA
El tercer requisito para lograr un estudio ideal es que la muestra de participantes analizados repre
sente adecuadamente la población a la que se supone que se aplica el estudio. Esa representativi-
dad se denomina legitimidad de ia generalización o validez externa. (La validez interna se
refiere a las cuestiones relacionadas con la equivalencia de los grupos experimenta! y de control y
a la equivalencia de circunstancias).
La investigación psicológica se realiza con frecuencia en alumnos universitarios, y se supone
que lo que se descubre acerca de ellos se aplica a la población más amplia formada por las perso
nas en general. En un estudio sobre el efecto que producen las luces centelleantes en el desempe
ño, el patrón general de resultados con alumnos universitarios probablemente se aplique a casi
todos los otros seres humanos. No obstante, en muchos otros tipos de investigaciones, es suma
mente importante la naturaleza del participante. Por ejemplo, los alumnos universitarios proba
blemente no serían los participantes adecuados en estudios acerca de las actitudes hacia los niños,
ya que la experiencia de los alumnos comúnmente no incluye la paternidad o maternidad. En el
mismo sentido, no se puede analizar la capacidad de lectura en escuelas suburbanas y generalizar
los resultados a todos los alumnos en todas las escuelas, o bien examinar la satisfacción laboral en
la industria informática y generalizarla a todo tipo de industria.
Otro inconveniente es el modo en que se seleccionan los participantes de un estudio. Por
ejemplo, en una encuesta por correspondencia acerca del conocimiento de un tema, algunos indi
viduos devolverán el cuestionario y otros no. Presumiblemente existen diferencias sistemáticas
entre aquellos que lo devuelven y aquellos que no, y es probable que aquellos que sí devuelven el
cuestionario tengan más conocimientos acerca del tema en estudio. Si el investigador utiliza sólo
los cuestionarios que fueron devueltos, podría llegar a la conclusión de que las personas tienen
mayores conocimientos acerca de determinado tema que si hubiera podido analizar a toda la po
blación. De modo similar, las personas que se ofrecen voluntariamente a participar en un experi
mento pueden diferir de aquellas que no lo hacen. Por ejemplo, los voluntarios pueden tener una
personalidad más sensible a las necesidades ajenas.
El muesfreo aleatorio es considerado el método óptimo para asegurar que una muestra sea
representativa de su población. Muestreo aleatorio significa que los investigadores comienzan
con una lista de todos ios miembros de la población sobre la cual desean generalizar sus resulta
dos (por ejemplo una lista de todos los psicoterapeutas de la nación), y luego utilizan un procedi
miento al azar (tal como una tabla de números aleatorios) para seleccionar una muestra de esa
población. El resultado del proceso descripto se denomina muestra probabilística, ya que cada
miembro de la población estudiada tiene la misma probabilidad de ser incluido en la muestra del
estudio.
No se debe confundir el muestreo aleatorio con la asignación aleatoria a los grupos que trata-
mos anteriormente. Ambos procesos utilizan verdaderos procedimientos al azar, pero el muestreo
aleatorio se refiere al método de obtención de una muestra, y la asignación aleatoria se refiere al
procedimiento de decisión con respecto a qué miembros de la muestra participarán en el grupo
experimental y cuáles en el grupo de control.
Confiabilidad
La confiabilidad de una medida es su precisión o coherencia, es decir, en qué grado los resulta
dos son similares si se aplica la misma medida al mismo elemento, en circunstancias idénticas.
En psicología, los resultados no necesariamente son similares. Por ejemplo, cuestionarios entre
gados a las mismas personas en diferentes días dan con frecuencia resultados disímiles. A veces
las preguntas son ambiguas y, por lo tanto, una persona puede responder de un modo en un m o-'
mentó y luego de otro. O bien, las personas pueden simplemente marcar en forma incorrecta al
guna o todas las respuestas en una o .más oportunidades. Las medidas de informe propio no son
las únicas que pueden no resultar confiables. Las medidas por observación pueden no ser confia
bles debido a que los distintos observadores pueden estar en desacuerdo, y las medidas fisiológi
cas con frecuencia son sumamente erráticas entre un momento y otro,
Existen tres tipos de indicadores para medir el grado de confiabilidad: a) la confiabilidad
por prueba-reprueba, conforme a la cual el mismo grupo es puesto a prueba dos veces; b) la co
herencia interna, según la cual, por ejemplo, los puntos obtenidos en la mitad de las preguntas se
comparan con los puntos obtenidos en la otra mitad (el alfa de Cronbach, descripta brevemente en
el capítulo 17, es el método más común para determinar la coherencia interna), y c) la confíabili-
dad por intercambio de juicios utilizada para medidas de observación, es el grado de acuerdo
entre los observadores. La tabla A-2 resume los tipos de confiabilidad descriptos.
Validez
La validez de una medida se refiere al hecho de que efectivamente pueda medir lo que pretende.
(El término validez se aplica, asimismo, a estudios completos, cuando se refiere a lo apropiado de
la conclusión que puede derivarse de los resultados).
Una medida que no es confiable no puede ser válida; una medida no confiable no mide ria
da. Pero aun cuando una medida sea confiable (precisa y repetible), no necesariamente es válida
para medir lo que pretende medir. Por ejemplo, un cuestionario sobre satisfacción marital que
pregunte, “¿cuál es la probabilidad de que usted permanezca con su esposo durante los próxi
mos años? puede resultar sumamente confiable (por ejemplo, las personas pueden contestar las
preguntas que incluye de forma bastante coherente), pero en lugar de medir satisfacción mari
tal, podría estar midiendo el compromiso hacia el matrimonio; y los que responden el cuestio
nario podrían estar comprometidos no porque están satisfechos sino porque no tienen otra
alternativa que la vida conyugal, o bien porque sienten que son muy poco atractivos y su situa
ción sólo podría empeorar si abandonaran a su pareja.
Tabla A-2.
Tipos de confiabilidad.
Confiabilidad por prueba-reprueba: correlación de pruebas aplicadas a las m ism as personas
en diferentes ocasion es.
C oherencia intem a: correlación entre los distintos ítem s.
Confiabilidad por intercam bio de ju icios: correlación entre los valores de diferentes evaluadores
al calificar al m ism o grupo de personas y objetos.
Otra razón por la cual una prueba puede no ser válida, aun siendo confiable, es que en lugar
de medir la variable que se pretende medir, en realidad está midiendo una tendencia para intentar
dar una buena impresión, o bien decir que sí o cualquier otro sesgo de respuesta por parte de ios
que responden. Una manera de encarar el problema de la intención de dar una buena impresión es
incluir una “escala de deseo sociar, a veces llamada “escala de la mentira”. Cuando la puntua
ción de un participante en una escala como la mencionada es alta, el investigador puede simple
mente descartar la prueba realizada por el participante. Otra alternativa sería que los valores en
una escala de deseo social puedan utilizarse en un procedimiento estadístico (tal como una corre
lación parcial o un análisis de covarianza, ambos descriptos brevemente en el capítulo 17) para
adaptar el valor de esa persona en cuanto a la parte regular de la medida.
La validez de una medida es más difícil de evaluar que la confiabilxdad. Para lograrlo se utili
zan diversos medios. Existe validez de contenido cuando el contenido de la medida parece abar
car todos los distintos aspectos de aquello que se está midiendo. Usualmente, la validez de
contenido la determina el investigador u otros expertos según el juicio de cada uno.
Asimismo, existen medios más sistemáticos para evaluar la validez de una medida. Determi
nar la validez o criterio implica realizar un estudio especial en el cual el investigador compara re
gistros de la medida en cuestión con algún otro indicador posible de la misma variable. Por
ejemplo, un investigador podría probar la validez de una medida de salud mental comparando va
lores de personas de un hospital psiquiátrico con las de puntuaciones de la población en general.
Un tipo de validez de criterio es la validez predictiva de una medida. Por ejemplo, el hecho de
que los registros de una prueba de capacidad laboral, tomada al presentarse la persona para solici
tar un trabajo, predigan el desempeño efectivo de la persona en el empleo. La validez predictiva
se utiliza especialmente cuando se diseña una medida con fines predictivos, como por ejemplo
para la ubicación laboral o educativa. Otro tipo de validez de criterio es la validez concurrente,
la cual se refiere al procedimiento de comparación de valores de una medida, con los de otra que
mide directamente lo mismo; por ejemplo, una prueba de inteligencia nueva y breve comparada
con una prueba de inteligencia existente más prolongada. La tabla A-3 resume los tres métodos de
evaluación de la validez.
También puede aparecer el término validez de constructo, el cual se utiliza de varias formas
(con frecuencia ambiguamente). Incluso textos sobre medición psicológica difieren en cuanto a
este término. A veces incluyen la validez de criterio y, otras, la validez de contenido. Con frecuen-
T a b ía A - 3 ,
T ip o s d e v a lid e z d e u n a m e d id a .
V alidez d e contenido: conform e la opinión de los expertos, e l contenido d e la prueba parece abarcar todo
el espectro de lo que la prueba pretende medir.
V alidez de criterio: las puntuaciones de la prueba s e correlacionan con algún otro indicador de lo que
se supone m ide la prueba.
V alidez predictiva: la puntuación de la prueba predice valores en otra variable que debería ser predicha
por la prueba, conform e a lo que pretende medir; es un tipo de va lid ez de criterio.
V alidez concurrente; la puntuación en la prueba se correlaciona con otra variable m edida a l m ism o
tiem po y que se sabe está relacionada con lo que la prueba pretende medir;
es un tipo d e validez de criterio.
cia, se utiliza para referirse a la medida que se utiliza en un estudio en el que existía un resultado
predicho que fue confirmado por el estudio. Dado que la medida utilizada logró producir el resul
tado predicho, se demuestra que la idea (o “constructo”) implícita en la medida queda comproba
da conforme a la teoría.
Términos clave
- Medidas de - Variable independiente. - Diseño cuasiexperimental.
comportamiento. - Confiabilidad - Asignación aleatoria
- Método de prueba a ciegas. por intercambio de juicios. a los grupos.
- Validez concurrente. - Coherencia interna. - Muestreo aleatorio.
- Validez de contenido. - Validez intema. - Conñabilidad.
- Grupo control. - Manipulación de - Diseño de investigación
- Diseño de investigación la variable independiente. de medidas repetidas.
correlacional. ~ Diseño de grupo de control ~ Sesgo de respuesta.
- Compensación. equivalente con prueba ~ Muestra.
- Validez de criterio. previa y posterior. - Medidas de informe propio.
~ Variable dependiente. - Diseño de investigación de - Diseño de grupo tínico con
- Procedimiento doble ciego. grupo de control equivalente. prueba previa y posterior.
- Grupo experimental. - Medidas por observación. - Investigación de sujeto
- Manipulación experimental. - Participantes. único.
- Sesgo del experimentador. - Medidas fisiológicas. - Confiabiíidad por
- Efectos del experimentador. - Efectos placebo. prueba-reprueba.
- Validez externa. - Población. ~ Experimento verdadero.
-- Legitimidad de la - Validez predictiva. - Validez.
generalización. - Diseño preexperimental. - Diseño de investigación
- Efectos Hawthorne. - Muestra probabilísima. intrasujeto.
Tabla B-l.
Áreas bajo ía curva normal:
Porcentaje del área bajo curva normal entre la media y las puntuaciones Z indicadas.
2 ,3 4 4 9 ,0 4 2 ,5 8 49,51 2 ,8 2 4 9,76
2,35 4 9 ,0 6 2 ,5 9 4 9,52 2,83 49,77
2 ,3 6 4 9 ,0 9 2 ,6 0 49,53 2 ,8 4 49,77
2 ,3 7 49,11 2,61 49,55 2,85 49,78
2,38 49,13 2 ,6 2 4 9,56 2,86 49,79
2 ,3 9 4 9 ,1 6 2,63 4 9,57 2,87 4 9,79
2 ,4 0 4 9 ,1 8 2 ,6 4 4 9,59 2,88 4 9,80
2,41 4 9 ,2 0 2,65 4 9 ,6 0 2,89 49,81
2 ,4 2 4 9 ,2 2 2 ,6 6 49,61 2 ,9 0 49,81
2,43 49,25 2,67 4 9 ,6 2 2,91 4 9,82
2 ,4 4 49,27 2,68 4 9,63 2 ,9 2 4 9,82
2,45 4 9 ,2 9 2 ,6 9 4 9,64 2 ,9 3 4 9,83
2,46 49,31 2,7 0 49,65 2 ,9 4 4 9,84
2,47 4 9 ,3 2 2,71 4 9 ,6 6 2,95 4 9 ,8 4
2,48 4 9 ,3 4 2,7 2 49,67 2 ,9 6 49,85
2,49 4 9 ,3 6 2,73 49,68 2,97 49,85
2,50 4 9 ,38 2,74 4 9 ,6 9 2,98 4 9 ,8 6
2,51 4 9 ,4 0 2,75 4 9,70 2,99 4 9,86
2,5 2 49,41 2,76 49,71 3,00 49,87
2,53 4 9 ,4 3 2,77 4 9,72 3,50 4 9,98
2 ,5 4 4 9 ,4 5 2,78 49,73 4,00 50,00
2,55 4 9 ,4 6 2,79 49,74 4,50 50,00
2,5 6 4 9 ,4 8 2 ,8 0 4 9,74
2,57 4 9 ,4 9 2,81 49,75
P ru eb a s de u n a c o la P ru eb a s d e dos c olas
O JO 0 ,0 5 0 ,0 1 O JO 0 ,0 5 0 ,0 1
gl
1 3,078 6,314 31,821 ó ,314 12,706 6 3 ,657
2 1,886 2 ,9 2 0 6,965 2,920 4 ,303 9,925
3 1,638 2,353 4,541 2,353 3 ,182 5,841
4 1,533 2 ,1 3 2 3,747 2,132 2 ,776 4 ,6 0 4
5 1,476 2,015 3,365 2,015 2,571 4 ,0 3 2
1 2 3 4 5 6
1 2 ■ 3 4 5 6
Tabla B-4.
Puntos de corte para la distribución chi-cuadrado.
Nivel de significación
gl OJO 0,05 0,01
l 2,706 3,841 6,635
2 4,605 5,992 9,211
3 6,252 7,815 11,345
4 7,780 9,488 13,277
5 9,237 11,071 15,087
6 10,645 12,592 16,812
7 12,017 14,067 18,475
8 13,362 15,507 20,090
9 14,684 16,919 21,666
10 15,987 18,307 23,209
Tabla B-5.
I n d ic e d e la s t a b la s d e p o t e n c ia y d e la s t a b la s c o n la c a n t id a d d e p a r t ic ip a n t e s n e c e s a r io s
p a r a o b t e n e r u n a p o t e n c ia d e l 8 0 % .
P r o c e d im ie n t o d e p r u e b a d e h ip ó te s is C a p ítu lo T a b la d e p o te n c ia T a b la c o n c a n tid a d
d e p a r tic ip a n te s
Apéndice B 615
Respuestas a los
ejercicios de la serie I
96 1 72 0 7 5 -7 9 . 4
95 0 71 1 7 0 -7 4 4
94 0 70 1 6 5 -6 9 4
93 0 69 1
6 0 -6 4 2
92 1 68 2
91 1 67 1 5 5 -5 9 1
90 0 66 0 5 0 -5 4 1
89 0 65 0
88 0 64 2 c ) Histogram a (según tabla d el punto b).
87 1 63 0
86 0 62 , 0
85 .1 61 0
84 0 60 0
83 2 59 . 1
82 0 58 0
81 1 57 0
80 1 56 0
79 0 55 0 Sensibilidad olfativa
78 0 54 0
77 0 53 0
76 2 ■ 52 0
75 2 51 0 d) Forma general de la distribución: unim odal,
■74 1 ■50 ■1 aproximadamente sim étrica (leve asim etría
73 ■ 1
negativa).
3. a) ta b la de frecuencias agrupadas (una de c ) Polígono de frecuencias (según tabla del punto b);
: varias posibilidades)^
In terv a lo F r e cu en cia
8 0 -8 9 10
7 0 -7 9 0
6 0 -6 9 5
5 0 -5 9 0
4 0 -4 9 ’ 5
3 0 -3 9 7
2 0 -2 9 7 ■
Horas de estudio
4. a) Tabla de frecuencia.
C a n tid a d C a n tid a d
d e h o ra s F recu en cia d e h o ra s F r ecu en cia __________
18 1 8 5 (b)
17 0 7 11
16 0 6 4
15 1 5 2
14 0 4 3
13 2 3 4 (c)
12 1 2 2
11 3 1 1
10 5 0 1 7. a) U na distribución e s la form a en que un grupo
9 4 de valores se organiza entre los diferentes va
lores posibles. U na manera d e describir tal
b) Tabla d e frecuencias agrupadas (una d e varias distribución es a través de un gráfico, denom i
posibilidades). nado histograma. U n histogram a es un tipo de
gráfico de barras con una barra para cada valor
In terv a lo F r ecu en cia
posible, ordenadas d e izquierda a derecha. Las
1 8 -2 0 1 barias tienen una altura igual a la cantidad de
1 5 -1 7 I v eces segú n e l valor que representan es obser
1 2 -1 4 3 vado. En este tipo d e gráficos, una distribu
9 -1 1 12 ción sim étrica tiene form a sim étrica, e s decir
6 -8 20 qu e la mitad derecha y la m itad izquierda s e
3 -5 ■ ■ 9 m ejan im ágenes especulares. En un sentido
0 -2 4
am plio, sign ifica que existen prácticam ente la
m ism a cantidad de valores altos qu e bajos, y tura e s 2 (e s decir, - 5 m enos - 7 ) que, elevado al
que a m edida que nos m ovem os del valor m e cuadrado, da 4. E levando cada d e sv ío al cuadrado
dio hacia e l valor más alto o él más bajo, la y sum ánd olos obten em os un resultado de 468. AI
cantidad 'de observaciones de cada valor dis dividir este resultado por 10 obtenem os un d esv ío
m inuye o aumenta del m ism o m odo). cuadrático m edio de 46,8. A-este resultado se lo d e
U na distribución e s unim odal si el histograma nom ina varianza. La varianza e s una form a de d es
tiene un punto alto. Es decir que ex iste un só lo cribir la dispersión de un grupo de números. La
nivel en particular que presenta m ás frecuen varianza es una parte muy importante de m uchos
cias que cualquier otro nivel. (A este nivel se cálculos estadísticos. Sin embargo, lam entable
ío denom ina “m oda” , y ser unim odal significa mente no transmite una idea m uy directa del grado
tener só lo una m o d a ). en que varían lo s números,
b) U na distribución unim odal negativam ente asi P odem os obtener una idea m ás directa del gra
m étrica no es sim étrica, y su cola, e l lado bajo do de variación de un grupo de números entre sí
y alargado de la m ism a, se extiende hacia la calculando la raíz cuadrada de la varianza. En este
izquierda (adonde se encuentran los valores caso, la raíz cuadrada de 46,8 es 6,84. La raíz cua
negativos del gráfico). drada de la varianza se denom ina d e s v ío e s t á n
d a r . Sin entrar en detalles, significa que, en un día
prom edio, la temperatura difiere en 6 ,8 4 grados
Capítulo 2 con respecto al prom edio de - 7 grados.
1. Serie A. a) M = % X JN = 2 6 1 /9 = 2 9 . 3. El resultado consta de dos partes. En primer lugar,
b) M ediana = 28, la “m edia” se refiere al prom edio aritmético c o
c) S S = X (X ~ M )2 = (32 - 2 9 )2 + (28 - 2 9 )2 mún: sumar la cantidad total de sueños y dividirlos
+ (24 - 2 9 )2 + (28 - 29)2 + (28 - 2 9 )2 por la cantidad de personas. En este caso, ía canti
+ (31 - 2 9 ) 2 + (35 - 29)3 + (29 - 2 9 )2 dad prom edio de sueños narrados durante las dos
+ (26 - 2 9 )2 , sem anas fue 6,84. En segundo lugar, el "S D ” se re
S S = 32 + ( ~ í) 2 + (- 5 )2 + (~1)2 + ( - 1 ) 2 fiere al “desvío estándar”. El desvió estándares, en
4- 22 + 62 + O2 + (~3)2 un sentido amplio, el prom edio-de dispersión de la
SS = 9 + 1 + 2 5 + 1 + 1 + 4 + 3 6 + 0 + 9 = 86. cantidad d e sueños con respecto al promedio de d i
d) S D 2 = S S /N = Z ( X - M ) 2/N = 86/9 = 9,56. chos sueños; en este ca so la dispersión e s dé 3,18
e) SD = ' ^ = t ' l 9 ¿ 6 = %Q9. sueños. La dispersión es bastante amplia. Para ser
Serie B . a) M = -4 ; b) M ediana = .4; c ) S S - 26; m ás precisos, el desvío estándar s e calcula tom an
d ) 5£>2 = 3 ,2 5 ; e ) SD = 1,80. do ía cantidad de sueños d e cada persona, restando
6,8 4 a esas cantidades y elevando la diferencia al
2. La temperatura promedio, entendiendo co m o tai la cuadrado; e l desvío estándar e s la raíz cuadrada del
suma de las 10 lecturas dividida por. 10, fue - 7 gra prom edio d e esas diferencias cuadráticas.
dos C elsius. E ste resultado es la media. Sin embar 4. a) Z = ( X - M )!S D = (91 - 7 9 ) / 1 2 = 12/12 = 1,00.
go, si ordenamos las temperaturas de menor a mayor, b) Z = ( 6 8 - 7 9 ) / 1 2 = - 1 1 / 1 2 = - 0 , 9 2
los dos números del m edio que determinan lo que c ) Z = (1 0 3 - 7 9 )/1 2 = 2 4 /1 2 = 2 ,0 0 .
s e denom ina la temperatura mediana, serian igual 5. a) Si el a = 107, Z = ( X - M )IS D = (107 - 100)/16
a - 5 grados. Otra forma de representar la tempera = 7/16 = 0 4 4 .
tura típica sería tomar la temperatura esp ecífica que X = (Z)(SD) + M = (0,44X41) + 231 = 18,04 + 231
ocurrió m ás frecuentemente, a la que se llam a mo = 249.
da. En este caso, hubo dos modas, dos temperatu (El resultado final está redondeado a un núm e
ras que ocurrieron más frecuentemente, - 1 y - 5 . ro entero ya que e l valor real de la prueba se
Las dos temperaturas ocurrieron d os veces. Pero la refiere a la cantidad de puntuaciones correc
m oda no es una información muy útil en este caso. tas, lo cual no puede ser una fracción)
Con respecto a l a variación, se puede calcular b ) Z = -1 ,0 6 ; X » 188.
según l a medida en que varió cada temperatura con c) Z = 0; X = 231,
respecto al promedio: primero, se eleva al cuadrado 6. Esposa: Z = (X - M )/S D - (63 - 60)/ó = 3/6 = 0,5.
cada uno de esos “desvíos'’ (con este procedimiento E sposo: Z = ( X - M )/S D = (5 9 - 55)/4 = 4 / 4 = 1.
anulamos los signos positivos y negativos de m ane El esp oso presenta una puntuación Z más e le
ra que obtenem os la diferencia con respecto al pro vada, de lo que se deduce que se ha adaptado m e
m edio sin importar el sentido de la mism a). L uego jor, con relación a otros hom bres divorciados, de
calculam os el promedio de estos desvíos cuadráti- lo que lo ha hecho su esp osa con relación a otras
cos. Por ejem plo, el desvío de la primera tempera mujeres divorciadas.
E xplicación a una persona que nunca ha asisti c)
do a un curso de estadística: para e l caso de las es
posas, un valor observado de 63 es 3 puntos mejor Empatia Satisfacción
que e í prom edio 60 para mujeres divorciadas en terapeuta paciente zxzr
general. (La “m edia” del problem a es un término
estadístico con e l que se denom ina e l prom edio or
O r ig in a l zx O r ig in a l zr
dinario, la suma de los valores dividida por la canti 1 70 0,36 4 0,63 0,23
dad de valores). Pero existen por supuesto algunas 2 94 1,45 5 1,26 1,83
variaciones entre lo s valores observados de mujeres 3 36 -1,17 2 -0,63 0,74
divorciadas. La cantidad prom edio aproximada en 4 48 -0,63 1 -1,26 0,80
1+1
o
crí
'O
que los valores de las mujeres difieren del promedio
11
e s 6 puntos; es el S D al que se refiere el problema. r = 3,60/4 = ■
0,90
(En realidad, y sin entrar en detalles, el S D , que sig
nifica desvío estándar, no es más que el promedio
de las desviaciones de lo s valores observados con d) E l primer paso para resolver un ejercicio de
respecto ai prom edio. Para ser más precisos, el S D correlación e s realizar un gráfico, representar
es la raíz cuadrada del promedio de las diferencias una variable en cada eje y después marcar un
cuadráticas de cada valor con la media). punto en el lugar correspondiente a cada ob
Por lo tanto, el valor de la esp osa supera la servación en ese gráfico. A esto se lo denom ina
m edia de las e sp o sa s, en general, en una cantidad diagrama de dispersión, y s o s da una im agen
que e s só lo la mitad de lo que lo s valores de las del patrón de relación entre las dos variables.
esp o sa s en general varían de la m edía correspon En este caso, los valores altos parecen coinci
diente. Esto le da lo que se denom ina una puntua dir con lo s altos, y ios bajos con lo s bajos, de
ción Z de + 0 ,5 , que la ubica en una esca la en la terminando lo que se denom ina una correla
que se compara su valor con el de las mujeres d i ción positiva. (B ásicam ente, la correlación
vorciadas en g e n e ra l U tilizando la m ism a ló gica indica en qué m edida lo s valores altos coinci
para analizar la adaptación al divorcio por parte den con lo s valores altos y los valores bajos
del m arido, en com paración co n otros hom bres con lo s valores bajos). A dem ás, dado que los
divorciados, él se encuentra por sobre e l prom edio puntos s e ubican aproximadamente cerca de
en una cantidad igual al prom edio según e l cual una línea recta, podem os decir que es un ejem
los hom bres varían de la m edia, es decir, presenta plo de correlación lineal positiva.
una puntuación Z de +1.
E l siguiente paso es convertir todos los valo
Por lo tanto, aunque los d os se han adaptado
res observados en puntuaciones Z para facilitar
m ejor que e l prom edio para su sex o , e l esp o so se
e l cálculo del grado en e l que los altos coinci
adaptó mejor, en relación con otros hom bres di
den con lo s altos y lo s bajos con los bajos. Las
vorciados, de lo que la esp osa se adaptó con rela
puntuaciones Z facilitan este cálculo porque
ción a otras m ujeres divorciadas.
constituyen e l mejor indicador de cuán bajo o
alto es un valor en relación con los otros valores
C a p ítu lo 3 de la distribución.
E l c oeficien te de correlación es un número
qu e indica e l grado de asociación. S e calcula
1. a)
m ultiplicando las d os puntuaciones Z d e cada
5 persona, sum ando estos productos y luego
4 prom ediando e l total por la cantidad de perso
nas involucradas en e l estudio. E l coeficien te
3
será un número alto si lo s registros altos coin
2
ciden con los altos y los bajos con los bajos,
debido a que en el caso de las puntuaciones Z,
0 ----------------------------------------------------------------------------- — ........— .......... — los altos son siem pre positivos (y cuanto más
30 40 50 60 70 80 90
altos son , m ás positivos) y al multiplicar posi
Empatia tivo por positivo el resultado e s positivo. Por
b) Correlación lineal positiva. A medida que au otro lado, con respecto a las puntuaciones Z,
menta la empatia del terapeuta también aumen los bajos son siem pre negativos (y cuanto m ás
ta la satisfacción del paciente, bajo el registro, m ás negativa e s la puntuación
Z ), y ai multiplicar negativo por negativo el
resultado tam bién es positivo.
Horas de estudio Calificaciones
L os estadísticos pueden probar que, sig u ien
ZX Z Y en la prueba
do con este procedim iento, el núm ero m ás alto O r ig in a l O r ig in a l Zy
que se puede obtener, si lo s valores de las dos 0 - 1 ,7 9 52 -1 ,4 1 2,52
variables están perfectam ente correlaciona 10 1,19 95 1,48 1,76
dos, es +1. S i no existiera relación lin eal entre 6 0 ,0 0 83 0,67 0 ,0 0
las variables, e l resultado de este procedi 8 0 ,6 0 71 -0 ,1 3 -0 ,0 8
m iento sería 0 (obtendríam os 0 porque lo s va ó 0 ,0 0 64 - 0 ,6 0 0 ,0 0
lores altos serían m ultiplicados a v e ce s por
íb
u
S D = 3,35 A# = 73; 14,90 £ == 4 ,2 0
altos y a v eces por bajos, y lo s valores bajos a
r = 4 ,20/5 =i 0,84.
v eces por altos y a v eces por bajos, dando una
m ezcla de núm eros positivos y negativos que
s e cancelarían entre sí).
En e l ca so que estam os analizando aquí, el
d) V é a s e en la respuesta al ejercicio Id un ejem
total de los productos de las puntuaciones Z e s
p lo de c ó m o escribir un ensayo de este tipo.
3 ,6 , y al dividirlo por la cantidad de parejas te
e) E xisten tres direcciones de causalidad lógicas
rapeuta-paciente da 0,9 0 . A este resultado,
posibles:
0 ,9 , se lo denom ina co eficien te r d e c o rr e la
(i) Estudiar m ás horas e s la cau sa d e m ejores
c ió n d e P e a r so n , e indica una fuerte correla
calificacion es; (ii) obtener m ejores califica
ción linea! positiva entre la satisfacción y la
c io n e s es la causa de m ás horas de estudio.
empatia.
C abe destacar que, aunque en la teoría e sto
e) E xisten tres posibilidades lógicas de la direc
sea p osib le, en la realidad e s im p osib le que
ción de causalidad: (i) S i un terapeuta tiene
un h ech o futuro (la c alificación en la prueba)
m ás empatia, esto hace que e l paciente se
cause un even to anterior (horas de estu d io), o
sienta m ás satisfecho (la em patia causa satis
(iii) un tercer factor, c o m o por ejem p lo e l in
facción); (íi) s i un paciente s e sien te m as satis
terés por la m ateria, podría ser la causa de
fecho, esto puede hacer que e l terapeuta sienta
que e l alum no estudie m ás y de que le vaya
más empatia hacia e l paciente (la satisfacción
m ejor en la prueba.
causa em patia), o (ííi) algún tercer factor, c o
m o una buena adaptación entre e l problem a
del paciente y la habilidad del terapeuta, pu e 3. a)
de hacer que lo s pacientes estén más sa tisfe
chos y que los terapeutas sientan m ás em patia 9
(un tercer factor causa tanto la satisfacción c o 8
m o la empatia), 7 *
6
2. a) 0
'g 5 •
1 4
Calificación en la prueba
100 3 •
90
■ 2
80
70
1 *
60 o!---------
10 15 20 25 30
50 •
*> Extraversión
0 1 2 3 4 5 6 7 8 9 10
Horas de estudio b) C orrelación curvilínea (form a de U inverti
da): hasta determ inado punto, a m edid a que
aum enta la extraversión, aum enta e l aprecio,
b) C orrelación lin eal positiva. A m edida qu e au pero superado e se punto, a m edid a que la e x
mentan las horas de estudio también lo hacen traversión continúa aum entando e l aprecio
las ca lificaciones. d ism in uye.
C)
muy relacionado con el nivel de estrés que su
compañero creé que ella está sufriendo. Por
Extraversión Aprecio por otro lado, la correlación de 0,50 (cerca del me
de un integrante ese integrante ZX Zy dio de la primera columna de correlaciones)
V a lo r P u n tu a c ió n V a lo r P u n tu a c ió n indica que existe una asociación mucho más
observado 1 observado Z fuerte entre el nivel de estrés informado por
8 0,407 una mujer ysu estado depresivo al momento
18 0,37 1,10 de la segunda entrevista. Es decir, es probable
17 0,17 9 1,47 0,245
20 0,80 6 0,37 0,296 que las mujeres que informan estar bajo cierto
8 -1,72 1 -1,47 2,528 nivel de estrés también informen estar depri
13 -0,67 7 0,74 -0,496 midas; aquellas que no están bajo mucho es
24 1,63 1 -1,47 -2,396 trés probablemente no informen estar muy
11 -1,09 3 -0,74 0,807 deprimidas.
12 -0,88 5 0,00 0,000 b) Engeneral, de todas las correlaciones representa
18 0,38 7 0,74 0,281 das en esta tabla, las m á s fuertes se danentre las
21 1,00 3 -0,74 -0,740 variables estrés, apoyo y estado emocional; las
correlaciones de estas variables con las demo
L= 0,932 gráficas (edad, origen étnico, etc.) eran bastan
vD
O
to
o
o
o
n
r
estar fuertemente correlacionado con el estrés
y el estado anímico, y el estado depresivo al
4, a) La tabla muestra el grado de asociación entre momento de la segunda prueba estaba particu
los valores de varias medidas aplicadas a mu larmente relacionado con las otras variables.
jeres embarazadas y a sus compañeros. El c) Sólo porque dos variables están correlaciona
grado de asociación entré valores dé dos me das, aun cuando estén fuertemente correlacio
didas indica en qué grado los valores altos o nadas no significa que podamos conocer la
bajos en una medida coinciden con los valo dirección de causalidad particular que crea di
res altos o bajos en la otra medida. Los núme cha asociación. Por ejemplo, existe una fuerte
ros que indican el grado de asociación se correlación inversa entre el apoyo del compa
denominan coeficientes de correlación. Un ñero en la primerapruebay el estado depresivo
coeficiente de correlación 1 significaría que en la segunda. Existen tres direcciones de cau
los valores de las dos medidas estaban perfec salidad lógicamente posibles en este caso; el
tamente vinculados; conocer el valor de una apoyo por parte del compañero puede causar
medida es todo lo que necesitaríamos para una menor depresión; una menor depresión
poder calcular el valor en la otra medida. (Es puede causar un mayor apoyo; o algún tercer
tas asociaciones tan perfectas casi nunca ocu factor puede causar ambos. Podemos anular la
rren en la vida real). Un coeficiente de segunda posibilidad, ya que un hecho futuro
correlación 0 significa que no existe asocia (poca depresión) no puede causar unhecho pa
ción entre las dos medidas, los valores de usa sado (apoyo inicial). Sin embargo, las otras
medida no tienen ninguna relación con los va dos posibilidades permanecen. Es realmente
lores de la otra medida. Finalmente, un coefi posible que el hecho’de tener el apoyo del
ciente de correlación -1 significa que existe compañero ayude a reducir la depresión. Pero
una asociación inversa perfecta, es decir, va también es posible que un tercer factor esté
lores altos en una medida están perfectamente causando ambas cosas. Por ejemplo, conside
asociados con los bajos en la otra, y vicever remos el nivel de ingresos. Tal vez cuando una
sa, La mayoría de las correlaciones se en pareja logra tener mayores ingresos, el compa
cuentran entre Oy+l óOy- l . Cuanto más ñero tiene más tiempo y energía para brindar
cerca de 0 se encuentra una correlación, más su apoyo, y a la vez una mayor calidad de vida
débil es el grado de asociación. mantiene bajos los niveles de depresión.
Por ejemplo, la correlación 0,17, e n t r e lo in 5. a) Ambas medidas pueden presentar un bajo ni
formado por las mujeres sobre su estrés y lo vel de confiabilídad, reduciendo (atenuando)
informado por los hombres sobre el estrés de así la posible correlación entre ellas.
las mujeres, indica que la asociación entre es b) Entre millonarios no puede haber un gran
tas dos medidas es bastante débil. Por lo tanto, rango de calidad de vida (probablemente to
el nivel de estrés que sufre una mujer no está dos ellos tienen una muy buena calidad de
vida), por lo tanto, la correlación con cual
quier variable {incluso la variable felicidad) 7. SERIEA:
es limitada.
Producto cruzado
Ó. SERIE A: Toma medicamento Se resfría de puntuaciones Z
O r ig in a l Z O r ig in a l Z
5 * 0 -1 1 1 „I
0 ”1 I 1 “1
4 * „1
^ 3 »
0 1 1 -I
0 -1 1 1 „I
2 * 1 1 0 „1 ~1
1 * 1 1 0 „I -I
0 ------- :------------ 1 1 0 „1 -I
1 2 3 4 5 1 1 0 -1 -I
X -8
r = ~8/S =-1,00.
Empatia
- (1 0 ~ 1 ,9 ) / 1 0 - 0,81.
f) -v /o sl = 0 , 9 ; r s 0,9.
g) Puede com probarse m atem áticam ente que el
m étodo m ás preciso para predecir la puntua
3,
ción Z de una persona en una variable (llam é
N o ta en el M o d e lo de m osla Y ), sobre la base de la puntuación Z de
N o ta p re d ic h a
p a rcia l p red icció n en el fin a l esa persona en otra variable (llam ém osla X ),
e s m ultiplicar la puntuación Z en X por el c o e
30 4 0 + (0 ,5)(30) 55 ficien te de correlación. E ste procedim iento
40 40 + (0 ,5)(40) 60 puede sim plificarse en una sola fórm ula (que
50 40 + (0,5X 50) 65 s o requiere las conversiones a puntuaciones Z
60 4 0 + (0 ,5)(60) 70 y de puntuaciones Z), en la que las puntuacio
70 4 0 + (0 ,5)(70) 75 nes originales de Y pueden predecirse directa
80 4 0 + (0,5){80) 80 m ente a partir d e las puntuaciones origínales
90 4 0 + (0 ,5)(90) 85 de X . En este ejem plo en particular, la fórm ula
100 4 0 + (0 ,5 X 1 0 0 ) '9 0 e s tal que, para predecir la puntuación original
d e un paciente en cuanto a satisfacción, se to
4. a) b = (b ) (S D Y/S D x) == (0,9 X 1 ,5 8 /2 2 ,1 4 )
m a la constante de -0 ,9 7 y lu ego s e le sum a el
= 0 ,0 6 4 ; resultado de m ultiplicar 0 ,0 6 4 por e l valor c o
a = M y -(É>)(M *) = 3 - (0 f0 6 4 )(6 2 ) rrespondiente a la em patia del terapeuta.
= -0 ,9 7 ; Para evaluar la precisión d e la fórm ula se de
S a tisfa cc ió n p redicha == - 0 , 9 7 + (0 ,0 6 4 ) ben seguir lo s siguientes pasos. Prim ero, de
(em p atia) terminar la predicción que s e hubiera hecho
utilizando la fórm ula para cada paciente de las
: 6) , cuatro parejas utilizadas para e l cálcu lo del
coeficien te de correlación. Por ejem plo, apli
N ú m ero E m p a tia S a tisfa cció n cando esta fórm ula a la primera pareja, suma
d e p a reja te ra p eu ta del clien te m os a -0 ,9 7 el resultado de multiplicar 0,064
R eal P r e d ic h a por la empatia del terapeuta (0,064 x 70 = 4,48);
el resultado é s 3 ,5 1 . S e puede calcular el
1 70 4 3,51
error en e l que incurriríam os utilizando este
2 94 5 5,05
m od elo para cada una de las predicciones,
3 36 2 1,33
restando el valor predicho al valor observa
4 48 1 2 ,1 0
do. Por ejem plo, en el caso de la primera pa
reja, 4 m en os 3,51 da un error de 0 ,4 9 . D ado
c)
que lo s errores se cancelarían unos a otros al
E rr o r E rr o r 2
sum arios (porque algunos son negativos y
0 ,49 0,24
otros p o sitiv o s), elev o los errores al cuadra
-0 ,0 5 0,0 0
do, Para ilustrarlo gráficam ente, se trazó so
0,67 0,45
bre el diagram a de dispersión preparado para
- 1 ,1 0 1,21
.estos datos una recta (denom inada r ec ta d e
r e g r e sió n ) que muestra las predicciones lo d)
gradas utilizando la fórmula. C o m o s e obser
va. los puntos correspondientes a los valores
observados están bastante cerca de la recta de
regresión, la distancia entre cada punto y la
recta e s el error.
D espu és se com para el err o r en el que incu
rriríamos, utilizando la fórm ula de predicción,
con e l error en e l que incurriríamos predicien
do sin ella (predecir sin ella significa predecir
só lo con la inedia de los valores correspon
dientes a la satisfacción del paciente). E l cálcu
lo estadístico que en realidad se utiliza se
denom ina red u cció n p r o p o r c io n a l d e error.
E s la reducción del error cuadrático ai utilizar e ) R educción proporcional de error
la fórm ula (es decir, e l eixor cuadrático total al
= (^ T o ia i ~ ^ E tro r^ ^ T o ta l “
predecir utilizando la m edia, que s e ca lcu ló en = (1.110 - 322,5 y i.110 *0,71,
10, m enos la suma de errores cuadráticos utili f) V 0 7 Í = 0,84; r * 0,84.
zando la fórmula, que se calculó en 1,9), d iv i g ) R espuesta sim ilar a la del ejercicio 4 g .
dido por e l error cuadrático total al utilizar la Para realizar e l estudio s e utilizó un procedim iento
m edia para predecir. E sto arroja un resultado . estadístico denom inado regresión m últiple. Este
de 0,81, lo que significa que e l error cuadráti procedim iento produce una fórm ula para predecir
c o se ha reducido en un 81% con respecto a e l valor de una persona en una variable dependien
utilizar só lo la m edia para predecir. D a d o que te (en este caso, la aceptación d e l niño por parte de
la reducción proporcional de error es matem á sus pares) a partir de los registros de esa persona
ticamente equivalente al coeficiente de correla en una serie de variables de predicción (en este ca
ción cuadrático, e l resultado se controló calcu so , la enseñanza no social y e l entrenam iento so
lando la raíz cuadrada de la reducción propor cial por parte de la madre d el niño). La fórm ula o
cional de error. La raíz cuadrada de 0,81 e s 0,9, ecu ación se forma m ultiplicando e l valor observa
que coincide exactamente con el coeficiente de do de esa persona, en cada una de las variables de
correlación, predicción, por un número particular denom inado
5. a) b = ($ ) (S D y IS D x ) co eficien te de regresión, y sum ando lu ego lo s pro
~ (0 ,8 4 X 1 4 ,9 /3 ,3 5 ) = 3,74; ductos. E ste procedim iento produce la regla de
a = M x - (b)(W x ) = 73 - (3,7 4 )(6 ) = 50,56. predicción m ás precisa en su tipo.
C alificación predicha = 5 0 ,5 6 + (3 ,74) Cuando e l coeficien te d e regresión e s e l que
(horas de estudio). s e utiliza co n puntuaciones Z, se denom ina c o efi
ciente d e regresión estandarizado y s e sim boliza
b) con la letra griega beta (¡3). En este ejem plo, esta
m os interesados en la ecu ación 1, relacionada con
H o r a s dé la aceptación por parte d e lo s pares. La tabla
e stu d io C a lifica c io n e s (L ) m uestra lo s coeficien tes beta para esta ecuación
(X ) O r ig in a l P r e d ic c ió n (0 ,1 0 y 0,3 2 ). Por lo tanto, la puntuación Z predi
cha para la aceptación por parte de lo s pares de un
0 52 5 0 ,5 6
10 95 87,96 niño e s 0 ,1 0 por la puntuación Z correspondiente a
6 83 7 3 ,0 0 la enseñanza no social brindada por su madre, m ás
8 71 80,48 0 ,3 2 por la puntuación Z correspondiente al entre
6 64 7 3 ,0 0 nam iento social brindado por su madre.
L os coeficien tes de regresión sugieren que la acep
c) E rror E rr o r 2 tación d e un niño por parte de sus pares está m uy
fuertem ente relacionada con e l entrenam iento so
1,44 2 ,0 7 cial brindado por su madre, y m ucho m enos fuer
7,07 4 9 ,5 6 tem ente relacionada con la enseñanza no social
10,00 100,00
brindada por ella. E s importante destacar, sin em
-9 ,4 8 89,87
bargo, que lo s coeficien tes d e regresión para cada
-9 ,0 0 8 1 ,0 0
una de estas variables de predicción reflejan lo que
cada una contribuye a la predicción, independien Capítulos
temente de lo que contribuye la otra. Por lo tanto,
1. a) 50%, b) 16%, c) 98%, d) 84%, e) 50%,
al considerar correlaciones comunes entre cada
f) 84%, g) 2%, h) 16%; i) 50, j) 45, k) 40,
una de las variables de predicción y la variable de
1) 35, m) 30,
pendiente, la importancia relativa de cada una de Nota: Será mucho más fácil resolver problemas
las variables puede ser muy diferente. En este como éste trazando un dibujo de la curva nor
ejemplo, se observa que las copelaciones comunes mal y marcándola como muestran los dibujos a
muestran un patrón similar, aunque la diferencia continuación.
entre las dos variables no es tan importante como
cuando se consideran los coeficientes beta.
Otra información importante en la tabla es R 2. Este
número indica la proporción de error cuadrático de
las predicciones, que se reduce ai utilizar esta regla
de predicción óptima, con respecto a utilizar sólo el
promedio de aceptación por parte de sus pares para
predecir cada registro. Es una forma estándar de
describir la calidad de la regla de predicción ópti
ma. En este caso, la reducción proporcional de (a)
error es del 14%. Además, la reducción proporcio
nal de error es exactamente el cuadrado de la conre-
lación total. La raíz cuadrada de 0,14 es 0,37. Por
lo tanto, la correlación total {denominada correla
ción múltiple y simbolizada con la R mayúscula)
de la aceptación por parte de los pares con respecto
a la enseñanza no social y al entrenamiento social
tomados en su conjunto es R = 0,37.
2, C o n c lu sió n
C o n d ició n r ea l d e la h ip ó te sis d e in v e stig a c ió n
a r ro ja d a p o r la
p r u e b a d e h ip ó tesis V erd adera F alsa
D ecid ir que un m ayor descanso mejora D ecidir que m ayor descanso m ejora
(a) Rechazar
el com portam iento es la d ecisión correc e l comportam iento, d ecisión incorrecta;
la pula ’
ta; de hecho, lo hace. de hecho, no lo hace,
No concluyente D ecid ir que se descon oce la relación entre D ecidir que se descon oce la relación entre
descanso y com portam iento, decisión descanso y com portam iento, d ecisión
inadecuada; de hecho, un m ayor descanso adecuada; de hecho, no están,relacionados.
mejora e l com portam iento.
(b) Rechazar D ecid ir que’, ios'daltónicós distinguen D ecidir que los daltónicós distinguen mejor,
la nula mejor, decisión correcta; de hecho lo ha decisión incorrecta; de hecho no lo hacen.
cen,
N o concluyente D ecidir que se descon oce si lo s daltónicós D ecidir que se d escon oce si los daltónicós
distinguen mejor, decisión inadecuada; distinguen mejor, decisión adecuada;
de hech o lo hacen.- ' de hecho no lo hacen.
(c) Rechazar D e cid ir que los individuos que han D ecidir que individuos que han asistido
la nula asistido a psicoterapia son más tolerantes, a psicoterapia son m ás tolerantes, decisión
d ecisión correcta; lo son. • incorrecta; no lo son. ■
D ecid ir que s e descon oce sí son o n o más D ecid ir que s e d escon oce si son o no más
N o co n clu y en te. tolerantes, decisión inadecuada; lo son. tolerantes, decisión adecuada; n o lo son.
no rechazar la hipótesis nula cuando en realidad la
Z necesario Valor
hipótesis nula es falsa,
para obtener para obtener
3. V é a s e la tabla en la parte superior de la siguiente significación significación
colum na y la figura en la parte superior de la pró
xim a página, (a ) 1,64 0,4 •* 90,66
(b) 1,64 0,4 90,66
4, Z necesario para significación = 1,64; a M - 2 (es 1,64 90,33
(c) 0,2
decir,V[144/361 - 2); puntuación original necesa (d) 1,64 1,0 91,64
ria para significación = 5 3 ,28 (es decir, 50 + (e) 2,33 0,4 90,93
[1,64][2] = 53,28); puntuación Z correspondiente (0 1,96 0,4 90,78
en la distribución predicha = - 0 ,8 6 (es decir,
Z para significación
[53,28 - 553/2 = -0 ,8 6 ); según la tabla Z, beta =
en la población Tan
0,19; potencia =50,81 (es decir, 1 - 0 ,1 9 ) . predicha Beta Potencia del e
Explicación: La potencia es la posibilidad de
rechazar la hip ótesis nula si la hipótesis de investi
(a)(90,66 - 91)/0,4 = -0,85 0,20 0,80 1/4
(b)(90,66 - 92)/0,4 = -3,35 <0,01 >0,99 1/2
gación es verdadera, Para calcular la potencia, e l
(c)(90,33 - 91)/0,2 = -3,35 <0,01 >0,99 1/2
primer paso e s determinar las características de la (d)(91,64-9i)/1 = 0,64 0,74 0,26 1/4
distribución comparativa. En este experim ento, se (e)(90,93 - 91)/0,4 = -0,18 0,43 0,57 1/4
rá una distribución de m edias (de muestras d e 36 (0 (90,78 - 91)10,4 = -0,55 0,29 0,71 1/4
artistas cada una) que está normalm ente distribui
El dibujo de las distribuciones superpuestas para
da (ya que la población lo está) con una m edia de la versión a aparece en la parte superior d e la ■
50 y un desv ío estándar de 2 (según lo s cálculos página 6 3 4 .
descriptos anteriormente). Para rechazar la hipóte
sis nula, la puntuación Z de la m edia muestra! debe
ser superior a 1,64 (se trata de una prueba de una
c ola a nivel 0 ,0 5 ), lo que corresponde a una m edia 5. a) N o la afecta (eso es lo que prueba e l nivel de
significación).
muestra! d e 5 3 ,2 8 puntos originales.
b) Probablemente de p oca im portancia (debido
Ahora bien, ios cálculos de la potencia son
al pequeño tamaño del efecto).
los siguientes. El investigador elaboró la hipótesis
6. a) A um enta la potencia; b) dism inuye la poten
de que la m edia pobíacional de artistas es 55 (e,
cia; c) aumenta la potencia; d) dism inuye la
im plícitam ente, que esta población también es
potencia; e) dism inuye la potencia.
normal con la m ism a a de 12). La distribución de 7. a) A l planificar un experim ento, para permitir
m edias de esta población sería normal con una m e cam bios de distinto tipo (o inclu so abandonar
dia ~ 5 5 y Ya determ inam os que cualquier el proyecto) si la potencia e s dem asiado baja.
m edia por sobre 5 3 ,28 será significativa en térmi (O posiblem ente hacer que el proyecto sea m e
nos de la distribución comparativa. Pero un valor nos costoso, por ejemplo, reduciendo la canti
de 53 ,2 8 se corresponde con una puntuación Z de dad de participantes si la potencia es más alta de
só lo - 0 ,8 6 en la distribución basada en la hipóte lo razonablemente necesario),
sis del investigador. U tilizando la tabla de áreas b) D espu és de realizar un estudio que ha arrojado
bajo la curva normal, el 81% del área bajo la curva resultados no concluyentes, para evaluar si la
se encuentra por encim a de este punto. Suponien falla del estudio debería atribuirse a que la hi
pótesis nula es falsa (en el caso de que la p o
do que las predicciones del investigador sean co
tencia sea alta) o a una potencia inadecuada,
rrectas, ex iste un 81% de posibilidades de que una
de form a tal que aún es razonable pensar que
muestra de 36 artistas produzca un resultado lo su
futuras investigaciones podrían tener la p osi
ficientem ente alto com o para rechazar la hipótesis
bilidad de ser significativas, (A dem ás, en el
nula. Es decir, la potencia es del 81%. caso de un resultado significativo con un gran
L as d o s d istrib u cio n es de m ed ias in v o lu tam año de muestra, si la potencia e s m uy alta,
cradas y la s áreas de sig n ific a c ió n y p o ten cia esto sugiere que es posible un bajo tamaño del
está n rep resen tadas g rá fica m en te ai fin a l d e la efecto indicando que, aunque el resultado es
s ig u ie n te página. significativo, puede no ser m uy importante).
Puntuaciones originales: 89,2 89,6 90 90,4
90,66
Puntuaciones Z: -3 -2 ¡-i 0 -si +2
-0,85
1. a) í necesario (g l = 63, p < 0,05, una cola) = ~ l,6 7 í,
5 <u = ( = c V 9 / 6 4 ) = V o T Í4 ! = 0 ,3 8 .
t = ( M - W /5 m - { 1 i - 1 2 , 4 0 ) /0 f3 8
= - 1 , 4 0 7 0 ,3 8 = - 3 , 6 8 .
S e rechaza la hipótesis nula.
b) t necesario = 2 ,690; S M = 2,55; t = 1,32;
no se rechaza la hipótesis nula,
c) í necesario = 2 ,364; S M = 0,13; t = 3,15;
se rechaza la hipótesis nula.
2. a) Pasos de la prueba d e hipótesis:
1. Replantear el problem a en fu nción de
hipótesis de investigación e hipótesis nula
de poblaciones.
P o b la ció n 1: tiem po d e respuesta con el
nuevo je fe de policía.
P o b la ció n 2: tiem po de respuesta co n el
antiguo je fe de policía.
La hipótesis nula esta b lece que las dos
poblaciones son iguales. La hipótesis de
investigación establece que las dos poblacio c) E xplicación: es la m ism a que la d el problema
nes son diferentes. 4, serie 1, de este capítulo, excepto que en lu
2. Determinar las características de la gar de diferencias, aquí s e utilizan lo s valores
distribución comparativa.. reales, y la m edia poblacíonal esperada son
los 3 0 m inutos (1/2 hora) que e l je fe de p olicía
Población 2: form a = s e presum e normal;
había prom etido cuando era candidato.
(X = 30; a 2 = desconocida;
3. a) t necesario ( g l = 19, p < 0 ,0 5 , una cola)
& = Z ( X - M ) 2/( N - 1 ) = S S /g l = 1,729.
= 1 2 4 /( 1 0 - 1 ) = 13,78. Sw= V(S2/W)= ^(8 29/20) = >Í415=0,64.
Distribución d e medias: form a = t ( g l = 9); t = ( M - í i )/S m = (1,7 - 0)70,64 = 2,66.
b) N o hay efecto s principales; efecto interactivo. b) A m bos efectos principales son significativos;
c) N i e l tipo d e facultad ni el tipo de especializa- no hay interacción,
d o n , por s í so la s, predicen ed ifica cio n es, Pero c) Las mujeres pierden m enos días por m es que
existe un patrón claro si uno analiza las com bina los hombres; los pasantes pierden m enos días por
ciones: las calificaciones correspondientes a alum m es que los supervisores. Cada com binación pier
nos esp ecializad os en arte de las facultades de la de la cantidad de días que esperaríam os c o n o c ie n
com unidad y a alum nos esp ecializados en ciencia do el nivel en cada variable independiente por
de las facultades de artes liberales, son más altas. separado.
* N. de la trad,: C om m u n ity College'. Colegio que comprende dos años de universidad y es mantenido en parte por la
comunidad a la cual sirve,
. Calificación de calidad del resiaurante
D ep orte
a) B é is b o l fú tb o l B a lo n c e s to
a m e r ic a n o
;o C on pro g ra m a 72 7 7 .
10 5 6
la d e m o tiv a c ió n ___ __________________________ _
c S in p r o g r a m a <- ,
10 5 6
¡2 d e m o tiv a c ió n L _ „ ™ J ___________________ _
10 5 6
b) B é is b o l F ú tb o l B a lo n c e s to
a m e r ic a n o
C on p ro g ra m a
' ' ’ '/■ 6 6 6
10 " ■ -Ciudad « d e m o tiv a c ió n
' Calificación de calidad itel restaurante
9 9 i iNuavàyòffc , 'c S in p r o g r a m a
OChicagb; 10 10 10
s ^ d e m o tiv a c ió n
:Y7 /-i. .•
7 8 8 8
Ó
c) B é is b o l F ú tb o l B a lo n c e s to
4
a m e r ic a n o
3 ,§ C on p ro g ra m a
■2 6 7 8
la d e m o tiv a c ió n
1 'q S in p r o g r a m a
8 9 10
0 ¡2 d e m o tiv a c ió n
, Can) Moderador B anco' ' i. 7
7 8 9
; I;' ;vv Coito;;
d) B é is b o l F ú tb o l B a lo n c e s to
b) E fecto principal de la ciudad y el n ivel de pre
a m e r ic a n o
cio, más una interacción.
,.§ C on p ro g ra m a
c) La calidad de los restaurantes es diferente en 6 7 8
‘.a d e m o tiv a c ió n
las distintas ciudades, siendo N ueva York la de
'§ S in p r o g r a m a
más alta calidad y C hicago la de más baja calidad. 10 9 8
y d e m o tiv a c ió n
La calidad de io s restaurantes es diferente según
lo s diferentes n iveles de precio, siendo m ejores los 8 8 8
caros y peores ios baratos. Sin embargo, lo s dos
factores no se com binan sim plem ente, ya que el
e) B é is b o l F ú tb o l B a lo n c e s to
precio crea una m ayor diferencia en N ueva York
que en otras ciudades. a m e r ic a n o
,§ C on p ro g ra m a
6 7 8,
« d e m o tiv a c ió n
'§ Sin p r o g r a m a
ó 8 10
2 d e m o tiv a c ió n
ó 7,5 9
3. a) E fecto dei deporte, 0 ,9 4 ; efecto de la con d i SS.total = 16 + 34 + 2 0 + 3 4 + 10 + 2 0 - 134.
ción , 0,9 7 ; efecto interactivo, 0,94. ss, = 8 + 2 + 2 + 2 + 2 + 2=18,
b) D eporte, 66; condición, 54; interacción, 66. sstcot«ranas = 2 + 2 + 0 + 2 + 2 + 0 = 8,
Por lo tanto, al m enos 66 son necesarios, ss,fitas = 18 + 1 8 + 18 + 1 8 + 18 + 18 = 108.
4. a) A nálisis de varianza: ss.interacción = 0 + 0 + 0 + 0 + 0 + 0 = 0.
Punto de corte F para e l efecto principal del
diagn óstico ( g l = l , 6 ; p < 0 ,0 5 ) = 5,99.
F u en te SC gt CM F
Punto de corte F para e l efecto principal d e la
terapia ( g l = 2 ,6 ; p < 0 ,0 5 ) = 5,14.
Terapia 8 2 4 1,33 N o se rechaza la
Panto de corte F para e l efecto interactivo
hipótesis nula
( g l = 2 , 6 ; p < 0 ,0 5 ) = 5,14.
D iagnóstico 108 1 108 36 S e rechaza
T erap ia A la hipótesis nula
Interacción 0 2 0 0 N o se rechaza
(X - la hipótesis nula
X GM f M f <M
- W -a ñ y /m 2 Interior
I 6 0 4 1 9 0 de casillas 18 6 3
2 16 4 1 9 0
M 4 b) Tabla de m edias de casilla y m arginales
16 8 2 18 0
11 n 0 M edias:
25 1 1 9
9 9 1 1 9 0
A B C
M 10 34 2 2 18 0
I 4 2 3
^Columna ^ n 10 8 9
T erapia B 7 5 6
(X - (X ~ (M r .
X GM f M f <M- W ~ G M f Int2
I 3 9 1 1 9 0
1 25 1 1 9 0
M 2 34 2 2 18 0
II 7 1 1 1 9 0
9 9 1 1 9 0
M 8 10 2 2 18 0
^Columna
T erapia C
(X - (X -
X GM f M f (- W ~ G § af Mí2
I 2 16 1 0 9 0
4 4 Î 0 9 0
M 3 20 2 0 18 0
c) Tamaños de efecto:
II 8 4 1 0 9 0 = »(134 - 108 - 0) = 8/26 = 0.31
10 16 1 0 9 0 R m = 108/(134 - 8 - 0) = 108/126 = 0,86
M 9 20 2 0 18 0 ^íracrcctiín = 0/(134 —8 —108) = 0/18 = 0
d) Explicación; los resultados indican que existe
una diferencia significativa en la efectividad
^Columna ^ entre las dos categorías de diagnóstico; la tera
pia es m ás efectiva para aquellos con diagn ós
tico H. Sin embargo, no existe diferencia sig-
nificativa entre los tipos d e terapia, y io s tipos F u e n te SC si CM F
de terapia no presentan una diferencia de e fe c Sim patía 0 1 0 0 N o se rechaza
tividad significativa en los distintos tipos de la hipótesis
diagnóstico. E l tamaño del efecto significativo nula.
es extrem adam ente grande. N erviosism o 0 i 0 0 N o s e rechaza
5. a) A nálisis de varianza: la hipótesis
Punto F de corte necesario para el efecto prin nula.
cipal de ía sim patía ( g l = 1 , 8;p < 0,0 5 ) - 5,14. Interacción 48 1 48 24 S e rechaza la
Punto F de corte necesario para el efecto prin hipótesis nula.
cipal del nerviosism o ( g l = 1,8; p < 0,05) Dentro
= 5,14. de casillas 12 8 2
Punto F de corte necesario del efecto interacti
vo ( g l = l , 8 ; p < 0 ,0 5 ) = 5,14.
b) Tabla de m edias de casilla y marginales, y gráfico:
M edias:
S im p a tía
A usen cia de
(X - (X - (^Coirniqtx Sim patía sim patía
X G M f M )2 -G M f -G M p In t? N ervioso 7 j 3 5
N erv io sism o 7 4 0 0 0 4 A usencia de N erviosism o 3 j 7 ........... 5
8 9 1 0 0 4 5 5
6 1 1 0 0 4
M 7 14 2 0 0 12
A usen cia de 3 4 0 0 0 4
N erviosism o 3 4 0 0 0 4
3 4 0 0 0 4
3 12 0 0 0 12
M Columna 5
( X - (X ~ ^Columoe,
X G M )2 M )2 - G M f - G M f In t2
N erviosism o 3 4 0 0 0 4
4 1 1 0 0 4
2 9 1 0 0 4
M 3 14 2 0 0 12 5
c ) Tamaño del efecto:
A usen cia de 7 4 0 0 0 4 ^ W = ° / < 6 0 - 0 ~ 4 8 ) = 0/12 = 0
N erviosism o 5 0 4 0 0 4 M, = 0 / ( 6 0 - 0 - 4 8 ) = 0 /1 2 = 0
9 16 4 0 0 4
« " u r t , * «* / ( 6 0 - o - 0 ) - 48/60 = 0,80
7 20 8 0 0 12 5 d) Explicación: los resultados indican que existe
una interacción significativa entre e l nervio
M 5 sism o y la simpatía: cuando e l acusado es sim
Columna
pático, tiene m ás probabilidades de ser ca
^^Toia! = 60. lificado inocente si está nervioso; pero s i no es
= 12. sim p á tic o , tiene m ás probabilidades de ser ca
^D entro
lificad o inocente si no está nervioso. (Tal vez
^Columnas = 0.
ucr* uno puede sentir em patia con el nerviosism o
^FU a = 0.
de una persona sim pática en el estrado, y si la
5CInteracción = 48. persona no estuviera nerviosa, uno podría sos-
pechar algo raro. En una persona que no es sim cuatro subgrupos, ios g l intergrupales - 3 , y
pática, el nerviosism o puede ser una adverten dado que hem os utilizado 1 para sim patía o
cia de que es culpable, pero si no está nervioso, ausencia de sim patía y 1 para nerviosism o o
sugiere que no tiene nada que ocultar). N o hubo ausencia de nerviosism o, queda 1 g l para la in
efecto significativo general en cuanto a la sim teracción,
patía o a la falta de ella, o en cuanto al nervio ó. En este estudio hubo dos hallazgos importantes.
sism o o la falta del m ism o, aunque debido al Primero, com o s e esperaba, los participantes con
pequeño tamaño de las muestras utilizadas, el estereotipos extrem os en cuanto a que lo s agentes
no poder rechazar la hipótesis nula no debería RRPP son extrovertidos, com parados con lo s parti
tomarse co m o prueba de que no existe tal
cipantes con estereotipos m oderados, describieron
efecto.
a lo s agentes rrpp com o m ás extrovertidos. Este
El cálculo de la significación en este experi
resultado fue estadísticam ente significativo; por
m ento es m uy parecido al análisis de varianza
consiguiente, podem os confiar en que e l patrón d el
de un criterio utilizando el m étodo del m odelo
resultado se aplica no só lo a las personas estudia
estructural, L os grados de libertad y la suma
das en particular sino a las personas en general que
de cuadrados intragm pales se calculan de la
sean sim ilares a las estudiadas. (M ás precisam en
forma acostumbrada, considerando a cada una
te, hem os calculado que si no existiera diferencia
de las cuatro casillas com o su propio grupo.
Sin embargo, en este caso, el desvío intergru prom edio en la población en general, entre perso
pa! se divide en partes. Una parte tiene en nas con estereotipos extrem os y m oderados existi
cuenta la variación intergrupal de la sim patía y ría m enos de un 0,0001 de probabilidad de que
la ausencia de la m isma. L os d esvíos se calcu este experim ento produjera un resultado tan fuerte
lan para cada participante tomando la m edia c o m o e l obtenido). M ás aún, con relación ai tama
de todos lo s participantes en esa condición de ñ o d e e fe cto (proporción de varianza explicada) tí
simpatía y ausencia de sim patía a la que perte picamente encontrado en ios estudios psicológicos,
nece el participante, y restándole la gran m e la diferencia obtenida fue considerable. (Utilizan
dia. Luego, los d esvíos se elevan al cuadrado y do la fórmula basada en los F , R 2 = (38,94)(1) /
se sum an para obtener la sum a de cuadrados. [(3 8 ,9 4 )(1 )+ 42) = 0,48).
D esp u és se repite el proceso con la condición En segundo lugar, y de sum a importancia, es
de nerviosism o y ausencia de nerviosism o. que sorprendentem ente la tendencia fu e m ucho
L os grados de libertad para cada condición m ás fuerte en los participantes a quienes se les dio
son la cantidad de niveles m enos uno. Por una descripción de un agente rrpp en particular
ejem plo, dado que hay dos niveles de simpatía que era altam ente introvertido. El resultado tam
(sim patía y ausencia de sim patía), esta condi bién fu e estadísticam ente significativo; (En este
ción tiene 1 grado de libertad. caso, la posibilidad de obtener un resultado tan
Aún queda una parte correspondiente al fuerte, si en la población en general no hubiera una
efecto intergrupal que tiene en cuenta las va tendencia prom edio del tipo observado, era m enor
riaciones intergrupales de las m edias de cada
al 5%). E l patrón de este resultado también tenía
uno de los cuatro subgm pos, que no son sim
un tam año del efecto bastante grande con relación
plem ente el resultado de sumar los efectos de
a lo que usualm ente s e ve en lo s estudios p sic o ló
la simpatía y el nerviosism o. Es decir, toda va
g ic o s (.R 2 = (5,69X 1) / E(5,69XÍ) + 42) = 0,12).
riación entre los grupos de simpatía, que difie
En líneas generales, las personas expuestas
re según el grupo de nerviosism o al que
al extrem o introvertido tendieron a dar m ayores
pertenezcan. El desv ío para este efecto inte
calificacion es de extroversion. El resultado tuvo
ractivo se encuentra tomando el desv ío de ca
da registro con respecto a la gran media significación estadística “m argin ar, es decir que
general, y restándole los otros tres desvíos (el se encontraba en e l lím ite de ser dem asiado im pro
del registro m enos la medía de su grupo, y los bable que sucediera sí no existiera verdadera d ife
de la m edia de simpatía m enos la gran media, rencia prom edio en la población. M ás aún, el re
y la m edia de nerviosism o m enos la gran m e sultado no es m uy interesante, ya que, com o se
dia). D espu és se elevan al cuadrado e so s des - puede observar en el gráfico, se debe enteramente
víos restantes y se suman para convertirse en a los participantes con estereotipos extrem os, y si
la sum a de cuadrados de la interacción. Los algún efecto se observa en los participantes de e s
grados de libertad son los que restan del total tereotipos moderados es en realidad un patrón de
de grados de libertad intergrupales. C om o hay efecto contrario.
C apítulo 14 La hipótesis de investigación establece que
la distribución entre las distintas temporadas,
î. a) Punto de corte x 2 necesario
con respecto al m om ento en que los pacientes
(g / = 5 - 1 = 4 ,5 % ) = 9 ,4 8 8 . com ienzan la psicoterapia, es diferente entre
las d os poblaciones. L a'hipótesis nula estable
Categoría O Esperado O - E (O -E )*1 (O -E )1/ E
c e qu e la distribución entre las distintas tem
A 19 (0 ,2 )(5 0 ) =10 9 81 8 ,1 0 poradas, cor- respecto al m om ento en que los
B 11 (0 ,2 X 5 0 ) = 10 1 1 0 ,1 0 pacientes com ienzan la psicoterapia, no es d i
C 10 (0 ,4 )(5 0 ) = 20 - 1 0 100 5 ,0 0 ferente entre las dos poblaciones.
D 5 (0 ,1 X 5 0 ) = 5 0 0 0.00 2. Determ inar las características de la
E 5 (0 ,1 )(5 0 ) = 5 0 0 0.00 distribución comparativa.
Total 50 (0 ,1 )(5 0 ) = 50 0 X2 "0 3 ,2 0 D istribución de chi-cuadrados con 3 grados de
Conclusión: se rechaza la hipótesis nula. libertad ( g l = 4 - 1 = 3).
3. Determinar el punto de corte en la distri
b) Punto de corte x 2 necesario
bución comparativa, a partir del cual se d eb e
(SÍ = 3 - 1 = 2 , 5 % ) = 5 ,9 9 2 . ría rechazar la hipótesis nula.
N ivel 0,05, = 3: x 2 = 7,815.
Categoría 0 Esperado O -E (O -E )1 (O - E f í. E
4. Determinar el valor muestra! en la distri
I 100 (0 ,3X 3 0 0 ) = 90 10 100 1,11 bución comparativa.
n 100 (0 ,5X 3 0 0 ) = 150 -5 0 2 ,5 0 0 16,67
in 100 (0 ,2 X 3 0 0 )= 60 4 0 1,600 26,67
Total 300 300 0 x 2 == 4 4 ,4 5
Conclusión: se rechaza la hipótesis nula. Temporada O Esperado 0 ~ E (0 ~ E )2{0 ~ E )2f £
10 (1 3 ) 16 (1 3 ) 26 (50% ) = 0 , 6 9 + 0 , 6 9 + 0 , 6 9 + 0 , 6 9 + 0 + 0 = 2 ,7 6 .
Respuestas 655
El chi-caudrado es una m edida del grado de Sin em bargo, p od em os estim ar el grado real
discrepancia entre los resultados observados y de relación, dentro de este grupo, entre el e le
esperados. C alculam os la diferencia entre lo m ento utilizado en clase y ei artefacto utiliza
observado y lo esperado en cada com binación, do en lo s hogares. El procedim iento m encio
de la estructura 2 x 3 , elevam os esa diferencia nado se denom ina “phi de Cramer", y se cal
al cuadrado y la dividim os por la cantidad e s cula dividiendo el chi-cuadrado calculado por
perada; luego sa m am os los resultados. En la la cantidad de personas que inclu ye el análi
com binación lapicera-máquina de escribir, 42 sis, sacando luego la raíz cuadrada del resul
m enos 39 es 3, elevado al cuadrado es 9, divi tado, En el ejem plo que analizam os el resultado
dido 39 e s 0,23. A l realizar el m ism o proceso es 0,07.
para las otras cinco com binaciones y sumarlas El estadístico que m encionam os en el párra
obtenem os 1,06. (L os chi-cuadrados utilizan fo anterior se extiende del 0 (ausencia de rela
diferencias elevadas al cuadrado para qué el ción) al 1 (relación perfecta, con ocer la si
resultado no se vea afectado por las direccio
tuación de una persona en una de las dim en
nes d e las diferencias. A dem ás, la diferencia
siones, com o por ejem plo, saber qué utiliza
cuadrática se divide por la cantidad esperada
para escribir en clase permitiría predecir per
para adaptar el im pacto de las cantidades rela
fectam ente su situación e n la otra dim ensión,
tivam ente diferentes esperadas para cada com
tal com o el elem ento que utiliza para escribir
binación).
en su hogar). Por lo tanto, 0 ,0 7 es un número
L os estadísticos han determinado matem áti
bastante bajo. (D e hecho, e l phi de Cramer es
cam ente lo que sucedería si tomáramos una
com parable con lo que s e denom ina un c o efi
cantidad infinita de muestras de una población,
ciente de correlación, y en p sic o lo g ía 0 ,0 7 es
con una proporción fija de personas en cada
un valor m uy bajo con respecto a las correla
una de las distintas agrupaciones, y calculára
cion es encontradas en la m ayoría de lo s estu
m os el chi-cuadrado de cada una ele esas m u es
dios). V iéndolo de otro m odo, podem os pre
tras. L a distribución de e so s chi-cuadrados
depende só lo de la cantidad de agrupaciones guntar, si realm ente existe una relación m ode
libres para adoptar diferentes valores espera rada, ¿cuáles son las posibilidades de que todo
dos. (Si de cada una de las categorías en las el proceso realizado diera co m o resultado una
que se divide la variable “artefactos utilizados conclusión positiva? L os estadísticos han de
en el hogar” co n o cem o s la cantidad de alum sarrollado tablas que nos indican esa probabi
nos que toman apuntes con lapicera, es fácil lidad y, en este caso, habría un 97% de pro
determinar la cantidad de alum nos que tom a babilidad. Por lo tanto, dado ei resultado obte
apuntes co n lápiz. Y si conocem os dos de las nido, si existe alguna relación, casi segura
tres categorías de la variable “artefactos utili m ente es bastante pequeña.
zados en los hogares” , correspondientes al 6. a) L os cinco pasos de la prueba de hip ótesis d e
grupo que utiliza lapicera, la tercera categoría berían realizarse de forma sim ilar a Eos indica
es fá cil de determinar porque debe sumar el dos en la respuesta a! ejercicio 5 que aparece
total de alum nos que utilizan lapicera. Por lo anteriormente. L os cálculos y resultados clave
tanto, só lo dos com binaciones son “libres de se indican a continuación: .
variar”). gt =(tfcbtom«-1Wflta -1) “ (3- D(3 - 1M ;
U na tabla de la distribución de chi-cuadra Punto de corte y 2 necesario (g l ~ 4,5% ) = 9,488.
d os, para el ca so en que dos agrupaciones son
libres de variar, muestra que ex iste só lo un
5 % de p osibilidades de obtener un chi-cua C om u n id ad
drado de 5 ,9 9 2 ó mayor. D ebido a que nuestro B
A C Total
chi-cuadrado es m enor a ese número, las can A favor 12 (9,8) 6 (4,2) 3 ( 7 ) 21 (23,33% )
tidades observadas en cada categoría difieren En contra 1 8 (1 6 ,8 ) 3 (7,2) 1 5 (1 2 ) 36 (40,00% )
d e las cantidades esperadas m enores a lo nece No emite
sario para poder rechazar la idea de que el e le opinión 1 2 (1 5 ,4 ) 9 (6,6) 1 2 ( H ) 33 (36,67% )
m ento que las personas utilizan para tomar
apuntes no está relacionado con e l artefacto T otal 42 18 30 90
que utilizan para escribir cuando están en sus
hogares. La encuesta no es concluyente.
( 1 2 - 9,8 )2 . (6 - 4,2)2. (3 - 7)2 (18 ~ 16,8)“ C ap ítu lo 15
• ^ ............. “Í............. "V
*------- + ......... .......
9,8 4,2 7 16,8 1.
(3 - 7 , 2 ) 2 (1 5 -1 2 )2 ( 1 2 - 15,4 )2 ( 9 - 6 , 6 )2
+ ......•.....+ ----- -------H— — ——+ ....... r":
7,2 12 15,4 6,6
, (1 2 - ll) 2
T ....
11
= 8,55. (a)
N o se rechaza la h ip ó te sis nula.
b) / cié Craraer = 78,55/(90)(2) = 7 8 ,5 5 /1 8 0 =
0,05 = 0,22.
Potencia para un tamaño d e efecto pequeño
= 0 , 1 1 ; m ediano = 0 ,6 6 ; grande = 0 , 9 9 . (Sobre
la base de N - 1 0 0 ) .
c) Explicación: V éa se la respuesta al ejercicio 5c.
7. a) C álculo de x 2
Han N o han
tratado tratado . Total
£ 4 0 hrs. 37 (5 2 ,9 ) 51 (35,2) 88 (15,80% )
4 0 - 4 9 hrs. 7 0 (7 0 ,4 ) 47 (4 6 ,8 ) 117 (21,00% )
> 5 0 hrs. 2 2 8 (21 2 ,1 ) 1 2 5 (1 4 1 ,2 ) 353 (63,30% )
T o ta l 335 223 5 5 8 (1 0 0 ,1 0 % )
Ce)
( 3 7 - 5 2 ,9 f (51 - 3 5 , 2 ) 2 ( 7 0 - 7 0 ,4 ) 2
52,9 + 3 5 ,2 * 70 ,4 D atos sin
tra n sfo rm a r R aíz c u a d r a d a R angos
( 4 7 - 4 6 , 8 )2 (2 2 8 - 2 1 2 ,l ) 2 ( 1 2 5 - 1 4 1 , 2 )2
0 -4 12 0 —0,9 1 0 -4 ,9 ■■■4
+ 46,8 + 212,1 + 141,2
5 -9 5 1 -1 ,9 7 5 -9 ,9 4
= 4 ,7 8 + 7 ,0 9 + 0 ,0 0 + 0,00 + 1,19 + 1,86 = 14,92 1 0 -1 4 4 2 -2 ,9 7 1 0 -1 4 ,9 6
1 5 -1 9 4 3 -3 ,9 6 1 5 -1 9 ,9 5
2 0 -2 4 3 4 -4 ,9 7 2 0 -2 4 ,9 5
b) cj> de Cramer 2 2 2 5 -2 9 ,9 5
2 5 -3 0 5 - 5 ,9
= ^ 4 , 9 2 / ( 5 5 8 ) 0 ) ] = VÓ£ 2 7 = 0 ,1 6 ; 3 0 -3 4 ,9 1
tamaño del efecto pequeño.
c) £1 princip al halla zg o e s qu e las pro p o rcio
nes d e m éd ico s que han tratado p a cien tes
co n hív /sid a e s m ucho m enor dentro del gru
po de m édicos que ejercen m enos d e 40 horas
por semana. D e todos m odos, se trata de un ta
maño del efecto pequeño. La explicación para
una persona que nunca ha tom ado un curso de
estadística sería sim ilar a la respuesta al ejer
cicio 5c anterior.
O ri- O ri tanto, probablem ente sugiere que la distribución
gin a l / R ango V” gín a l / R ango - f poblacional de raíces cuadradas de los tam años de
las fam ilias está distribuida de form a práctica
0/ 1 1 0 ,0 14 mente normal. Som os con scien tes de que calcular
Mí! 3 3 1,0 15 la raíz cuadrada de cada tamaño fam iliar distor
2 Ul 3 6 1,4 16// 2 22,5 4 ,0
siona su significado directo. Pero el im pacto cau
3/ 1 8 1,7 17/ 1 24 4,1
sado a los individuos de la fam ilia per cada hijo
m 4 10,5 2,0 18/ 1 25 4,2
adicional probablem ente no sea igual. Es decir, no
5/ 1 13 2 ,2 19
tener ningún hijo y tener uno provoca un enorm e
6/ 1 14 2 ,4 20/ 1 26 4,5
7/ 1 15 2 ,6 21/ 1 27 4,6 im pacto. Pasar de tener 1 a tener 2 provoca un
8 22 im pacto menor, y pasar de tener 7 a tener 8 proba
9// 2 16,5 3,0 23/ 1 28 4,8 blem ente provoca una diferencia m ucho menor
10// 2 18,5 3,2 24 para ia fam ilia,
11/ 1 20 3,3 25/ 1 29 5,0 D e todos m odos, después de haber calculado
12/ 1 21 3,5 26 la raíz cuadrada de cada observación, se realizó
13 27 una prueba t com ún para m edias independientes.
14 28/ 1 30 5,3 El resultado no fue concluyente; no se pudo recha
15 zar la hipótesis nula. (Y dado que e l tam año d e ia
muestra era tan pequeño, la potencia probable
2. Probablem ente no normal: a) asim étrica hacia la mente tam bién era baja, haciendo difícil deducir
derecha, b) bim odal, c) asim étrica hacia ia algún significado del hecho de no haber podido re
derecha, chazar la hipótesis nula).
3. a) y b) Punto de corte r necesario (dos colas, 4. a) y b)
p < 0,0 5 , g l = B) = 2 ,3 0 6
Observación:
201 523 614 136 340 301 838 911 1.007
V alores a lo s que se le ap licó Rango:
la tra n sfo rm a ció n ra íz c u a d ra d a 2 5 6 1 4 3 7 8 9
M:
G ru p o A G ru po B
13/3 = 4,33 8/3 = 2,67 24/3 = 8 GM = 5
1,1 1,4
S2:
1,6 3 ,0
8,67/2 = 4,34 4,66/2 = 2,33 2 /2 = 1
2,1 2,4
Punto de corte F necesario ( g l = 2 , 6 ; p < 0 ,0 5 ) = 5 ,1 4
1,9 2,6
S2« * == ( S S / g m = « (4 ,3 3 - 5)2 + (2,67 ~ 5 ) 2
2 ,7 2 ,2
+ (8 - 5)2]/(3 - 1) )(3 ) = (1 4 ,8 8 /2 )(3 ) = 2 2 ,3 2
r= 1,88 2,32
= (4 ,3 4 + 2,33 + 1)/3=2,56; F = 2 2 ,3 2 /2 ,5 6 = 8,72
*= 0,35 0,35
C onclusión: s e rechaza la hipótesis nula.
! = 0 35
5a 0,07 c ) E xplicación: com únm ente, en estos casos en
&'Diferencia = » ,0 7 + 0.07 " 0 .1 * W * . « 0,37 ios que se prueba la significación de la d ife
t - (1 ,8 8 - 2 ,3 2 )/0 ,3 7 = —i , 19
rencia entre tres m edias, se realizaría un análi
conclusión: no se rechaza la hipótesis nula,
sis estándar de varianza de un criterio. S in
c) E xplicación: no habría sido adecuado realizar una em bargo, un supuesto del análisis de varianza
prueba t con los números tal com o estaban (sin establece que las poblaciones correspondien
transformarlos). Las distribuciones de las m ues tes a cada grupo están distribuidas normal
tras eran tan asim étricas para am bos grupos m ente. Según la muestra, las calificaciones
idiom áticos que parecía probable que la distribu dadas por e l grupo que miró la película que
ció n poblacional también fuera considerablem ente causaba tristeza parecían m uy asim étricas ha
asimétrica. En e se caso, no s e cum pliría el cia la izquierda y, posiblem ente, las califica
supuesto para la prueba t que establece que las dis cion es del grupo que v io la p elícula que
tribuciones poblacionales im plícitas son normales. causaba enojo tam bién lo fueran. (E s más,
Por lo tanto, s e calculó ia raíz cuadrada de cada existía bastante diferencia entre las estim acio
observación, A través d e ese proceso s e obtuvo la nes de varianza poblacional d e l grupo d e la
posibilidad de crear una distribución muestra! película triste y del grupo de la película alegre,
m ucho más cercana a lo normal, y que, por lo hecho que cuestiona otro de los supuestos del
anova, que establece que las distribuciones que, de todos m odos, hubieran realizado bien
pobiacíonales tienen la m ism a variarla). la tarea. Pero, ¿cuál es la probabilidad de que
Para resolver este problema, cam biam os lo antedicho ocurra? E xisten só lo 20 formas
cada uno de los valores observados por su de com binar a seis personas en dos grupos de
rango, en todos los casos. El proceso arriba tres. E sas 20 com binaciones fueron presenta
m encionado produjo el efecto de convertir la das en el enunciado d el problema, y se calculó
distribución de calificaciones en una distribu la diferencia del prom edio de lo s valores c o
ción rectangular (aunque en realidad no ayudó rrespondientes a las personas que realizaron la
m ucho en cuanto al grupo de la película tarea a solas, m enos el prom edio de los valo
triste). D e todas maneras, algunos estadísticos res de aquellos que realizaron la tarea en pre
recom iendan que si lo s supuestos de un análi sen cia de un am igo. D e las 20 posibles com bi
sis de varianza com ún son cuestionables, uno naciones de asignación aleatoria, sólo una, la
debería cambiar los valores primero a rangos que presenta los valores de los dos grupos rea
y luego realizar el proceso, y a sí se obtendrán les, habría producido sem ejante diferencia en
resultados más precisos. En realidad, existen tre los dos grupos. Si los resultados se dieran
procedim ientos esp eciales que uno puede uti de m odo casual, existe sólo una probabilidad
lizar para realizar un análisis de varianza por del 5 % de obtener el m ayor de 20 resultados.
rangos. Pero lo s cálculos son m atem ática E se porcentaje es dem asiado bajo para con si
mente equivalentes a los que se realizan en un derarlo probable. Por lo tanto, se llegó a la
análisis de varianza utilizando rangos. La conclusión de que la gran diferencia entre los
única diferencia es que co n el procedim iento prom edios de ios dos grupos no fu e un hecho
de rango y orden existen tablas esp eciales que, casual resultante de la asignación aleatoria.
en estos casos, son más precisas que la tabla F, D ado que todos los dem ás aspectos entre lo s
D e todos m odos, los estadísticos sugieren que grupos eran iguales, la conclusión es que la si
los resultados, al utilizar una tabla F com ún en tuación de estar a solas o estar en presencia de
estos casos, son una buena aproxim ación. un am igo es lo que ocasion ó ia diferencia.
D ado que nuestro resultado era claramente 6. M iller deseaba exam inar la relación entre las va
más extrem o que el punto F d e corte, podem os riables que estaba analizando, probablem ente in
aceptar esta conclusión sin temor a equivo cluyendo varias técnicas paramétricas d e prueba
cam os, y rechazar la hipótesis nula. de hipótesis tales com o la prueba t o un análisis de
5. a) Procedim iento: con 2 0 diferencias de m edia, varianza (o probando la significación de los resul
la diferencia de m edia resultante debe ser la tados de una correlación o regresión m últiple o bi-
m ayor para rechazar ia hipótesis nula al nivel variada). Todos e sos procedim ientos se basan en el
0,05. supuesto de que las distribuciones de las variables
Las diferencias de m edia, en el orden en que en la población siguen una distribución normal.
se presentan lo s grupos en el ejercicio, son las Sin embargo, antes de realizar los procedim ientos
siguientes: m encionados, M iller controló las distribuciones de
varias de las variables que estaba organizando. A l
4,67 4 2,67 2 3,33 2 1,33 1,33 0,67 -0 ,6 7 realizar ese control, descubrió que las observacio
-4 ,6 7 - 4 -2 ,6 7 - 2 -3 ,3 3 - 2 -1 ,3 3 -1 ,3 3 - 0 ,6 7 -0 ,6 7 nes correspondientes a dos m edidas clave (el índi
ce de atención a alternativas y e l tiem po transcu
Las diferencias de m edia, ordenadas de menor rrido observando las diapositivas) eran positiva
(m ás negativa) a mayor, son las siguientes: mente asim étricos (presentaban una distribución
ladeada con una larga cola hacia la derecha). Por
-4 ,6 7 , - 4 , -3 ,3 3 , -2 ,6 7 , -2 , - 2 , - 2 , -1 ,3 3 , -1 ,3 3 , -0 ,6 7 , ello resultaba poco probable que las distribuciones
-0 ,6 7 , 0 ,6 7 ,0 ,6 7 , 1,33, 1,33, 2, 2, 2 ,6 7 , 3 ,3 3 ,4 , 4,67 poblacionales de esas variables cum plieran e l su
puesto de seguir una curva normal. Por lo tanto,
b) Explicación: supongam os que realizar la prue M üier decidió cam biar cada valor m atem ática
ba so lo o frente a un am igo no im plicaba nin m ente, Este proceso se denom ina transformación.
guna diferencia. En ese caso, la razón por la En este caso, calculó el logaritm o de cada registro.
cual los valores observados de las personas El efecto del proceso m encionado es reducir todos
analizadas son m ayores cuando se encuentran ios números, pero los números mayores en m ayor
a solas debe de ser que la asignación aleatoria grado, reduciendo de ese modo la asimetría positi
accidentalm ente ubicó, dentro de ia condición va y acercando la distribución a la n orm al Parece
en la que se encuentran a solas, más personas particularmente adecuado realizar e l tipo de trans-
formación descripía con una medida de informe Comparación:
propío, en la que no existe una escala absoluta.
Probablemente, eí mismo proceso sea apropiado Varianza
también para ei tiempo transcurrido observando gl Punto de corte intragrupal t óF
las diapositivas, ya que cada segundo adicional de t 70 1 ,9 9 5 S l Mtx0 = 4 4 2 ,5 6
observación puede no representar una cantidad F 70 3 ,9 8 S l emr^ 4 4 6 ,5 5
igual de interés adicional. D e todos modos, es im ( f = 1 ,9 9 5 ) ( V = 2 ,5 6 )
portante subrayar que una transformación de este
tipo aún conserva intacto el orden de las observa iii) Prueba z:
ciones. D e todos modos, luego de realizar la trans Punto de corte í
formación, ios valores transformados probable ( g l = 30 , p < 0,05, dos colas) = 2,043
mente se utilizaron en las técnicas estadísticas pa S2Combinada «1500118» + (D5/30H 6)) = 7;
ramétricas comunes. S2m =7/16 = 0,44; S2M 2 = 7/16=0,44;
■ SW »=0.'W + 0,44 = 0,88;
S » ™ * = 0,94; t -> < 7 3 -■7 5 y 0 ,9 4 =■-2 ,1 3
Capítulo 16 Se rechaza la hipótesis nula.
1.
anova:
S í: 5 10 15 20 Punto de corte F (g l = 1, 30; p < 0,05) = 4,17
t 2,571 2,228 2,132 2,086 ^ - {[(73 - 74)2 + (75 - 74)2]/
6,61 4,96 4,55 4.35 (2 —1 )} (1 6 )= = (2 /l)(1 6 ) = 32
F 6,61 4,97 4,54 4,35 ■^dentro™ $ + 6)/2 = 7; F = 32/7 = 4,57
Se rechaza la hipótesis nula.
2. i ) anova:
Comparación:
Punto de corte F ( g l - 1, 58; p < 0,05) = 4,02
S^etre = (S C /g l) (n ) = ({[(12 - 11,55)2 + Varianza
(11,1 - 11,55)2]/= (2 -1)}(3 0 ) gl Punto de corte intragrupal tó F
Comparación: 3.
C2
Diferencia Gradas de libertad:
“ ^Mí + ^M2 S/Totai = / V ^ l = 8 - l = 7
" ^ C o m b in a d a ^ l^ + ^ C o m b in a d a ^ ) S ^cnm = g l í + g l 2 + - - - + U ltim o = 4 + 2 = 6
= (4 0 /1 0 ) + (4 0 /1 0 )
centre ~ ^Grupos 1 ~ 2 1~1
=4+4=8 Control (g L to a = g l áeow + g l&nJ : 7 = 6 + 1
G rupoA X Y
O r í- O ri-
X X - GM X -M M - GM
g in a l Z g in a l Z Z XZ y Y E rro r E rro r
D esv D esv2 D esv D esv2 D esv D esv 2
1 0,77 13 - 0 ,2 2 - 0 ,1 7 17 -4 16
1 0,77 16 0 ,4 6 0,35 17 -1 1
13 -1 1 _4 16 3 9
1 0,77 19 1,14 0,88 17 2 4
16 2 4 -1 1 3 9
1 0,77 18 0 ,9 2 0,71 17 1 1
19 5 25 2 4 3 9
4 16 3 l 0,77 19 1,14 0,88 17 2 4
18 1 1 9
19 5 25 2 4 3 9 0 --1,29 11 -0 ,6 8 0,88 9 2 4
71 45 0 *-1,29 7 -1 ,6 0 2,06 9 -2 4
2 85 26
M = 17 0 --1,29 9 -1 ,1 4 1,47 9 0 0
G rupo B 2 :5 112 7 ,0 6 34
X X - GM X~M M - GM M = 0,625 14 r = 0 ,8 8 r 2 = 0,77
S C = 1 ,8 7 4 154
D esv D esv 2 D esv D e s v 2 D esv D esv 2
S D ~ 0 ,4 8 4 4,387
O r ig in a l O r ig in a l 2 .
¿.y
2* Z A
1 1 0,7 0 ,4 2 0 ,4 2
1 1 0,9 1,26 1,26
1 1 0 ,8 0 ,8 4 0 ,8 4
0 -1 0 ,6 0 ,0 0 0.00
0 -1 0,4 - 0 ,8 4 0,84
0 -1 0,2 -1 ,6 8 1,68
2 3 3,6 5,04
M = 0,5 0,6 r = 0 ,8 4
S D = 0 ,5 0 ,2 3 8
t - = 0 , 8 4 = OM-F/FIu Ï
= (0,84)(2)/V Ô 29 = 1 ,68/0,54 = 3,11
D istrib u ció n n o rm a l: distribución d e frecuencias que E stadísticam ente significativo: conclusión que estable
sigue una curva normal. (5) ce que los resultados de un estudio serían improbables
si, en e fe cto , n o hubiera d iferen cia en las pob la
D istrib u ció n recta n g u la r: distribución de frecuen
ciones representadas por las muestras analizadas; resul
cias en la cual todos ios valores tienen aproximada
tado de una prueba de hipótesis en la que se rechaza la
m ente ía m ism a frecuencia, ( i )
hipótesis nula, (3 ,6 )
D istr ib u c ió n sim é tr ic a : distribución en la cual los pa
E stim ación c o m b in a d a d e ia v arian za p o b lacion al:
trones de frecuencias a la derecha y a la izquierda son
im ágenes especulares entre sí. (1) í^2Combinad»): en una Prue^>a f para m edias independien
tes, es un prom edio ponderado de las estim aciones de
D istrib u ció n t: curva matemáticamente definida que varianza poblacional calculadas a partir de las dos
describe la distribución comparativa en una prueba t. (9) muestras (cada estim ación ponderada según la propor
D istrib u ció n u n im o d a l: distribución de frecuencias ción de grados de libertad de su muestra, dividida por
con un valor que claramente presenta una frecuencia los grados d e libertad totales de ambas m uestras). (10)
m ayor a la de cualquier otro. (1) E stim ación in terg ru p a l de la v arian za p o b la cio n a l
E fecto in tera ctiv o : situación que se presenta en el (^Emre' CMgntre) : en un análisis de varianza, es la esti
análisis factorial de varianza, en la cual la com bina m ación de ia varianza de la distribución poblacional de
ción de variables tiene un efecto esp ecial que no p o individuos que se basa en la variación entre las m edias
dría predecirse a partir del conocim iento de los efectos de ios grupos analizados; es igual a los C uadrados m e
de las d os variables en forma individual. (13) d ios in terg ru p a les. (11)
Estim ación intercalar: rango de registros (es decir, Frecuencia esperada: en una prueba chi-cuadrado, es
registros que se encuentran entre algún valor superior la cantidad esperada de individuos en una categoría o
e inferior específico) que se estima incluye un paráme casilla si la hipótesis nula fuera verdadera. (14)
tro poblacional y se contrapone a la estim ación pun Frecuencia m arginal: en una prueba chi-cuadrado, la
tual; un intervalo de confianza es un ejemplo de frecuencia (cantidad de casos) én una fila o columna
estimación intervalar. (7) de una tabla de contingencia. (14)
Estim ación intragrupai de va fianza poblacional Frecuencia observada: en una prueba chi-cuadrado,
(^Dentro1 t^Demro'f en un análisis de varianza, es la es es la cantidad de individuos en una categoría o casilla
timación de la varianza de la distribución poblacional efectivamente encontrados a través de un estudio. (14)
de individuos basada en la variación entre los registros
Frecuencia relativa esperada: la cantidad de resulta
dentro de cada uno de ios grupos analizados; también
dos exitosos dividida por la cantidad de resultados to
se la llama cuadrados medios intragrupales; es igual a
tales que se esperaría obtener si se repitiera un
la varianza dei error y error de los cuadrados
experimento una gran cantidad de veces. (5)
medios ( C M Bm r). (11)
G rado de correlación: la medida en la cual existe un
E stim ación no sesgad a de la varianza p o b la d o - patrón claro de alguna relación en particular (general
n al (ó2): estim ación de la varianza poblacional ba mente lineal) entre dos variables, (3)
sada en registros maestrales, que ha sido corregida
(dividiendo la suma de desvíos cuadráticos por el G rados de libertad ( g l) : cantidad de registros libres
tamaño de la muestra menos 1, en lugar de utilizar para variar cuando se estima un parámetro poblacio
el procedimiento usual de dividir directamente por nal; comúnmente parte de una ecuación que se utiliza
para realizar esa estimación. Por ejemplo, en la fórmu
el tamaño de la muestra) de manera que resulte
la para la estimación de la varianza poblacional a partir
igualmente probable sobrestimar o subestimar la
de una sola muestra, los grados de libertad son la canti
verdadera varianza poblacional. (2, 9)
dad de registros menos 1. (9-14)
Estimación sesgada: estimación de un parámetro po
Grados de libertad del denom inado r (g/Dt;(rtC0): gra
blacional que probablemente sobrestime o subestime dos de libertad utilizados en la estimación intragrupai
sistemáticamente el verdadero valor poblacional, Por de varianza en un análisis de varianza; forman el deno
ejemplo, S D 2 sería una estimación sesgada de la varian minador de la razón F ; la cantidad de registros libres
za poblacional (la subestimaría sistemáticamente). (9) para variar (cantidad de registros de cada grupo menos
Excluir: es el hecho de anular la influencia de una 1, sumando los de todos los grupos) en el cálculo de la
variable en la asociación entre las otras variables en estimación intragrupai de varianza; grados de libertad
intragrupales. (11)
la regresión múltiple, la correlación parcial o el aná
lisis de covarianza; es igual a mantener constante o G rados d e lib ertad del num erador (gíEotre): gra
controlar. (17) dos de libertad utilizados en la estim ación imergru-
pal de varianza en un análisis de varianza (el
Factor: en un análisis factorial, es la sub-serie de va numerador de lai razón F ) \ cantidad de registros li
riables correlacionadas entre sí pero no con variables bres para variar (cantidad de grupos m enos I) en el
fuera de la sub-serie, (17) cálculo de la estim ación intergrupal de varianza;
Forma de una distribución de medias: contorno del grados de libertad intergrupales. (11)
histograma de una distribución de medias que puede G rados d e libertad intergrupales (glElltí.e): es igual a
seguir una curva normal o ser asimétrica; eu general, los grados de libertad del numerador. (11)
una distribución de medias tendrá tendencia a ser uni-
modal y simétrica, y usualmente es normal. (7) Grados de libertad intragrupales (gíDeatr0): es igual
a los grados de libertad del denominador. ( 11)
Fórmula de cálculo: ecuación matemáticamente
H ipótesis de investigación: en la prueba de hipótesis,
equivalente a la fórmula de definición que es más fácil
afirmación acerca de la relación predicha entre pobla
de utilizar para cálculos manuales pero que no muestra
ciones (comúnmente es una predicción de diferencias
directamente el significado del procedimiento que entre medias poblacionales). (6)
simboliza. (2)
H ipótesis direccional: hipótesis de investigación que
Fórmula de definición: ecuación que muestra direc predice una determinada dirección de la diferencia en
tamente el significado del procedimiento que simboli tre poblaciones; por ejemplo, que una población ten
za. (2) drá una media mayor que la otra población, (6)
Fórm ula de predicción con puntuaciones origina H ipótesis no direccional: hipótesis de investigación
les: norma de predicción (ecuación de regresión) que que no pTedice ninguna dirección determinada de la
utiliza puntuaciones originales. (4) diferencia entre poblaciones. (6)
H ip ó te sis n u la : a firm a ció n sobre una relación en L ím ites d e con fian za: valores superior e inferior del
tre p o b la cio n es que representa la noción crucial intervalo de confianza. (7)
opu esta a la h ip ó te sis d e in v estig a ció n ; afirm ación
L ín ea d e regresión: una lín ea en un gráfico que
que e sta b lece que en la p o b la ció n no e x iste d iferen
muestra el valor predicho de la variable dependiente
cia (o e x iste una d iferen cia op u esta a la predicha)
entre p o b la cio n es; una afirm ación artificial esta b le correspondiente a cada valor de la variable indepen
cid a para analizar si puede ser rechazada c o m o par diente. (4)
te d e i p r o c eso d e prueba de h ip ó te sis. (6 ) L IS R E L : programa para computadoras del m odelo de
H isto g ra m a : tipo de gráfico de barras de una distribu ecuación estructural; a veces utilizado com o nombre
ción en el cual los valores se marcan en e l eje horizon genérico del propio procedim iento. (17)
tal y la altura de cada barra e s la frecuencia de ese
mancova (A n álisis d e cov a ria n za m u ltivariad o):
valor; las barras se ubican una al lado d e la otra sin es
análisis de covarianza en e l qu e existe m ás d e una va
pacios interm edios, dando la apariencia del contom o
riable dependiente. (17)
de una ciudad en e l horizonte. (1)
MANOVA (A n álisis de v arian za m u ltiv a ria d o ): análi
In d ep en d en cia : situación en la que no existe relación
sistem ática entre dos variables; término utilizado g e
sis de varianza en el que existe más de una variable de
neralmente en relación con d os variables nom inales en pendiente. (1 7 )
e l contexto de una prueba chi-cuadrado de indepen M a n te n e r c o n sta n te : es el hech o de anular la in
dencia. (1 4 ) fluencia de una variable en la asociación entre las
ín d ic e d e c o n co rd a n cia : en el m odelo de ecuación otras variables en la regresión m últiple, la correla
estructural, es una m edida d e la calidad con que el pa ción parcial o el análisis de covarianza; es igual a e x
trón de correlaciones de una muestra coincide con las c lu ir o con trolar. (17)
correlaciones que se esperarían según el patrón hipoté
M atriz de co rrelación : m odo com ún de informar las
tico de causas y efecto s entre las variables; usualmente
correlaciones entre diversas variables en publicaciones
presenta valores de 0 a 1, siendo I una concordancia
científicas; tabla con lo s nom bres de las variables en la
perfecta. (17)
parte superior y lateral, y en la que se indican todas las
In terp reta ció n d e la p ro b a b ilid a d com o la frecu en correlaciones entre las variables incluidas (por lo g e
cia rela tiv a a la rg o p la zo : com prensión de la probabi neral sólo la mitad del cuadrado resultante se com ple
lidad com o la proporción de un determinado resultado ta, ya sea la parte superior o inferior d e la diagonal, y
que se obtendría si se repitiera e l experim ento muchas la otra mitad resulta redundante). (3)
veces. (5)
M ed ia (M , ¡a): prom edio aritmético de un grupo de re
Interpretación su b jetiv a d e probabilidad: es un mo
gistros; la suma de lo s registros dividida por la canti
do de entender la probabilidad com o el grado de certi
dad de registros. (2)
dumbre de que ocurrirá determinado resultado. (5)
M ed ia arm ón ica (IV): prom edio especial que es in
In terv a lo d e co n fia n za : rango de registros (es decir,
fluido en mayor m edida por io s núm eros m enores; en
los registros que se encuentran entre determinados va
lores superior e inferior) que probablem ente incluye la una prueba t para m edias independientes, cuando las
verdadera m edia poblacionaí. (7) cantidades de registros de los d os grupos son diferen
tes, se utiliza la m edia arm ónica com o equivalente del
In terv a lo d e lím ite a b ierto : en una tabla de frecuen tamaño muestral de cada grupo para la determ inación
cias agrupadas, es e l m ayor (o menor) intervalo, que la potencia. (10)
incluye todos lo s valores por encim a (o por debajo) de
un determinado valor. (1) M ed ia de casilla: m edia de una com binación en parti
cular de niveles de las variables independientes en un
In terv a lo d e un a tab la d e frecu en cia s a g ru p a d a s: la
diseño factorial. (13)
serie de valores que s e agrupan (por ejem plo, si el ta
maño del intervalo fuera 10, uno de los intervalos p o M ed ia d e colum n a: registro m edio de todos lo s parti
dría ser de 10,00 a 19,99). (1) cipantes de un nivel determinado de ía variable inde
I n te r v a lo d e l 9 5 % de c o n fia n z a : intervalo de co n pendiente, cuyos niveles forman las colum nas en el
fian za en e l cu al, e n térm in o s gen era les, e x iste un esquem a diagramado de un diseño factorial. (13)
95% d e p o sib ilid a d e s d e qu e se encuentre la m edia M ed ia d e fila: en un diseño factorial es el registro m e
p o b la cio n a í. (7) dió de todos los participantes que forman un determ i
In terv a lo d el 99% d e c o n fia n za : intervalo de con nado nivel de la variable independiente, cu yos niveles
fianza en el cual, en términos generales, existe un corresponden a las filas de la d isposición diagramada y
9 9 % de posibilidades de que se encuentre la m edía a niveles que corresponden a las filas en e i esquem a
poblacionaí. (7) diagramado. (13)
M ed ia m a rg in a l: en un diseño factorial, e l registro una persona en una variable dependiente sobre la base
m edio de todos los participantes de un determ inado ni del registro de esa persona en una o m ás variables in
vel de una de las variables independientes. (13) dependientes. (4)
M ed ia p o b la cio n a i ( ja): m edia de la población (usual- M o d e lo d e variab le laten te: es igual al m o d elo de
m ente desconocida). (5) ecu a ción estru ctu ral. (17
M ed ia n a : e l registro m edio después de ordenar de ma M o d e lo estru ctu ral: forma de interpretación del aná
yor a m enor todos los registros de una distribución. (2) lisis de varianza com o una división del d esvío de cada
registro con respecto a la m edia general en distintas
M e d ic ió n d e in te r v a lo s ig u a les: m e d ic ió n en la .
partes que corresponden a la variación intragrupal (el
qu e la d iferen cia entre cualqu ier par d e v a lo res re
desvío del registro con respecto a la m edia de su gru
p resen ta la m ism a d iferen cia d e l a sp ecto im p líc ito
po) e intergrupal (el desvío de la m edia del grupo al
bajo m ed ició n . (1 5 )
que pertenece e l registro con respecto a la m edia gen e
M ed ició n d e r a n g o y orden: m edición en la que los ral); interpretación alternativa (pero m atem áticam ente
valores m ayores representan m ás del aspecto im plícito equivalente) del análisis de varianza. (1 2 ,1 3 )
que s e está m idiendo, pero en la que la diferencia entre
M o d e lo lin ea l general: fórm ula general que es la base
dos registros cualesquiera no representa e l m ism o ni
de la mayoría de lo s m étodos estadísticos tratados en
vel de diferencia del aspecto im p lícito qu e se está m i
este texto. La fórm ula describe un registro c o m o la su
diendo; es igual a la v a ria b le o r d in a l. (1 ,1 5 )
ma de una constante, la influencia ponderada de diver
M e d ic ió n o r d in a l: es ig u a l a la m e d ic ió n d e r a n g o sas variables y e l error; la fórmula es sim ilar a una
y o r d e n . (1 ,1 5 ) ecuación de regresión múltiple excepto por e l hecho de
que incluye el error y porque la suma de las influencias
M eta -a n á lisis: m étodo estadístico para com binar los
es igual al registro real en la variable dependiente (y no
resultados de estudios independientes, usualm ente en
e l predicho). (16)
focado en los tamaños de efecto. (8 )
M u e str a : lo s registros de determ inado grupo de
M éto d o s in ten siv o s p o r co m p u ta d o ra : m étod os e s
person as analizad as; gen eralm en te consideradlo re
tadísticos que incluyen procedim ientos de prueba de
p resentativo de lo s registros de alguna p o b la ció n
hipótesis, los cuales involucran grandes cantidades de
m ás am plia. (5 )
cálculos repetidos. Estos m étodos só lo se han hecho
posibles últimamente gracias a la disponibilidad de M ulticoJh iealidad: situación que se produce en la re
computadoras. gresión múltiple, cuando las variables de predicción
están correlacionadas entre sí, (4)
M o d a : el valor con m ayor frecu en cia en una distri
bución. (2) N ivel de significación (a): probabilidad de obtener
significación estadística si la hipótesis nula en efecto es
M o d e lo c a u s a l: en el m o d elo d e ecu a ció n estru ctu
verdadera; probabilidad de cometer eí error Tipo I. (6 -8 )
ral, e s la serie de sen d ero s ca u sa les entre variables
latentes. (1 7 ) N iv e le s c o n v e n c io n a le s d e s ig n ific a c ió n (p < 0 ,0 5 ,
p < 0,01): los niveles de significación (niveles alfa) c o
M o d e lo d e c u a d ra d o s m ín im o s: m étodo usual de de
múnmente utilizados en psicología, (6)
terminación de lo s valores óptim os de lo s coeficientes
de correlación; e so s valores óptim os son los que pro N iv eles d e m ed ició n : distintos tipos de inform ación
ducen el m enor error cuadrático en lo s valores predi num érica im plícita provista por una m edida, c om o por
chos. (16) ejem plo, de intervalos iguales, de rango y orden o no
minal (categórica). (1,15)
M o d e lo d e ecu a ció n estru ctu ra l: versión sofisticada
del análisis de senderos, que incluye senderos que in N o rm as: parámetros poblacionales conocidos de
volucran variables teóricas - n o m ed id a s-, latentes, y pruebas estandarizadas (com o una prueba de persona
que adem ás permite realizar una esp ecie de prueba de lidad o aptitud) que sirven com o patrones de com para
significación y proporciona m edidas de la concordan ción para cualquier individuo que realice la prueba. (7)
cia general de lo s datos con el patrón causal hipotético;
P a rá m etro p o b lacion ai: valor real de la media, el
también se denom ina m o d elo d e v a r ia b le la ten te y
desv ío estándar, etc., de la población (com únm ente los
L ÍS R E M 1 7 )
parámetros poblacionales se desconocen, aunque a v e
M o d elo d e m ed ició n : en el m odelo de ecuación es ces se estiman); los parámetros poblacionales por lo
tructural, es la serie de senderos causales entre la va general se sim bolizan con letras griegas, (5)
riable latente y la variable manifiesta. (17)
P en d ien te: la inclinación del á n g u lo de una lín ea en
M o d e lo d e p red icció n : fórm ula para realizar predic un gráfico de dos variables, tal com o la línea de regre
cion es; es decir, fórmula para predecir e í registro de sión en un gráfico de la relación entre una variable de
pendiente y otra independíente; e s la cantidad de uni es lo m ism o que la red u cción p rop o r c io n a l d e error
dades que la línea s e eleva por cada unidad que cruza en la regresión m últiple. ( 4 , 1 2 ,1 3 , 1 6 )
(en la regresión con p u n tu acion es o rig in a les, la pen
P ru eb a ch i-cu ad rad o de in d ep en d en cia: procedi
diente es igual a = b ). (4)
miento de prueba de hipótesis que examina si la distri
p h i d e C ra m er: m edida de relación entre dos varia bución de frecuencias de las categorías de una variable
bles nom inales; m edida del tamaño de efecto para una nominal no está relacionada con la distribución- de fre
prueba tihi-cuadrado de independencia con una tabla cuencias de las categorías de otra variable nominal, (14)
de contingencia mayor a 2 x 2; también s e lo co n o ce
com o V d e Cramer, y a v eces se representa en forma P ru eb a c h i-c u a d ra d o de la b o n d a d d e aju ste: proce
escrita co m o 4>c ó Vc . (14) dim iento de prueba de hipótesis que exam ina en qué
medida una distribución de frecuencias observadas d e
P leg a r se so b r e fa cto res: procedim iento del análisis una variable nom inal se ajusta a algún patrón esperado
factorial de varianza en e l que se ignora una de las d i de frecuencias. (14)
m ensiones (variables independientes), reduciendo el
análisis total en una dim ensión pero m anteniendo la P rueba de aleatorización aproxim ada: alternativa de la
m ism a cantidad total de participantes. (13) prueba de aleatorización para aquellos casos en los que la
muestra es demasiado grande com o para realizar una
P o b la ció n : e l grupo com pleto de personas al cual un prueba de aleatorización que tenga en cuenta cada posi
investigador se propone aplicar los resultados de un ble reorganización de los datos obtenidos de la muestra;
estudio; aquel grupo m ás am plio sobre e l cual se reali e í método de aleatorización aproximada, intensivo por
zan inferencias sobre la base de una determinada serie computadora, genera una gran cantidad de las posibles
de personas analizadas. (5) reorganizaciones de datos; por ejem plo 1.000. (15)
P o líg o n o d e frecu en cia s: gráfico de líneas de una dis
P ru eb a d e ale a to r iz a ció n : procedim iento de prueba
tribución en e l que los valores se marcan sobre e l eje
de hipótesis (por lo general, se trata d e un m étod o in
horizontal y la altura de cada punto corresponde a la
tensivo por computadora) que tiene en cuenta cada
frecuencia de ese valor, las líneas com ienzan y termi
reorganización posible de los datos de la muestra para
nan en e l eje horizontal y e l gráfico se asem eja al c o n
determinar si la organización de los datos reales de la
torno de montañas en e í horizonte. (1)
muestra podría ocurrir por casualidad. (15)
P o ten cia esta d ística : probabilidad de que e l estudio
P ru eb a de d os colas: e l procedim iento de prueba de
arroje un resultado significativo si la hipótesis de in
hipótesis para una hipótesis no direccional; situación
vestigación es verdadera. (8)
en ía cual el sector de la distribución comparativa en el
Poten cia: es igual a la p o ten cia esta d ística . (8) que se rechazaría ía hipótesis nula está dividido entre
los dos lados (colas) de la distribución. (6)
P red icció n b ivariad a: predicción de registros en una
variable sobre la base de registros en otra variable. (4) P ru eb a d e h ip ó tesis: procedim iento utilizado para de
terminar si ios resultados de un experim ento (que ana
P ro b a b ilid a d (p ): la frecuencia relativa con que se e s
liza una muestra) sustentan determinada teoría o
pera determinado resultado; la proporción de resulta
dos exitosos en relación con todos lo s resultados, (5) innovación práctica (que se considera aplicable a una
población). (6)
P r o ced im ien to B o n ferro n i: procedim iento de co m
paración múltiple en e l cual e l porcentaje total de alfa P r u e b a d e r a n g o y o r d e n : p r oced im ien to d e prue
se divide entre la serie de com paraciones, de m odo tal ba de h ip ó te sis que u tiliza datos ord en ad os por
que cada una se prueba con un nivel más exigente de rangos. (1 5 )
significación. (12) P r u e b a de una cola: el procedim iento de prueba de
P ro d u cto cru za d o d e p u n tu a cio n es Z : es e l resulta hipótesis para una hipótesis direccional; situación en
do de m ultiplicar la puntuación Z de determinada per la cual e l sector de la distribución comparativa en el
sona, en una variable, por la puntuación Z de esa que se rechazaría ía hipótesis nula s e encuentra entera
m ism a persona en otra variable; con respecto a un gru m ente en un lado (cola) de la distribución. (6)
po de individuos, e l prom edio de los productos cruza P ru eb a lib re de d istrib u ció n : procedim iento de prue
dos de puntuaciones Z entre dos variables e s el ba de hipótesis en la que no existen supuestos en cuan
coeficien te de correlación de esas dos variables. (3)
to a la forma de las poblaciones implícitas; es sim ilar a
P r o m e d io p o n d e r a d o : prom edio en el que lo s re una prueba no paramétrica. (15)
g istro s p rom ediad os no tienen ia m ism a in flu en cia
P ru eb a no param étrica: procedim iento de prueba de
sobre el total. (1 0 )
hipótesis que no asum e supuestos con respecto a pará
P ro p o rció n d e v arian za ju stific a d a {r2, R 2): un indi metros pobiacíonales; es sim ilar a una p ru e b a lib re de
cador de! tamaño del efecto en un análisis de varianza; d istrib u ción . ( í 5)
P ru eb a p a ra m étrica : procedim iento de prueba de hi R ed u cción p rop orcion al de error (r2, R 2)- es la m e
pótesis ordinario, tal co m o una prueba r o un análisis dida de asociación entre variables que se utiliza cuan
de varianza, que asume supuestos acerca de la form a y do s e comparan asociaciones obtenidas en diferentes
otros parámetros de las poblaciones. (15) estudios o con diferentes variables; e l coeficien te de
correlación elevado al cuadrado; es el error cuadrácico
P ru eb a t para m ed ia s dep en d ien tes: procedim iento
que se reduce utilizando una norma de predicción para
d e prueba d e hipótesis en ei que cada participante tiene
regresión m últiple o bivariada con respecto al error
dos registros (o los participantes forman parejas equi
cuadrático; utilizando la media para predecir, expresa
paradas) y se descon oce ia varianza poblacional; el
do com o una proporción del error cuadrático a! utilizar
procedim iento determina la significación de una hipó
la m edia para predecir. Es igual a la p rop orción de v a
tesis utilizando registros diferenciales de un só lo gru
ria n za ju stific a d a . ( 3 , 4 ,1 2 , 1 3 ,1 6 , 1 7 )
po de participantes. (9)
R e g is t r o d ife r e n c ia l: e s la d iferen cia entre e l re
P r u e b a t pa ra in ed ia s in d ep en d ien tes: procedim ien
g istro d e un p articip ante en una prueba y e l registro
to de prueba de hipótesis en e l que se prueban d os gru
d e ia m ism a p erson a en otra prueba. Por lo gen eral,
pos distintos de personas y en el que se desco n o ce la
se trata de un registro posterior m enos un registro
varianza poblacional, (10)
anterior, en cu y o c a so tam bién se lo den om in a r e
P r u e b a t p a ra un a so la m u estra : procedim iento de g is tr o d e c a m b io . (9)
prueba de hipótesis en el que se compara una m edia
R e g istro m u e s tr a l d e co rte: punto en la distribu
muestral con una m edia poblacional conocida, y se
ció n com parativa seg ú n e l cual, si es igualado o su
descon oce la varianza poblacional. (9)
perado por e l registro muestral, se rechazará la
P ru eb a t: procedim iento de prueba de hipótesis en ei h ip ó te sis nula. (6)
qu e s e desco n o ce la varianza poblacional; compara R eg istro : valor correspondiente a un determinado par
puntuaciones t de una muestra con una distribución ticipante con respecto a una variable. (1)
comparativa denom inada distribución t. (9 ,1 0 )
R eg la s del tam añ o d e efecto: regias acerca de lo que
P ru eb a Z: procedimiento de prueba de hipótesis en el se debe considerar con respecto a un tamaño de efecto
cual hay una so la muestra y se conoce la varianza pobla pequeño, mediano y grande, basadas en lo que resulta
cional. (7) P u n tu ación estándar: una puntuación Z de típico de la investigación psicológica; tam bién se c o
una distribución que sigue una curva normal; a veces nocen c o m o reg la s d e C ohén. (8)
utilizada para referirse a cualquier puntuación Z. (2)
R eg resió n b ivariad a: ídem predicción bivariada. (4)
P u n to m ed io : la mitad de un intervalo en un histogra-
tna o p olígono de frecuencias basados en una tabla de R egresión m ú ltip le gradual: procedimiento explora
frecuencias agrupadas; punto que se encuentra justo en torio en el que se prueban todas las potenciales varia
el m edio entre el com ienzo del intervalo y el com ienzo bles de predicción que han sido medidas para descubrir
del intervalo siguiente. (1) la variable que produce la mejor predicción; luego, ca
da una de las variables restantes se prueba para d escu
P u n to ¿: en una distribución í, es la cantidad de d es brir la variable que, en combinación con la primera,
víos estándar con respecto a ia media; es sim ilar a una produce la mejor predicción; el proceso continúa hasta
puntuación Z . (9) el m om ento en que, agregar la mejor variable restante,
P u n tu a ció n orig in a l: U na m edición ordinaria (o cual no produce una mejora significativa, (17)
quier otro número de una distribución antes de ser c o n R e g re sió n m ú ltip le je rá rq u ica : m étodo de regresión
vertido en una puntuación Z o transformado de algún m últiple en e l cual las variables de predicción s e agre
otro m odo). (2) gan, una o unas pocas por vez, de forma secuencial
planificada, permitiendo al investigador calcular la
P u n tu a cio n es Z: Cantidad de desv ío s estándar por e n
contribución de cada variable sucesiva a la predicción
cim a (o por debajo, si es negativo) de la m edia de su
por encim a de aquellas ya incluidas. (17)
distribución a la que s e encuentra un registro; registro
ordinario transformado de form a tal qu e describe más R e g re sió n m ú ltip le: predicción de registros en una
adecuadam ente su ubicación en una distribución. (2) variable (la variable dependiente) sobre la base de re
gistros en otras dos o más variables (variables de pre
R a z ó n F : en el análisis de varianza, e s la razón entre
d icción o independientes). (4)
la estim ación ¡ntergrupaí de varianza poblacional y la
estim ación intragrupal de varianza poblacional; es un R e str ic c ió n d e l ra n g o : situación en la cual se calcu
registro en la distribución comparativa (una distribu la una correlación inclu yen do en e l grupo estudiado
ción F ) de un análisis de varianza; tam bién s e lo llam a só lo una serie lim itada de los p osibles valores d e una
sim plem ente F . ( 1 1 -1 3 ) de las variables (3)
R esu lta d o ; término utilizado al discutir la probabilidad, S u p u esto: condición necesaria para realizar un deter
el cual se refiere a la consecuencia de un experimento (o m inado procedim iento de prueba de hipótesis, tal c o
vínualm ente cualquier hecho, com o por ejemplo, que m o el hecho de que una población tenga distribución
una moneda caiga cara hacia arriba o que llueva maña normal; parte del fundam ento m atem ático para la
na). (5) exactitud de las tablas utilizadas en el proceso de de
terminación de lo s valores de corte. (9 -1 5 )
R o b u stez: la m edida en la cual determinado procedi
m iento de prueba de hipótesis e s razonablemente pre T abla chi-cuad rad o: tabla que proporciona los regis
c iso aun cuando no se cumplan los supuestos del tros de corte en la distribución chi-cuadrado según dis
m ism o. (9) tintos grados de libertad y niveles de significación. (14)
S u m a d e erro res cu a d r á tie o s (S SError): suma de las T am año d e efecto en el análisis d e varianza (/): el des
diferencias cuadráticas entre cada registro y el registro vío estándar de las m edías grupales dividido por e l
predicho correspondiente. (4) desvío estándar de ios valores individuales. ( H )
T ra n sfo rm a ció n inversa: transformación de datos en V ariables cru zad as: en un diseño factorial, es la situa
Ja cual el investigador utiliza el número inverso de ca ción en la que cada nivel de una variable independiente
da registro (1 dividido por e l registro). (15) se m id e a cada nivel de la otra variable ind ep en dien
te. (13)
T ransform ación lo g : transformación de datos en la cual
el investigador utiliza e i logaritmo de cada registro. (15) V a rian za (S jD1, S2, o 2, CAÍ)'- m edida del grado de dis
persión d e una serie de registros; prom edio de los d es
V alor: número o categoría p o s ib le q u e puede presen
v ío s cuadráticos con respecto a la m edia. (2, 5, 9 , 1 1 )
tar un registro. (1)
V a rian za de un a d istrib u ció n d e d iferen cia s e n tre
Variable categórica; es igual a la variable nominal. (1,14)
m e d ia s ( 5 % ^ ^ ) : es uno de los cálculos que forman
V ariab le d e p red icció n (usualm ente X ): en la regre parte de la prueba t para m edias independientes; es
sión múltiple, es la variable que se utiliza para predecir igual a la sum a de las varianzas de las distribuciones
los registros de individuos en otra variable; a veces se de medias de cada una de dos muestras, (10)
la llam a v a r ia b le in d ep en d ien te. (4)
V a rian za de u n a d istrib u ción d e m ed ias (S 2M, ó 2^):
V ariable d ep e n d ien te (usualmente Y): variable con varianza poblacional dividida por ía cantidad de casos
siderada un efecto; también se utiliza en la regresión en cada muestra. ( 7 ,9 )
para definir toda variable con respecto a la cual se rea-
V a rian za p ob lacion al (o-2): varianza de la población
fiza la predicción, (3 ,4 )
(usualm ente desconocida). (5)
V ariab le e n d ó g en a : variable en un análisis de sen de
ros (que inclu ye un m od elo de ecuación estructural) a
la cual se dirigen las flechas. (17)
Glosario 67 7
Glosario de Símbolos
ji: m edia poblacional. (5) g /Total ; grados de libertad totales de todos lo s grupos.
(1 0 -1 3 )
]¡.M; m edia de una distribución de medias. (7)
g¿Dsnito: gritóos de libertad del denom inador en el
o : desvío estándar poblacional. (5)
análisis de varianza, ( 1 1 )
c M: desvío estándar de una distribución de medías. (7)
/: m edida de! tamaño de efecto en el análisis de va
cr2: varianza poblacional, (5) rianza, ( 1 1 )
varianza de una distribución de medías. (7) R azón F\ razón entre la estim ación intergrupal de va
rianza poblacional y la estim ación intragrupal de va
I : sum a de sumar todos los registros que siguen. ( 2 )
rianza poblacional en el análisis de varianza. ( 1 1 )
9 : co eficien te phi; tamaño de efecto en el análisis
chi-cuadrado co n tabla de contingencia 2 x 2 . (14) G M ; m edia d e tod os ios registros en el an álisis de
varianza. ( 1 1 - 1 3 )
X 2: dato estadístico chi-cuadrado. (14)
Ai: m edia. (2)
a\ constante de regresión. (4)
Aij, M 21 etc.: m edia del primer grupo, del segundo
b\ coeficien te de regresión para puntuaciones origi
grupo, etc. (1 0 -1 3 )
nales. (4)
^Columna» ^F¡ia: medta de los registros en determinada
d ; tamaño de efecto en estudios que incluyen una o
colum na o determinada fila (en el análisis factorial de
dos medias. ( 8- 10)
varianza). (13)
gl: grados de libertad. (9 -1 4 )
CA7Encre: cuadrados m edios intergrupales. (11)
g l v g i v etc.; grados de libertad del primer grupo, del
C M CoiíimnkS, CMFi]as, C M Mc[3CC¡úa: cuadrados m edios
segundo grupo, etc. (1 0 -1 3 )
intergrupales d e colum nas, filas e interacciones, (13)
gIEntfe; grados de libertad del numerador en el análisis
de varianza. ( 11 ) C M EmT\ error de los cuadrados m edios. (11)
C¿V/Demro: cuadrados m edios intragrupales. (11) iS’’2m1, etc,: varianza de la distribución de m edias
basada en una e s tim a c ió n c o m b in a d a d e ¡a varianza
n: cantidad de registros en cada grupo del análisis de
pobiacional, correspondiente a la primera muestra, la
varianza. ( l ì )
segunda muestra, etc. (1 0 ,1 1 )
N : cantidad total de registros. (2)
■^combinada' estim ación com binada del d esvío estándar
/V,, N 2¡ etc.: cantidad de ca so s en e l primer grupo, en pobiacional. (1 0 )
el segundo grupo, etc. (1 0 -1 3 )
^combinada- estim ación com binada de la varianza po-
N ': m edia armónica de d os tam años de muestras bíacional. (10)
desiguales. (10)
estim ación intragmpal de la varianza pobla-
^columnas’ canfidad de colum nas, cantidad de cional. (11)
filas (en el análisis factorial de varianza). (13)
S D : desvío estándar
catlddad de casillas en un diseño factorial, (13)
S D 2: varianza. (2)
^Grupos* cantidad de grupos en el análisis de varianza.
50: sum a de d esvíos cuadráticos. (2)
p \ probabilidad. (5)
5 5 Ertlre: sum a de desvíos cuadráticos íntergrupales. (12)
r: coeficien te de correlación. (3)
f2 : reducción proporcional de error (proporción de va ssC o ^ ’ ssm-^ SSM ^ián-suraa de desvíos ctjadrá-
ticos entre colum nas o filas o por efecto de la interac
rianza justificada) en una regresión bivariada. (3)
ción (en el análisis factorial de varianza). (13)
R: coeficien te de correlación múltiple. (4, 12)
SSTota[: sum a total de d esvíos cuadráticos con respecto
R 7: reducción proporcional de error (proporción de a la m edia (o con respecto a la gran m edia, en e l análi
varianza justificada) en análisis de varianza y regre sis de varianza). (4 ,1 2 ,1 3 )
sión m últiple. (4 ,1 2 , 13)
d'1*’Deturo' sum a de desvíos cuadráticos intragrupales (o
^Coiumnas’ ^ H i» * ^ V ra««jn: proporción de varianza dentro de las casillas). (12, 13)
justificada (una medida del tamaño dei efecto en el
análisis factorial de varianza) por las colum nas, las Puntuación t: cantidad de d esvíos cuadráticos con res
filas y la interacción. (13) pecto a la m edia en una distribución t. (9)
S : estim a ció n no sesg a d a del d e sv ío estándar po- X: registro en una variable determinada; en la regre
biacion al. (9) sión X , es e l nombre usual de la variable de predicción
o independiente. (1 - 4 )
S21 estimación no sesgada de la varianza pobiacional (9)
X ¡, X T etc.: primera variable independiente o de pre
S 2¡, S22, etc.: estim ación no sesgada de la varianza po-
dicción, segunda variable independiente o de predic
blacional, basada en lo s registros de la primer muestra,
ción, etc. (4)
de la segunda muestra, etc. (1 0 -1 3 )
X : m e d ia d e la variable denom inada X . (2)
d-g ' estim ación imergrupal de la varianza poblacio-
nal. (11) Y: por lo g e n e ra l, la variable dependiente en una regre
sión. (3 ,4 )
^ píu.- varianza pobiacional esti
mada intergrupal de colum nas, filas, interacción (en el Y: valor predicho de la variable denom inada Y. (4)
análisis factorial de varianza). (13)
Z: cantidad de desvíos estándar de la media. (2)
desv ío estándar de la distribución de diferen
cias entre medias. (10) Zx : puntuación Z de la variable denom inada X (3, 4)
■^Difetencìa1 varianza de la distribución de diferencias ZXÍ, Z x2, etc.: puntuación Z de la primera variable in
entre medias. (10) dependiente o de predicción; puntuación Z de la se
gunda variable independiente o de predicción, etc. (4)
S 2gtrof- varianza del error. (4, 11)
ZY: puntuación Z de la variable denom inada Y. (3, 4 )
■ V desvío estándar de la distribución de medias basa
do en una varianza pobiacional estimada, (9) Zy: valor predicho de la puntuación Z en la variable
denom inada y . (4)
S 2m: varianza d e una distribu ción de m edias basada
en una varianza p o b ia cio n a l estim ada, en el c a so de Otros sím bolos
una prueba í ; o estim ada a partir de la variación e n
valor predicho de la variable. (4)
tre m ed ia s g rupales, en e l c a so de un a n á lisis de v a
rianza. (9, 11) medía de la variable, (2)
Referencias bibliográficas
A selson, R. P. (1997), On the surprising longevity o f personal closeness; A procedure and some preliminary
flogged horses: Why there is a case for the significan findings. P e r s o n a lity a n d S o c ia l P s y c h o lo g y B u lle tin ,
ce test. P s y c h o l o g ic a l S c ie n c e , 8 , 12-15. 2 3 , 363-377.
A l e x a n d e r , C . N ., LANG Er, E . I , N R. I ., C h a n d
ew m an, Aron, A„ Paris, M„ & Aron, E, N. (1995). Falling in love:
l e r , H. M., & Davies, J. L, (1989). Transcendental M e Prospective studies of self-concept change. Journal o f
ditation, mindfulness, and longevity: An experimental P erson ality a n d S o cia l P sych ology, 6 9 , 1102-1112.
study with the elderly, J o u rn a l o f P e r s o n a lity a n d S o Aron, E. N. (1996). The high ly sen sitive person. New York:
c i a l P s y c h o lo g y , 5 7 , 950-964,
Btrch/Lane,
Algina, J,, & Keselman, H. J. (1997). Detecting repea A ron, E. N ., & A ron, A. (1997). Sensory processing sen
ted measures effects with univariate and multivariate sitivity and its relation to introversion and emotiona
statistics. P s y c h o lo g ic a l M eth o d s, 2 , 2 0 8-218.
lity. J o u rn a l o f P erso n a lity a n d S o c ia t P sy ch o lo g y , 73,
Altman, D. G., Levine, d . w ., Howard, G., & Hamilton, 345-368.
H. (1997). Tobacco farming and public health: Attitudes Baker, D. P., & Jones, D. P. (1993). Creating gender equa
o f the general public and farmers. Jou rn al o f S o c ia l Is
lity: Cross-national gender stratification and mathe
su es, 53, 113-128.
matical performance. S o c io lo g y o f E du ca tio n , 6 6 ,
A merican Psychological A sso ciat io n (1994). G radu ate 91 -1 0 3 .
stu dy in psych o lo g y. Washington, DC: Author.
Bardslby. J. J., & Rhodes, S. R. (1996). Using the Steers-
Aron, A., & A ron, E. N. (1989). The h ea rt o f s o c ia l p s y Rhodes (1984) framework to identify correlates of
ch ology.,L exin gton , MA: Heath. em ployee lateness. J o u rn a l o f B u sin ess a n d P sy ch o
Aron, A ., & Aron, E. N. (1997). Self-expansion motivation logy, 1 0 , 351-365.
and including other in the self. En W. Ickes (Section Ed.) Baumrind, D . (1983). Sp ecious causal attributions in
& S. Duck (Ed.), H an dbook o f p e rso n a l relationships the social sciences: T he reformulated stepping-sto
(2nd Edition, Voi. 1, pp. 251-270). London: Wiley. ne theory o f heroin use as exemplar. J o u r n a l o f P e r
A ron, A ., Aron, E. N., & Allen, L (in press). Motivations s o n a lity a n d S o c ia l P s y c h o lo g y , 4 5 , 12 8 9 -1 2 9 8 .
for unreciprocated love. P erson ality a n d S o c ia t P sych o Bjernat, M ., & Wortman, C. B. (1991). Sharing o f ho
lo g y Bulletin. me responsibilities between professionally employed
Aron, A ., & Fraley, B. (in press). Relationship close women and their husbands. J o u rn a l o f P erso n a lity
ness as including other in the self: Cognitive under a n d S o c ia l P sych o lo g y, 60, 844-860.
pinnings and measures. S o c ia l C ogn ition . Blanchard, E A., L illy, X , & Vaughn, L. A. (1991). Re
Aron, a ., Melinat, E , Aron, E. N., Vallone, R. D ., & B a ducing the expression of racial prejudice. P sych o lo g i
tor, R. J. (1997). The experimental generation o f inter c a l Science, 2 , 101-105.
BOYD, C. P , & G u i i o m , E. (1997). An investigation o f C h iu ,C„ H ong , Y , & D w e c k , C. S. (1997). Lay disposi-
negative afifectivity in Australian adolescents. Journal tionism and implicit theories o f personality. J o u rn a l o f
o f C lin ical C h ild P sych ology, 2 6 , 190-197. P erso n a lity a n d S o cia l P sych o lo g y, 7 3 , 19-30.
B rewer, J. K. (1972). On the power o f statistical tests in Chow, S. L. (1988). Significance test or effect size. Psy-
the A m e ric a n E du cation R esearch Journal. A m erican c h o lo g k a l B ulletin, 1 0 3 , 105-110.
E d u ca tio n a l R esea rch Journal, 9 ,3 9 1 -4 0 1 . C how, S. L. (1996). S ta tistic a l sig n ifica n ce: R ation ale,
B r ic k m a n , (1978).
P , C o a t e s , D . , & Ja n o f f - B u l m an , R. validity, a n d utility. London: Sage.
Lottery winners and accident victims: Is happiness re C ia l d in i, R. B ., B row n, S. L., L ew is , B. P , Luce, C., &
lative? Jou rn al o f P erso n a lity a n d S o c ia l P sych ology, N eubero, S. L. (1997). Reinterpreting the empathy-
3 6 , 917-927. altruism relationship: When one into one equals one
Buck, j . L. (1985), A failure to find gender differences ness. J ou rn al o f P erso n a lity a n d S o c ia l P sych o lo g y,
in statistics achievement. T eachin g o f P sych ology, 73, 481-494.
12, 100. C lark, D. M„ S alkovskis, P. M., O st, L-G„ Breitholtz,
B uss, D. M., & S c h m i t t , D. P, (1993), Sexual strategies E., Koehler, K. A., W estung , B. E., Jeavons, A., &
theory: An evolutionary perspective on human mating. Gblder, M. (1997). Misinterpretation o f body sensa
P sych o lo g ica l Review, 100, 204-232. tions in panic disorder. Journal o f C onsultin g a n d Cli
M .,.& P a t t e r s o n , G . R. (1991). Relation o f
C a p a l d i, D .
n ical Psychology, 65, 203-213.
parental transitions to boys’ adjustment problems: 1,A Cohen, J, (1962). The statistical power o f abnormal-so
linear hypothesis 2, Mothers at risk for transitions and cial psychological research: A review. Jo u rn a l o f A b
unskilled parenting. D evelo p m en ta l P sychology, 27, n orm al a n d S o c ia l P sych o lo g y, 65, 145-153,
489-504. C ohen, J, (1988). S ta tistic a l p o w e r a n a ly sis f o r the b e h a
C arey, M. R, M aisto, S. A,, Kalichman, S. C„ F orsyth, vio ra l scien ces. Hillsdale, NJ: Erlbaum,
A .D ., W right, E. M „ & Johnson , B. T. (1997), En C ohen, J. (1990). Things I have Seamed (so far). A m erica n
hancing motivation to reduce the risk o f HIV infec P sych ologist, 45, 1304-1312.
tion for econom ically disadvantaged urban women,
C ohen, J, (1992). A power primer. Psychological B u lle
J o u rn a l o f C o n su ltin g a n d C lin ic a l P sy ch o lo g y , 6 5 ,
tin, 1 1 2 , 155-159.
53 1 -5 4 1 .
Cohen, J. (1994). The Earth is round (p < 0,05). Ameri
C a s p i, A„ B egg, D ., D ic k s o n , N . , H a r r i n g t o n , H ., L a n
can Psychologist, 4 9 ,9 9 7 -1 0 0 3 .
gley, J., M o m r r , T. E , & S il v a , P. A. (1997). Perso
nality differences predict health-risk behaviors in Cohen, J., & Cohen, P. (1983). A p p lie d m u ltip le reg res
young adulthood: Evidence from a longitudinal study. sio n /" c o rre la tio n a n a ly sis f o r the b e h a v io ra l s c ie n
Jou rn al o f P e rso n a lity a n d S o c ia l P sych ology, 73, ces. Hillsdale, NJ: Erlbaum.
change: Assortative marriage and the consistency o f C onnors, G. J., C arroll, K. M., D iC lemente, C. C .,
personality in adulthood. J o u rn a l o f P erso n a lity a n d L ongabaugh, R., & Donovan, D. M. (1997). The the
S o cia l P sych ology, 58, 2 5 0 -2 5 8 . rapeutic alliance and its relationship to alcoholism
C atanzaro, D., & T a y l o r , J. C. (1996). The scaling o f treatment participation and outcome. Jo u rn a l o f C on
dispersion and con-elation: A comparison o f least- su ltin g a n d C lin ica l P sych o lo g y, 6 5 ,5 8 8 -5 9 8 .
squares and absolute deviation statistics, B ritish J o u r Conover, W., & Iman , R. L. (1981). Rank transforma
nal o f M a th e m a tic a l a n d S ta tistic a l P sych o lo g y, 49, tions as a bridge between parametric and nonparame-
171-188. tric statistics. A m erica n S ta tisticia n , 3 5 , 124-129.
Chapm a n , H. A ., H o b f o l l , S. £ ., & R i t t e r , C. (1997). C o o k , T. D ., & C a m p b e l l , D . T. (1979). Q u asi-experim en
Partners' stress underestimations lead to women’s dis tation : D esig n a n d a n a lysis issu es f o r fie ld settings.
tress: A study o f pregnant inner-city women. Journal Skokie, IL: Rand McNally.
o f P erso n a lity a n d S o c ia l P sych ology, 73, 418-425, C ooper, S. E., & Robinson, D. A. G. (1989). The in
Ch a se, L. J., & C h a s e , R. B. (1976). A statistical power fluence o f gender and anxiety on mathematics perfor
analysis o f applied psychological research. Jou rn al o f mance. Journal o f C o lleg e S tu d en t D evelo p m en t, 30,
A p p lie d P sych ology, 6 1 , 2 3 4 -237. 459-461.
J. M ., & D u n l o p , W . P. (1997). On the logic
C o r t in a , Escudero, V„ Rogers, L. E., & Gutierrez, E. (1997). Pat
and purpose o f significance testing. P sy ch o lo g ic a l terns o f relational control and nonverbal affect in clinic
M eth ods. 2, 161-172. and nonclinic couples. Journal o f S o cia l a n d Person al
C r ic k, N . R ., C a s a s , J . F ., & M o s h e r , M . (1 9 97). Re
R elationships, 14, 5-29.
lational and overt aggression in preschool. D e v e Evans, R. (1976). The m akin g o f p s ych o lo g y. New York:
lo p m e n ta l P s y c h o lo g y , 3 3 , 5 7 9 -5 8 8 . Knopf.
D ah lstr o m , W . G ., L arbar , D ., & D ah lstr o m , L, E. Everett, S. A., Price, l H„ B edell, A. W., & T eluo-
(1 9 8 6 ). M M P I p a tte r n s o f A m e ric a n m in o ritie s. M in hann, S. K. (1997). The effect o f a monetary incentive
neapolis: University o f M innesota Press. in increasing the return rate o f a survey to family phy
D ane , F. C „ & W r i g h t s m a n , L. S. (1 9 82). E ffects o f sicians. E va lu a tio n a n d th e H ea lth P ro fessio n s, 20,
207-214.
defendants’ and v ictim s’ characteristics on jurors’
verdicts. In N . L. Kerr & R . M . Bray (E ds.), T h e Eysenck, H. J. (1981). A m o d e l f o r p e rso n a lity. Berlin:
p s y c h o lo g y o f th e c o u r tro o m . Orlando, FL: A cade Springer-Verlag.
m ic Press. Fawzi, M. C. S., Pham , T , Lin, L., N guyen, T. V., N go,
DARLINGTON, R . B. (1 9 9 0 ). R e g r e s s io n a n d lin e a r m o D„ Murphy, E., & M ollica, R. F. (1997). The vali
d e ls. N e w York: M cG raw -H ill. dity o f posttraumatic stress disorder am ong Viet
nam ese refugees. J o u r n a l o f T ra u m a tic S tress, 10,
D awes, R. M ., F a u s t , D ., & M e e h l , P. E. (1 9 9 3 ). Sta
101-108.
tistical prediction versus clinical prediction: Impro
ving what works. In G. Keren & C. L ew is (E ds.), A F isher, B. (1978). F ish er D ivo rce A djustm ent Scale. Boul
h a n d b o o k f o r d a ta a n a ly s is in th e b e h a v io r a l s c ie n der, CO: Family Relations Learning Center.
c e s : M e th o d o lo g ic a l is s u e s (pp. 3 5 1 -3 6 7 ). H illsda Fisher, R. A. (1938). S ta tistica l m eth o d s f o r research w o r
le, NJ: Erlbaum. kers (7th ed.). London: Oliver & Boyd.
D e Carlo, L. T. (1997). On the meaning and use of Foertsch, J., & Gernsbacher, M. A. (1997). In search o f
kurtosis. P s y c h o lo g ic a l M e th o d s, 2, 292-307. gender neutrality: Is singular they a cognitively effi
D bG armo , D . S., & F o r g a t c h , M . S . (1 9 9 7 ). D eterm i cient substitute for generic h e ! P s y c h o lo g ic a l Science,
nants o f observed confidant support for divorced 8, 106-112.
mothers, J o u r n a l o f P e r s o n a lity a n d S o c ia l P s y c h o F olwell, A. L., C hung, L. C.t N ussbaum, J. R, Bethea,
logy, 72, 3 3 6 -3 4 5 . L.S., & G rant, J. A. (1997), Differential accounts of
D K, L. (1983). The use and m isuse o f chi-
e l u c c h i, closeness in older adult sibling relationships. J ou rn al
square: L ew is and Burke revisited. P s y c h o lo g ic a l o f S o c ia l a n d P erso n a l R ela tio n sh ip s, 14, 843-849.
B u lletin , 94, 1 6 6 -1 7 6 . F ord , J. D ., Fisher, R, & L arson, L. (1997). Object rela
D esmaris, S., & Curtis, J. (1997). Gender and percei tions as a predictor o f treatment outcome with chronic
ved pay entitlement: Testing for effects of experien posttraumatic stress disorder. Jo u rn a l o f C on su ltin g
ce with income. J o u r n a l o f P e r s o n a lity a n d S o c ia l a n d C lin ica l P sych ology, 65, 547-559.
P s y c h o lo g y , 72, 141-150. Frank, S . Poorman, M. 0 ., Van Egerbn, L. A., & Field,
D unlap, W. P , & M y e r s , L. (1997). Approximating po D. T. (1997). Perceived relationships with parents among
wer for significance tests with one degree o f freedom. adolescent inpatients with depressive preoccupations
P s y c h o lo g ic a l M eth ods, 2, 186-191. and depressed mood. Journal o f C lin ical C h ild P sych o
logy, 2 6 , 205-215.
D w in e l l ,P E., & H i g b e e , J. L. (1991). A ffective varia
bles related to mathematics achievement among high- Franz, M. L. von. (1979). The p r o b le m o f p u e r aetern u s.
G aufon, F. (1889). N atu ral inheritance. London: Macmillan. N ., K ofkin , J., & Jordan , J. (1997). A uton om y and
G a m es,P. A. (1988). Theory-free statistics and theory- connectedness as dim ensions o f relationship styles
based statistics: Their appropriate roles in the repor in m en and w om en. J o u r n a l o f S o c ia l a n d P e r s o n a l
ting o f scientific results. J o u rn a l o f E x p erim en ta l R e la tio n s h ip s , 14, 1 47-164.
E ducation, 57, 4 7 -5 8 . H azan , C., & S h a v e r , P. (1987). Romantic love con
G e is s e r , S„ & G r eenh o u se, S. (1958). An extension o f ceptualized as an attachment process. J o u r n a l o f
B o x ’s r e s u l t s o n t h e u s e o f t h e F distribution in m u l t i P e r s o n a lity a n d S o c ia l P s y c h o lo g y , 5 2 , 5 1 1 -5 2 4 ,
v a r ia t e a n a l y s i s . A n n a ls o f M a th em a tica l Statistics,
Herm ann, C., B l a n c h a r d , E. B.f & F l o r , H. (1997). B io
29, 8 8 5-891.
feedback treatment for pediatric migraine: Prediction
G ig e r e n z e r , G., & M urray, D. J. (1987). C ognition a s in o f treatment outcome. Journal o f C onsultin g a n d C lini
tu itive sta tis tic s . Hillsdale, NJ: Erlbatun. c a l Psych ology, 65, 611-616.
G G., S w u n k , Z., P orter, Y., D a s t o n , L.,
ig e r e n z e r , P. S., & F i n l e y , H. C. (1996). D oing qualitative
H io h l e n ,
B J., & K r u g e r , L. (1989). The e m p ire o f c h an
eatty,
analysis. En: N. F. T. L. Leong & J. T. Austin (Eds.),
ce. Cambridge, England: Cambridge University Press. The p s y c h o lo g y resea rch h a n d b o o k (pp, 177-192).
G ir e ,J. T. (1997). T he varying effect o f individualism - Thousand Oaks, CA: Sage,
collectivism on preference for m ethods o f conflict H il g a r d , E. R. (1987). P s y c h o lo g y in A m e r ic a : A h is to
resolution. C a n a d ia n J o u rn a l o f B e h a vio u ra l S c ie n r ic a l p e rs p e c tiv e . Orlando, FL: Harcourt Brace Jova-
ce, 2 9 , 3 8 -4 3 ,
novich.
G o sset,W. S. (1 9 47). “S tu d e n t's “ c o lle c te d p a p e r s .
B in d l e y , C., F il h o z a t , a ., K l a c k e n b b r g , G., N icolet-
London: U niversity C ollege.
M D ., & S a n d , E. (1966). D ifferences in age o f
e is t e r ,
G ough, H ., & HjEOLBRUN, a . (1983). T h e A d je c tiv e C h eck walking in five European longitudinal samples. H u
L ist M a n u a l Palo Alto, CA: Consulting Psychologist m an B iology, 3 8 , 364-379.
Press.
Holden, G. W ., T h o m pso n , E. £„ Z am barano , R. J., &
G raham S., W e i n e r , B ., & Z u c k e r , G. S. (1997). An
,
M L. A . (1997). Child effects as a source o f
arsh a ll,
attributkmal analysis o f punishm ent goals and pu change in maternal attitudes. J o u rn a l o f S o c ia l a n d
blic reactions to O. J. Sim pson. P e r s o n a lity a n d S o P erso n a l R ela tio n sh ip s, 14, 481-490.
c ia l P s y c h o lo g y B u lle tin , 23, 3 3 1 -3 4 6 .
Holzw orth, R. 3. (1996). Policy capturing with ridge re
G reenw ald (1 9 75). C onsequences o f prejudice
, A. G.
gression. O rg a n iza tio n a l B eh a vio r a n d H u m a n D e c i
against the null hypothesis. P s y c h o lo g ic a l B u lletin ,
sio n P ro c esses, 6 8 ,1 7 1 - 1 7 9 .
82, 1 -1 9 .
H o p k in s , K. D ., & G lass, G. V. (1978). B a sic sta tistics f o r
G r il o ,C. M ., W a l k e r , M . L ., B e c k e r , D . F., E d e l l ,
the beh a vio ra l scien ces. Englewood Cliffs, NJ: Prentice
W. S., & M c G l a s h a n , T. H. (1 9 9 7 ). Personality di
Hall.
sorders m adolescents w ith major depression, subs
tance use disorders, and coexisting major depression H unter, J. E. (1997). Needed: A ban on the significance
and substance use disorders. J o u rn a l o f C o n su ltin g test. P s y c h o lo g ic a l Science, 8 , 3 -7 .
a n d C lin ic a l P sy ch o lo g y , 65, 3 2 8 -3 3 2 . H u sse r l , E. (1970). The c risis o f E uropean scien ces a n d
G um p B ., & K u l i k , J. A . (1 9 97). Stress, affiliation,
, B. tran scen den tal phenom enology: A n introduction to p h e
and em otional contagion. J o u r n a l o f P e r so n a lity nom enological p h ilo so p h y (D. C. Carr, Trans.). Evans
a n d S o c ia l P s y c h o lo g y , 7 2 , 3 0 5 -3 1 9 . ton, EL: Northwestern University Press.
H amilton , D . (1 9 8 1 ), C o g n itiv e p r o c e s s e s in s t e H yde , J. S. (1993), Gender differences in mathematics
r e o ty p in g a n d in te r g r o u p b e h a v io r. H illsdale, NJ: ability, anxiety, and attitudes: What do meta-analyses
Bribaum. tell us? En: L. A. Penner, G. M. Batsche, H: M. Knoff,
& D. L. N elson, The ch a lle n g e in m a th e m a tic s a n d K leinmuntz , B. (1990). W hy w e still use our heads ins
s c ie n c e ed u c a tio n : P s y c h o lo g y 's r esp o n se (pp. tead o f formulas: Toward an integrative approach.
2 3 7 -2 4 9 ). Washington, DC: American P sychologi P s y c h o lo g ic a l B u lletin , 1 0 7 , 2 9 6 -3 1 0 .
cal Association. Kraem er , H. C., & T h ie m a n n ^ S. (1987). H o w m a n y
H yde, J. S„ Fennema, E., & L a m o n , S. J. (1990). Gender s u b je c ts ? S ta tis tic a l p o w e r 'a n a l y s is in rese a rc h .
differences in mathematics performance: A meta- Newbury Park, CA: Sage.
analysis, P sy ch o lo g ic a l B ulletin, 107, 139-155. K u n d a , 2 ., & O lssqn , K. C. (1997). W hen exceptions
Inhgff, A., Lima, S., & Carroll, P. (1984). Contexturai prove the rule: How extrem ity o f deviance determ i
effects on metaphor comprehension in reading. M e nes the impact o f deviant exam ples on stereotypes.
m ory a n d C ognition , 12, 558-567. J o u r n a l o f P e r so n a lity a n d S o c ia l P s y c h o lo g y , 72,
Johnson, C , & Mullen, B. (1994), Evidence for the ac L e v e n t h a l , L ., & H u y n , C -L . (1 9 9 6 ) . Directional d e
cessibility o f paired distinctiveness in distinctiveness- c ision s for two-tailed tests: Power, error rates, and
based illusory correlaion in stereotyping. P erso n a lity sam ple size . P s y c h o lo g ic a l M e th o d s, 1, 2 7 8 -2 9 2 .
a n d S o c ia l P sy c h o lo g y Bulletin, 20, 6 5 -7 0 . L e w is , D ., & B u r k e , C. J. (1949). T he u se and m isuse
Judd, C. M„ M c C l e l l a n d , G. H., & Culhane, S. E. (1995). o f the chi-square test. P s y c h o lo g ic a l B u lle tin , 4 6 ,
Data analysis: Continuing issues in She everyday analy 4 3 3 -4 8 9 .
sis of psychological data, A nnual R eview o f Psych ology, L i n d z e y , E . W ., M i z e , L , & P e t t it , G . S . (1 9 9 7 ). M u
46, 433-465. tuality in parent-child play: C onsequences for ch il
K agan , J. (1994). G a le n ’s p ro p h e cy : T em peram en t in h u dren’s peer competence. J o u r n a l o f S o c ia l a n d
m an nature. New York: Basic Books. P e r so n a l R e la tio n s h ip s , 14, 523-538,
K arney , B. R., & B r a d b u r y , T. N. (1997), Neuroti- Lydon, L, P i e r c e , X, & O'Regan, S. (1997). Coping with
cism, marital interaction, and the trajectory of mari moral commitment to long-distance dating relations
tal satisfaction. J o u r n a l o f P e r s o n a lity a n d S o c ia l hips. J o u rn a l o f P e r so n a lity a n d S o c ia l P sy ch o lo g y ,
P s y c h o lo g y , 72, 1075-1092. 7 3 , 104-113.
Kelley, H. H. (1971). A ttr ib u tio n in s o c ia l in te r a c M acD onald, C., C hamberlain, K,, & L ong, N. (1997).
tion . Morristown, NJ: General Learning Press. Race, combat, and t o d in a community sample of
K enney, D, A- (1995). Relationship science in the 21st New Zealand Vietnam War veterans. Jo u rn a l o f Trau
m a tic S tress, 1 0 , 117-124.
century. J o u rn a l o f S o c ia l a n d P e r s o n a l R e la tio n s
h ips, 12, 597-600. MacKinnon-L ewis, C„ Starnes, R., Volung, B., & J o h n
son, S. (1997). Perceptions of parenting as predictors
KerlinOBR, F. N. (1973). F o u n d a tio n s o f b e h a v io r a l
research . New York: Hoit, Rinehart and Winston.
o f boys’ sibling and peer relations. D e v e lo p m e n ta l
P sych o lo g y, 33, 1024-1031.
Keselman, J. C., Lix, L. M., & Keselman, H. J. (1996).
M arkm an , H . J ., R e n i c k , M. J ., F l o y d , F. J ., S t a n l e y , S .
The analysis of repeated measurements: A quantitati
ve research synthesis. B ritish J o u r n a l o f M a th e m a ti M „ & C l e m e n t s , M. (1993). Preventing marital dis
tress through communication and conflict manage
c a l a n d S ta tis tic a l P sych o lo g y, 4 9 , 275-298.
ment training: A 4- and 5-year follow-up. Jo u rn a l o f
K leun , W. C., v a n der R o e g , H. M ., & T o p m a n , R. M .
C on su ltin g a n d C lin ic a l Psych o lo g y, 6 1 , 70 -7 7 .
(1 9 9 4 ). C ognition, study habits, test anxiety, and
academ ic perform ance. P s y c h o lo g ic a l R e p o r ts , 75, M axw ell, S. E., & D e l a n e y , H. D. (1990). D esigning expe
1 2 1 9 -1 2 2 6 . rim ents a n d analyzing data. Belmont, C A : Wadsworth.
M axwell, S. E., & D elaney, H. D. (1993). Bivariate me peer competence: Is the medium the message? C h ild
dian splits and spurious statistical significance. P s y c h o 312-332.
D e v e lo p m e n t, 6 8 ,
lo g ic a l B u lle tin , 1 1 3 , 181-190. MoriaRTY, S. E .,& Everett, S-L. (1994). Commercial
McConnell, A. R., S herman, S. J., & Hamilton, D. L. breaks: A viewing behavior study. J o u r n a lis m Q u a r
(1994). Illusory correlation in the perception o f groups: te r ly , 7 1 , 346-355.
An extension of the distinctiveness-based account. M ueller, J. H., Elser, M. J., & P ollack, D. N. (1993).
J o u r n a l o f P e r s o n a lit y a n d S o c ia l P s y c h o lo g y , 6 7 , Test anxiety and implicit memory. B u lle tin o f th e P s y -
414-429. c h o n o m ic S o c ie ty , 3 1 , 531-533.
McCracken, G. (1988). T h e lo n g in te rv ie w . London: Sage. Myers, D. G. (1991). Union is strength: A consumer’s
McLaughlin-Volpe, T., A ron, A, & Reis, H. T. (1998, Au view of meta-analysis. P e r s o n a lity a n d S o c ia l P s y c h o
gust). Closeness during interethnic social interactions lo g y B u lle tin , 1 7 , 265-266.
and prejudice: A diary study. En: A. Aron (Chair), I n te r N ezlek, J. B., Kowalski, R. M., Leary, M. R., B levins,
g r o u p c o n ta c t a n d p e r s o n a l r e la tio n sh ip s . Symposium T , & HolgaTE, S. (1997). Personality moderators of
conducted at the Annual Convention of the American reactions to interpersonal rejection: Depression and
Psychological Association, San Francisco, CA. trait self-esteem. P e r s o n a lit y a n d S o c i a l P s y c h o l o g y
McLeod, J. (1996). Qualitative research methods in coun B u lle tin , 2 3 , 1235-1244.
seling psychology. En: R. Wooife & W. Dryden (Eds.), Norcross, J. C., Hanych, J. M., & Terranova, R. D. (1996).
H a n d b o o k o f c o u n s e lin g p s y c h o lo g y (pp. 65-86). Lon Graduate study in psychology: 1992-1993. A m e ric a n
don: Sage. P s y c h o lo g is t, 5 1 , 631-643.
M eehl, P. E. (1954). C lin ic a l v e r s u s s ta tis tic a l p r e d ic tio n : Norman, C., & A ron, A. (1997, June). Shared expansion
A th e o r e tic a l a n a ly s is a n d a r e v ie w o f th e e v id e n c e . Min experiences and relationship satisfaction. En: C. Nor
neapolis: University of Minnesota Press. man. (Chair), H o w to m a k e y o u r r e la tio n s h ip w o r k :
MiCCERt, T. (1989). The unicorn, the normal curve, and S p e c u la t io n s b a s e d o n h a r d r e s e a r c h . Symposium
other improbable creatures. P s y c h o lo g ic a l B u lle tin , 105, conducted at the International Network on Personal
156-166. Relationships Conference, Oxford, OH.
Migkelson, ft. D., Kessler, R. C.( & S haver, P. R. (1997). Oakes, M. (1982). Intuiting strength of association from
Adult attachment in a nationally representative sam a correlation coefficient. B r itis h J o u r n a l o f P s y c h o
ple. J o u r n a l o f P e r s o n a lity a n d S o c i a l P s y c h o lo g y , 73, lo g y , 7 3 , 51-56.
1092-1106. OltHOFF, R. K. (1989). T h e e f f e c tiv e n e s s o f p r e m a r i t a l
the sense of trust: An exploration of interaction goals tation, California Graduate School of Family Psycho
and affect regulation. J o u r n a l o f P e r s o n a lity a n d S o logy, San Francisco.
c i a l P s y c h o lo g y , 7 4 . Onwuegbuzie, A. J. (1995). Statistics text anxiety and fe
M iller, L, C„ & Pishkin, S. A, (1997). On the dynamics male students. P s y c h o l o g y o f W o m en Q u a r te r ly , 1 9 ,
of human bonding and reproductive success: Seeking 413-418.
windows on the adapted-for human-environmental in Orbach, I., Mikulincer, M., King, R., Cohen, D., & Stein,
terface. En: J, Simpson & D. T. Kenrick (Eds,), E v o lu D. (1997), Thresholds and tolerance of physical pain in
ti o n a r y s o c i a l p s y c h o l o g y (pp. 197-235). Hillsdale, suicidal and nonsuicidal adolescents. J o u r n a l o f C o n s u l
NJ: Erlbaum. tin g a n d C lin ic a l P s y c h o lo g y , 6 5 , 646-652.
S ternberg, R. J. (1988). C o n s t r u c t v a l i d a t i o n o f a tr ia n
Van L ange , P. M., O tten , W., D eB ruin , E. M. N., &
Joireman, J. A. (1997). Development o f prosocial,
Unpublished manuscript, Ya
g u la r th e o r y o f lo v e .
individualistic, and competitive orientations: The
le University, Department of Psychology, New
ory and preliminary evidence. J o u r n a l o f P e r s o n a
Haven, CT.
l i t y a n d S o c i a l P s y c h o l o g y , 7 3 , 733-746.
S tigler , S. M. (1986). T h e h i s t o r y o f s ta tis tic s . Cam
Vance, W. R., Jr„ & W atson, T. S . (1994). Comparing
bridge, MA: Belknap Press.
anxiety management training and systematic ratio
Stipek , D. J., & Ryan , R. H. (1997). Economically nal restructuring for reducing mathematics anxiety
disadvantaged preschoolers; Ready to learn but in college students. J o u r n a l o f C o l l e g e S t u d e n t D e
further to go, D e v e l o p m e n t a l P s y c h o l o g y , 3 3 , v e lo p m e n t , 3 5 , 261-266.
711-723.
Walberg , H. J., S trykowski, B. F., R ovai, E., & H ung,
Strahan , R. F. (1991). Remarks on the binomial effect S. S. (1984). Exceptional performance. R e v i e w o f
size display, A m e r i c a n P s y c h o l o g is t, 4 6 , 1083-1084. E d u c a ti o n a l R e s e a r c h , 5 4 ,8 7 - 1 1 2 .
S uh , E., D iener , E., & F ijita, F. (1996), Events and Wardle , J., Steptoe , A., B ellisle , E , D avou, B.,
subjective well-being: Only recent events matter, R eschke, K., L appajlainen, R., & F redrikson , M.
J o u rn a l o f P e r s o n a lity a n d S o c ia l P s y c h o lo g y , 70, (1997). Healthy dietary practices among European
1091-1102. students. H e a l t h P s y c h o l o g y , 1 6 , 443-450.
Tabachnick, B. G., & FtDELL, L. S. (1996). U s in g m u lti Watts, W., & W right, L. (1990). The relationship of
v a r ia t e s t a t i s t i c s (3rd ed.). New York: Harper & Row. alcohol, tobacco, marijuana, and other illegal drug
use to delinquency among Mexican-American,
T ankard , J,, Jr. (1984). T h e s t a t i s t i c a l p i o n e e r s . Cam
black, and white adolescent males. A d o l e s c e n c e ,
bridge, MA: Schenkman.
2 5 , 171-181.
T erpstra , D, E., & R ozell , E, J. (1997), Sources of
W echsler , H .f D avenport, A., D owdall , G., M oey -
human resource information and the link to organi
kens , B., & C astillo , S. (1994). Health and beha
zational profitability, J o u r n a l o f A p p l i e d B e h a v i o
vioral consequences of binge drinking in college:
r a l S c ie n c e , 3 3 , 66-83.
A national survey of students at 140 campuses.
T h o m p so n , K . N., & S chumacher , R. E. (1997). An J o u r n a l o f th e A m e r ic a n M e d ic a l A s s o c ia tio n , 2 7 2 ,
evaluation o f Rosenthal and Rubin’s binomial ef 1672-1677.
fect size display. J o u r n a l o f E d u c a t i o n a l a n d B e h a W eller , A., & W eller , L. (1997). Menstrual synch
v i o r a l S t a t i s t i c s , 2 2 , 109-117.
rony under optimal conditions: Bedouin families.
T obias, S. (1987), S u c c e e d w i t h m a th : E v e r y s t u d e n t ’s J o u r n a l o f C o m p a r a t i v e P s y c h o l o g y , 1 1 1 , 143-151.
g u i d e t o c o n q u e r i n g m a t h a n x ie t y . New York: Co W hîtecotton , S, M. (1996). The effects o f experience
llege Entrance Examination Board. and a decision aid on the slope, scatter, and bias of
T ufte, E, R. (1983). T h e v i s u a l d i s p l a y o f q u a n t i t a t i v e earnings forecasts. O r g a n i z a t i o n a l B e h a v i o r a n d
in f o r m a ti o n . Cheshire, CT: Graphic Press. H u m a n D e c i s i o n P r o c e s s e s , 6 6 , 111-121,
W iseman , H. (1997). Interpersonal relatedness and sues on gender differences, lo u m a l o f P e r s o n a lity
self-definition in the experience of loneliness du a n d S o c ia l P s y c h o lo g y , 6 0 , 154-164.
ring the transition to university. P e r s o n a l R e l a t i o n s Z ejodner, M. (1991). Statistics and mathematics anxiety
h ip s , 4 , 285-299.
in social science students: Some interesting parallels.
W ong , M. M , & CsncszENTMiHALYt, M. (1991). Affi B r iti s h J o u r n a l o f E d u c a tio n , '61, 319-329.
liation motivation and daily experience: Some is
A de cuadrados mínimos, 444
de dos criterios, 410,420-21,424-436
Abrams, R. A,, 264 de tres criterios, 443
Agresión a través de relaciones, 591-93 de un criterio, 346,405, 410
Alfa de Cronbach, 565 desarrollos recientes, 397-98
Alfa, V é a s e alfa de Cronbach; error Tipo I estimación de la varianza poblacional a partir de,
Allport, Gordon, 59 346-47
Altman, D, G., 170-71 factorial, 346, 407-449
Análisis de covarianza multivariado, 576-577 grupos de tamaños desiguales y; 385-91, 394
Análisis de covarianza, 575-76 hipótesis nula y, 347, 349-5!
Análisis de senderos, 570 la prueba ( como caso especial de, 531-36
Análisis de sistemas, 60 limitaciones, 368-69,397-98
Análisis de un caso, 59,601 lógica de, 346-53
Análisis de varianza de cuadrados mínimos, 444 medidas repetidas, 443-44,457-59
Análisis de varianza de dos criterios, 410 modelo estructural, 377-400
cálculo de, 425-26 multivariado, 444
ejemplo de, 428-36 paralelismos con la lógica de la prueba t, 532
fórmulas de cálculo para, 455-57 plegado, 443
grados de libertad de, 426-28 potencia de, 366
lógica de, 420-21,424-36 principio fundamental de, 351
modelo estructural para, 424 prueba de hipótesis con, 346,361-63
razón F en, 420-21,424. realización de, 354
resumen del procedimiento, 436-37 relación de ia prueba t con, 539
supuestos de, 436 según se describe en publicaciones científicas, 369-70
tabla para, 428 supuestos de, 363-364, 370
Análisis de varianza de medidas repetidas, 443-44, tablas, 384-85
457-59 tamaño de efecto del, 364-66
Análisis de varianza de tres criterios, 443 tamaño muestral, 366-67
Análisis de varianza de un criterio, 346, 410 Análisis estadístico, 52
Análisis de varianza multivariado, 444, 576-577 Análisis factorial de varianza, 346, 407-449. V é a s e
Análisis de varianza, 345-71. V é a s e también análisis también análisis de varianza; diseño factorial de
factorial de varianza, modelo estructural investigación
analogía, 353 cantidad desigual de participantes y , 444
como caso especial de coeficiente de correlación casos especiales de, 443-44
múltiple, 541-47,549 controversias, 444-47
como forma de pensar, 381 desarrollos recientes, 444-47
controversias, 368,397 dicotomización de variables numéricas en, 444-47
extensiones de, 443*44 Caspi, A., 268,520
limitaciones, 444*47 Categorías objetivo, 269
lógica de, 407*20 Causalidad
potencia de, 442 dirección de, 91
según se describe en publicaciones científicas, 447- teoría basada en la regularidad, 551
448 teoría generativa de, 551-52
tamaño del efecto de, 436-42 Chapman, H. A., 102
tamaño muestra!, 442 Chiu, C„ 227-28
Análisis factorial, 568*70 Chow,S.L„ 267-68
aNCOVA. V é a s e análisis de covarianza Ciaidini, R. 8., 404
Angustia matemática, Í3 Clark, O .M ., 389,399
Angustia por los exámenes, 13-14 Clark, Margaret, 52
Angustia, 13-15 Coates, D., 187
anova. V é a s e análisis de varianza Cochran, Wifiiam G„ 352
Ansiedad, 14 Codificación nominal, 547,549
Apuesta de Pascal, 159 Coeficiente de correlación de Pearson.
Aristóteles, 552 V é a s e coeficiente de correlación
Aron, A., 2 ,3 1 9 ,3 2 2 ,3 3 4 ,5 8 6 ,5 8 9 Coeficiente de correlación múltiple, 127-28,541-47,549
Aron, E. N., 2 ,5 8 9 Coeficiente de correlación parcial, 565
Asendorpf, j. B ., 339 Coeficiente de correlación, 79*100,121,459-60.
Asignación aleatoria, 368-69,598 V é a s e también beta abreviatura de, 82
Asimetría, 23,463 controversias, 95-99
Asociación Americana de Matemática, 28 definición de, 82
Asociación Americana de Psicología ( apa), 195 desatTollos recientes, 95-99
Atenuación, 95 ejemplo de, 84
fórmula de, 84
fórmulas de cálculo de, 105
B fórmulas de cálculo versus fórmulas de definición
de, 84-85
Bardsley, J. 1 ,7 5 intetpretación, 91-95
Barras de error estándar, 227 pasos a seguir para el cálculo de, 84,85
Baumrind, D., 552 potencia de, 107
Bayes, Thomas, 168 probando la significación estadística de, 90
Behaviorismo, 58 prueba t como caso especial de, 536-541
Bell, Julia, 463 pruebas de hipótesis de, 105-06
Beta. V é a s e coeficiente de regresión estandarizado; reglas de Cohén para, 107
error Tipo I según se describen en publicaciones científicas, 99-100
Biener, L., 200 significación de, 105-106
Biemat, M., 582 tamaño del efecto de, 107
Biometria, SI, 533 Coeficiente de regresión estandarizado, 111,126-27
Biométrika, 464 Coeficiente de regresión para puntuaciones ordinarias, 113
Blanchard, R A„ 432,457 Coeficiente de regresión, 111
Boyd, C. P„ 585 Coeficiente de senderos, 570
Brickman, R, 187 Coeficiente phi, 483
Buck, J. L.,27 Cohén, Jacob, 107,249-51,254-55,257,30Qn, 328,
Buffon, 330 333n, 365,396,440, 445, 483,485, 579
Burke, C. J,, 486 Cohén, R, 445
Bush, George, 164 Comisión Juvenil de Texas, 129
¿Cómo tener éxito con las matemáticas?: guía para que
cada alumno pueda superar la angustia
C matemática, 13
Comparaciones a posteriori, 394
C de Cochran, 582 Comparaciones a priori, 393-94
Capaldi, D. M„ 575 Comparaciones múltiples, 391,393-94
Carey, M. R, 524 efectos de, 394
Carga factorial, 568 métodos, 393-94
Carroll, R, 11 según se describen en publicaciones científicas, 398-
Casilla, 411 400
Comparaciones planificadas, 393-94 Curtís, J., 454
Comparaciones p o s : h o c , 394 Curtosis, 23-24, 502
Compensación, 600 Curva con forma de campana. V é a s e curva normal
Confiabilídad por división en mitades, 567 Curva normal, 23-24,147-56, 167-168
Confiabilidad por intercambio de juicios, 604 controversias, 168-69 ■;
Confiabilídad por prueba y repetición, 567 fórmula de, 148n
Confiabilidad, 566-68. V é a s e también validez historia de, 149
consistencia interna, 604 limitaciones, 168-69
definición de, 566 porcentajes de valores en, 150-156
división en mitades, 567 probabilidad en, 159-60,167-68
intercambio de juicios, 604 puntuaciones Z y, 152-53
prueba-reprueba, 567,604 según se describe
Confianza en sí mismo, i 4 en publicaciones científicas, 170-71
Conflicto de separación-individuación, 566 tabla de áreas de, 152-56,609-U
Connors, G. 1., 519
Conover, W., 510
Consistencia interna, 604 D
Constante de regresión, 113-14,115
Constructivismo, 60 d de Cohén, 247
Contingencia, 463 Dañe, F. C., 36 In
Contrastes lineales, 393-94 Darwin, Charles, 81
Contrastes planificados, 393-94 Dato estadístico phi de Cramer, 483-484
Control de manipulación, 319 DeGarmo, D. S.. 576-77,593
Controlar, 565 Delaney, H. D .,445
Corrección por atenuación, 95 Deíaney, S. E., 446
Correlación curvilínea, 75
Delucchi, K. L., 486
Correlación espuria, 463
DeMoivre, Abraham, 148,150
Correlación ilusoria, 91
Desempeño matemático, 27-28
Correlación lineal, 73,79-82
Desensibilización sistemática, 14
Correlación negativa, 74-75
Desmaris, S., 454
Correlación nula, 75-76
Desvío cuadxático, 43,378-79
Correlación parcial, 564-566
Desvío estándar de una distribución de medias, 208,
Correlación perfecta, 82,111
225,280-81
Correlación positiva, 73
Desvío estándar de una distribución de diferencias entre
Correlación semiparcial cuadrática, 126n, Í27n
medias, 318
Correlación semiparcial, 565n
Correlación, 69-70,49ón, 531. Desvío estándar, 45-51. V é a s e también varianza
V é a s e también coeficiente de correlación definición de, 45
causalidad y, 91 descripción de, 45
curvilínea, 75 ejemplo de, 45,47
definición de, 69 fórmulas de cálculo, 50-51, 65-66
grado de, 79-80 fórmulas para, 46-47
gran, 95-99. según se describe en publicaciones científicas, 60-61
ilusoria, 91-92 Desvío medio, 45n
lineal, 73 Desvío promedio, 45n
negativa, 74-75 Desvío, 43
nula, 75-76 Dewey, Thomas, 164
pasos a seguir para la determinación, 85-90 Diagramas de dispersión, 71-76, 85
patrones de, 73-78 cómo crear, 71
pequeña, 97-98 ejemplo de, 72-73
perfecta, 82,111 Dicotomización, 444-445
positiva, 73 Diferenciación relacionada, 91
regresión múltiple y, 126-27 Dirección de causalidad, 91
representación gráfica, 71-73 Diseño cuasiexperimental, 598
Correlaciones de orden cero, 82 Diseño de investigación con grupo de control
Covariable, 575 equivalente y pruebas previa y posterior, 598
Crick, N. R., 590 Diseño de investigación con grupo de control
Csikszentmihalyi, M., 428,439 equivalente, 598
Diseño de investigación de grupo tínico con pruebas como distribuciones comparativas, 212
previa y posterior, 600 creación de, 204-206
Diseño de investigación de medidas repetidas, 287-89, desvío estándar de, 208,225
30 í, 600-01 ejemplo de, 210-212
Diseño de investigación factorial de dos criterios, 410 forma de, 208-209
Diseño de investigación factorial de tres criterios, 411 media de, 206-207
Diseño de investigación íntra-sujeto, 287-89,301, 600 pruebas de hipótesis q u e involucran, 212-219
Diseño de investigación. puntuación 2 de ia media muestral en , 212-213
V é a s e también experimento reglas para la determinación de las características
análisis de varianza y, 550 de, 209
características de, 597 varianza de, 207-208,317
con grupo de control equivalente y pruebas previa y Distribución de maestreo, 181
posterior, 598 Distribución F , 358-59
con grupo de control equivalente, 598 Distribución Gaussiana, 148
correlacional, 547-50,601 Distribución multimodai, 20-21
cuasiexperimental, 598 Distribución normal. V é a s e curva normal
diseño de grupo único con pruebas previa y Distribución rectangular, 20-21
posterior, 600 Distribución simétrica, 23,148
equivalencia de las circunstancias en, 603 Distribución t, 276,281-82,318
equivalencia de participantes en, 597-601 forma de, 281-82
experimental, 547-50 puntos de corte para, 282-84,612
intrasujetos, 600 Distribución unimodal, 20-21,148
medidas repetidas, 600-01 Dunlap, VV. P.( Í05n, 333n, 4 8 5 a
medidas utilizadas en, 604-07 Dweck, C .S., 227-28
papel que desempeña la potencia en, 256-260
preexperimental, 600
problemas, 603 £
representatividad de la muestra, 603-04
resumen de, 601 Efecto de fatiga, 600
Diseño factorial de investigación, 409-20. V é a s e Efecto de práctica, 600
también análisis fa c to r ia l de varianza Efecto de tr a s p a s o , 6 0 0
de dos criterios, 411 Efecto interactivo, 409-20
de tres criterios, 410 definición de, 410
definición de, 409 efecto principal y, 418-20
efectos interactivos,409-10 ejemplo de, 422
terminología, 410-411 interpretación, 412-414
Diseño preexperimental, 600 medías de casilla y, 412
Diseños de investigación correlaciónales, 91, 601 razón F , 421,423
Distribución arco-seno, 502 reconocimiento de, 412-14
Distribución asimétrica, 23 representación gráfica, 415-18
Distribución bimodal, 20-2! Efecto principal, 411
Distribución chi-cuadrado, 466 efecto interactivo y, 418-20
Distribución comparativa medias marginales y, 411
características, 181 razón F para, 421
distribución de inedias c o m o , 212 Efecto piso, 23
media muestra! y, 284 Efecto techo, 23
punto muestral de corte, 181-83 Efectos del experimentador, 603
valor muestral de investigación, 183 Efectos Hawthome, 603-04
varianza poblacional estimada y, 281-82 Efectos placebo, 603
Distribución de diferencias de medias, 313-319 E l c o r a z ó n d e l a p s i c o l o g í a s o c ia l , 5 2
contenido de, 313-314 Elser, M. J., 14
desvío estándar de, 318 Encuesta Crossley, 164
forma de, 318 Encuesta de Gallup, 164,218
media de, 314 Encuesta de Roper, 164
varianza de, 317-318 Encuestas telefónicas, 164,170-71,213
Distribución de frecuencias, 20-25, 159 Encuestas, 164, 213
•Distribución de medias, 200-213. Entrevistas, 60
V é a s e también medias características de, 206-212 Eppley, K. R„ 264
Error cuadrático total al predecir utilizando la media, 121 F
Error cuadrático, 118,121
Error estándar de estimación, 122n
Factor agrupación de medidas repetidas, 458
Error estándar de la media, 208,225.
Factor, 568
V é a s e también media
Fawzi, M. C. S., 585 '
Error estándar. V é a s e error estándar de la media
Punto de corte para, 360,613
error Tipo 1,2 36-37,238,444,445,517-19,579
tabla F y , 352-53
error Tipo II, 237-39,444,445,517-19,579
Fenomenología, 58-60
error Tipo IH, 236n
Fermat, Pierre, 159
Error, 117-122. V é a s e también porcentaje de varianza
explicada Fidell, Linda, 548
Quadràtico, 118 Finley, H. C., 60
definición de, 118 Fisher, Ronaíd A., 352-53,463, 486, 5 íS, 533, 578, 579
interpretación gráfica de, 118 Foertsch, J., 225
tipo 1,236-37,444,445 Folwell, A, L., 490
tipo H, 237-39, 444,445 Ford, I. D., 520
tipo III, 236n Forgatch, M, S., 576-77, 593
Escala de idealización, 69 Forma de la distribución de medias, 208-09
Escala de intimidad, 69 Fórmula de predicción con puntuaciones originales, 113
Escudero, V., 340 Fórmulas de cálculo, 50, 84
E s s a i d ’A r íth m e tiq u e m o r a le , 330 Fórmulas de definición, 50,84
Estadística Frank, S. J., 566
Estadística descriptiva, 2 Frecuencia esperada, 465,474-476
Estadística inductiva, 2,147-171, 179 Frecuencia observada, 465
Estadística multivariada, 126n, 576 Frecuencia relativa esperada, 157
Estadísticas maestrales, 164 Frecuencia relativa, 157
Estado de ánimo estadístico, 60 Frecuencia, 157
Estimación combinada de la varianza poblacíonal, Frick, R, W,, 169a, 186,266-67
315-17, 347 Frisch, A. S., 335
Estimación insesgada de la varianza poblacíonal, 280
Estimación intergrupal de varianza poblacíonal, 349-51,
V é a s e también razón F G
Estimación ímervalar, 219
Estimación íntragrupal de la varianza poblacíonal, 347, Cableo, 552
350-51. V é a s e también razón F Galton, Francis, 81,8 2 ,1 6 8 ,4 6 3 ,5 3 3
Estimación puntual, 219 Gangestad, S. W., 31,105
Estimación sesgada, 279 Gauss, Kart Friedrich, 148,149
Estimación, 219 Género, 26-28
eta cuadrado, 396 . Gemsbacher, M. A„ 225
Etnìa, 27-28 Gigerenzer, G., 254,579,580
Etnografía, 60 Gire, I.T., 586
Eugenesia 81, 353,463 Glass, G. V., 167
Everett, S. A., 493 Gosset, Wilfiam S., 81,276-77,301,302,
Everett, Shu-Ling, 487 352,463,518,533
Examen de Inscripción de Graduados ( gre), 210 Grado de correlación, 79-82.
Excluir, 565 V é a s e también coeficiente de correlación
Experimento de Lanarkshire acerca del consumo de Grados de libertad del denominador, 359-360
lecbe, 302 Grados de libertad del numerador, 359-60
Experimento verdadero, 596-97 Grados de libertad intergrupales, 359-60
Experimento. V é a s e también diseño de investigación Grados de libertad intragrupaíes, 359-60
equivalencia de las circunstancias en, 603-604 Grados de libertad, 280,315
equivalencia de participantes en, 597-601 análisis de varianza de dos criterios y, 394-96
medidas utilizadas en, 604-607 denominador, 359-360
papel que desempeña La potencia en, 256-60 intragrupaíes, 359-360
representativídad de la muestra, 603-604 numerador, 359-360
terminología relacionada con, 596-597 prueba chi-cuadrado de independencia y, 477-478
verdadero, 596 Grabara, S., 143
Exposición binomial del tamaño dei efecto, 98 Gran correlación, 95-99
Gran media, 356 índice de concordancia, 571
Graziand, Biil, 52 Inhoff.A., 10
Greenwald, A. G., 186 Instrumentos de ayuda, 132-133
Grilo, C. M„ 369 Interaccionismo simbólico, 60
Grupo contrôi, 596 Interaccíonismo, 60,422
Grupo experimental, 596 Interpretación de laprobabilidad como la frecuencia
Gullone, E., 585 relativa a largo plazo, 157
Gump, B. B,, 447-48 Interpretación subjetiva de la probabilidad, 157
Gutierrez, E., 340 Interpretación, 396
IntersecciónY (ordenada al origen), 115
H Intervalos de confianza, 219
controversias, 224-25
del 95%, 220
Hamilton, H., 170-71 del 99%, 221 ■
Hanych, J. M.,29 ejemplo de, 220-21
Harter, S., 462,465,467,473,490,491 limitaciones, 223-224
Hay, Jennifer, 479, 485,487 lógica de, 221-222
Hazan, Cindy, 345,349,352-53, 399, 541 pasos aseguir para el cálculo, 220
Herbener, E. S., 520 potencia estadística y, 263,266
Hermano, C, 562,563 potencia y, 263,266
Highíen, P. S„ 60
Hipótesis alternativa, 180 prueba de hipótesis y, 204-5
Hipótesis de investigación, 180-81 según se describen enpublicaciones científicas, 227
Hipótesis direccional, 188-189 tamaño del efecto y, 263,266
Hipótesis no direccional, 189 ventajas de, 224-25
Hipótesis nula, 180-81 Intervalos, 8,9-10
aceptación, 186 límites, 9-10
análisis de varianza y, 347,349-51 tamaño, 9-10,24-25
criterio para, 186 Intuiciones capacitadas, 132
pruebas de rango y orden y, 509-10 Inventario de Personalidad
rechazo, 181-83,184-85,282-84 Polifacético deMinnessota (mmpi), 192
Histogramas, 12,16,463 Inventario Muitidimensíonal
cómo crear, 16 de Identidad de la Raza Negra (mdbi), 568
controversias, 24-25 Investigación cualitativa, 6 0
ejemplos de, 16 Investigación de conductas, 60
exageración de proporciones, 25 Investigación de sujeto único, 601
limitaciones, 24-25
polígonos de frecuencias y, 20
según se describen en publicaciones científicas, 28- J
31
Hobfoll, S. £., 102 íanoff-Buíman, R., 187
Holden, G. W„ 304 Jehn.K. A, 137
Homoscedasticidad, 551 Jung, Cari, 60
Hong, Y, 227-28
Hopkins, K. D., 167
Howard, G„ 170-71 K
Hume, David, 552
Hunter, J. E., 194-95 fíant, Immanuel, 552
Huyo, C-L., 190n Keíley, H. H„ 381
Hyde, J. S„ 27 Kenney, D. A., 422
Kiein, D. R, 369
Kleinmuntz, B,, 132
I Kotovsky, K., 195
Kulik, I A., 447-448
Imán, R. L., 510 Kunda, Z„ 451,452
independencia, 473 Kurtz, M., 335
índice de Atención aAlternativas, 523 Kwan, V. S. Y., 573
L división por, 445
utilización de, 41-43
Medias marginales, 411
La época dorada de la estadística, 533 Medición
Lamben, A . L, 2 9 9 -3 0 6 ,4 1 5 ,4 2 0 ,4 2 1 ,4 2 4 ,4 4 3 ,4 4 7
confiabilidad de, 604
Laplace, Pierre, 149 de comportamiento, 604
Latane, Bibb, 52 falta de confiabilidad de, 95
Legitimidadde la generalización, 603 fisiológicas, 604
Levanthal, L „ 190n informe propio, 604
Levine, D. W., 170-71 niveles de, 5-6
Lewis, D„ 486 por observación, 604
Lilly, T., 434 validez de, 605-06
Lima, S., 10 Medidas de comportamiento, 604
Límites de confianza, 219-220 Medidas de informe propio, 604
Lindquist, E. F., 353 Medidas fisiológicas, 604
Lindzey, E. W., 585 Medidas por observación, 604
Linea de regresión, 114-17 Meditación trascendental (tm ), 243
cómo trazar, 115-17 Meehl, Paul, 132
pendiente de, 114-115 Meta-análisis, 248,263-66,267,269
LISREL. V é a s e modelo de ecuación estructural Método Bayesiano, 1 6 8
Lista de Control de Adjetivos, 211 Método de aproximación, 149
Logaritmo, 502 Método de Montecario, 330-31,486, 518
Lydon, John, 487 Método de prueba a ciegas, 603
Método ideográfico, 59
M
Método nomotético, 58
Método probabilístieo, 164
Métodos de prueba intensivos por computadora según se
MacDonald, C., 561 describen en, 520
•MacKinnon-Lewis, C., 570 análisis factorial de varianza según se describe en,
M a n c o v a . V é a s e análisis de covarianza multivariado
447-48
Manipulación de la variable independiente, 596 coeficiente de correlación según se describe en,
Manipulación experimental, 596 99-100
m a n o v a . V é a s e análisis de varianza m ultivariado comparaciones múltiples según se describen en,
Mantenerconstante, 565 398-400
Manual de Diagnóstico y Estadístico de Trastornos curva normal según se describe en, 170-71
Mentales (DSM-IV), 585 desvío estándar según se describe en, 60-61
Matriz de correlación, 99 htstogramas según se describen en, 28-31
Maxwell, S.E., 445,447 intervalos de confianza según se describen en, 227
McLaughlin-Volpe, Tracy, 7 la media según se describe en, 60-61
Media armónica, 332-33 modelo estructural según se describe en, 398-400
Media de casilla, 411 muestra según se describe en, 170-71
Media de la distribución de diferencias entremedias, 315 población según se describe en, 170-71
Media de la distribución de medias, 206-07 poblaciones anormales según se describen en,
Media de los cuadrados; 355 519-20
Media, 35-39. V é a s e también tendencia central, polígonos de frecuencia según se describen en, 28-
distribución de medias, mediana, moda, error 31
estándar de la media potencia estadísticasegún se describe en, 267-69 .
controversias, 58-60 probabilidad según se describe en, 170-71
descripción de, 32 pruebade hipótesis según se describe en, 195-96,
distribución de, 200-219 225-28
ejemplos de cálculo, 37-39 pruebas de rangoy ordensegún se describen en, 520
fórmula para calcular, 37 pruebas t para medias dependientes según se
limitaciones, 58-60 describen en, 303-05
según se describen en publicaciones científicas, 60- pruebas í para medias independientes según se
61 describen en, 334-37
valor t paradiferencias entre, 318-19 pruebas rsegún se describen en, 303-05
Mediana, 40-43. regresión / correlación múltiples según se describen
V é a s e también tendencia central, media, moda en, 137
tablas de frecuencia según se describen en, 28-31 modelo de los cuadrados mínimos, 552
tamañodel efecto según se describe en, 267-69 supuestos y, 551
transformaciones de datos según se describen en, Modelo lineal, 530-31.
519-20 V é a s e también modelo lineal general
M é to d o s d e prueba intensivos por computadora, 510-16 Modelos de predicción, 110-12,117-18,136-37
controversias, 519 Moriarty, Sandra, 487
desventajas de, 517 Mu, 37,162
pruebas de aleatorización, 510-16 Mueller, J. H., 14
pruebas de esfuerzo propio, 416 { b o o is tr a p te s ts ) Muestraprobabilísima, 604
pruebas de rango y ordeny, 516-19 Muestra, 160-65,596
segúnse describenen publicaciones científicas, 520 controversia, 169-70
transformaciónde datos y, 516-19 curva normal y, 165-66
Micceri, T., 167-68 media, 284
Mikulmcer, M., 361,365-66 métodos deselección, 162
Mili, JohnStuart, 552 población versus, 165-66
Miller, D. T,, 99 probabilidady, 165-66
Miller, R. S., 400,523 razones parautilizar, 160-62
Mischeí, Walter, 422 representatividadde, 603-04
Moda, 40-41. V é a s e también tendenciacentral; según se describe
medía; mediana en publicaciones científicas, 170-71
Modelo causal, 570-75 Muestreo aleatorio, 603-04
análisis de senderos, 570 Muestreocon reemplazo, 230n
limitaciones, 575 Muestreo de agrupaciónde escenarios múltiples, 164
modelo de ecuación estructural, 570-75 Muestreo por cuotas, 164
Modelo de cuadrados mínimos, 531,552 Muíticolinearidad, 136
Modelo de ecuación estructural, 570-75 Murray, D. J,, 579
diagramade senderos, 573 Myers, L., 106n, 333n, 485n
ejemplo de, 573-75
índice de concordancia, 571 N
matemática de, 573
ventajas de, 571-73
Modelo de variable latente, 570 Narcisismo, 199
Modelo estadístico, 181 Newton, Isaac, 149
Modelo estructural, 377-400. V é a s e también análisis de Neyman, Jerzy, 578-79
varianza Nezlek, J. B., 136
Niveles de medición, 5-6
análisis de varianza utilizando, 383-84 Niveles de significacióncondicionales, 183
comparaciones múltiples y, 391, 393-94 Norcross, I. C., 28
controversia, 397-98 Normal bivariada, 551
división del desvío en, 378 Norman, C., 318,322,334
ejemplo de, 386-91 Números seudo aleatorios, 518
estimaciones de varianzapobíacional, 379-80
grupos de tamaños desiguales y, 385-391,. 394
método del capítulo 11y, 380,383 O
para el análisis de varianzade dos criterios, 424
potencia de, 395-96 Oakes, Michael, 96
principios de, 378-80,383 Oleson, K. C, 45í, 452
proporción de varianza explicada, 395-96 Olthoff, R. K„ 290-93,304
resumen del procedimiento, 391 Observación del participante, 601
segúnsedescribeenpublicaciones científicas, 398-400 Operaciones formales, 381
sumade desvíos cuadráticos, 378-79 Orbach, I., 60,397,398
tamaño dei efecto en, 395-96
Modelo lineal general, 527-553
controversias, 551-552 P-
correlación/ regresión múltiples y, 531
definición de, 530 Paciolí, Lúea, 159
introducción a, 530-31 París, M., 2
limitaciones, 551-52 Participantes, 596
Pascal, Blaise, 159 papel que desempeña en ios resultados de estudios
Patterson, G. R., 576 no significativos, 262
Pearson, Egon, 578*79, 579 papel que desempeña en los resultados de estudios
Pearson, Karl, 81,82,149, 352,462,463, 518, 533, significativos, 261-62
578-79 tamaño de muestra y, 2 5 2 - 5 6 , 2 5 6
Pendiente, 114-15 pasos aseguir para el cálculo de, 241
Personas altamente sensibles ( pas), 1 4 , 589-90 modelo estructural y, 395-96
Pezdek, K., 304-306 tablas, 242,299-300,615
Piaget, Jean, 381 de pruebas t paramedias dependientes, 299-300
Población, 160-65,596 de pruebas t paramedias independientes, 331-33
controversia, 169-70 Predicción bivariada, 109-14, 531
curva normal y, 165 con puntuaciones originales, 112-14
muestras versus, 165 con puntuaciones Z, 110-12
parámetros, 162, 219 controversias, 135-36
probabilidad y, 165 definiciónde, 109
según se describe ejemplo de, 122-25
en publicaciones científicas, 170-71 limitaciones, 135-36
Pioneros de la estadística, ios, 533 modelo, 110
Polígonos de frecuencias, 17-20 revisión de, 528-29
cómo crear, 15 según se describen en publicaciones científicas, 136
controversias, 24-25 Predicción clínica, 132-33
ejemplo de, 18,19 Predicciónestadística versus predicción clínica, 132
exageración de proporciones, 25 Predicción estadística, 132-33
histogramas y, 20 Prejuicios, 91
limitaciones, 24-25 Prentice, D, A,, 99
según se describen en publicaciones científicas, Probabilidad condicional, 174
28-30 Probabilidad, 156-60,165-166
Porcentaje de varíanza explicada, 94,117-22,365n, regla de adición, 173-74
395-96,529 cálculo, 157-59
coeficiente de correlación y, 121-22 condicional, 174
definición de, 121 controversia, 166-69
representación gráfica, 122 definición de, 157
Posavac, S. $,, 28 interpretaciones de, 157
Positivismo lógico, 60 significado de, 168
Pospositivismo, 60 regiade multiplicación, 174
P o s g r a d o d e p s ic o l o g ía , 29 curva normal y, 159-60,165-66
Potenciaestadística. V é a s e potencia rango de, 159
Potencia, 233-42 según se describe en publicaciones científicas, 170-
análisis de varíanzay, 366 71
cálculo de, 239-42 reglas, 159,173-74
pruebachi-cuadrado de independencia y, 485-86 símbolos de, 159
intervalos de confianza y, 263,266 Problema de los puntos, 159
definición de, 233-34 Procedimiento a ciegas porpartidadoble, 603
tamaño del efecto y, 244-51,263,266 Procedimiento Bonferroni, 393-94
ejemplo de, 234-36,239,241-42 Procedimiento de Scheffé, 399
análisis factorial de varianza y, 442 Procedimiento Neuman-Keuls, 399
determinaciónde factores, 242 Procedimientos avanzados según se describen en
cálculo del tamaño de muestrapara, 253,255 publicaciones científicas, 559-583
media armónica y, 332-33 angustia, 13-14
importanciaen la evaluación de los resultados de un controversia acerca de, 58-60,578-79
estudio, 261-62 elección de las pruebas, 549-51
aumento, 256-60 historiade, 3
influencias en, 255-56,259 lecturade resultados de técnicaque no nos resultan
experimentos psicológicos y, 254 familiares, 579-82
según se describe en publicaciones científicas, ramas de, 2
268-69 relación entre los métodos, 527-28
papel que desempeña en el diseño experimental, repaso general de las técnicas, 577
256-60 trivialidades, 3
Procedimieto HSD deTukey, 399 pruebas de rango y orden, 506-15
Productocruzado de puntuaciones Z, 79-82 pruebas de una cola, 188-89,189-90,255
Promedio ponderado, 316-17 pruebas libres de distribución, 506
Proporciones, 159 pruebas no paramétricas, 506
Prueba chi-cuadrado de bondadde ajuste, 467-76 pruebas paramétricas, 506
definición de, 466-67 resumen de pasos, 185
ejemplo de, 467 según aparecenen publicaciones científicas, 195-96,
pasos a seguirpara realizar, 467-68 225-28
según se describe en publicaciones científicas, 487 supuestos estándar de, 495-96
Prueba chi-cuadrado de independencia, 472-82 varianza poblacionaí desconocida y, 284
cálculo, 476 Prueba de rango múltiple de Duncan, 399,400
definición de, 473 Prueba de signos, 508n
determinación de frecuencias esperadas, 474-76 Prueba de suma de rangos de Wilcoxon, 509
ejemplo de, 477-82 Prueba exacta de Fisher, 486n
grados de libertady, 476-77 Prueba F . V é a s e análisis de varianza
muestra, 474,485-87 Prueba t de pares, 289n
pasos a seguir para realizar, 487-88 Prueba t de una muestra, 277-87
población, 474 Prueba í paramedias dependientes, 287-96
potencia de, 485-86 controversias, 303
pruebade hipótesis y, 477-82 ejemplos de, 290-96
según se describe en publicaciones científicas, fórmulas de cálculopara, 310
487-88 limitaciones, 303
tamaño del efecto de, 482-86 pasos a seguir pararealizar, 290-75
utilización, 474 planificación del tamaño de muestrapara, 301
Prueba chi-cuadrado, 462-72 poblaciones extremadamente asimétricas y, 296
controversias, 486-87 potencia de estudios que emplean, 301,02
ejemplo de, 467-71 potencia de, 299-300
inventor de, 464 según se describe en las publicaciones científicas,
limitaciones, 486-87 303-06
según se describe en publicaciones científicas tamaño del, 296-299
suposiciones de, 482 Prueba t para medias independientes, 313-337
Pruebade Dunn, 393-94 cálculodelavarianzade ladistribuciónde medías, 317
Pruebade hipótesis, 177-98 controversias, 333-34
alfa y, 239 distribución de diferencias entre medias, 313-318
análisis de varianza de dos criterios y, 436-437 ejemplos de, 318-325
análisis de varianza y, 361-363 estimación de la varianza poblacionaí, 315-17
análisis factorial de varianza y, 430-434 estrategia básica de, 313-18
beta y, 239 fórmulas de cálculo para, 341-42
comparación de métodos, 516-19 limitaciones, 333-34
con medias muéstrales, 200-229 lógica de, 314-319
controversias, 194-95,224-25,266-67 pasos a seguir para realizar, 325-28
definición de, 177 potencia de, 331-33
distribución de medias en, 212-219 prueba de hipótesis con, 319-326
ejemplo de, 178-79,185-88,214-219 segúnse describeenpublicaciones científicas, 334-37
estimación versus, 225 supuestos de, 326-7
intervalos de confianza y, 223-24 tamaño del efecto de, 328,331
limitaciones, 194-95,224-25,266-67 tamañomaestral, 333
lógica de, 179 Prueba t parapares equiparados, 289n
modelo estructural y, 386-91 Prueba r, 81,393
poblaciones anormales y, 496-521 como caso especial de coeficiente de correlación,
potencia estadística y, 239 536-541
proceso, 167,179-88, 284 como caso especial del análisis de varianza, 531-36
pruebachí-cuadrado de independencia y, 477-82 controversias, 302-03
prueba chi-cuadrado de la bondadde ajuste y, de pares, 289n
467-68 ejemplos de, 277
prueba í para medias dependientes y, 290-96 limitaciones, 302-03
prueba í paramedias independientes y, 319-326 Paralelismos de ia lógica del análisis de varianza
pruebas de dos colas, 189-193,255 con, 532-33
pasos a seguir para realizar, 286-87 Puntuaciones estándar, 57.
principio básico de, 277-80 V é a s e también puntuaciones Z
relación del análisis de varianza con, 532 Puntuaciones ordinarias, 53.
robustezde, 296 V é a s e también puntuaciones Z
segúnse describe enpublicaciones científicas, 303-06 convertiren puntuaciones Z, 55
supuestos de, 296 regresión múltiple con, 127
una solamuestra, 277-87 tabla de áreas bajo la curva normai y, 153-56
Prueba Ude Mann-Whitney, 509,520 Puntuaciones Z, 51-57,79,111. V é a se también
Pruebas de aleatorización, 515-16 puntuaciones originales, puntuaciones estándar,
aproximada, 516 cálculo a partir de una puntuación original, 55-56
ejemplo de, 512-16 características de, 57
Pruebas de aleatorización, 516 conversión a puntuación original, 55
Pruebas de dos colas definición de, 52-53
cuándo utilizar, 190 desvío estándar de una distribución de, 57
ejemplo de, 190-193 ejemplos de, 53
direccionales, 190n en distribuciones de medias, 212-13
hipótesis no direccional y, 189 media de una distribución de, 57
puntos de corte, 189 modelo de predicción bivariadacon,. 111-12
pruebas de unacola versus, 255 modelo de predicción, 125-26
Pruebas de esfuerzo propio, 515, 516 ( b o o ts tm p te s t s ) producto cruzado de, 79-82
Pruebas de rango y orden, 506-11 prueba Z, 225
aproximaciones ala curva normal en, 510 tabia de áreas bajo la curva normal y, 152-56
definición de, 506 utilizados como escala, 53
ejemplo de, 509
hipótesis nulaen, 509-10
idea general de, 508 Q
lógica de, 508-09
métodos de pruebaintensivos por computadoray, Q, 520 [Qs o r t]
516-19
pruebas paramétricas correspondientes a, 508 R
según se describen en publicaciones científicas, 520
transformaciones de datos y, 516-19
ventajas de, 517n Rango, 43q, 94
Pruebas de significación. V é a s e prueba de hipótesis Razón F , 351,352,532-34
V é a s e también estimación intergrupal de varianza;
Pruebas de una cola
cuándo utilizar, 190 estimación intragrupal de varianza
hipótesis direccional y, 188-89 análisis de varianza de dos criterios y, 420
pruebas de dos colas versus, 255 del efecto interactivo, 421,422
Pruebas libres de distribución, 506 determinaciónde, 421,424
Pruebas no paramétricas, 506 de los efectos principales, 421
Pruebas paramétricas, 506 fórmulas del, 358
controversias, 519 Reber, P. J„ 195
datos transformados en rangos en, 510 Reducción proporcional del error. V é a s e porcentaje de
pruebas de rango y orden correspondientes a, 508 varianza explicada
riesgo de error en, 517-19 Reflejar, 502
transformaciones de datos y, 510 Registros de rango y orden, 506
Psicoanálisis freudiano, 59 Registros, 4-5
Psicología clínica, 59 Regla de la adición, 173-74
P s ic o lo g ía h u m a n ís tic a , 59 Regía de la multiplicación, 174
P s ic ó lo g o A m e r ic a n o , 2 5 5 Regresión! correlación múltiples, 125-26,128
Publicaciones científicas coeficientes beta de, 126-127
análisis de varianza según se describe en, 369-70 controversias, 135-36
predicción bivariadasegún se describe en, 136 correlaciones y, 126-27
procedimientos estadísticos avanzados según se definiciones de, 125
describen en, 559-83 ejemplo de, 128-29, 133-135
prueba chí-cuadrado según se describe en, 487-88 fórmulas de, 130,133
Punto muestral de corte, 181-83 jerárquica, 561-563,564
Puntuación i, 284,318-19,532-534 limitaciones, 135-36
modelo lineal general y, 53! Shapiro, D„ 269
reducción proporcional del erroren, 128 Sharp, Maña, 463
Regresión/ correlación múltiples (cont.) Shaver, Philip, 345,349, 352-53, 399, 541
con puntuaciones ordinarias, 127 Shear,264
modelos de predicción con puntuaciones Z para, Shi, L., 491
125-26 Shreider.Yu. A,,331
por pasos, 563-64 Siegeí, M., 200
revisiónde, 528-530, 560 Sigma, 37,46,162
según se describen enpublicaciones científicas, 137 Significación estadística, 91,261-62,266-67
Regresión bivariada. Véase predicción bivariada niveles convencionales de, 183
Regresión múltiplejerárquica Significación práctica, 261:62
comparadacon laregresión múltiple gradual, 564 Significación.Véase significación práctica; significación
ejemplo de, 561-64 estadística
Regresión múltiple porpasos, 563-64 Símbolos estadísticos, 37,46,111,162,165,280
de avance, 563n Simpson, O. J., 143
de retroceso, 563n Simpson, Thomas, 149
en comparacióncon la regresión múltiplejerárquica, Skínner, B. R, 58,601
564 Snedecor, George, 353
Regresión, 82,112,496n. Véase también predicción Sociología, 170
bivariada; correlación Sondeos de opinión, 164
Reís, Harry, 52 Sondeos, 164
Relación, 536-37,575 Speed,A.,31,105
Restricción del rango, 94 Stasney, R., 28
Resultado independiente, 174 Steil, Janice, 479,485,487
Resultado mutuamente excluyeme, 173-74 Stipek, D. J., 195-96
Resultado, 157
independiente, 174 Sumade desvíos cuadráticos, 43,-378-79
mutuamenteexcluyeme, 173-74 estimaciones de la varianza poblacional y, 379
Revista Científicade PsicologíaPatológicay Social, 254 fórmulas de cálculopara, 405
Revista Científica de Psicología Social y de la Sumade errores cuadráticos 121
Personalidad, 52 Supresión, 135n
Rhodes, S. R., 75 Supuestos, 296
Riehl, R. J., 478,482, 483
Ritter, C., 102 T
Robustez, 296
Rogets, L. E,, 340
Rollack, D . R, 14 t de Student. Véaseprueba t
Rosenthal, R., 98,397,579 Tabachnick, Bárbara, 548
Rosnow, R. L, 98,397 Tabla chi-cuadrado, 466
Ross, D. C., 369 Tabla de números aleatorios, 518
Rozeii, E. J,, 134 Tabla F, 352-53,359-60
Ryan, R. H„ 195-96 Tablar, 282-84
Tablas de contingencia, 473
Tablas de frecuencias agrupadas, 7-1V
s cómo crear, 9-10
definición de, 8
Sanbonmatsu, D. M., 28 ejemplo de, 10-11
SantoTomás deAquiso, 552 Tablas de frecuencias, 2-11
Sedlmeier, R, 254 agrupadas, 8-11
Selección aleatoria, Í60 controversias, 24-25
Seleccióncasual, 162 definición de, 2
Selección sistemática, 368-69 ejemplode, 6
Selléis, R. M., 567,568 limitaciones, 24-25
Sesgo de respuesta, 605 procedimientos paracrear, 6-7
Sesgo del experimentador, 603 según se describen en publicaciones científicas,
Shah, F. P., 137 28-30
Shamsuddin, K., 335 tamaños de intervalos iguales en, 9,25-26
Shapiro, D. A., 269,591 tipos de, 4
Tamaño del efecto, 244-251 métodos de prueba intensivos por computadora j ,
análisis de varianza y, 364-66 516-519
análisis factorial de varianza y, 436-42 tipos de, 498, 500-502
cálculo, 245-48 ventajas de, 498
controversias, 266-68 Transformaciones inversas, 502 ■;
de la prueba í para medias dependientes, 296-97 Transformaciones lo g , 502
de la prueba t para medias independientes, 328, 329 Transformaciones lo g it, 502
definición de, 245 Transformaciones p ro b it, 502
importancia de, 248 Triángulo aritmético, 149
intervalos de confianza y, 263,244 Truman, Harry, 164
limitaciones,266-68 Tufte, E. R.,24
modelo estructural y, 395-96
potencia y, 244-51,263,266
prueba chi-cuadrado de independencia, 482-85 u
regías de Cohén para, 249-250
según se describen en publicaciones científicas, Unidad causativa, 463
268-69 Utilización de cálculos estadísticos multívariados, 548
Tamaño muesfral, 213,252-53
cálculo del nivel de potencia, 253,255
planificación de, 301,333,367-68,442-43 y
Tamizado de datos, 498n
Tankard, James, 533 Valenzuela, 322,324,328,334,342
Tendencia casi significativa, 195 Validez concurrente, 605
Tendencia central, 35,40-43. V éase también media, Validez de constracto, 605-606
mediana, moda Validez de contenido, 605
forma de, 466 Validez de criterio, 605
puntos de corte para, 466,615 Validez extema, 603
Teorema de Bayes, 168 Validez intema, 603
Teorema del límite central, 150,206 Validez predictiva, 605
Teoría de la probabilidad, 159 Validez. V éase también conftabilidad
Teóricos de entes, 227-28 concurrente, 605
Terpstra, D, B., 134 criterio, 605
Terranova, R. D., 28 de constructo, 605-06
Tippett, L. H. C,, 518 de contenido, 605
Tobías, Sheila, 13,27 predictiva, 605
Transformación de datos (cont.) sesgo de respuesta, 605
lo s, 502 Valor crítico, 181
íogif, 503 Valor estadístico chi-cuadrado, 462,465-72
probit, 503 cálculo de, 466
pruebas de rango y orden y, 516-519 controversias, 486-87
pruebas paramétricas y, 510 definición de, 466
raíz cuadrada, 498,500 distribución de, 466-67
rango y orden, 505 limitaciones, 486-87
según se describen en publicaciones científicas, Valores atípicos, 496
519-520 Valores diferenciales
Transformación de rango y orden desvío estándar de, 301
definición de, 506 media poblacíonal de, 289-90
utilización de pruebas paramétricas con, 510 potencia de estudios que utilizan, 302
Transformación raíz cuadrada, 498, 500 Valores, 3-5
Transformación, V éase transformación de datos Van Aken, M, A. G., 339
Transformaciones cúbicas, 502 Van Lange, P, M., 402
Transformaciones de datos, 497-505 Variable categórica, 462
controversias, 519 Variable de criterio, 71,110
cúbica, 502 Variable dependiente, 70-71,110,596
definición de, 497 Variable nominal, 5,462
ejemplo de, 502-505 Variables cuantitativas, 4
inversa, 502 Variables de predicción, 71,109
legitimidad de, 498,500 Variables de rango y orden, 5
Variables independientes, 70-7!, 109,596 ejemplos de, 47-50
Variables intervaíares, 4 fórmulas de cálculo de, 50-51, 65-66
Variables latentes, 571-72 fórmulas de, 46-47
Variables numéricas, 5,6 pasos a seguir para eí cálculo de, 43-44
Variables ordinales, 5
utilización de, 44-45
Variables, 4-6
Vaughn, L. A., 434
categóricas, 462
cuantitativa, 3 Versión Revisada de la Escala
de criterio, 71,111 de Angustia Manifiesta en Niños (romas), 585
de predicción, 71,109 Visión crítica, 60
de rango y orden, 5 Visión postestructural, 60
dependiente, 70-71,111,596 Von Franz, Marie Louise, 60
diferencias grupaies entre, 536
independiente, 70-71, i 09,596
intervalares, 5 W
latente, 571-73
nominal, 5,462
Watts, W., 129
numérica, 5, 6
Wechsler, H„ 30-31
ordinal, 5
Weller, A., 303-04
Varianza de Ja distribución de diferencias de medias,
317-18 Weller, L , 303-04
Varianza de una distribución de medias, 207-08,356-57 Windelband, Wilhelm, 58
Varianza del error, 355 Wiseman, H., 225
Varianza poblaclonal, 275-76. V éase también varianza Wong, M. M„ 428,440
comparación de estimaciones intragrupales e Wortman, C. B., 582
intergrupales de, 350-51 Wright, L„ 129
desvío estándar de la distribución de medias de,
Wrightsmaa, L. S., 36 In
280-81
Wundt, Wilhelm, 58
estimación combinada de, 291-93,321
estimación de, 277-80,315-17,346-50,355-57,
379-80
X
estimación intergrupal de, 349-51
estimación intragrupal de, 347,350-51
estimación no sesgada de, 280 X-barra, 37
estimación sesgada de, 279
forma de la distribución comparativa, 281-82
Varianza, 43-45. V éase también análisis de varianza;
Y
varianza poblacional; desvío, estándar
como suma de desvíos cuadráticos, 51-52 Yates, Frank, 518
definición de, 43 Yerkes-Dodson law, 414
Argentina Colombia
Av. Regimiento de ios Patricios 1959 Carrera 68 » 22-55
{C1266AAF) Buenos Aires Santa Fé de Bogotá, D.C.
Argentina Colombia
Tel, (54-11} 4309-6100 Tel. (571) 405-9300
Fax (54-11) 4309-6199 Fax (571) 405-9330
E-mail: [email protected]
España
América Central-Panamá Nuñez de Baiboa120
Barrio La Guaría, Moravia (28006) Madrid
75 metros norte, España
Del Portón Norte del Club La Guaría Tel. (3491)590-3432
San José, Costa Rica Fax (3491) 590-3448
Tel. (506) 235 72 76
Fax (506) 29728 52 Estados Unidos
E-mail: [email protected] One Lake Street
Upper Saddle River
Brasil NJ 07458
Rúa Emilio Goeldi 747, Lapa Tel. (201) 236-7000
(05065-110) Sao Paulo -SP Fax: (201) 238-3400
Brasil
Tel. (5511) 36111-0201 México
Fax (5511)36111-0654 Calle Cuatro No. 25 2do piso
Fracc. Industrial Alce Blanco
Caribe (53370), Naucalpan de Juárez
Monte Mal!, 2do. piso, suite 21 -B Estado de México
Av. Muñoz Rivera Tei. (305) 3870700
Hato Rey Fax(525)3870811
Puerto Rico 00918-4261
TeL (787) 751-4830 Uruguay
Fax (787) 751-1677 Casa juana de América
E-ma¡l: [email protected] Av. 8 de Octubre 3061
[email protected] (11600) Montevideo
Uruguay
Chile Tel./Fax (5982) 486-1617
Av Manuel M onttl452
Providencia
Santiago, Chite
Tei. (562) 269 2089
Fax (562) 2746158
E-mail: í[email protected]!