Las Peligros Del Lenguaje Estadistico
Las Peligros Del Lenguaje Estadistico
Las Peligros Del Lenguaje Estadistico
1. Introducción
También puede deberse a otra causas. Una de ellas es, directamente, la des-
honestidad, ya que algunos autores de trabajos científicos acuden a un len-
guaje calculadamente turbio para maquillar, camuflar u ocultar su propio des-
concierto. De hecho, confieso que casi cada vez que me veo en dificultades
para comprender una reflexión o un razonamiento, tiendo a sospechar que
una parte del problema pudiera derivarse de que el propio autor del texto no
tenía claras sus ideas.
*
Silva Ayçaguer LC. Los peligros del lenguaje estadísti-
co. En Locutora J, editor. De la idea a la palabra. Cómo
preparar, elaborar y difundir una comunicación científica.
Barcelona: Publicaciones Permanyer; 2003. p. 149-158.
1
también en medios que, aunque no especializados, presumen de poseer alto
nivel académico.
A diferencia de lo que acaece, pongamos por caso, con las ecuaciones dife-
renciales, con la programación en Visual Basic, o con el diseño gráfico -
materias que cuentan con especialistas a los que un profesional típico ha de
recurrir cuando le surgen necesidades en las áreas respectivas- en muchos
profesionales de la salud se ha ido cincelando la absurda convicción de que
cualquiera puede (y, peor aun, debe) dominar la estadística, como si se trata-
ra del inglés, de la gramática básica o de los procesadores de texto. Sin em-
bargo, el dominio genuino de las técnicas estadísticas exige de conocimientos
altamente especializados, particularmente en materia de teoría de probabilida-
des. No en balde se trata de una carrera universitaria.
Hace más de medio siglo, Luykx (1949) advertía: "Es ahora casi inconcebible
que un estudio de cualquier dimensión en el campo de las ciencias médicas
pueda planearse sin el concurso de un estadístico". Sin embargo, la tendencia
en muchos enclaves ha ido en dirección opuesta. O, al menos, se ha produ-
cido una fractura paradójica: los que más conocimientos tienen sobre estadís-
tica, así como los que no saben casi nada, suelen buscar ayuda de personal
especializado en esta materia, y los que están en una situación intermedia -
2
aquellos que se han proveído de cierto barniz- se consideran autosuficientes
o inclinados a conducirse como si lo fueran. Las consecuencias son a veces
tragicómicas.
Hace algunos años (Silva, 1997) publiqué dos anécdotas, verídicas ambas,
que me permito sintetizar ahora nuevamente.
Pocos años después, en el vestíbulo de cierto ministerio donde tenía que tra-
mitar un documento, y mientras hacía la espera de rigor, me puse a hojear
algunas revistas de índole diversa allí disponibles, quizás para hacer menos
pesada la espera de los ciudadanos. Cayó así en mis manos un pequeño fo-
lleto técnico en el que se daba cuenta de un estudio realizado por investigado-
res de dicho ministerio. Puesto que mi espera se dilataba, comencé a leerlo
con mediano interés. Tras la introducción y el enunciado de los propósitos,
los autores se internaban en la explicación del método aplicado; una vez ex-
puestos algunos procedimientos para la captación de datos, los autores pasa-
ban a comunicar las técnicas de análisis utilizadas. Con estupor pude leer
que en ese punto se decía textualmente lo siguiente: "para el análisis estadís-
tico de los datos, se aplicaron la t de Student y la s de Standard".
3
Ahora bien, más allá de tan burdos ejemplos, el problema expuesto en la
Sección precedente está bastante generalizado y suele expresarse en espa-
cios de cierta relevancia. Quien publica lo hace como consecuencia de una
decisión soberana, incluso como resultado de un empecinamiento. Pero ello
tiene un precio: la aparición pública de un texto científico convierte al autor en
rehén de lo que ha escrito, algo que muchos, en su afán publicador, suelen
olvidar. Es gracias a esa circunstancia que resulta posible ilustrar con ejem-
plos tangibles y corroborables algunos de los errores en que a menudo caen
los autores y que son de origen estadístico aunque se detecten a través del
lenguaje. Ese es el propósito de la presente Sección.
Muestreo
Más sutil en el error es la frecuente declaración de que “se obtuvo una mues-
tra representativa”. Esto es en el fondo absurdo, porque el investigador nunca
puede estar seguro acerca de si su muestra fue representativa o no. Él sabe,
por ejemplo, si para obtenerla se cumplió o no el requisito de emplear el azar,
pero no puede conocer el resultado que tal empleo produjo.
5
cedimiento muestral empleado), pero nunca afirmar que “se obtuvo una mues-
tra representativa”.
Pruebas de hipótesis
En este caso, el abuso de lenguaje es quizás más grave, ya que es bien co-
nocido por los estadísticos que es muy fácil que la hipótesis de nulidad sea
rechazada. Para que ello no ocurra, o bien el valor de r tiene que ser ínfimo,
o bien el tamaño de muestra muy pequeño. Por ejemplo, si la verdadera co-
rrelación entre los datos mediciones correspondientes a un nuevo tipo de ma-
nómetro y un equipo convencional para medir la tensión arterial fuera igual a
0.15 y el investigador obtuviera un coeficiente de correlación empírico acorde
con esa realidad (o sea, de magnitud tan reducida como r =0.15), entonces la
prueba indicaría que r es significativamente diferente de 0 siempre que se
haya empleado un tamaño muestral superior a 180. Ante esta situación el
autor no debería insinuar que ha descubierto una relación significativa. En
realidad, la asociación es significativamente... escuálida, aunque es-
tadísticamente haya motivos para creer que la situación no llega a ser tan mi-
serable como para afirmar que no hay indicios de asociación. Adviértase que
tal afirmación equivaldría a declarar que el nuevo manómetro arroja resulta-
dos que nada tienen que ver con los del convencional (sería como decir que
el nuevo equipo es tan útil a los efectos de medir la tensión arterial como un
termómetro o un test de inteligencia).
Probabilidades
7
El riesgo de que se produzca cierto suceso adverso en una población dada
se suele cuantificar mediante una probabilidad. En ocasiones, se emplea la
probabilidad de que un individuo tomado al azar de dicha población lo pa-
dezca (prevalencia); en otras oportunidades se emplea la probabilidad de que
dicho suceso se produzca para un sujeto aleatoriamente elegido, a lo largo de
cierto lapso (incidencia). Pero la oración citada entraña un uso equívoco y
arbitrario del término, puesto que "fenómeno epidemiológico" es un concep-
to genérico y, a estos efectos, sumamente difuso: el brote de una epidemia,
el abandono generalizado de la lactancia materna y el impacto de un pro-
grama contra el consumo de grasas saturadas son, sin duda, fenómenos
epidemiológicos para los que la afirmación en cuestión carece de todo sen-
tido.
Una incomprensión frecuente en esta esfera se relaciona con el hecho de que
la probabilidad de un suceso es un número único entre 0 y 1. Un periodista de
la agencia Reuters(2002) en un artículo cuyo título ya es de por sí bastante
desconcertante ("El sexo ayuda en el embarazo”) parece no haberlo advertido
cuando escribe: “El acto sexual con mucha frecuencia no sólo aumenta las
probabilidades de que una mujer quede embarazada sino que también ayuda
a evitar los problemas que a veces causan abortos espontáneos”. Me temo
que este resultado científico es de amplio dominio público desde el paleolítico,
pero pasando por alto este hecho, ahora irrelevante, lo cierto es que debería
haberse escrito que el acto sexual aumenta la probabilidad de que una mujer
quede embarazada.
Sería admisible que alguien usara el plural en una frase tal como: “Cuando se
realiza un experimento aleatorio un número muy elevado de veces, las
probabilidades de los diversos posibles sucesos empiezan a converger”, pero
es erróneo decir, como a menudo hacen quienes comunican el pronóstico del
tiempo: "las probabilidades de lluvia en la Capital son reducidas". Lo correcto
sería decir "la probabilidad de que llueva hoy en la Capital es reducida". Los
ejemplos que adornan el ciberespacio con este error son cuantiosos (una
búsqueda en Google arrojó más de 19000). He aquí algunos botones de
muestra:
• “Según el estudio, las probabilidades de que las mujeres desarrollen cáncer del cuello
de útero resultaron por lo menos un 58 por ciento menores si su pareja ...”
www.terra.com/salud/articulo/html/sal1393.htm
• Para padre y madre flacos las probabilidades de tener hijos gordos es de un 28%;en
padre flaco y mamá gorda las probabilidades de obesidad para los hijos es ...”*
www.efdeportes.com/efd11a/saav8.htm
• “Unos pocos días después de dejar de fumar, aumenta su capacidad pulmonar y dis-
minuyen las probabilidades de sufrir un ataque cardíaco”
www.healthig.com/tabaquismo/diamundi3.html
*
Obsérvese en este ejemplo la falta de concordancia de nú-
mero que, lejos de atenuar el error, lo agrava.
8
Correlación y regresión
9
no), de los síntomas (graves o no) y del curso de la dolencia (episódico o no).
Los autores comunican que “el modelo explica el 16% de la variabilidad de la
duración de la hospitalización”. El hecho de que R 2 = 0.16 revela que ese mo-
delo tiene escasa capacidad predictiva, pero el lenguaje empleado hace pen-
sar que los autores no comprenden que las variables que reflejan causas (ex-
plicaciones) tienen valor predictivo, pero que lo contrario no es cierto: una va-
riable puede ser útil para la predicción sin tener nada que ver con las causas.
Esa es la situación del ejemplo de los niños de diez años expuesto arriba. Un
modelo puede ser construido para predecir pero su construcción podría ins-
cribirse en el intento de dilucidar relaciones causales; tal distinción suele ser
pasada por algo por muchos usuarios de la regresión múltiple.
Una fuente inagotable para tales errores proviene, por cierto, de las traduc-
ciones erróneas del inglés. Por ejemplo, en toda Hispanoamérica se ha ex-
tendido el vicio de llamar “chi” a la vigésimo segunda letra griega, que en in-
glés de llama de ese modo pero que en idioma español se denomina “ji”. Re-
sulta obvio que solo en virtud de una tradición acríticamente asimilada se ex-
plica que, por ejemplo, se aluda a la prueba Ji-cuadrado como Chi-cuadrado.
Algo muy parecido ocurre cuando se escribe o dice “estudio caso-control”
(proveniente de la traducción literal de case-control study) en lugar de un “es-
tudio de casos y controles”, lo cual es un error ya que, obviamente, caso-
control no es en castellano un adjetivo.
Por otra parte, aquellos investigadores que comprenden que resulta pertinen-
te recibir ayuda especializada, no pocas veces parecen convencidos de que el
estadístico, en el mejor de los casos, es un auxiliar cuya participación en el
estudio ha de ser similar al de un utilero que transporta los instrumentos de
los músicos. Peor aun: solo cuando están desconcertados y no saben qué
hacer con unos datos ya recogidos, acuden a los estadísticos para que cum-
plan sin mayor demora con una obligación natural y salgan rápidamente del
escenario. No tengo ni siquiera una hipótesis plausible para explicar cómo se
ha consolidado en muchos investigadores la convicción de que el posible
aporte de los especialistas en estadística es, en el mejor de los casos, una
especie de deber gratuitamente conseguible.
11
Ludwig Wittgenstein, en su Tractatus Logico-Philosophicus de 1992, escribió
“Los límites de mi lenguaje son los límites de mi mundo”. Yo pienso que si
usted conoce bien los límites de su mundo, lo más recomendable es que no
pretenda extenderlos falsamente mediante el peligroso recurso de expandir
inopinadamente los de su lenguaje.
Bibliografía
Aguero RE y col. (1997) Efecto antitumoral de los aines en el melanoma b16f1. Estudio
en ratones de la cepa c57bl/6. Acta Científica Venezolana. Volumen 48 (sup1): 79.
Altman PG, Goodman NS, Schroter S. (2002) How statistical expertise is used in medi-
cal reseach JAMA 287: 2817-2820
Nickerson RS. (2000) Null Hypothesis Significance Testing:A Review of an Old and
Continuing Controversy. Psychological Methods. 2000; 5(2): 241-301.
Orozco JB, Sáenz MA, Ugalde F. (1999) Tabaco y recreación en adolescentes Escolari-
zados de Centroamérica, Panamá y República Dominicana. Revista Costarricense de Sa-
lud Pública 8 (14): 1-8.
Rey J. (1989) Método epidemiológico y salud de la comunidad. Madrid: McGraw Hill In-
teramericana de España.
Silva LC. (1997). Cultura estadística e investigación en el campo de la salud: Una mirada
crítica. Madrid: Díaz de Santos.
Vega M. (2001) Las tres caras de una cifra. Periódico La Prensa, Panamá (6 de octubre de
2001)