Mal Uso de La Estadística
Mal Uso de La Estadística
Mal Uso de La Estadística
A veces hay una percepción de que el conocimiento estadístico no se utiliza de forma correcta,
encontrando maneras de interpretar los datos que sean favorables al presentador. Un dicho famoso,
al parecer de Benjamin Disraeli,21 es: «Hay tres tipos de mentiras: mentiras pequeñas, mentiras
grandes y estadísticas». El popular libro How to lie with statistics (Cómo mentir con las
estadísticas en la edición española) de Darrell Huff discute muchos casos de mal uso de la
estadística, con énfasis en gráficas malinterpretadas. Al escoger, rechazar o modificar una muestra
de observaciones mediante procedimientos no aleatorizados, los resultados de su análisis pueden
estar sesgados; por ejemplo, mediante la eliminación selectiva de valores atípicos (outliers). Este
puede ser el resultado tanto de fraudes como de sesgos no intencionados por parte de
investigadores con escaso conocimiento estadístico. 22 Lawrence Lowell (decano de la Universidad
de Harvard) escribió en 1909 que las estadísticas, «como algunos pasteles, son buenas si se sabe
quién las hizo y se está seguro de los ingredientes». Por este motivo es fundamental que el análisis
estadístico de datos sea realizado por profesionales cualificados, con Grado en Matemáticas con
especialización en estadística o bien con Grado en Estadística, siendo cada vez más necesario que
la estadística se convierta en una profesión regulada por el Estado. 2
Cuando personas sin la cualificación adecuada usan la estadística para analizar los datos de un
experimento o de una investigación observacional en ciencias fácticas, uno de los errores más
frecuentes es el desconocimiento del error de tipo I, que puede llevar a conclusiones falsas. La
probabilidad de encontrar una asociación espuria o casual entre dos variables, y creer erróneamente
que se ha encontrado una asociación real, se incrementa cuando en lugar de aplicar el método
científico se realiza el hackeo estadístico de una base de datos (P-hacking). Esta mala práctica
consiste en jugar con una base de datos y relacionar la variable dependiente con todas las posibles
variables independientes hasta encontrar una asociación estadísticamente significativa, sin haber
establecido previamente un marco conceptual y una hipótesis de investigación que justifiquen por
qué se van a estudiar estas relaciones. 23 La publicación de estos resultados en revistas científicas
es una de las causas de la pérdida de credibilidad y reproducibilidad de la ciencia, lo que ha llevado
a muchos científicos a realizar manifiestos de alerta.24 El hackeo estadístico es una de las razones
por las que algunos estudios contradicen los resultados obtenidos en otros: un día se afirma que el
café, el queso o el vino tinto protegen contra las enfermedades cardíacas y después otro estudio
afirma que estos mismos alimentos causan esas enfermedades.25 Además, cada estudio suele
utilizar procedimientos diferentes y técnicas estadísticas distintas, que no siempre están aplicadas
de forma correcta. O bien se usan muestras pequeñas cuyos resultados no son confirmados en
estudios de mayor tamaño. Sin embargo, muchos profesionales de las ciencias fácticas que leen
estas publicaciones en revistas especializadas no perciben estas malas prácticas, los medios de
comunicación amplifican la información alrededor del estudio y la desconfianza del público comienza
a crecer.
dado. De nuevo, sin embargo, esto resume la evidencia para un efecto pero no
el tamaño del efecto. Una posibilidad es reportar intervalos de confianza, puesto que estos
indican el tamaño del efecto y la incertidumbre. Esto ayuda a interpretar los resultados, como el