Mal Uso de La Estadística

Mal uso de la estadística
A veces hay una percepción de que el conocimiento estadístico no se utiliza de forma correcta,
encontrando maneras de interpretar los datos que sean favorables al presentador. Un dicho famoso,
al parecer de Benjamin Disraeli,21 es: «Hay tres tipos de mentiras: mentiras pequeñas, mentiras
grandes y estadísticas». El popular libro How to lie with statistics (Cómo mentir con las
estadísticas en la edición española) de Darrell Huff discute muchos casos de mal uso de la
estadística, con énfasis en gráficas malinterpretadas. Al escoger, rechazar o modificar una muestra
de observaciones mediante procedimientos no aleatorizados, los resultados de su análisis pueden
estar sesgados; por ejemplo, mediante la eliminación selectiva de valores atípicos (outliers). Este
puede ser el resultado tanto de fraudes como de sesgos no intencionados por parte de
investigadores con escaso conocimiento estadístico. 22 Lawrence Lowell (decano de la Universidad
de Harvard) escribió en 1909 que las estadísticas, «como algunos pasteles, son buenas si se sabe
quién las hizo y se está seguro de los ingredientes». Por este motivo es fundamental que el análisis
estadístico de datos sea realizado por profesionales cualificados, con Grado en Matemáticas con
especialización en estadística o bien con Grado en Estadística, siendo cada vez más necesario que
la estadística se convierta en una profesión regulada por el Estado. 2
Cuando personas sin la cualificación adecuada usan la estadística para analizar los datos de un
experimento o de una investigación observacional en ciencias fácticas, uno de los errores más
frecuentes es el desconocimiento del error de tipo I, que puede llevar a conclusiones falsas. La
probabilidad de encontrar una asociación espuria o casual entre dos variables, y creer erróneamente
que se ha encontrado una asociación real, se incrementa cuando en lugar de aplicar el método
científico se realiza el hackeo estadístico de una base de datos (P-hacking). Esta mala práctica
consiste en jugar con una base de datos y relacionar la variable dependiente con todas las posibles
variables independientes hasta encontrar una asociación estadísticamente significativa, sin haber
establecido previamente un marco conceptual y una hipótesis de investigación que justifiquen por
qué se van a estudiar estas relaciones. 23 La publicación de estos resultados en revistas científicas
es una de las causas de la pérdida de credibilidad y reproducibilidad de la ciencia, lo que ha llevado
a muchos científicos a realizar manifiestos de alerta.24 El hackeo estadístico es una de las razones
por las que algunos estudios contradicen los resultados obtenidos en otros: un día se afirma que el
café, el queso o el vino tinto protegen contra las enfermedades cardíacas y después otro estudio
afirma que estos mismos alimentos causan esas enfermedades.25 Además, cada estudio suele
utilizar procedimientos diferentes y técnicas estadísticas distintas, que no siempre están aplicadas
de forma correcta. O bien se usan muestras pequeñas cuyos resultados no son confirmados en
estudios de mayor tamaño. Sin embargo, muchos profesionales de las ciencias fácticas que leen
estas publicaciones en revistas especializadas no perciben estas malas prácticas, los medios de
comunicación amplifican la información alrededor del estudio y la desconfianza del público comienza
a crecer.
Inferencia clásica e inferencia bayesiana[editar]

La aproximación de pruebas de hipótesis, ampliamente usada, obliga a establecer una hipótesis
nula para contrastar posteriormente el acuerdo de los datos con esta hipótesis. Una mala
interpretación de los resultados puede exagerar la importancia de pequeñas diferencias en estudios
con muestras grandes que puede no tener ninguna relevancia práctica.
Véase también críticas de prueba de hipótesis y controversia de la hipótesis nula.
En los campos de la psicología y la medicina, especialmente con respecto a la aprobación de
nuevos medicamentos por la Food and Drug Administration, las críticas a la prueba de hipótesis
se han incrementado en los años recientes. Una respuesta ha sido un gran énfasis en el p-
valor en vez de simplemente reportar si la hipótesis fue rechazada al nivel de significancia
dado. De nuevo, sin embargo, esto resume la evidencia para un efecto pero no
el tamaño del efecto. Una posibilidad es reportar intervalos de confianza, puesto que estos
indican el tamaño del efecto y la incertidumbre. Esto ayuda a interpretar los resultados, como el
intervalo de confianza para un dado indicando simultáneamente la significancia

estadística y el efecto de tamaño. El p-valor y los intervalos de confianza son basados en los
mismos cálculos fundamentales como aquellos para las correspondientes pruebas de hipótesis.
Los resultados son presentados en un formato más detallado, en lugar del «sí o no» de las
pruebas de hipótesis y con la misma metodología estadística.
Otro tipo de aproximación es el uso de métodos bayesianos. Esta aproximación, sin embargo,
también ha sido criticada.
El fuerte deseo de que los medicamentos buenos sean aprobados y que los medicamentos
peligrosos o de poco uso sean rechazados crea tensiones y conflictos (errores tipo I y II en el
lenguaje de pruebas de hipótesis).
Enseñanza de la estadística en las ciencias

sociales[editar]
Sobre la enseñanza de la estadística en las ciencias sociales, algunas investigaciones
“sugieren que los estudiantes aprenden más cuando los profesores usan ejemplos concretos y
problemas relevantes para ellos”.26
Para contar con ejemplos concretos y problemas relevantes a los estudiantes, es posible
proponer actividades de aprendizaje que vinculen los métodos cuantitativos a los enfoques
cualitativos, debido a que estos últimos son utilizados con mayor recurrencia en los planes de
estudio de las licenciaturas en Ciencias sociales. Sobre esta combinación de métodos
encontramos que una de sus principales virtudes es que “la recopilación de los ricos detalles
descriptivos de los datos cualitativos se puede usar para cuantificar y generalizar los
resultados”.27
Entre las ventajas de una enseñanza que combine los métodos cuantitativos con los cualitativos
se encuentra el que los estudiantes desarrollen la destreza para triangular resultados, lo que
disminuye la falibilidad inherente a cada enfoque. Por ejemplo los errores que puedan atribuirse
a los datos de origen, dado que los métodos utilizan tipos de datos distintos, serán más
confiables los resultados si proceden de una triangulación de métodos. 28
Incluso, se puede contemplar la enseñanza de los métodos cuantitativos dentro de los
programas de los distintos ejes del currículum académico. Actualmente es común que en las
diversas asignaturas se ejercite el uso de los métodos de investigación cualitativos pero no de
los cuantitativos. Esto debería cambiar porque “introducir el razonamiento cuantitativo en los
cursos sustanciales permite ligar el entrenamiento en métodos cuantitativos, especialmente
estadísticos, con los asuntos medulares de las ciencias sociales”. 29
La estadística en el campo de la educación[editar]

El análisis de datos estadísticos es un recurso ampliamente empleado en el campo educativo.
Las estadísticas se emplean con mucha frecuencia en al campo de las ciencias físicas,
sociales, médicas, económicas y muchas otras y, en todas ellas, predomina el uso didáctico o
aplicado de las estadísticas. Un uso importante y novedoso es el empleo de las estadísticas del
número de visitas de los distintos artículos de la Wikipedia: dicho análisis sirve para distinguir
los artículos desarrollados en los planes de estudios de los distintos países, de los que no se
encuentran en dichos planes. En la wikipedia en alemán, por ejemplo, aparece en muchos de
los temas educativos incluidos un subtema denominado Didaktic (Didáctica), que indica algunas
sugerencias que sirven tanto para los estudiantes como para los profesores con el fin de
incrementar el beneficio derivado de la lectura del tema. En la página de discusión de este
artículo aparece un enlace automático que nos lleva a ver el número de visitas del artículo a lo
largo de un período determinado (20, 30, 60, 90 días; 1 año o un lapso determinado entre dos
fechas) de este artículo (estadística). Un punto debajo de una fecha determinada nos indica que
es lunes por lo que podemos ver el bajo número de consultas de la página en el fin de semana
y el gran incremento que hay en los días intermedios de la semana (generalmente en los
miércoles y jueves). A veces, hay temas que no siguen siempre estas ideas y ello puede
deberse a razones particulares de la materia o del plan de estudios, por ejemplo, hacer los
exámenes en un viernes, lo cual significaría muchas consultas del artículo después del examen
para ver en qué se ha acertado o fallado. Ver nota ( 30).

Mal Uso de La Estadística

Cargado por

Copyright:

Formatos disponibles

Mal Uso de La Estadística

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Mal Uso de La Estadística

Cargado por

Copyright:

Formatos disponibles

Mal uso de la estadística

Inferencia clásica e inferencia bayesiana[editar]

intervalo de confianza para un dado indicando simultáneamente la significancia

Enseñanza de la estadística en las ciencias

La estadística en el campo de la educación[editar]

También podría gustarte