Los errores en el manejo de las estadísticas

Desde los años noventa, el profesor de matemáticas en la Universidad de Temple de Filadelfia John Allen Paulos se ha dedicado a divulgar la ciencia con un especial enfoque en su especialidad: la estadística. Con su libro “El hombre anumérico”, el científico encontró la expresión precisa para el analfabeto en matemáticas y reveló el ‘anumerismo’ imperante en los periódicos y en la vida cotidiana.  “Con demasiada frecuencia, los periodistas usan los números como decoración de las noticias, cuando lo que deberían proporcionar es información”, dijo el matemático en una entrevista para el Servicio de Información y Noticias Científicas – SINC en el 2013.

John Allen Paulos se refería a que los periodistas no buscamos respuestas más allá de las clásicas preguntas (quién, qué, donde, cuándo y por qué) cuando estamos frente a estadísticas y sondeos. “Hay que saber cuánto, con qué frecuencia, con qué tasa, decir si la tasa crece o decrece, para contextualizar la información y ponerla en perspectiva”, explicó.

El también autor de los libros “Un matemático lee el periódico” y “Un matemático invierte en la bolsa” sostiene que se ha vuelto habitual que se maquillen los números en funciones de intereses concretos. “Como digo en alguno de mis textos, en las noticias, el 62,341768% de los números de las estadísticas son inventados sobre la marcha [risas]. No ofrecen ninguna información ni se sabe cuáles son los intervalos de confianza, ni de dónde salen los datos. La ideología de quien mide también introduce un sesgo. Si en una noticia habláramos del número de personas sin techo, deberíamos saber de dónde salen los datos: ¿de informes policiales o de estudios académicos?”, dice.

 

Casos comunes de malas interpretaciones numéricas

 

El contexto de las comparaciones numéricas

¿Es correcto decir que La Punta es el distrito del con menos deudas de arbitrios del Callao? O ¿Lima es la ciudad donde más perros se abandonan? Si tenemos en cuenta que La Punta tiene la más pequeña población del Callao y que Lima posee la mayor cantidad de población del país, veremos que estamos ante interpretaciones de datos equivocadas.

 

La media y la mediana

Cuando hablamos de media (medidas de centralidad) dejamos de tomar en cuenta información valiosa que nos dice cómo están distribuidos los datos que nos proponemos interpretar (medidas de dispersión). ¿Cuáles son los valores que están justo en el medio y cuáles son los valores que quedan debajo de la mitad? Para ello debemos sacar la mediana y no la media. Un ejemplo claro es el salario medio. ¿Cómo se distribuyen los salarios en el Perú? No es lo mismo decir que el 90% de las personas cobra entre 2000 y 3000 mil soles a que haya un grupo del 45% con un salario de 0-850 soles y otro grupo del mismo tamaña con salarios de 12.000 y 20.000 soles.

 

Las predicciones

La estadística no predice nada por sí misma. Los errores más habituales están en el periodismo deportivo. Es usual leer noticias del tipo “según las estadísticas, el equipo local ha ganado más veces así que es más probable que gane este encuentro" o "siempre que el equipo ha ganado 2-1 en la ida se ha clasificado". Este es un falso vínculo entre correlación (dos cosas ocurren a la vez/relacionadas) y causalidad (una cosa causa la otra).

La estadística es fiable. El problema viene cuando se usa mal o cuando no te dan todos los datos.