domingo, 7 de junio de 2020

L’art d’enganyar amb l’estadística


Font: César Mejías

Un article en el periòdic, una notícia a la televisió i pràcticament en qualsevol situació en la qual es busque transmetre un fet o idea a un públic ampli es fa ús de gràfics; l’estadística sempre aporta objectivitat i serveix com a suport per a demostrar idees de forma contundent, ja que, sense importar l’autor, un gràfic sempre diu la veritat no?

“Avui en dia els economistes disposem de tantes ferramentes matemàtiques, estadístiques i economètriques, que podem torturar els números fins que confessen el que volem” - Mançur Lloyd Olson, economista i sociòleg.

Les dades són objectives, la informació extreta o transmesa a partir d’aquestes és on recau el perill. En 1954 Darrell Huff va escriure el seu libre “Cómo mentir con estadísticas”, on mostra un gran nombre de formes que permeten, partint de les mateixes dades, transmetre idees fins i tot contraries; al revisar-les resulta fàcil identificar com alguns d’aquests mètodes s’utilitzen en la majoria de mèdis de comunicació, ja siga de forma intencionada o no. Seguidament veurem algunes de les tàctiques més utilitzades, i com identificar-les:


Escales

Quasi totes les dies veuràs algún gràfic i de segur que la majoria de veges ni et fixes en els eixos. S’utilitzen eixos verticals que no parteixen de 0 o es mostra sols un petit rang de valors que permet exagerar les diferències.

Font: ElDefinido

Sembla quasi impossible, però els dos gràfics parteixen de les mateixes dades, sols que l’eix Y del segon comença des de 0, mentre que el de l’esquerra sols mostra des de 9100 fins a 9800; mirant sols el primer seria fàcil caure en la mentida que el Grup E és més del doble que el A, cosa que evidentment és falsa.

“Els gràfics poden ser tan manipuladors com les paraules” - Spiegelhalter.

Ara pareix obvi, però podem trobar exemples on s’han utilitzat, en el canal FOX, si no parem suficient atenció, menys d’un 5% de diferència passaria a ser més del 500%:

Font: ElDefinido

També passa en gràfics de línies:

Font: ElArteDePresentar

I en els eixos horitzontals, sobre tot quant es representa el temps:

Font: ThinkingBussines


Causalitat i Paradoxa de Simpson

Aquest mètode és més difícil d’identificar a simple vista, però és el causant de gran part de les conclusions errònies que obtenim. Un exemple simple on s’identifica ràpidament el problema:

Es realitza un estudi que obté com a resultats una forta correlació entre el consum de gelats i víctimes de colps de calor.

Evidentment, el consum de gelats no augmenta el risc de sofrir un colp de calor, és una tercera variable, la temperatura ambient, la que està causant els canvis en les altres dos variables. Amb un exemple com aquest no tenim problema en adonar-nos de l'error, però quan es compliquen les variables no és tan senzill. En aquesta pàgina trobem molt exemples explicats com el seguent:

“Si las estadísticas mostrasen que la mortalidad por tuberculosis es mayor en Segovia que en las demás provincias, ¿significaría esto que el clima segoviano favorece el contagio tuberculoso? Todo lo contrario. El clima segoviano es tan beneficioso para los tuberculosos que muchos acuden allí para restablecerse. Naturalmente, ésta es la causa de que aumenten allí los fallecimientos provocados por el mal.”

La paradoxa de Simpsons resulta un poc més complexa d’explicar, però pot causar efectes tant sorprenents com els mostrats en la següent xarrada TED, on s’expliquen les causes de la paradoxa:


3D

Mitjançant la perspectiva de aporta una representació 3D podem fer que en un gràfic de sectors un 5% semble igual que un 11%:

Font: ElDefinido

Apple ha utilitzat aquesta tècnica en el passat per tal de mostrar que la seua quota de mercat, 19.5%, es superior a la dels altres, 21.2%, de forma deliberada, ja que sense seguir cap ordre lògic, casualment es coloca “Other” a la part mes allunyada i el de “Apple” en la més propera:

Font: ElArteDePresentar

Representació errònia

Per últim, simplement representar els gràfics de forma incorrecta, una vegada més el canal de FOX té l’exemple perfecte, on de 8.8% a 9.2% és una gran pujada, però més tard 9.0% = 8.6%:

Font: TheOrbit


Finalment, dir que espere que haja sigut d’utilitat el conèixer aquestes estratègies per a poder identificar-les, i que, encara que de segur que la majoria dels casos són errors, anar amb compte amb aquells que transmeten idees concretes. Si voleu més informació, vos recomane els tres primers vídeos de les fonts que expliquen amb més detall aquestes tàctiques; igual que el llibre de Darrell Huff, How to Lie with Statistics, que encara que ja té un temps, els conceptes segueixen a l'ordre del dia.

Fonts:

5 comentarios:

  1. Very interesting Trace,nice explanation

    ResponderEliminar
    Respuestas
    1. I completely agree with this comment, nice job Trace.
      Reading this was very exciting and interesting.
      I will wait your next post.

      Eliminar
    2. WOW, I did not expect you to read this post, thank you very much for your comments.

      Eliminar
  2. Este comentario ha sido eliminado por el autor.

    ResponderEliminar
  3. Molt interessant i clar.
    Crec que aquest tema no es tracta el suficient ni li donem d'importància que realment té.
    La documentació és molt diversa i la biografía molt completa si es vol aprofundir més.
    Bon treball.

    ResponderEliminar