Big Data vereist ook Big Interpretation. In een nieuwe verhaallijn rond het thema ‘digital transformation’ en ‘Data’, wilde ik aangeven hoe kwantiteit geen kwaliteit en correlatie geen causaliteit maakt. Daarbij wilde ik ook aangeven hoe presentatie nog geen acceptatie maakt, oftewel hoe data (mis)leidend gepresenteerd kan worden.

Een mooi voorbeeld hiervan is in het boek “The Creative Destruction of Medicine” door Eric Topol. Daarin geeft hij een voorbeeld van een medicijn dat in een advertentie wordt aangeprezen als “Lipitor reduces the risk of a heart attack by 36 percent“.  Dat klinkt natuurlijk geweldig. Maar er stond een ‘sterretje’ bij dat verduidelijkte hoe deze reductie gezien moest worden: “3 percent of patients taking a sugar pill or placebo had a heart attack compared to 2 percent of patients taking Lipitor“.  Dus de 36 procent reductie is de ‘delta’, het verschil tussen de 3 en 2 procent. En niet, wat menigeen misschien zou interpreteren, dat het individuele risico op een hart aanval met 36 procent afneemt. Best een belangrijk verschil in interpretatie.

snip_20160510163239

Stel je eens voor dat 4 mensen in de ‘placebo’ groep waren overleden aan een hartaanval, en in de ‘Lipitor’ groep de geconstateerde 2.  Dan zou de advertentie hebben kunnen stellen “reduces the risk of a heart attack by 100 percent“. Het is inderdaad de waarde van interpretatie van de data.

Overigens is dit geen diskwalificatie van het specifieke medicijn, maar een kwalificatie hoe relevant de presentatie en interpretatie van data is.

Advertenties