Het visualiseren van onzekere getallen

By 23 april 2019Infographics

Communiceren van onzekerheden in je data is ontzettend belangrijk in de besluitvorming, en dus is de vraag hoe we dit visualiseren essentieel. Het integreren van onzekerheden in je datavisualisatie is belangrijk: je wil dat mensen goed geïnformeerde beslissingen kunnen maken. Dus: je wil niet dat men bestaande en betekenisvolle variatie in de data negeert. Maar: je wil ook niet dat mensen onzekerheden als zekerheden interpreteren. Denk bijvoorbeeld aan peilingen in verkiezingstijd. Maar ook aan die visualisatie op je telefoon die aangeeft dat de boodschappenbezorger over vijf minuten voor bij jou voor de deur staat. Of de trein die tien minuten vertraging heeft. Daar zit een onzekerheidsmarge op die niet visueel gecommuniceerd wordt. Maar dat kan wel net dat ene kopje koffie schelen – en dat kan best relevante informatie zijn voor je besluitvorming op de vroege ochtend.

Ik schreef eerder al eens een blog over verschillende visualisatietechnieken om onzekerheid in datasets weer te geven. Maar nu kwam ik een techniek tegen die ik nog niet kende: de Value-Suppressing Uncertainty Palette, beschreven in een paper door Correll, Moritz en Heer in 2018. De naam zegt het eigenlijk al: een kleurenpalet waarbij de mate van onzekerheid bepaalt in hoeverre waardes van elkaar te onderscheiden zijn. Data met grote onzekerheid krijgen maar een kleur – er is dan dus niet te zien of een waarde hoog of laag is (vandaar dus ‘value-suppressing’). Dat werkt intuïtief: je wil immers dat er aan een getal dat met grote onzekerheid is omgeven, weinig betekenis wordt toegekend. Omgekeerd werkt het palet ook: naarmate de zekerheid groter wordt, zijn waardes beter van elkaar te onderscheiden, en wordt dus de informatie steeds preciezer.

Om de proef op de som te nemen, heb ik van de afgelopen tien jaar de gemiddelde dagtemperaturen opgezocht (zie de website van het KNMI). Van elk jaar heb ik het gemiddelde per maand berekend en de bijbehorende standaardafwijking. De standaardafwijking was in deze proef mijn ‘onzekerheidsfactor’, en bepaalde dus in hoeverre een waarde goed af te lezen was. Bij een grote standaardafwijking is er derhalve weinig onderscheid tussen hoge en lage temperaturen te zien. Bij een kleine standaardafwijking is dat onderscheid beter te zien. Hieronder zie je het resultaat. Vanzelfsprekend eigenlijk, maar tegelijkertijd ook verhelderend, oogt de visualisatie die rekening houdt met onzekerheid minder ‘spectaculair’ dan de visualisatie die dat niet doet. Extremiteiten gaan immers vaak gepaard met onzekerheid. Het lijkt mij interessant om dit door te trekken naar onderzoeksrapporten die de basis vormen voor advies en beleid.

Bronnen: meer lezen over het Value-Suppressing Uncertainty Palette? Ik maakte gebruik van dit artikel op Medium, en het paper door Correll, Moritz en Heer in 2018.