Avtor sekcije: Danielle J. Navarro and David R. Foxcroft

Risanje grafov

Pokažite predvsem podatke

—Edward Tufte[1]

Vizualizacija podatkov je ena najpomembnejših nalog, s katerimi se srečuje analitik podatkov. Pomembno je iz dveh različnih, vendar tesno povezanih razlogov. Prvič, gre za risanje „predstavitvene grafike“, saj prikaz podatkov na čist, vizualno privlačen način bralcu olajša razumevanje tega, kar mu želite povedati. Enako pomembno, morda celo pomembnejše, je dejstvo, da vam risanje grafov pomaga razumeti podatke. Zato je pomembno, da narišete „raziskovalne grafikone“, ki vam pomagajo pri spoznavanju podatkov, ko jih analizirate. Te točke se morda zdijo precej očitne, vendar ne morem prešteti, kolikokrat sem videl, da so jih ljudje pozabili.

Da bi pokazal pomembnost tega poglavja, želim začeti s klasično ilustracijo, kako močan je lahko dober graf. V ta namen Fig. 31 prikazuje ponovni izris ene najbolj znanih vizualizacij podatkov vseh časov. To je zemljevid smrti zaradi kolere Johna Snowa iz leta 1854. Zemljevid je eleganten v svoji preprostosti. V ozadju je zemljevid ulic, ki gledalcu pomaga pri orientaciji. Na vrhu je veliko število majhnih pik, od katerih vsaka predstavlja lokacijo primera kolere. Večji simboli prikazujejo lokacije vodnih črpalk, ki so označene z imeni. Že ob najbolj bežnem pregledu grafa je jasno, da je vir izbruha skoraj zagotovo črpalka na ulici Broad Street. Dr. Snow je po ogledu tega grafa poskrbel, da so s črpalke odstranili ročico, in tako končal izbruh, zaradi katerega je umrlo več kot 500 ljudi. Takšna je moč dobre vizualizacije podatkov.

Preoblikovanje Snowovega prvotnega zemljevida kolere

Fig. 31 Stilizirana predelava izvirnega zemljevida kolere od Johna Snowa. Vsaka majhna pika predstavlja lokacijo primera kolere, vsak velik krog pa lokacijo vodnjaka. Kot je razvidno iz risbe, je izbruh kolere zelo blizu črpalke na ulici Broad St.

V tem poglavju smo si zastavili dva cilja. Kot prvo, obravnavati nekaj precej standardnih grafov, ki jih pogosto uporabljamo pri analizi in predstavitvi podatkov, in kot drugo, pokazati vam, kako te grafe ustvariti v jamovi. Sami grafi so ponavadi precej preprosti, zato je to poglavje v enem pogledu precej preprosto. Ljudje imajo običajno težave pri učenju izdelave grafov, zlasti pri učenju izdelave dobrih grafov. Na srečo je učenje risanja grafov v jamovi precej preprosto, če le niste preveč izbirčni glede videza grafa. S tem mislim, da ima jamovi veliko zelo dobrih privzetih grafov ali ploskev, ki večinoma ustvarijo čiste in kakovostne grafike. Vendar pa v primerih, ko želite narediti nekaj nestandardnega ali če morate na sliki narediti zelo specifične spremembe, grafične funkcije v jamovi še ne podpirajo naprednega dela ali urejanja podrobnosti.