Autor rozdziału: Danielle J. Navarro and David R. Foxcroft

Rysowanie wykresów

Przede wszystkim pokaż dane.

—Edward Tufte[1]

Wizualizacja danych jest jednym z najważniejszych zadań stojących przed analitykiem danych. Jest ona ważna z dwóch różnych, ale ściśle powiązanych powodów. Po pierwsze, jest to kwestia rysowania „grafiki prezentacyjnej”, wyświetlanie danych w czysty, wizualnie atrakcyjny sposób ułatwia czytelnikowi zrozumienie tego, co próbujesz mu powiedzieć. Równie ważny, a może nawet ważniejszy, jest fakt, że rysowanie wykresów pomaga tobie zrozumieć dane. W tym celu ważne jest, aby rysować „grafiki eksploracyjne”, które pomogą Ci poznać dane w trakcie ich analizy. Te punkty mogą wydawać się dość oczywiste, ale nie mogę zliczyć ile razy widziałem, że ludzie o nich zapominają.

Aby dać poczucie wagi tego rozdziału, chcę zacząć od klasycznej ilustracji tego, jak potężny może być dobry wykres. W tym celu, Rys. 31 pokazuje przerysowanie jednej z najbardziej znanych wizualizacji danych wszech czasów. Jest to mapa John’a Snow’a z 1854 roku dotycząca zgonów z powodu cholery. Mapa jest elegancka w swojej prostocie. W tle mamy mapę ulic, która pomaga zorientować widza. Na górze widzimy dużą liczbę małych kropek, z których każda reprezentuje lokalizację przypadku cholery. Większe symbole pokazują lokalizację pomp wodnych, oznaczonych według nazwy. Nawet najbardziej pobieżna analiza wykresu pozwala stwierdzić, że źródłem epidemii jest prawie na pewno pompa na Broad Street. Po obejrzeniu tego wykresu dr Snow zlecił usunięcie uchwytu z pompy i zakończył epidemię, która zabiła ponad 500 osób. Taka jest siła dobrej wizualizacji danych.

Przerysowanie oryginalnej mapy Snowa dotyczącej cholery

Rys. 31 Stylizowane przerysowanie oryginalnej mapy cholery Johna Snowa. Każda mała kropka reprezentuje lokalizację przypadku cholery, a każde duże koło pokazuje lokalizację studni. Jak widać na wykresie, epidemia cholery koncentruje się bardzo blisko pompy na Broad St.

Cele w tym rozdziale są dwojakie. Po pierwsze, omówienie kilku dość standardowych wykresów, których często używamy podczas analizy i prezentacji danych, a po drugie pokazanie, jak tworzyć te wykresy w jamovi. Same wykresy są dość proste, więc pod jednym względem ten rozdział jest dość prosty. Problemem jest natomiast nauka tworzenia wykresów, a w szczególności nauka tworzenia dobrych wykresów. Na szczęście nauka rysowania wykresów w jamovi jest dość prosta, o ile nie jesteście zbyt wybredni co do wyglądu wykresu. Mam na myśli to, że jamovi ma wiele bardzo dobrych domyślnych wykresów, lub działek, które w większości przypadków tworzą czystą, wysokiej jakości grafikę. Jednak w przypadkach, gdy chcesz zrobić coś niestandardowego lub gdy musisz dokonać bardzo specyficznych zmian w figurze, wtedy funkcjonalność graficzna w jamovi nie jest jeszcze w stanie wspierać zaawansowanej pracy lub edycji szczegółów.