Blog
10.6.2021

Wykres punktowy, czyli Scatter Plot

Spis treści:
Tagi:
No items found.
Klient:
Autor:

Wykres punktowy, czyli Scatter Plot

Wykres punktowy (ang. scatter plot), zwany także m.in. wykresem rozproszenia, rozrzutu, czy też punktowym diagramem korelacji, tworzony jest z dwóch do czterech zmiennych w postaci miar (measures) lub większej ilości wymiarów (dimensions). Pierwsze dwie główne miary, między którymi chcemy przetestować zależność, tworzą osie x i y, zaś kolejne miary i/lub wymiary mogą być użyte do tworzenia kontekstu dla punktów wykresu.

Wykres punktowy i jego zastosowanie

Wykres punktowy, podobnie jak wykres kolumnowy, czy wykres liniowy, to jeden z najbardziej popularnych rodzajów wizualizacji. Często preferowany np. w publikacjach naukowych lub niektórych rodzajach przemysłu, ze względu na szczególną predyspozycję do identyfikacji i odzwierciedlania zależności.

Zasadniczą zaletą wykresu punktowego jest fakt, iż można przedstawić dużą ilość punktów/znaczników odzwierciedlających wartości na niewielkiej powierzchni.

Oczywiście, ta duża ilość nie służy analizie indywidualnych punktów, ponieważ najprawdopodobniej będą one nachodzić na siebie częściowo lub nawet całkowicie. Jednak w przypadku wykresu punktowego zaletą jest podkreślanie uogólnień, grupowanie oraz identyfikowanie i uwypuklanie zależności.

Ale jest coś więcej: dzięki sposobowi, w jaki wykres punktowy jest ułożony wg miar na każdej osi, poprzez proste dodanie na każdej z nich linii odniesienia (np. wartości średniej) tworzymy w sposób naturalny cztery kwadranty. Jest to prosta technika segmentacji, dzięki której można analizować dane w oddzielnych grupach.

Jak stworzyć wykres punktowy w Tableau?

W przykładzie użyjemy preinstalowanych w Tableau danych Sample Superstore.

dwie miary i produkt

Wybieramy dwie miary (measures). Do półki Columns przeciągamy sprzedaż [Sales] zagregowaną jako SUM ([Sales]), która utworzy oś x, a do półki Rows przeciągamy Procent zysku, jako AGG([Procent zysku]), który utworzy oś y w naszym wykresie punktowym.

Alternatywnie, jeśli wybierzemy te pola kolejno, klikając dwukrotnie lewym przyciskiem myszy, Tableau odczyta je jako wiersz i kolumna i umieści je w półkach Rows i Columns.

W celu nadania wykresowi granulacji dodamy wymiar (dimension), przeciągając nazwę produktu [Product Name] do półki Marks na ikonę Detail.

Kształt punktu wykresu można zmienić w menu dostępnym po kliknięciu ikony Shape.

Łatwo zauważyć produkty 'odstające’ od pozostałych w zakresie wysokiej wartości sprzedaży i udziału w budowaniu zysku.

Widać też, że występują produkty przynoszące straty w całym zakresie wartości sprzedaży.

Wykres punktowy i jego czytelność

Wykresy punktowe dają możliwość zobrazowania dużej ilości danych na małej powierzchni. Jednak wiąże się to z utratą czytelności w odniesieniu do pojedynczych rekordów danych, gdyż punkty wykresu zachodzą na siebie.

Można poprawić czytelność poprzez odpowiednie ustawienie koloru wypełnienia punktów i ich obrysu. Chociaż możemy dobrać dowolnie kolor i zmienić jego przeźroczystość, to nie możemy zrobić tego wprost z obrysem kształtu.

Osiągniemy to poprzez nałożenie na siebie dwóch wykresów tej samej serii danych.

Duplikowanie wykresu

Miarę [Procent zysku] duplikujemy na półce Rows poprzez przeciągnięcie z wciśniętym klawiszem CTRL, co tworzy dwie miary, z których każdą możemy formatować oddzielnie.

Wybieramy na półce Marks zakładkę dla miary, którą chcemy formatować i ustawiamy dowolnie wybrany kolor dla pełnego koła (tutaj wykres górny). Przeźroczystość ustawiamy na ok. 30%, zaś rozmiar kół możemy dostosować suwakiem Size.

Następnie w zakładce drugiej miary (tutaj wykres dolny) zmieniamy kształt z koła na okrąg w menu otwieranym kliknięciem ikony Shape.

Ustawiamy kolor okręgu taki, jak poprzednio dla kół, ale suwak przeźroczystości pozostawiamy na 100%.

Suwakiem Size dostosowujemy rozmiar okręgów do rozmiaru kół.

zduplikowanie wykresu

Nakładanie wykresów

Połączymy te dwa wykresy punktowe w jeden. Klikając prawym przyciskiem myszy na jednej z miar, otwieramy menu, w którym wybieramy pozycję Dual Axis:

nalozenie wykresow

Wykresy nałożą się na siebie. Koła i okręgi mogą być nieco przesunięte względem siebie, co wyrównamy poprzez ich zsynchronizowanie. Klikamy prawym przyciskiem myszy na jednej z pionowych osi i w menu wybieramy opcję Synchronize Axis.

synchronizacja osi

Ponownie klikamy prawym przyciskiem myszy, tym razem na prawej osi i odznaczamy w menu opcje Show Header – nie potrzebujemy dwóch jednakowych opisów.

zbedny opis osi

Wprowadzenie trzeciej wielkości — kolorowanie

Nasz wykres punktowy jest już bardziej czytelny, ale możemy to znacznie poprawić.

wykres monochromatyczny

Podzielimy produkty wg kategorii, poprzez przeciągnięcie pola Category na ikonę Color na półce Marks.

Na półce Marks zaznaczamy zakładkę All, dzięki czemu 'koloryzacja’ obejmie oba wykresy składające się na nasz wykres punktowy.

kolorowanie wymiarem

W tej postaci wykres punktowy pozwala rozróżnić grupy danych (Products) w jednej serii, według kategorii (Category).

Automatycznie została utworzona legenda wg. trzech kategorii produktów. Kolory możemy dostosować dowolnie.

zobrazowanie kategorii

Nasz wykres punktowy uwidacznia, że w pierwszej kolejności wartość sprzedaży jak i zysk generują produkty z kategorii Technology, chociaż niektóre wygenerowały też największe straty.

Analiza w grupach

Na wykresie punktowym mam możliwość analizy serii danych w grupach. Przełączając pomiędzy kategoriami za pomocą legendy, możemy analizować na tym samym wykresie każdą kategorię z osobna, jako oddzielną grupę danych.

analiza w grupach

Teraz łatwo zaobserwować, że produkty Furniture generują mniej więcej tyle samo zysku co strat. Pozostałe dwie kategorie zdecydowanie wnoszą większy wkład w budowanie zysku.

Linie odniesienia

Dodajmy linie odniesienia dla każdej osi, co podzieli nam wykres na kwadranty.

Poziomy odniesienia możemy określić i dostosowywać dowolnie.

linie odniesienia

Widać, iż produkty kategorii Technology i Office Supplies generują sprzedaż powyżej przyjętego poziomu, zaś produkty kategorii Furniture generują sprzedaż zdecydowanie poniżej tego poziomu, a średni generowany przez nie zysk jest bliski zeru.

Linie trendu

Z obszaru Model w zakładce Analytics wybieramy pozycję Trend Line.

Chwytamy Trend Line lewym kliknięciem myszy i przeciągamy do półki opcji. Wybieramy rodzaj linii trendu upuszczając pod ikoną Linear.

Kolory linii trendu dostosowały się do kolorów kategorii.

linie trendu

Największe nachylenie linii trendu oznacza, że produkty Technology wnoszą największy wkład w budowanie zysku.

Zalety i wady wykresu punktowego

Wykres punktowy pokazuje zależności pomiędzy dwiema zmiennymi. Punkty danych są wykreślane na przecięciu osi x i y, które z kolei reprezentują nasze cechy. Posiada wiele zastosowań, między innymi może posłużyć do segmentacji lub grupowania naszych danych, lub wykrycia związków między danymi.

DOBRE PRAKTYKI

  • użycie przeźroczystych symboli w przypadku nakładających się punktów;
  • umieszczenie zmiennej zależnej na osi y i zmiennej niezależnej na osi x;
  • dodanie linii trendu;
  • użycie koloru do grupowania danych.

ZALETY

  • pozwala wykryć wartości odstające;
  • pokazuje relację i jej typ między dwiema zmiennymi;
  • daje możliwość pokazania całej zbiorowości;
  • pozwala na segmentację danych.

WADY

  • w przypadku, kiedy punktów danych jest zbyt dużo i nakładają się one na siebie, staje się mało czytelny, a nawet bezużyteczny;
  • dla niektórych odbiorców może być trudny w interpretacji;
  • w przypadku nieskorelowanych zmiennych bezużyteczny.

,
No items found.