Analiza porównawcza funkcjonalności Tableau Prep, dzięki którym sprawniej przygotujesz dane do analizy. Wpis zainteresuje osoby, które korzystają z Tableau Desktop ale nie miały okazji spróbować pracy z Tableau Prep i zastanawiają się czy w ogóle jest im to potrzebne. Postaram się przekonać Was, że warto go poznać bo dla mnie i moich kolegów Prep to narzędzie, które istotnie redukuje czas na zrozumienie i przygotowanie danych do dalszej analizy.
Tableau Prep? Pierwsze słyszę…
Tableau Prep został oficjalnie dołączony do portfolio produktowego Tableau w kwietniu 2018. W założeniach Tableau Prep miał wypełnić lukę w funkcjonalnościach ETL, które posiadało Tableau Desktop. Mówi się, że Prep nie jest pełnowartościowym ETL jak Alteryx, KNIME itp. Po pierwsze trzeba jednak pamiętać, że nie takie były intencje Tableau Software aby konkurować z tymi rozwiązaniami. Po drugie, Prep to narzędzie (podobnie jak Desktop), które jest dedykowane użytkownikom biznesowym a nie technicznym i spełnia swoje zadanie w większości przypadków, dając przy okazji sporo frajdy. Przeczytacie więcej o nim tutaj.
Dlaczego lubimy Tableau Prep?
W codziennej pracy Prep sprawdza się przede wszystkim do prototypowania modeli danych, które później mogą znaleźć swoje odzwierciedlenie w postaci obiektów bazodanowych w hurtowniach danych. Dzięki niemu w czytelny sposób możemy oglądać rozkład danych, analizować zawartość i relacje między polami danych.
Górna część obszaru roboczego, to cały nasz przepływ, czyli wszystkie kroki jakie podejmujemy w procesie oczyszczania i transformacji danych (1). Profil danych od razu daje nam pogląd z jakimi danymi pracujemy i jakie to rodzi potencjalne wyzwania (2). Na samym dole widzimy w czasie rzeczywistym podgląd na rezultat każdego kroku i w jaki sposób on wpływa na strukturę danych (3).
Super rozwiązaniem jest podgląd na relacji między polami. Zaznaczając wybrane pole widzimy udział tej kategorii w pozostałych polach. Daje to od razu obraz jakie występują wzajemne zależności między polami.
Nie musimy pisać długich zapytań w języku SQL aby zrozumieć z jakimi danymi mamy do czynienia i jaka powinna być docelowa struktura modelu danych, który wykorzystamy do analiz. Docenimy to przede wszystkim gdy mamy kontakt z danymi po raz pierwszy i naszym celem jest zrozumienie ich struktury, jakości, kompletności. Tutaj na pewno jest spora przewaga Prep nad wstępną analizą danych metodą prób i błędów w SQL lub z użyciem tabeli przestawnej w Excelu.
Tableau Desktop daje radę, po co mi Tableau Prep?
Do momentu uruchomienia Prep, użytkownicy musieli sobie radzić z użyciem Desktop. Choć w większości przypadków jest to nadal możliwe, to jednak technologia idzie do przodu i tym samym ujawniają się nasze dotychczas nieuświadomione potrzeby. Dzięki temu, że Prep zawiera sporo funkcjonalności, które czynią nasze życie łatwiejszym, to praca z danymi staje się przyjemniejsza. Do takich rozwiązań należy na przykład możliwość korygowania wartości poszczególnych rekordów, jak również algorytmy grupowania oparte o podobieństwo pisowni lub wymowy.
Przejdźmy do meritum. Poniższa tabela zawiera porównanie funkcjonalności w obszarze przygotowania danych między Prep i Desktop. Po co ją wykorzystać? Po to aby mieć świadomość kiedy należy sięgnąć po Prep aby rozwiązać nasz konkretny problem z danymi. Trzeba pamiętać, że oba narzędzia są rozwijane i ciągle pojawiają się nowe funkcjonalności.
W poniższej tabeli prezentujemy porównanie funkcjonalności służących do przygotowania danych. Jest to stan na podstawie wersji 2019.2.
*agregacja jest możliwa do poziomu użytych wymiarów ale tylko na poziomie ostatecznego ekstraktu danych a nie dla każdej tabeli użytej do zbudowania relacji
**via Tableau Server
***via command line
****brakuje plików JSON, Spatial files
Lista connector’ów Tableau Desktop
Lista connector’ów Tableau Prep
Podsumowanie
Nie jest zaskoczeniem, że Prep ma zdecydowanie większe możliwości w obszarze przygotowania danych. Jedyną przewagą Desktop jest liczba wspieranych connector’ów ale pewnie z czasem oba narzędzia będą oferowały podobny zakres. To czego nie odda tabela porównawcza, to sam sposób pracy w obszarze przygotowania danych.
Prep można więc scharakteryzować jednym słowem „flow”. Dzięki niemu wszystko przebiega jak przepływ od lewej do prawej. Cały proces ma swój widoczny początek i koniec. Na każdym etapie transformacji, widzimy zmiany w czasie rzeczywistym. W Desktop jesteśmy w zasadzie ograniczeni do zbudowania relacji między tabelami, możliwością edycji metadanych oraz nałożeniem filtrów na źródło danych. Ponadto, jego istotną różnicą jest również sposób automatyzacji odświeżania źródeł danych. W Desktop odbywa się to poprzez harmonogram Tableau Server, w Prep musimy uruchomić plik wsadowy bat poprzez scheduler Windows. Ma to swoje ograniczenia i niestety najczęściej znowu skazuje użytkownika na zależność od działu IT. Gdyby połączyć obie platformy mielibyśmy narzędzie prawie idealne.
Jeśli jesteś użytkownikiem Tableau Desktop, ale Prep jest dla Ciebie nowy – zapraszamy na nasze szkolenia, konsultacje i oczywiście bloga gdzie będą pojawiały się nowe praktyczne przykłady.
Happy Prepping!