Użycie Pythona w analizie danych jest od wielu lat powszechne, a sam program doczekał się również swojego miejsca w oprogramowaniu Tableau pod nazwą narzędzia TabPy. Poniższy artykuł przedstawi proces instalacji Pythona wraz z bibliotekami, odpowiedniej jego konfiguracji, podłączenia do Tableau i przetestowania prostego skryptu.
Przedstawiamy przebieg instalacji TabPy na wersjach:
- Python 3.7.6
- Pip 20.0.2
- TabPy 1.0
- Tableau 2020.01
- oraz systemie: Windows 10 64-bitowym w języku polskim
Pobieranie i instalacja języka Python
Do uruchomiana TabPy użyjemy Pythona w wspomnianej już wersji 3.7.6, który jest do pobrania na oficjalnej stronie pod tym linkiem.
Na samym dole strony, pod działem Files pobieramy wersję Windows x86-64 executable installer.
Na samym wstępie warto zaznaczyć, ażeby wszelkich instalacji oraz uruchomień programu dokonywać jako administrator. Pominięcie tej kwestii może spowodować problemy z połączeniem serwera.
Pojawienie się okna startowego instalacji, powinno wyglądać tak jak na zamieszczonym obrazku. Klikamy Install Now i po chwili nasz Python jest zainstalowany na naszym systemie.
Edycja zmiennych środowiskowych systemu – dodanie plików Pythona do PATH
Tutaj zaczyna się największy problem, przez jaki użytkownik musi przebrną by sprawnie używać Pythona, a mianowicie wymagane jest ręczne dodanie go do ścieżki PATH. Dodanie go z poziomu instalacji, może później zaowocować konfliktem wersji.
Przechodzimy tym samym do Panelu Sterowania, a tam wybieramy Edytuj zmienne środowiskowe systemu.
Tam postępujemy zgodnie z zamieszczonym zdjęciem, tj. klikamy Zmienne środowiskowe… (1) w zakładce Zaawansowane.
Po wyświetleniu się okna naciskamy dwa razy z listę Path.
Po czym klikając Nowy, wpisujemy lokalizację dwóch plików Pythona, w mim przypadku są to ścieżki:
C:UsersMateusz BrojaAppDataLocalProgramsPythonPython37
oraz
C:Users Mateusz BrojaAppDataLocalProgramsPythonPython37Scripts
Jeżeli znasz lokalizację ww. plików, możesz pominąć następny rozdział i przejść od razu do instalacji oprogramowania pip.
Odnalezienie lokalizacji plików Python37 oraz Scripts
Jeżeli masz problem z odnalezieniem odpowiedniej ścieżki do ww. plików, przedstawię listę kroków, jak się do nich dostać. Ale uwaga, ich lokalizacja może być różna jeżeli wybrałeś inne miejsce instalacji Twojego Pythona. Zaczynając:
- Przejdź do okna Ten Komputer
- Następnie do dysku C (dysk domyślny instalacji)
- Wybierz folder Użytkownicy i dalej folder z nazwą użytkownika, w moim przypadku Mateusz Broja
- Powinien ukazać się tutaj folder AppData, jeżeli jednak go tam nie ma, przejdź do zakładki Widok i zaznacz Ukryte elementy, tak jak na obrazku poniżej.
- W folderze AppData, przejdź do Local, następnie Programs, dalej Python i Python37
- Z tego miejsca skopiuj ścieżkę pliku, wklej we wcześniej wspomnianych ustawieniach zmiennych środowiskowych systemu, następnie dopisz do ścieżki Scripts i ponownie wklej do PATH.
Ostatecznie tak to powinno wyglądać:
Instalacja oprogramowania pip oraz bibliotek Python
Na początku upewnijmy się, że całość instalacji Pythona przebiegła jak do tej pory pomyślnie. Otwieramy tym samym Wiersz poleceń (wyszukać po jego nazwie lub wpisać skrót cmd), tam wpisujemy:
Python
Jeśli naszym oczom ukażę się taki obrazek:
oznacza to, że poprawnie nadaliśmy ścieżki oraz zainstalowaliśmy Pythona. Jeżeli jednak to się nie udało, należy wrócić i powtórnie wykonać wszystkie kroki z poprzednich rozdziałów, upewnić się co do wersji oraz pamiętać, ażeby uruchamiać programy (w tym Wiersz poleceń) jako administrator.
Wpisujemy komendę exit(), wychodząc tym samym z Pythona. Sprawdzimy dodatkowo, czy menadżer bibliotek dla samego Pythona również działa w sposób odpowiedni, wpisując komendę pip. I ponownie, jeżeli nie wyskoczy żaden komunikat o błędzie lub o nieznajomości danej komendy, wszystko jest jak na razie w porządku.
Natępnie powklejamy kilka komend, które usprawnią działanie Pythona i uruchomią TabPy:
- Komenda do aktualizacji oprogramowania pip:
python -m pip install –upgrade pip
- Komenda do instalacji TabPy:
pip install tabpy
- Komenda do instalacji wybranych biblioteki:
pip install pandas sklearn slackclient simple_salesforce
- Natępnie uruchamiamy TabPy:
tabpy
Ukaże się na konsoli pełno, mało zrozumiały komunikatów, ale jeden z nich, ostatni, jest jak najbardziej istotny. Jest to numer portu, który trzeba na ten moment zapamiętać (port 9004).
Podłączenie TabPy do Tableau
Ostatnim krokiem będzie samo połączenie narzędzia TabPy do samego Tableau. W tym calu otwieramy Tableau, z górnego panelu wybieramy Help (1), dalej Settings and Performance (2) i Manage External Service Connection (3).
Pojawi się okno z możliwością połączenia Tableau do zewnętrznego narzędzia. Tak właśnie traktowany jest TabPy i to jego wybieramy z rubryki (1). Wpisujemy:
- serwer 0.0.1
- wcześniej zapamiętany port 9004
i sprawdzamy stan połączenia (4).
Naszym oczom ukazać się powinien poniższy komunikat.
Gratulację, udało Ci się z sukcesem zainstalować Pythona, jego biblioteki, samo narzędzie TabPy oraz odpowiednio połączyć je z Tableau.
W kolejnym artykule przedstawię możliwości jakie daje nam to połączenie wraz z zagadnieniem biznesowym, w którym warto go użyć.
Analiza RFM – Python + Tableau