Adam Gabriel Dobrakowski – jest ekspertem Machine Learning (ML) i Data Science z doświadczeniem w implementacji algorytmów w obszarach takich jak przetwarzanie języka naturalnego, systemy rekomendacji i wiele innych. Jako CEO w COGITA prowadzi projekty m.in. w branżach takich jak medycyna, e-commerce czy produkcja. Jest też autorem prac naukowych z zakresu AI. Poza tym prowadzi blog praktycznyml.pl, opublikował ebook na temat budowy modelu ML od zera (do pobrania tutaj) oraz jest twórcą programu Machine Learning Mastery.
Z tego artykułu dowiesz się:
- Co wyróżnia projekty ML-owe względem innych w IT
- Gdzie szukać wiedzy na temat Zarządzania Projektami ML-owymi
- Od czego zacząć przygotowania do roli PMa w projektach ML
- Jakie są najważniejsze etapy projektu wykorzystującego sztuczną inteligencję
- Jak będzie kształtował się rynek projektów ML w przyszłości
Artur Guła – Cześć Adam, dziękuję, że znalazłeś chwilę na podzielenie się z nami swoją wiedzą na temat projektów wykorzystujących sztuczną inteligencję.
Zanim przejdziemy do Zarządzania Projektami, to chciałbym wyjaśnić kwestię terminologii. Czy ML i AI to jest to samo, a czy są między tymi pojęciami jakieś różnice?
Adam Gabriel Dobrakowski: Sztuczna inteligencja (AI) to mało precyzyjne określenie, ja osobiście za nim nie przepadam. Nie ma powszechnej zgody co do jej definicji. Zwykle określa się tak algorytmy imitujące w jakiś sposób inteligentne zachowania człowieka, takie jak tworzenie tekstów, granie w szachy czy rekomendowanie produktów dla użytkowników.
ML, po polsku Uczenie Maszynowe, to bardziej techniczne, lepiej zdefiniowane określenie. Jest to podejście do tworzenia algorytmów, w którym nie programuje się wprost ich działania, tak jak w klasycznym programowaniu, lecz umożliwia dostosowanie działania w oparciu o istniejące dane i przekazane wzorce. Mówimy tutaj o “uczeniu się”, które polega na dostosowaniu wag (parametrów) modeli, aby zminimalizować zadaną funkcję straty.
ML jest najczęstszą realizacją algorytmów AI, ale są również algorytmy, które mogą być określone jako AI, a które nie korzystają z uczenia maszynowego.
AG: Dziękuję za usystematyzowanie tej wiedzy. Zacznijmy teraz od podstaw. Załóżmy, że ktoś prowadzi “standardowe” projekty polegające na budowaniu i rozwijaniu oprogramowania. Czy taka osoba potrzebuje zdobyć jakieś szczególne kompetencje, żeby poprowadzić swój pierwszy projekt ML-owy?
AGD: Zdecydowanie tak. Projekty ML są obarczone dużo większą niepewnością i są w dużej mierze eksperymentami. Ponieważ system uczy się na podstawie danych, z góry trudno przewidzieć, jakich wyników można się spodziewać. Często szkic projektu jest robiony, zanim zostaną przeanalizowane dane, wtedy może się okazać, że dane są zupełnie inne, niż się spodziewaliśmy i trzeba całkowicie przeformułować cele projektu. Myślę zatem, że takie kluczowe kompetencje to jeszcze lepsza umiejętność komunikacji z biznesem i prowadzenia projektu w sposób zwinny. A także znajomość podstaw technologii ML, aby znać tzw. cykl życia modelu ML, czy umieć operować takimi pojęciami jak zbiór treningowy, przeuczenie się modelu, czy interpretowalność.
AG: Czy są może na rynku jakieś standardy, czy metodyki, które pomagają kierownikom projektów prowadzić tego typu projekty?
AGD: Podstawą jest na pewno metodologia Scrum, którą – z mojego doświadczenia – każdy zespół dostosowuje w jakiś sposób do wyzwań związanych z ML-em. Można spotkać się z podejściem Data-Driven Scrum (DDS), które wprowadza pewne korekty do tradycyjnego Scruma, takie jak możliwość regulowania długości sprintu.
Myślę jednak, że wciąż jest mało materiałów na ten temat i nie ma jeszcze przyjętego ogólnie standardu. Dlatego w moich treściach – zarówno na blogu, jak i we wspomnianym ebooku – zarządzanie projektami ML zajmuje istotne miejsce.
AG: Przejdźmy w takim razie do Twojego ebooka “Projekt AI od zera”, gdzie podajesz 10 kroków do budowy skutecznego modelu. Jakie jest znaczenie tego ebooka z perspektywy Zarządzania Projektem ?
AGD: Ebook jest rozbudowaną check-listą, która ma przeprowadzić zarówno Data Scientista, jak i inne osoby odpowiadające za projekt ML, przez cały proces, tak aby nie zapomnieć o żadnym kluczowym kroku. Dodatkowo jest uzupełniona o liczne linki i narzędzia potrzebne na różnych etapach.
Dlatego myślę, że ebook stanowi szczególnie dużą pomoc dla kierowników projektów, którzy nie mają dużego doświadczenia w projektach ML. Pokazuje im, o co należy zadbać na każdym etapie i co trzeba zrobić, żeby przejść do kolejnego etapu.
AG: Teraz zapytam o to, co interesuje wszystkich zarządzających projektami. Czyli jak projekt ML-owy wygląda od strony czasu trwania i budżetu. Które z wymienionych etapów są najbardziej czasochłonne, a przez to kosztowne?
AGD: Pamiętajmy, że na koszty projektu składają się trzy podstawowe rzeczy: koszty zasobów obliczeniowych, koszty różnych narzędzi i – przede wszystkim – koszty pracy zespołu, które zwykle są przeważające. Dlatego kluczowe jest oszacowanie czasu trwania projektu przed jego rozpoczęciem, by ocenić opłacalność z potencjalnego wdrożenia. Jednak tak jak mówiłem, istotną częścią projektów ML są eksperymenty i dlatego z góry bardzo trudno ocenić, ile eksperymentów trzeba wykonać, żeby osiągnąć określoną skuteczność modelu.
Tę sprzeczność w mojej firmie rozwiązujemy w ten sposób, że najpierw wyceniamy tzw. Proof-of-Concept (PoC), gdzie dzielimy czas mniej więcej po równo pomiędzy analizę danych i wstępne eksperymenty. Dopiero po wykonaniu PoC-a podajemy wycenę czasową całego projektu, bo dopiero wtedy widać, jak daleko jesteśmy od oczekiwanej skuteczności modelu.
AG: Brzmi to jak rozsądne podejście, które chroni przed niepotrzebnym przepalaniem budżetu, jeżeli coś pójdzie nie tak. No właśnie, bo w rozmowie o Zarządzaniu Projektami nie może zabraknąć wątku o ryzykach. Co może nas zaskoczyć w projektach ML-owych? (jakie są główne ryzyka?)
AGD: Wymieniłbym dwa główne ryzyka, które pojawiają się prawie w każdym projekcie. Pierwsze jest takie, że danych będzie za mało lub nie będą w jakiś sposób odpowiednie, aby wytrenować model. A drugie ryzyko, to że cel projektu okaże się zbyt trudny dla istniejących rozwiązań ML (model nie będzie w stanie nauczyć się zależności i działania, którego byśmy oczekiwali).
Do tego dochodzą takie ryzyka, jak zbyt długi czas obliczeń modelu, brak interpretowalności wyników – tzn. nie wiemy, dlaczego model zwraca takie, a nie inne wyniki, a to może być kluczowe w pewnych zastosowaniach – czy wyzwania etyczne, takie jak niechęć pracowników czy klientów do współpracy z algorytmami AI.
AG: Chciałbym Cię teraz zapytać o perspektywy tego rynku. Jak oceniasz teraz proporcję pomiędzy zapotrzebowaniem na PMów z obszaru ML względem dostępności osób o takich kompetencjach?
AGD: Myślę, że jest większe zapotrzebowanie na PMów niż dostępność osób z takimi kompetencjami. Może dlatego, że nie ma ogólnie przyjętych standardów, z doświadczenia wiem, że firmy zwykle same wolą zainwestować w wyedukowanie takiego PM-a (np. z roli analityka, czy – rzadziej – Data Scientista lub “klasycznego” PM-a) niż zatrudnić taką osobę z rynku, bo po prostu jej styl pracy może nie odpowiadać wypracowanym standardom w firmie.
AG: Teraz spróbujmy przewidzieć przyszłość. Jak oceniasz, ile % projektów IT będzie zahaczać o tematy ML za 5 lat?
AGD: To przecięcie projektów IT z tematami AI / ML jest już teraz na wielu poziomach. Zauważmy, że mamy klasyczne projekty ML – które tutaj głównie omawiamy – które polegają na zebraniu danych, opracowaniu architektury i wytrenowaniu modelu. Ale w projektach IT może być też wykorzystanie jakiś istniejących modeli, nawet bez ich trenowania, np. przez jakąś nakładkę na chatGPT, czy wreszcie tylko wykorzystanie narzędzi AI, takich jak Copilot, do codziennej pracy Data Scientistów. Więc patrząc tak łącznie na tych poziomach, to z pewnością blisko 100% projektów będzie zahaczać o AI. A ograniczając się tylko do projektów polegających na tworzeniu algorytmów ML, to myślę, że to się będzie przesuwać mocniej w stronę połączenia z istniejącymi systemami AI, tworzonymi przez duże organizacje i stopniowo wypierać tworzenie od podstaw modeli ML.
AG: Powiedzmy, że zainteresowaliśmy kogoś tematem prowadzenia projektów ML-owych. Jaki taka osoba powinna teraz wykonać pierwszy krok, jeżeli wcześniej nie miała żadnej styczności z projektami tego typu (nie liczymy korzystania z ChataGPT).
AGD: Zapraszam oczywiście na mój blog, gdzie jest kilka artykułów nawiązujących do tego tematu oraz do pobrania ebooka. Kolejnym krokiem może być przerobienie kursu online w tym temacie, np. na Courserze. Jednak pamiętajmy, że nic nie zastąpi doświadczenia z prawdziwych projektów, dlatego zachęcam do ich poszukania, jeśli ktoś wie, że to ścieżka dla niego.
AG: To jeszcze na koniec zapytam, czy według Ciebie jest coś, co warto podkreślić, jeżeli chodzi o projekty ML, o co nie zapytałem do tej pory?
AGD: Może dodam, że projekty ML, z racji na swoją nieprzewidywalność, będą z pewnością fascynujące dla osób, które mają w sobie nutkę naukowca i eksperymentatora. Dla mnie zawsze jest to wielka satysfakcja, gdy tworzę system, który wykrywa ciekawe zależności w danych, zupełnie nieoczekiwane dla człowieka i pomaga zautomatyzować nawet najtrudniejsze zadania.
AG: Dziękuję za interesującą rozmowę!
Pozostaje jeszcze jedna kwestia. Jeżeli ktoś chciałby zgłębić temat ML, to jak najlepiej się z Tobą skontaktować?
AGD: Również bardzo dziękuję za zaproszenie. Najłatwiej skontaktować się ze mną przez LinkedIn albo mój adres e-mail: adam.dobrakowski@praktycznyml.pl
Zobacz jeszcze inne materiały i wydarzenia udostępnione przez Adama: