Online, 9.06 | Wt

#60 Talk4Devs - online

Michał Dyrda - Data Science @ PMI - Podróż od problemu biznesowego do industrializacji produktu danych.

Czy zastanawiałeś się kiedyś co decyduje o tym jakie produkty możesz oglądać na półkach sklepowych? Dlaczego na danym lotnisku nie możesz kupić tych samych produktów co na dworcu kolejowym? 

Podczas mojego wystąpienia zaprezentuje techniki oraz narzędzia (takie jak: Kubernetes, Docker, Airflow), które wykorzystaliśmy podczas projektu poświęconego optymalizacji katalogu produktów w firmie Philip Morris International. Opowiem, jak działa data science w globalnej organizacji jaką jest PMI oraz podzielę się naszymi najlepszymi praktykami jak tworzyć oraz wdrażać produkty Data Science na środowiska produkcyjne.

Jarek Pałka - Jeśli wszystko wydaje się pod kontrolą, po prostu nie jedziesz wystarczająco szybko.

Czy zastanawiałeś się kiedyś, co trzeba zrobić, aby Twój kod działał szybciej? Czy zastanawiałeś się kiedyś, jak zostać “człowiekiem od wydajności”? Być może zajmujesz się wydajnością, od czasu do czasu, od jednej awarii do kolejnego incydentu o “severity 1”? I masz w sobie to dziwne uczucie, że robisz to źle? Być może nigdy nie przejmowałeś się jak szybko działa Twój kod. Od wieków wiadomo jest, że zawsze jest to problem z bazą danych (lub problem kogoś innego). A może, po prostu trudno się przyznać, że nie wiesz, jak usprawnić działanie swojego kodu? 

Podczas tej prezentacji pokażę, jak zostać programistą świadomym wydajności swojego kodu. W towarzystwie narzędzi takich, jak JMH, JFR i flamegraphs. Skupimy się nie tylko na narzędziach, ale także na procesie optymalizowania wydajności. Porozmawiamy o tym, jak dobrej jakości, tzw. “clean code”, wpływa na wydajność, dlaczego zbiory danych, które wykorzystujemy, są kluczowe, a także kiedy więcej nie znaczy szybciej.

Agenda:
14:00 Powitanie
14:10 Michał Dyrda - Data Science @ PMI - Podróż od problemu biznesowego do industrializacji produktu danych
15:10 Przerwa
15:15 Jarek Pałka - Jeśli wszystko wydaje się pod kontrolą, po prostu nie jedziesz wystarczająco szybko
16:15 Zakończenie

 

zdjęcie
Michał Dyrda

Posiada doktorat z astrofizyki. Ma ponad 12 lat doświadczenia w pracy w Data Science. Swoją przygodę z danymi rozpoczął od pracy w ramach różnych eksperymentów astrofizycznych. Następnie współpracował z różnymi zespołami zarówno biznesowymi jaki i inżynierskimi w celu dostarczenia nowych informacji w oparciu o dane. Posiad doświadczenie w projektowaniu i wdrażaniu złożonego systemu oprogramowania dla różnych międzynarodowych projektów, w tym projektów mających na celu analizy dużych zbiorów danych.
W obecnej chwili jest Lead’em zespołu Data Science Best Practice @PMI i Senior Enterprise Data Scientist w PMI w Krakowie. Na co dzień pracuje nad ewaluacją nowych technologi w celu zwiększenia wartości biznesowej zapewnianej przez zespół Data Science. Jego celem jest wprowadzanie nowoczesnych rozwiązań do analizy danych i i skrócenie czasu wprowadzania produktów na rynek. Jest uzależniony od biegów długodystansowych, ostatnio razem z psem

zdjęcie
Jarek Pałka

Od ponad 20 lat w branży IT, jako administrator baz danych, programista, architekt, manager i "inżynier od spraw katastrof". Brałem udział w małych, średnich i nonsensownie dużych projektach, prowadzonych zgodnie zasadami "waterfall", Agile oraz przy braku jakichkolwiek metodyk, z tym samym zawsze skutkiem. Co doprowadziło mnie do wniosku, że nie ważne co robisz tak długo, jak robisz to dobrze, w najprostszy z możliwych sposobów i używasz właściwych narzędzi, które wykonają pracę za ciebie. W międzyczasie dałem się porwać ideą TDD oraz Software Craftmanship, do granic możliwości wyeksploatować tak piękne w swej prostocie pomysły jak REST i NoSQL, by potem porzucić je by zgłębić tajniki "system thinking" i zachwycić się siłą jaką niesie z sobą "metafora" i odkryć, że rządzą nami te same prawa "natury". Niepokorny wyznawca kościoła JVM, badacz bytecode'u i JIT oraz wszelkiej maści parserów, interpreterów i kompilatorów. Na co dzień walczący o lepszą wydajność w Neo4j. 
Od czasu do czasu można usłyszeć moje niskiej jakości żarty na temat architektury na konferencjach w Polsce. W wolnych chwilach trener w http://symentis.pl i autor bloga na http://geekyprimitives.wordpress.com/ oraz samozwańczy dyktator w radach programowych konferencji CoreDump, SegFault, JDD oraz 4Developers.