Uniwersytet Marii Curie-Skłodowskiej
Zaawansowana Analityka Danych
Aż 90% danych pozyskiwanych przez firmy nie jest skutecznie wykorzystywanych bez stosowania narzędzi i metod zaawansowanej analityki. Może to być analiza nie tylko tego co się wydarzyło, ale również predykcja przyszłych zdarzeń, odkrywanie wzorców i anomalii, identyfikacja zmiennych i relacji co owocuje w lepszym zrozumieniu własnego biznesu.
Zaawansowana Analityka to nie tylko dokładniejsza analiza danych, ale także większa automatyzacja procesów, a więc oszczędność czasu wcześniej przeznaczonego na ręczne analizy. Stworzenie odpowiedniego modelu analitycznego oraz zastosowanie matematycznych i statystycznych algorytmów wymaga wiedzy i kompetencji osób o profilu Data Scientist, którzy wchodzą w skład naszego zespołu.
Implementacja zaawansowanych modeli to konkretne korzyści dla firmy. Należą do nich np.:
- predykcja popytu na produkty,
- podejmowanie bardziej trafnych decyzji opartych o wiedzę,
- lepsze zrozumienie i zastosowanie informacji dotyczących przyszłych trendów,
- wykorzystanie wcześniej nieużywanych zbiorów danych,
- identyfikacja potrzeb konsumenckich, zarówno indywidualnych, jak i grupowych,
- oszczędność pieniędzy wynikająca z trafniejszego lokowania środków finansowych
Segmentacja klientów
Dzięki segmentacji Klientów możliwy jest ich podział na grupy o podobnych profilach. Daje to możliwość określenia grup z wartościowymi dla danej firmy Klientami, a co więcej – na precyzyjne zidentyfikowanie tych, którzy generują niewielkie zyski lub nawet straty. Stworzenie i wykorzystanie takiej analizy pomaga podejmować bardziej precyzyjne i skuteczne działania marketingowe, kierując tym samym kampanię marketingową do konkretnej grupy odbiorców, której zachowania i preferencje są znane.
Tego typy analizy udzielą odpowiedzi na pytania takie jak:
- czy pozyskanie danego Klienta będzie oznaczało jednorazową sprzedaż, czy długotrwałą współpracę?
- jaki jest poziom satysfakcji Klientów z dostarczanych usług / produktów (mierzony np. za pomocą metody NPS)?
- jaki potencjał zakupowy niesie ze sobą dany Klient?
- jaką wartość dochodów gwarantuje dany Klient (mierzony za pomocą wskaźnika CLV)?
- jakiego zakresu usług oczekuje dany Klient?
- czy określony Klient może przynieść firmie możliwość pozyskania nowych Klientów?
Analiza koszykowa
Zastosowanie analizy koszykowej pozwoli na automatyczne wyszukanie najczęściej kupowanych ze sobą produktów. W efekcie możliwe jest zastosowanie mechanizmów Next Best Offer, czyli sugerowanie Klientowi produktu, który zwykle kupowany jest z wybranym przez niego towarem. Tego typu system pozwoli na określenie koszyka zakupów, który dostarczy informacji pomocnych w organizowaniu akcji promocyjnych firmy, jak również w efektywniejszym rozmieszczaniu towarów na półkach.
Tego typy analizy udzielą odpowiedzi na pytania takie jak:
- jak rozmieścić towary na półkach aby ich ekspozycja była efektywniejsza?
- jakie akcje promocyjne przeprowadzić aby zwiększyć sprzedaż?
- jak dopasować ofertę do potrzeb Klientów?
- jak zaplanować proces dystrybucji i uzupełniania zapasów magazynowych?
Analiza migracji klientów
Analiza migracji klientów pozwala na identyfikację Klientów firmy, u których istnieje prawdopodobieństwo zaprzestania korzystania z dotychczasowych usług czy kupowania określonych produktów. Dzięki temu możliwe jest podjęcie działań mających na celu zminimalizowanie zagrożeń skutkujących utratą Klienta.
Tego typu analizy udzielą odpowiedzi na pytania:
- którzy z Klientów posiadają niski, a którzy wysoki wskaźnik migracji?
- ilu z Klientów zrezygnowało z usług firmy na przestrzeni określonego czasu?
- którzy Klienci wykazują się dużym stopniem zadowolenia, a którzy nie?
- jakie były główne powody, dla których dotychczasowi Klienci migrowali?
- którzy z Klientów migrowali na skutek niesatysfakcjonujących ich warunków, a którzy zostali do tego zmuszeni z powodu niewywiązywania się z umowy przez usługodawcę?
- którzy Klienci zmigrowali z jednego segmentu do innego, co powinno skutkować ponownym dostosowaniem dostarczanych im ofert?
Detekcja nadużyć
W dzisiejszych czasach niemalże każde przedsiębiorstwo narażone jest na różnego rodzaju nadużycia, które wraz z rozwojem technologicznym, coraz trudniej wykryć i im zapobiegać.
Rozwiązanie Comarch Business Intelligence dzięki analizie danych, a także zastosowaniu zaawansowanych modeli predykcyjnych pozwala na dokładną analizę i szybką reakcję na negatywne zdarzenia w celu np. minimalizacji ewentualnych strat finansowych. Dzięki zastosowaniu statystycznej analizy m.in. transakcji Klientów oraz zaimplementowaniu odpowiednich algorytmów możliwe jest odnalezienie pojedynczych przypadków nadużyć.
Tego typu analizy udzielą odpowiedzi na pytania:
- którzy z Klientów dokonywali nadużyć?
- jak zwiększyć zaufanie Klientów?
- jak zminimalizować straty finansowe związane z nadużyciami?
- w której grupie Klientów występuje najwyższe prawdopodobieństwo popełniania nadużyć?
Budowanie relacji z klientem/ programy lojalnościowe
W kontekście programów lojalnościowych istotne jest dotarcie do określonej grupy docelowej Klientów firmy i adekwatne do tego tworzenie kampanii marketingowych. Dzięki temu można uzyskać optymalizację całego procesu marketingowego ze względu na koszty prowadzonej kampanii i kontaktu z Klientem czy alokację zasobów. Za pomocą procesów data mining możliwe jest uzyskanie informacji o potrzebach i oczekiwaniach Klienta oraz ocenienie skuteczności jego pozyskania. Określając preferencje i zwyczaje Klienta można również zidentyfikować wzorce jego zachowań.
Tego typu analizy udzielą odpowiedzi na pytania takie jak:
- kim jest grupa docelowa firmy?
- do kogo powinna być skierowana dana kampania?
- jak zmniejszyć koszty podejmowanych działań marketingowych?
- jak wygląda efektywność przeprowadzanych kampanii?
- jak dopasować ofertę do potrzeb Klientów?
- jakie są szanse na pozytywny odbiór analizowanej kampanii?
Prognozowanie wyników przedsiębiorstwa
Każde przedsiębiorstwo charakteryzuje się zmiennymi trendami sprzedaży swoich usług czy produktów i posiada inną wielkość popytu, w zależności od obranego horyzontu czasu. Prognozowanie jest niewątpliwie trudnym zagadnieniem, jednak w tej materii z pomocą przychodzą mechanizmy zaawansowanej analityki. Dobrze zdefiniowana i wykonana predykcja sprzedaży ma kluczową wartość w konstruowaniu strategii biznesu i przynosi konkretne korzyści.
Tego typu analizy udzielą odpowiedzi na pytania takie jak:
- jaką marżę osiągnie firma w przyszłych okresach przy obranych założeniach?
- czy specyfika branży firmy przejawia objawy sezonowości sprzedaży w poszczególnych grupach produktów lub usług
- czy należy podjąć działania w celu zapobiegania negatywnym skutkom prawdopodobnych zdarzeń?
- ile powinna wynosić wartość zakupów w firmie przy obranych założeniach?
- jaka prawdopodobnie będzie wyglądać rotacja produktów na magazynie?
Algolytics: Zaawansowana analityka predykcyjna dla SAP
Analityka predykcyjna, w dużym uproszczeniu, pozwala przewidywać przyszłość, bazując na danych historycznych. Przykładowo, mając informację o tym, którzy klienci do tej pory zrezygnowali z produktów bądź usług firmy, można zbudować profil takich klientów, opisujący wzorzec ich zachowań i charakterystykę. Jeżeli podobne zachowania zostaną zaobserwowane u innych klientów, szczególnie tych strategicznych, generujących największą sprzedaż, nadal pozostanie szansa, by z wyprzedzeniem zapobiec ich utracie.
Jeszcze do niedawna analityka predykcyjna była wykorzystywana głównie w telekomunikacji i finansach, m.in. do zapobiegania odejściu klientów (tzw. churn), optymalizacji działań marketingowych czy badania zdolności kredytowej klientów. Obecnie staje się ona coraz bardziej popularna także wśród firm z innych branż. Na przykład portal Netflix, który ostatnimi czasy szturmem podbija rynek filmów online, wykorzystuje analitykę predykcyjną do przewidywania, które filmy lub programy jego użytkownicy będą najchętniej oglądali. Pozwoliło to firmie co roku zmniejszyć wskaźnik odejść klientów o kilka punktów procentowych i daje oszczędności rzędu 1 mld dol. rocznie.
Rozwiązania do analizy wielkich zbiorów danych (Big Data) stosuje w niektórych obszarach biznesu już 97% firm na świecie, w Europie 25%, a w Polsce 18% (źródło: Computerworld). Trend jest jednak wzrostowy, a obserwując różnice dzielące nas od firm zachodnich, można stwierdzić, że wkrótce będziemy ten dystans niwelować.
Poniżej przedstawiamy kilka wybranych przykładów zastosowań analityki predykcyjnej dla firm z różnych branż.
Personalizacja oferty produktowej
Co za dużo, to niezdrowo
Obecnie, przy bardzo rozbudowanych ofertach, które do tego często się zmieniają, wyzwaniem staje się – zarówno dla klienta, jak i dla firmy – znalezienie i zaproponowanie tej optymalnej. Poza tym portfolio coraz większej liczby firm składa się dziś z dziesiątek czy nawet setek wariantów produktów oraz usług własnych, często uzupełnionych dodatkowo o ofertę partnerów. Ta mnogość to jedna strona medalu.
Z drugiej strony wiadomo, że klient nie powinien być „zasypywany” ofertami niedopasowanymi do jego preferencji (które postrzega jako spam) lub być obiektem niespójnej komunikacji marketingowej. Psuje to dobry wizerunek firmy i zniechęca do dalszej współpracy czy dodatkowych zakupów. Należy też wziąć pod uwagę ograniczenia budżetowe prowadzonych działań marketingowych – firmy muszą prowadzić kampanie marketingowe dopasowane do swoich możliwości finansowych.
Zatem odpowiednie dopasowanie oferty do zapotrzebowań konkretnego klienta oraz wybór najlepszego momentu i sposobu komunikacji są w tym wypadku kluczowe dla skutecznej finalizacji transakcji.
Personalizacja kluczem do sukcesu
Wyobraźmy sobie, że firma X z branży e-commerce posiada dużą bazę klientów. W systemie SAP przechowuje nie tylko dane demograficzne (np. datę urodzenia, miejsce zamieszkania, płeć), ale również behawioralne (np. częstotliwość zakupów, ich wartość). Te informacje pozwolą na opracowanie indywidualnego profilu klienta. Zdobytą wiedzę można następnie wykorzystać do przygotowania spersonalizowanej oferty oraz opracowania strategii komunikacji, tak aby zmaksymalizować przychody.
Profil ten dostarczy wiedzy, na przykład, na temat tego:
jakimi produktami z oferty firmy X dana osoba będzie najbardziej zainteresowana,
kiedy (dzień tygodnia, pora dnia) najlepiej się kontaktować z klientem,
jaki kanał komunikacji (np. SMS, telefon, e-mail) będzie w przypadku danego klienta najskuteczniejszy.
Firma X może uwzględnić także maksymalne obciążenie kanałów komunikacji, to znaczy z jednej strony np. możliwości call center, a z drugiej ograniczenie do minimum np. liczby wysyłanych e-maili czy SMS-ów. A cały plan kampanii ułożyć tak, aby maksymalizować zadane kryterium (np. rentowność sprzedaży), przy uwzględnieniu ograniczeń budżetowych (np. budżet na kampanie, budżet na promocje).
Analityka predykcyjna jest niezwykle potężnym i skutecznym narzędziem w zwiększaniu ROI kampanii sprzedażowych i marketingowych.
2,8 mln zł oszczędności i o 25% większa konwersja
Analityka predykcyjna jest niezwykle potężnym i skutecznym narzędziem w zwiększaniu ROI kampanii sprzedażowych i marketingowych. Nasze doświadczenia pokazują, że dzięki wykorzystaniu odpowiednich narzędzi analitycznych można zwiększyć konwersję kampanii marketingowych nawet o 25% przy jednoczesnym zmniejszeniu sił sprzedażowych. U jednego z naszych klientów dało to oszczędności rzędu 2,8 mln zł rocznie.
Prognozowanie zapotrzebowania na produkty
Handlowy zawrót głowy
Firmy z branży retail czy FMCG posiadają bogatą ofertę produktową, która charakteryzuje się bardzo dużą rotacją towaru. Kluczowe dla rentowności prowadzonej działalności jest zatem podejmowanie optymalnych decyzji dotyczących składania zamówień na produkty.
Błędna decyzja w tym obszarze może spowodować:
policzalne straty wynikające np. z przekroczenia terminu ważności (produkty szybko psujące się), konieczność stymulacji sprzedaży rabatami w przypadku zamówienia zbyt dużej ilości towaru,
utratę potencjalnych korzyści, udziału w rynku i reputacji – w przypadku zamówienia zbyt małej ilości towaru.
Dodatkowym problemem jest konieczność zarządzania dużą liczbą produktów (nawet setki kategorii i tysiące pozycji). Przy tak dużej skali oferty konieczne jest zautomatyzowanie procesu prognozowania zapotrzebowania na towary i uwzględnienie wszelkich możliwych do wykorzystania informacji pozwalających na trafniejsze przewidywania.
Jednocześnie potencjał usprawnień i optymalizacji jest na opisywanym polu bardzo duży. Na przykład przy marży na sprzedaży rzędu 1% ograniczenie strat wynikających z przeterminowania produktów o 1% ich wartości zwiększa rentowność sprzedaży aż o 100%!
W tym przypadku rozwiązaniem jest bieżące monitorowanie zapotrzebowania na produkty i prognoza jego przyszłej wartości.
Już teraz, dzięki współpracy firm BCC (aktualnie All for One Poland) i Algolytics, firmy korzystające z systemu SAP mogą wdrożyć systemy do analityki predykcyjnej i zintegrować je z podstawowym systemem transakcyjnym.
Dokładne prognozy w czasie rzeczywistym
Także w obszarze prognozowania w czasie rzeczywistym z pomocą przychodzi analityka predykcyjna. System analityczny na podstawie historycznej sprzedaży (np. pobieranej z systemów SAP) i szeregu dodatkowych informacji (informacje o lokalizacji, informacje o rynku, akcje promocyjne konkurencji, pogoda itp.) może w czasie rzeczywistym automatycznie generować prognozy zapotrzebowania na daną jednostkę asortymentu (SKU). Na tej podstawie automatycznie generowane są też zamówienia do dostawców. Cały czas użytkownik ma możliwość przeglądu i korekty zamówień.
Taki system powinien również na bieżąco monitorować jakość prognoz i korygować je oraz być wydajny – zarządzać prognozami dla poszczególnych jednostek asortymentu.
Przewidywać przyszłość, analizować trafność prognoz
Firmy posiadające system SAP gromadzą w nim obszerne zbiory danych. W szczególności dotyczy to przedsiębiorstw działających w modelu B2C, czyli np. branży handlowej, banków, ubezpieczycieli, firm telekomunikacyjnych, spółek energetycznych i sektora usług publicznych. Nie są to tylko zbiory informacji finansowo-księgowych, ale także danych logistycznych i z obszaru zarządzania kapitałem ludzkim. Już po kilku latach działania systemu bazy danych dotyczące np. kontraktów, płatności, sprzedaży, stanów magazynowych, szkoleń pracowników, remontów i przeglądów okresowych czy wreszcie statystyki produkcji są na tyle zasobne, że stają się solidną podstawą do przewidywania przyszłości: zachowań klientów, trendów rynkowych, wielkości wzrostów i spadków przychodów w poszczególnych miesiącach roku itp.
Liczba danych do przetworzenia, a także wielość czynników wpływających na ostateczny wynik sprawiają, że coraz trudniej jest szacować przyszłość ręcznie, wykorzystując np. skoroszyty MS Excel. Potrzebne są specjalistyczne narzędzia, które dzięki wyposażeniu w silniki analityczne (np. heurystyczne, statystyczne, drążenie danych) automatyzują przetwarzanie informacji. Umożliwia to zarówno szybsze wykonywanie raz zdefiniowanych analiz, jak i prowadzenie zupełnie nowych analiz ad hoc, coraz częściej wymaganych przez zmienną rzeczywistość biznesową.
Rozwiązania firmy Algolytics pozwalają nie tylko przewidywać przyszłość, ale także analizować trafność prognoz. Wspomaga to ciągły proces udoskonalania systemów wnioskowania na podstawie dostępnych informacji.
Krzysztof Siwiec, Menedżer Rozwoju Biznesu w obszarze Finanse, Analizy, Planowanie, All for One Poland
Optymalizacja windykacji
Którzy klienci będą się spóźniać z płatnościami?
W ostatnich latach trendy rynkowe, jeśli chodzi o zaległe płatności, są mało optymistyczne (źródło: knf.gov.pl):
wzrasta poziom należności zagrożonych (z 72 mld zł w 2013 r. do 75,6 mld zł w 2015),
wzrasta wysokość odpisów i rezerw (saldo odpisów i rezerw w latach 2013-2015 wzrosło z 8,26 do 9,24 mld zł),
spadają wskaźniki efektywności działania (w analogicznym okresie ROE spadło z 10,1 do 6,8).
Zastosowanie analityki predykcyjnej pozwala na wyeliminowanie wielu przypadków opóźnień bądź braku płatności, zanim jeszcze te zjawiska wystąpią.
Profilaktyka zamiast leczenia
Kolejny przykład to firma energetyczna, która obsługuje tysiące klientów, dostarczając im energię elektryczną. Jak każdy podmiot na tym rynku, zmaga się z problemem niezapłaconych bądź przeterminowanych faktur. Jednym z rozwiązań jest odcięcie dłużnikom dostawy prądu, ale spójrzmy prawdzie w oczy – jest to rozwiązanie ostateczne, które generuje znaczne koszty i nie zawsze przynosi pożądane rezultaty.
Najlepszym rozwiązaniem jest zapobieganie takim sytuacjom. A jeśli dług już się pojawi, ważna jest personalizacja kontaktu z dłużnikiem, tak aby zwiększyć skuteczność windykacji.
Stosując analitykę predykcyjną, można otrzymać szereg prognoz dotyczących niezapłaconych wierzytelności, w tym dla każdego dłużnika indywidualnie:
prognozę wejścia na ścieżkę windykacyjną,
prognozę długości trwania windykacji do czasu spłaty wierzytelności,
prognozę statusu zakończenia ścieżki/scenariusza windykacyjnego,
prognozę skłonności do spłaty po określonym kroku/scenariuszu windykacyjnym.
Potencjalne korzyści z zastosowania analityki predykcyjnej w tym obszarze to m.in.:
zwiększenie skuteczności odzyskiwania długów przez działania prewencyjne (na etapie prewindykacji),
szybsze odzyskiwanie należności,
ograniczenie kosztów obsługi przez dostosowanie scenariuszy windykacyjnych do profilu klienta,
redukcja kosztów przez eliminację zbędnych kroków windykacyjnych (na etapie windykacji wewnętrznej),
wcześniejsza sprzedaż wierzytelności o niskim prawdopodobieństwie spłaty.
Jakość danych – szansa na dodatkowe oszczędności
Istotnym czynnikiem, ważnym z punktu widzenia wdrożenia rozwiązań analitycznych, są dane o klientach. Od ich jakości zależy bowiem np. efektywność kampanii marketingowych lub ściągalność należności za usługi (klient nie płaci faktury, bo jej nie otrzymał). Dane te, niestety, często zawierają błędy (np. zdublowane wpisy), są niekompletne lub niespójne. i Software AG podają, że koszt biznesowy wynikający z niskiej jakości danych może sięgać nawet 10-25% przychodów firm.
Z kolei statystyki podane przez Halo Business Intelligence wskazują że:
– 92% badanych firm przyznaje, że posiadane dane teleadresowe są niedokładne,
– 66% badanych organizacji wierzy, że niepoprawne dane mają negatywny wpływ na ich działalność.
Stosując odpowiednie narzędzia i mechanizmy poprawy jakości danych, firmy osiągają policzalne korzyści biznesowe. Teraz narzędzia te dostępne są także jako rozszerzenia systemu SAP razem z analityką predykcyjną.
Analityka predykcyjna – haczyka nie ma
Czytając o potencjalnych korzyściach z rozwiązań informatycznych, decydenci często zastanawiają się, gdzie jest haczyk. Mamy dobrą informację. Jeśli chodzi o analitykę predykcyjną, haczyka nie ma. Narzędzia umożliwiające wykonywanie analiz predykcyjnych są stosowane przez coraz większą liczbę firm, nie tylko tych największych. Firmy te – nasi klienci – doceniają wymierne korzyści biznesowe płynące z zaawansowanej analityki predykcyjnej.
Warto też podkreślić, że dostępność tego typu rozwiązań, dostosowanych do profilu firm z różnych branż, w ostatnich latach znacznie wzrosła. Już teraz, dzięki współpracy firm BCC (aktualnie All for One Poland) i Algolytics, firmy korzystające z systemu SAP mogą wdrożyć systemy do analityki predykcyjnej i zintegrować je z podstawowym systemem transakcyjnym.
Systemy Algolytics to sprawdzone rozwiązania wykorzystywane m.in. przez największe firmy telekomunikacyjne czy instytucje finansowe. W 2016 r. zostały okrzyknięte Innowacją Roku 2015 w kategorii Big Data w ramach konkursu BIG DATA: Think Big CEE Congress. Nagroda w tej kategorii przyznawana jest wyróżniającym się na tle konkurencji polskim firmom za wprowadzanie przełomowych technologii i realne oddziaływanie na kształt rynku.
Algolytics od 2001 roku tworzy i dostarcza rozwiązania z zakresu zaawansowanej analityki biznesowej na polskim rynku. Firma rozwija autorskie oprogramowanie do analiz predykcyjnych, zarządzania relacjami z klientem, zarządzania ryzykiem oraz Data Mining; świadczy także zaawansowane usługi analityczne. Rozwiązania Algolytics są pochodną wieloletnich doświadczeń zdobytych w projektach obejmujących analizę predykcyjną oraz modelowanie dużych i rzeczywistych zbiorów danych o klientach. Wśród klientów Algolytics znajdują się czołowe polskie banki i firmy telekomunikacyjne.
Uniwersytet Marii Curie-Skłodowskiej
Posiadanie podstawowej wiedzy z zakresu obsługi komputera oraz pakietu office. Posiadanie wiedzy z zakresu statystyki zgodnie z programem studiuów.
Łącznie 50h , w tym: studiowanie literatury przedmiotu 20h, wykonanie analizy i przygotowanie raportu 20h, przygotowanie do egzaminu 10h. 2 ECTS
Łącznie 45h, w tym 15h wykładu oraz 30h laboratorium. 2 ECTS
a) godziny kontaktowe (z udziałem nauczyciela akademickiego):
2. Obszar data mining - wykonanie projektu głębokiej eksploracji danych, poszukiwanie prawidłowości w opracowanej hurtowni danych, analizy statystyczne danych, analityka decyzyjna oraz predykcyjna z wykorzystaniem dedykowanego oprogramowania data minig - samodzielne przygotowanie projektu przez studentów na podstawie zaleceń prowadzącego,
1. Obszar hurtowni danych oraz big data: zbudowanie hurtowni danych w oparciu o wskazówki prowadzącego, oczyszczenie danych (redukcja szumów oraz błędów), zaawansowane przekształcenia danych, łączenie danych z różnych źródeł, zapytania w języku M - kolokwium
Efekty kształcenia będą weryfikowane w oparciu o dwa obszary:
• Egzamin pisemny w formie testu. Zostanie przygotowana baza pytań, z której każdy ze studentów będzie miał losowaną stosowną ilość pytań. Pytania będą jednokrotnego oraz wielokrotnego wyboru, będzie należało uzupełnić luki, dopasować braki itp.
Duża część obecnie wytwarzanych danych ma specyficzne właściwości: są wysoce zróżnicowane, złożone i zazwyczaj słabo ustrukturyzowane. Wstępnie uporządkowane są zazwyczaj cyfrowe dane gromadzone przez instytucje publiczne, korporacje i organizacje pozarządowe. Natomiast dane generowane przez media społecznościowe, logowania na serwery, zakupy w sieci, systemy geolokacji czy odczyty sensorów są słabo ustrukturyzowane. Celem kursu jest zapoznanie uczestników z zasadami budowania dużych zbiorów danych (hurtownie danych, big data) oraz sposobami automatycznego czyszczenia i porządkowania tych zbiorów. Możliwości wykorzystania big data rosną wraz z rozwojem sztucznej inteligencji i opartych na niej nowych narzędziach i technologiach analizy, w tym: uczenia maszynowego (machine learning) i uczenia głębokiego (deep learning). W rezultacie dane są pozyskiwane, przetwarzane, analizowane i wizualizowane coraz szybciej i efektywniej. Możliwości jakie dają nam hurtownie danych coraz częściej wykorzystywane są data mining'u. Zgłębianie danych (data mining) to proces analityczny, przeznaczony do badania dużych zasobów danych (zazwyczaj powiązanych z zagadnieniami gospodarczymi lub rynkowymi) w poszukiwaniu regularnych wzorców oraz systematycznych współzależności pomiędzy zmiennymi, a następnie do oceny wyników poprzez zastosowanie wykrytych wzorców do nowych podzbiorów danych. Finalnym celem data mining jest najczęściej przewidywanie (zachowań klientów, wielkości sprzedaży, prawdopodobieństwa utraty klienta itp.), dlatego też predykcyjny data mining jest bardzo popularny. Predykcyjny data mining daje bezpośrednie korzyści biznesowe. W trakcie kursu studenci zostaną zapoznani z zasadami realizacji zadań z wykorzystaniem technik data mining'u, a także z wybranym oprogramowaniem wspierającym wykorzystanie technik głębokiej eksploracji danych.
3. Data Mining, czyli wyszukiwanie informacji w zbiorach danych, Marcin Urbański, Wiedza i Praktyka, 2015,
2. Data science od podstaw. Analiza danych w Pythonie, Grus Joel, 2020
3. Big data, nauka o danych i AI bez tajemnic?, David Stephenson, 2019
2. POWER BI I POWER PIVOT DLA EXCELA. ANALIZA DANYCH, Ferrari Alberto, Russo Marco, Wydawnictwo Helion
1. Power query w Excelu i Power BI, Zbieranie i przekształcania danych, Gil Raviv
Efekty uczenia się: