Analityka predykcyjna – analiza umożliwiająca prognozowanie przyszłości
Eksploracja danych - Metody i algorytmy (Morzy Tadeusz)
Opis
Rozwój oraz upowszechnienie rozwiązań technologicznych służących gromadzeniu informacji sprawiły, że we wszystkich obszarach działalności człowieka mamy do czynienia z przechowywaniem i przetwarzaniem danych. Zazwyczaj są one wykorzystywane jedynie w bieżącej działalności instytucji je gromadzących; analiza i interpretacja danych może jednak dostarczyć istotnej wiedzy na temat reguł i zależności rządzących procesami biznesowymi, zachowaniami konsumentów i zagrożeniami funkcjonowania firmy. Eksploracja danych to nowa dziedzina informatyki odpowiadająca na potrzebę zaawansowanej i automatycznej analizy informacji. Jej dynamiczny rozwój wynika z konieczności integracji istniejących algorytmów w celu efektywnego przetwarzania dużej ilości nowych typów danych. Obecnie, wraz z rozwojem narzędzi do generowania i przechowywania danych, eksploracji poddawane są coraz bardziej złożone informacje: multimedialne (zdjęcia, filmy, muzyka), przestrzenne (mapy), przebiegi czasowe, struktury chemiczne (sekwencje DNA), sieci społecznościowe. Niniejsza książka jest pierwszym na polskim rynku samodzielnym podręcznikiem przedstawiającym metody eksploracji danych w ujęciu algorytmicznym, a nie statystycznym. Zawiera omówienie podstawowych metod eksploracji, min. odkrywanie asocjacji, wzorców sekwencji, klasyfikację i grupowanie. Dla każdej z metod omówiono podstawowe algorytmy eksploracji ilustrowane licznymi przykładami. Dodatkowo, w celu sprawdzenia wiedzy czytelnika, przygotowano zestaw zadań i ćwiczeń do samodzielnego wykonania.Głównymi adresatami podręcznika są studenci informatyki, ekonomii, psychologii, socjologii ? dziedzin, w których duże znaczenie ma przetwarzanie informacji. Z pewnością skorzystają z niego również doktoranci zajmujący się zagadnieniami eksploracji danych i odkrywania wiedzy.
Eksploracja danych i hurtownie danych
Kod przedmiotu: WIM-INF-Z2-EDHD-02 Kod Erasmus / ISCED: (brak danych) / (0619) Komputeryzacja (inne)
Nazwa przedmiotu: Eksploracja danych i hurtownie danych
Grupy:
Punkty ECTS i inne: 0 LUB 4.00 LUB 3.00 (zmienne w czasie)
zobacz reguły punktacji
Język prowadzenia: (brak danych)
Skrócony opis: Zajęcia mają na celu: - Zapoznanie studentów z eksploracja danych i jej głównymi kierunkami rozwoju. - Nabycie umiejętności efektywnego znajdowania zależności i związków między danymi: odkrywanie asocjacji, klastrów, wzorców sekwencji, klasyfikacji (w tym metody jej oceny), odkrywanie podobieństw w przebiegach czasowych, wykrywanie zmian i odchyleń. Eksploracja tekstu i sieci Web. - Uświadomienie problemów i zagrożeń płynących z eksploracji danych - Nabycie umiejętności praktycznego wdrożenia idei eksploracji danych w hurtowniach danych.
Pełny opis: Forma zajęć – WYKŁADY - Liczba godzin 9 W 1-2 - Wprowadzeniem do eksploracji danych. Odkrywanie asocjacji W 3-4 – Algorytmy odkrywania reguł asocjacyjnych. Klastrowanie W 5-6 – Odkrywanie wzorców sekwencji. Odkrywanie klasyfikacji. W 7 – Podstawowe algorytmy grupowania W 8-9 – Hurtownie danych – wprowadzenie, architektura. Projektowanie hurtowni: modele wielowymiarowe W 10 – Ładowanie, transformacje, czyszczenie danych. Aktualizacja hurtowni danych W 11 – Przetwarzanie zapytań w hurtowniach danych W 12-14 – Eksploracja tekstu, sieci web, danych złożonych. W 15 – Problemy odkrywania wiedzy Forma zajęć – LABORATORIA Liczba godzin 18 Zajęcia laboratoryjne mają na celu zastosowanie w praktyce treści podanych ma wykładzie. Zakres zajęć laboratoryjnych obejmuje następujące zagadnienia:
Literatura: R. Brachman, T. Khabaza, W. Kloesgen, G. Piatetsky-Shapiro, E. Simoudis, Industrial applications of data mining and knowledge discovery, Communicatiosn of ACM, 39, 11, 1996. Hand David, Mannila Heikki, Smyth Padhraic, Eksploracja danych, WNT. U. Fayyad, G. Piatetsky-Shapiro, [eds.], Advances in Knowledge Discovery and Data Mining, MIT Press, 1996 Larose Daniel T. Metody i modele eksploracji danych Wydawnictwo Naukowe PWN2008 U. Fayyad, D. Haussler, P. Stolorz, Mining science data, Communications of ACM, 39, 11, 1996. T. Imieliński, H. Manilla, A Database Perspective on Knowledge Discovery, Communications of ACM, 39, 11, 1996. T. Morzy, M. Zakrzewicz, SQL-like languages for database mining, Proc. Int. Conf. On Advances in Databases and Information Systems, 1997. T. Morzy, M. Zakrzewicz, Group Bitmap Index; A Strucure for Association Rules retrieval, Proc. Of 4th Int. Conf. On Knowledge Discovery and Data Mining, AAAI Press, 1998. R. Agrawal, T. Imieliński, A. Swami, Mining Associations between Sets of Items in Massive Databases, SIGMOD-93, Washington, 1993.
Efekty uczenia się: - student posiada wiedzę z zakresu metod eksploracji danych, - student dostrzega zna powiązania pomiędzy eksploracją danych a magazynami i systemami baz danych, - student potrafi dostosowywać techniki eksploracji do danej dziedziny problemu, - student posiada niezbędną wiedzę i doświadczenie praktyczne w znajdowaniu zależności między danymi a zastosowaniem danej technologii eksploracji, - student zna i potrafi stosować algorytmy asocjacji, modele klasyfikacji i metody grupowania danych - student posiada umiejętności praktyczne podparte teorią z dziedziny eksploracji tekstu, sieci Web i danych złożonych - student dostrzega problemy prawne i etyczne związane z eksploracją danych - student zna współczesne techniki związane z hurtowniami danych i potrafi je stosować
Analityka predykcyjna – analiza umożliwiająca prognozowanie przyszłości
Obecnie ogromne ilości danych generowanych przez ludzi poprzez podejmowane przez nich decyzje i działania mogą być automatycznie gromadzone i przetwarzane. Otwiera to szerokie możliwości przed dziedziną, jaką jest analityka predykcyjna. Pozwala ona przekształcać te dane w informacje, dzięki którym możemy przewidywać przyszłe sekwencje zdarzeń i przygotować się na nie. Prognozy te są często wykorzystywane w logistyce 4.0.
Kluczem do sukcesu nie jest samo gromadzenie i zestawianie danych, lecz zdolność ich przekształcenia w przydatne informacje – według raportu Workforce 2020 firmy Oxford Economics umiejętnie radzi sobie z tym zaledwie 42% firm.
Dzięki zastosowaniu analityki predykcyjnej w logistyce operacje stają się bardziej wydajne i precyzyjne, a koszty związane z prowadzoną działalnością ulegają znacznemu ograniczeniu. W niniejszym artykule wyjaśniamy, jak wykorzystać tę metodę.
Definicja analityki predykcyjnej
Analityki predykcyjnej nawiązuje do rodzaju analizy wykorzystującej zarówno dane historyczne, jak i dane pozyskiwane w czasie rzeczywistym w celu przewidywania ludzkiego zachowania, tendencji i nawyków oraz wydajności maszyn.
Te wysoce wiarygodne prognozy umożliwiają podejmowanie lepszych decyzji biznesowych. Przykładowo dzięki analityce predykcyjnej firmy mogą wychodzić naprzeciw zapotrzebowaniu klientów w oparciu o szereg czynników podlegających kontroli, takich jak cena sprzedaży, oraz na podstawie czynników zewnętrznych, w tym kalendarza pracowniczego czy skutków zjawisk meteorologicznych.
W latach 80. i 90. ubiegłego wieku banki i towarzystwa ubezpieczeniowe jako pierwsze zaczęły stosować analitykę predykcyjną za pośrednictwem technik eksploracji danych (ang. „data mining”). Z biegiem czasu prowadzenie analizy predykcyjnej ułatwiły systemy big data i urządzenia IIoT (przemysłowy internet rzeczy). Duże znaczenie mają także coraz większe ilości danych gromadzonych przez firmy w celu ich przetwarzania w czasie rzeczywistym. Rozwój technologii umożliwiającej masowe przetwarzanie informacji znacznie zwiększył możliwości analizy i przekształcenia danych w wiarygodne informacje o charakterze predykcyjnym.
Różnica między analityką opisową, predykcyjną i preskryptywną
Dla lepszego zrozumienia analityki predykcyjnej należy odróżnić ją od innych wykorzystywanych rodzajów analizy danych:
Analityka opisowa: na podstawie danych historycznych powstaje obraz dotychczasowego funkcjonowania firmy. Jest to technika pozwalająca określić rodzaj i liczbę zaistniałych zdarzeń oraz przeanalizować je.
na podstawie danych historycznych powstaje obraz dotychczasowego funkcjonowania firmy. Jest to technika pozwalająca określić rodzaj i liczbę zaistniałych zdarzeń oraz przeanalizować je. Analityka predykcyjna: zakłada przewidywanie lub szacowanie przyszłych wydarzeń na podstawie danych historycznych.
zakłada przewidywanie lub szacowanie przyszłych wydarzeń na podstawie danych historycznych. Analityka preskryptywna: wskazuje, co i jak należy zrobić, aby opracowane prognozy spełniły się lub – w przypadku przewidywanych negatywnych zdarzeń – aby można było ich uniknąć. Wykorzystuje techniki symulacji i optymalizacji dla określenia najdogodniejszego sposobu postępowania.
Celem tego rodzaju analiz jest zgromadzenie wszelkich możliwych danych i przetworzenie ich w informacje niezbędne do zrozumienia zdarzenia zaistniałego lub przewidywanego oraz do określenia koniecznych działań umożliwiających realizację prognozy lub jej uniknięcie.
Zalety analityki predykcyjnej
Analiza predykcyjna i podejmowanie lepszych decyzji dostarczają wielu korzyści przyczyniających się do poprawy rentowności prowadzonego biznesu. W logistyce możliwa jest optymalizacja następujących obszarów:
Analiza zapotrzebowania. Gromadzone są dane dotyczące uprzednich transakcji sprzedaży oraz rynku w celu analizy potencjalnych konsumentów, aby poznać ich oczekiwania.
Gromadzone są dane dotyczące uprzednich transakcji sprzedaży oraz rynku w celu analizy potencjalnych konsumentów, aby poznać ich oczekiwania. Zarządzanie zapasami. Analiza predykcyjna umożliwia precyzyjne prognozowanie poziomów zapasu zabezpieczającego i zapasu minimalnego oraz uniknięcie braku zapasów w magazynie.
Analiza predykcyjna umożliwia precyzyjne prognozowanie poziomów zapasu zabezpieczającego i zapasu minimalnego oraz uniknięcie braku zapasów w magazynie. Planowanie uzupełniania zapasów. Dzięki przewidywaniu zapotrzebowania można sprawnie zarządzać punktem zamawiania danego produktu, zapewniając jego dostępność w magazynie i w punktach sprzedaży, zwiększając w ten sposób poziom zadowolenia klientów.
Dzięki przewidywaniu zapotrzebowania można sprawnie zarządzać punktem zamawiania danego produktu, zapewniając jego dostępność w magazynie i w punktach sprzedaży, zwiększając w ten sposób poziom zadowolenia klientów. Optymalizacja zasobów. Uzyskane informacje umożliwiają lepszą alokację zasobów zarówno rzeczowych, jak i ludzkich.
Uzyskane informacje umożliwiają lepszą alokację zasobów zarówno rzeczowych, jak i ludzkich. Oszczędność kosztów. Analiza predykcyjna pozwala na obniżenie zarówno stałych, jak i zmiennych kosztów operacyjnych.
Prognozowanie danych w drodze analityki predykcyjnej umożliwia przewidywanie przyszłej działalności, najbardziej prawdopodobnego zachowania oraz najbardziej odpowiednich wskaźników (KPI) logistycznych w celu podejmowania decyzji zmierzających do doskonalenia prowadzonej działalności.
Analityka predykcyjna umożliwia przewidywanie zapotrzebowania i efektywne planowanie uzupełniania zapasów
Algorytmy i modele analityki predykcyjnej przy użyciu big data
Analityka predykcyjna wykorzystuje zaawansowane operacje matematyczne, podobnie jak analiza statystyczna czy algorytmy zautomatyzowane, w celu wyszukiwania wzorców wśród danych zebranych za pomocą technologii big data.
Po określeniu celów i wyborze danych należy zastosować algorytmy przyczyniające się do prognozowania przyszłych zdarzeń. W analizie predykcyjnej biorą udział algorytmy, które można podzielić na trzy główne rodzaje:
Algorytmy grupowania: służą do segmentacji klientów, aby ukierunkować kampanię marketingową, określić czas trwania danej oferty lub promocji itp.
służą do segmentacji klientów, aby ukierunkować kampanię marketingową, określić czas trwania danej oferty lub promocji itp. Algorytmy klasyfikacji: ich zadaniem jest zapewnienie lojalności klientów dzięki lepszemu poznaniu ich nawyków i zachowania. Umożliwiają opracowywanie spersonalizowanych ofert, doskonalenie usług lub określanie ewentualnych zamiarów zakupu kolejnych produktów przez klienta.
ich zadaniem jest zapewnienie lojalności klientów dzięki lepszemu poznaniu ich nawyków i zachowania. Umożliwiają opracowywanie spersonalizowanych ofert, doskonalenie usług lub określanie ewentualnych zamiarów zakupu kolejnych produktów przez klienta. Algorytmy regresji: ich celem jest sporządzanie wiarygodnych prognoz w oparciu o obiektywne dane służące m.in. do optymalizacji zarządzania zapasami lub przewidywania wzrostu popytu na dany produkt.
Jak wykazano powyżej, istnieją różne rodzaje algorytmów, z który każdy pełni odmienne funkcje.
Optymalizacja zarządzania zapasami jest łatwiejsza i skuteczniejsza dzięki analityce predykcyjnej
Narzędzia w ramach analizy predykcyjnej
Jakie narzędzia można wdrożyć w celu wykorzystywania analityki predykcyjnej w danym modelu biznesowym, a konkretnie w ramach łańcucha dostaw?
Excel: jego zadaniem jest nie tylko zbieranie, ale również porządkowanie wszystkich gromadzonych danych lub wprowadzonych ręcznie w tabeli arkusza, aby zapewnić strukturyzację wszystkich danych na potrzeby analizy.
jego zadaniem jest nie tylko zbieranie, ale również porządkowanie wszystkich gromadzonych danych lub wprowadzonych ręcznie w tabeli arkusza, aby zapewnić strukturyzację wszystkich danych na potrzeby analizy. WMS: systemy zarządzania magazynem, jak np. Easy WMS, to programy, które nieprzerwanie zarządzają czynnościami prowadzonymi w magazynie i przekształcają informacje w dane prognozujące określony scenariusz w celu podejmowania trafniejszych decyzji.
systemy zarządzania magazynem, jak np. Easy WMS, to programy, które nieprzerwanie zarządzają czynnościami prowadzonymi w magazynie i przekształcają informacje w dane prognozujące określony scenariusz w celu podejmowania trafniejszych decyzji. Narzędzia ogólne: wiodące koncerny technologiczne, takie jak m.in. IBM czy Microsoft, posiadają szereg narzędzi do analityki predykcyjnej, które wspomagają firmy w staraniach o zapewnienie lojalności klientów, zwiększenie dochodów czy określenie właściwego momentu zmiany dostawcy. Przykładowo firma IBM posiada rozwiązania z zakresu analiz predykcyjnych, które umożliwiają wyciąganie wniosków dotyczących poziomu zadowolenia klienta w oparciu o zgromadzone informacje.
Należy pamiętać, że choć narzędzia do analityki predykcyjnej oferują bardzo cenne informacje, nie zapewniają bezpośredniej automatyzacji procesu podejmowania decyzji.
Przykład analityki predykcyjnej w logistyce
Wykorzystywanie analityki predykcyjnej w logistyce dotyczy głównie przewidywania zapotrzebowania na dane produkty lub usługi. Przykładowo analityka predykcyjna szczególnie dobrze sprawdza się u operatorów logistycznych, ponieważ umożliwia określenie przyszłych potrzeb, a tym samym optymalizację zarządzania dwoma kluczowymi aspektami: planowaniem floty oraz zarządzaniem zapotrzebowania w magazynie. Cel? Maksymalne wykorzystanie dostępnych zasobów, aby osiągnąć uzgodnione z każdym klientem wymogi w zakresie wydajności.
Taką strategię obrała między innymi firma DHL, która wykorzystuje big data, zaawansowaną analitykę danych oraz machine learning, osiągając średnio 90% skuteczność prognozowania zapotrzebowania w ramach prowadzonej działalności.
Z kolei w odniesieniu do sektora spożywczego warto wymienić magazyn firmy Danone w Madrycie. Ta międzynarodowa firma wdrożyła moduł Supply Chain Analytics umożliwiający weryfikację i analizę wszystkich danych generowanych przez system Easy WMS. Moduł przekształca dane w przydatne informacje w celu zobrazowania czynności w magazynie i podejmowania strategicznych decyzji dotyczących doskonalenia lub przewidywania wszelkich przyszłych zdarzeń.
System zarządzania magazynem Easy WMS gromadzi dane dotyczące magazynu, które można wykorzystać do analizy predykcyjnej
Eksploracja danych w celu przewidywania przyszłości
Analityka predykcyjna to stale rozwijane narzędzie, dzięki któremu firmy zyskują możliwość podejmowania trafniejszych decyzji oraz oceny obecnego modelu biznesowego w celu rozważenia jego przeformułowania, aby sprostać przyszłym wyzwaniom.
Magazyny stanowią bogate źródło danych, które dzięki wdrożeniu systemu zarządzania (WMS) można przekształcić w niezwykle cenne informacje, wspomagające procesy decyzyjne. Jeżeli nie masz jeszcze systemu zarządzania magazynem, skontaktuj się z firmą Mecalux, aby uzyskać wsparcie przy wykorzystaniu technologii takich jak analizy predykcyjne, big data oraz uczenie maszynowe do modernizacji łańcucha dostaw i budowy przewagi konkurencyjnej.