GUIDE STUDIO BLOG — DATA MINING

By Weronika Skotnicka

RapidMiner Documentation

Documentation 9.10 (Latest) 9.9 9.8 9.7 9.6 9.5 9.4 9.3 9.2 9.1 9.0 8.2 8.1 8.0 7.6 Radoop RapidMiner Radoop

You are viewing the RapidMiner Radoop documentation for version 9.6 - Check here for latest version

RapidMiner Radoop: Big Data Predictive Analytics

RapidMiner Radoop provides an easy-to-use graphical interface for analyzing data on a Hadoop cluster with a running Hive server. This introduction provides a quick description of the software and the capabilities of the solution for processing and analyzing big data.

Understanding the basic architecture

RapidMiner Radoop is client software with an intuitive graphical user interface. Radoop requires your Hadoop cluster to be accessible from the client running RapidMiner Studio (and RapidMiner Server, if applicable). The diagram below shows the basic architecture of the RapidMiner Radoop solution on RapidMiner Studio:

You can also use RapidMiner Radoop on RapidMiner Server for scheduling and managing client-created processes, as well as for collaboration and as a web reporting interface. The diagram below incorporates RapidMiner Server to show the basic architecture of the complete solution:

Documentation overview

This document, RapidMiner Radoop Overview, provides some background and resource material for using Radoop. It assumes that you are already familiar with using RapidMiner Studio.

The document provides:

RapidMiner Radoop for Data Science

Key highlights

Category

Modernize Architecture

About RapidMiner

RapidMiner is the global leader in open source data science. Our unified data science platform accelerates the process of creating predictive analytics models and makes it easy to embed results into business applications. A community of over 200,000 users trust RapidMiner to do real data science, fast and simple.

GUIDE STUDIO BLOG — DATA MINING

Nazwa oprogramowania Opis Licencja

SAS Data Mining Statistical Analysis System (SAS) to produkt opracowany przez SAS Institute do analizy i zarządzania danymi. SAS może zbierać dane, zmieniać je, zarządzać danymi z różnych źródeł i przeprowadzać analizy statystyczne. Zapewnia graficzny interfejs użytkownika dla użytkowników nietechnicznych.

SAS Data Miner pozwala użytkownikom analizować Big Data i uzyskać dokładny wgląd w podejmowanie decyzji w odpowiednim czasie. SAS ma rozproszoną architekturę przetwarzania pamięci, która jest wysoce skalowalna. Dobrze nadaje się do eksploracji danych, eksploracji i optymalizacji tekstu. Oprogramowanie płatne

Oracle Data Mining Komponent Oracle Advance Analytics, oprogramowanie do eksploracji danych Oracle, zapewnia doskonałe algorytmy eksploracji danych do klasyfikacji, przewidywania, regresji i specjalistycznych analiz, które umożliwiają analitykom analizowanie spostrzeżeń, tworzenie lepszych prognoz, kierowanie do najlepszych klientów, identyfikowanie możliwości sprzedaży krzyżowej i wykrywanie oszustw.

Algorytmy zaprojektowane w ODM wykorzystują potencjalne zalety bazy danych Oracle. Funkcja eksploracji danych SQL może wykopać dane z tabel, widoków i schematów bazy danych.

GUI Oracle Data Miner to rozszerzona wersja Oracle SQL Developer. Zapewnia możliwość bezpośredniego „przeciągania i upuszczania” danych wewnątrz bazy danych do użytkowników, zapewniając tym samym lepszy wgląd. Licencja płatna

Rapid Miner Rapid Miner jest jednym z najlepszych systemów analizy predykcyjnej opracowanym przez firmę o tej samej nazwie co Rapid Miner. Jest napisany w języku programowania JAVA. Zapewnia zintegrowane środowisko do głębokiego uczenia się, eksploracji tekstu, uczenia maszynowego i analizy predykcyjnej.

Narzędzie może być używane w szerokim zakresie aplikacji, w tym w aplikacjach biznesowych, aplikacjach komercyjnych, szkoleniach, edukacji, badaniach, tworzeniu aplikacji, uczeniu maszynowym.

Rapid Miner oferuje serwer zarówno jako infrastrukturę lokalną, jak i infrastrukturę chmury publicznej / prywatnej. Podstawą jest model klient / serwer. Rapid Miner zawiera ramy oparte na szablonach, które umożliwiają szybką dostawę przy zmniejszonej liczbie błędów (które są dość często oczekiwane w procesie ręcznego pisania kodu).

Rapid Miner składa się z trzech modułów, a mianowicie:

Rapid Miner Studio - Ten moduł służy do projektowania przepływu pracy, tworzenia prototypów, sprawdzania poprawności itp.

Rapid Miner Server - do obsługi predykcyjnych modeli danych utworzonych w studio

Rapid Miner Radoop - Wykonuje procesy bezpośrednio w klastrze Hadoop, aby uprościć analizę predykcyjną. Licencja płatna

Orange Orange to doskonały pakiet oprogramowania do uczenia maszynowego i eksploracji danych. Najlepiej wspomaga wizualizację danych i jest oprogramowaniem opartym na komponentach. Został napisany w języku obliczeniowym Python.

Ponieważ jest to oprogramowanie oparte na komponentach, składniki nazywane są „widżetami”. Widgety te obejmują wizualizację danych i przetwarzanie wstępne, a także ocenę algorytmów i modelowanie predykcyjne.

Widżety oferują takie ważne funkcje, jak

Wyświetlanie tabeli danych i wybieranie funkcji

Czytanie danych

Predyktory treningowe i porównanie algorytmów uczenia się

Wizualizacja elementów danych itp.

Dodatkowo Orange wprowadza bardziej interaktywny i zabawny klimat do nudnych narzędzi analitycznych. Jest dość interesujący w obsłudze.

Dane przychodzące do Orange są szybko formatowane do żądanego wzoru i mogą być łatwo przenoszone tam, gdzie jest to potrzebne, po prostu przesuwając / odwracając widżety. Użytkownicy są zafascynowani Orange. Orange pozwala użytkownikom podejmować mądrzejsze decyzje w krótkim czasie, szybko porównując i analizując dane. Open Source