Najważniejsze informacje

BESTSELLER!
Tytuł szkolenia
Big Data dla Data Scientist
Czas trwania
3 dni
Odbywa się w miastach
Wrocław,
Warszawa,
Kraków,
Katowice
Ceny
1899 zł netto
Kod szkolenia
BIG_DATA_6

Vouchery z roczną ważnością

Istnieje możliwość wykupienia vouchera z roczną ważnością. Można zakupić przedpłaconą usługę szkoleniową w jednym okresie rozliczeniowym, a zrealizować w innym. Wpłacana kwota jest dowolna. Vouchery są ważne przez rok. W celu uzyskania szczegółowych informacji prosimy o kontakt z biurem.


Szkolenie z tabletem

Istnieje możliwość wykupu szkolenia wraz z tabletem. Na tablecie dostarczane są materiały szkoleniowe. Urządzenie w takiej sytuacji jest traktowane jako nośnik.



Szkolenie zamknięte

Istnieje możliwość organizacji szkolenia zamkniętego w siedzibie klienta lub w naszych salach. Przy grupach 4 i więcej osób może to być korzystniejsze cenowo. Ponadto istnieje możliwość dostosowania programu szkolenia do potrzeb klienta.
Skontaktuj się z nami by dowiedzieć się więcej

Opis szkolenia

Szkolenie adresowane jest do analityków danych (Data Scientist) którzy w swojej codziennej pracy zmierzają się z problemem analizy danych w dużych zbiorach. Każdy wykład poparty jest ćwiczeniami praktycznymi. Szkolenie ze względu na swój praktyczny charakter odbywa się w małych grupach i jest prowadzone przez praktyków z wieloletnim doświadczeniem.

Program

  1. Wprowadzenie
    • Czym jest Big Data
    • Cele i historia powstania
    • Typowe zastosowania
  2. Apache Hadoop
    • Wprowadzenie do platformy Hadoop
    • HDFS
      • Składowanie danych w HDFS
      • Korzystanie z interfejsu WWW
      • Korzystanie z CLI
    • MapReduce i YARN
      • Wprowadzenie do paradygmatu MapReduce
      • Architektura klastrów obliczeniowych opartych o YARN
      • Tworzenie i uruchamianie zadań MapReduce
      • Hadoop Streaming
  3. Apache Hive
    • Wprowadzenie
    • Architektura
    • Tabele zewnętrzne i wewnętrzne
    • Przetwarzanie danych za pomocą języka HiveQL
  4. HBase
    • Wprowadzenie do baz NoSQL na przykładzie HBase
    • Model danych
    • Korzystanie za pomocą CLI
    • Dostęp do danych za pomocą Hive i Pig
  5. Spark
    • Wprowadzenie do rozproszonych kolekcji obiektów Resilient Distributed Datasets (RDDs) i porównanie z Hadoop MapReduce
    • Tworzenie i uruchamianie zadań
    • Spark SQL
    • Spark Streaming
    • Spark MLlib i GraphX
  6. Język R
    • Wprowadzenie
    • Typy i struktury danych
    • Podstawy języka R
    • Przydatne pakiety
    • Prezentacja wyników

Szkolenia poprzedzające

Szkolenia kontynuujące

Proponowane terminy

Termin od Do Miasto Cena Opcje
05-11-2018 07-11-2018 Kraków 1899 zł netto Rezerwuj Pokaż
05-11-2018 07-11-2018 Katowice 1899 zł netto Rezerwuj Pokaż
05-11-2018 07-11-2018 Wrocław 1899 zł netto Rezerwuj Pokaż
05-11-2018 07-11-2018 Warszawa 1899 zł netto Rezerwuj Pokaż