Przetwarzanie dużych zbiorów danych za pomocą Cloudera / Hortonworks Data Platform

Najbliższe terminy szkoleń

Opis szkolenia

Opis szkolenia: Szkolenie ma na celu wprowadzenie osób nie mających styczności z Big Data do tej tematyki. Szkolenie zawiera przegląd najpopularniejszych narzędzi wykorzystywanych w Big Data z uwzględnieniem ich praktycznych zastosowań. Każdy wykład poparty jest ćwiczeniami praktycznymi. Szkolenie ze względu na swój praktyczny charakter odbywa się w małych grupach i jest prowadzone przez praktyków z wieloletnim doświadczeniem. Czas trwania: 5 dni

Vouchery

Istnieje możliwość wykupienia vouchera z roczną ważnością. Można zakupić przedpłaconą usługę szkoleniową w jednym okresie rozliczeniowym, a zrealizować w innym.

Czas trwania 5 dni
Poziom trudności Trudny
Cena kursu 3499,00 PLN (netto)

Czy wiesz, że możemy takie szkolenie zorganizować specjalnie dla Twojej firmy?

Dowiedz się więcej

Czego się nauczysz?

Program szkolenia:

  1. Wprowadzenie
    • Czym jest Big Data
    • Cele i historia powstania
    • Typowe zastosowania
  2. Apache Hadoop
    • Wprowadzenie
    • HDFS
      • Architektura
      • Korzystanie z CLI
      • Java API dla HDFS
    • YARN i MapReduce
      • Wprowadzenie do paradygmatu MapReduce
      • Czym jest YARN i powody powstania
      • Architektura rozproszonych klastrów obliczeniowych YARN
      • Uruchamianie zadań na klastrze z użyciem YARN (MR/TEZ/Spark)
      • Konfiguracja i zarządzanie
  3. Apache Hive
    • Wprowadzenie
    • Architektura
    • Tabele zewnętrzne i wewnętrzne
    • Przetwarzanie danych za pomocą języka HiveQL
  4. HBase
    • Wprowadzenie do baz NoSQL na przykładzie HBase
    • Architektura
    • Model danych
    • Korzystanie za pomocą CLI
    • Java API i inne metody dostępu do danych
  5. Spark
    • Wprowadzenie
    • Architektura
    • Wprowadzenie do rozproszonych kolekcji obiektów Resilient Distributed Datasets (RDDs) i porównanie z Hadoop MapReduce
    • Tworzenie i uruchamianie zadań
    • Spark SQL
    • Spark (Structured) Streaming
  6. Apache Kafka
    • Wprowadzenie
    • Architektura
    • Korzystanie z Producen Consumer API
    • Kafka Streams
    • Zarządzanie klastrami Kafka
  7. Wizualizacja danych
    • Zeppelin
    • Jupyter
    • Superset
    • HUE
  8. Administracja
    • Topologia klastrów obliczeniowych w Big Data
    • Metody instalacji narzędzi
    • Zarządzanie i Monitoring
  9. Bezpieczeństwo
    • Kerberos
    • Ranger
    • Knox
  10. Przegląd innych narzędzi
    • Oozie
    • Druid
    • Zookeeper
    • Solr
    • Storm
    • Atlas
    • Accumulo
    • Sqoop

Co wyróżnia szkolenia Big Data w JSystems?

Szkolenia na wysokim poziomie
Instruktorzy praktycy z wieloletnim doświadcze- niem
Znaczna część szkolenia to warsztaty
Komfortowe sale i przestrzeń wspólna
Małe grupy szkoleniowe
Gwarantowane terminy szkoleń
Dużo ćwiczeń
Przystępne ceny

Potrzebujesz więcej informacji?

Wiadomość wysłana

Przyjęliśmy Twoją wiadomość i skontaktujemy się z Tobą w tej sprawie

Klikając OK wrócisz do formularza

Gdzie prowadzimy szkolenia?

Warszawa (siedziba firmy) Grójecka 1/3, 02-019
Kraków
Wrocław
Katowice

Nasza strona korzysta z plików cookie. Możesz zmienić zasady ich używania lub zablokować pliki cookie w ustawieniach przeglądarki. Więcej informacji można znaleźć w Polityce prywatności. Kontynuując korzystanie ze strony, wyrażasz zgodę na używanie plików cookie.