Najważniejsze informacje

Tytuł szkolenia
Big Data dla Administratorów
Czas trwania
4 dni
Odbywa się w miastach
Wrocław,
Warszawa,
Kraków,
Katowice,
Gdańsk
Ceny
2199 zł netto
Kod szkolenia
BIG_DATA_4

Vouchery z roczną ważnością

Istnieje możliwość wykupienia vouchera z roczną ważnością. Można zakupić przedpłaconą usługę szkoleniową w jednym okresie rozliczeniowym, a zrealizować w innym. Wpłacana kwota jest dowolna. Vouchery są ważne przez rok. W celu uzyskania szczegółowych informacji prosimy o kontakt z biurem.


Szkolenie z tabletem

Istnieje możliwość wykupu szkolenia wraz z tabletem. Na tablecie dostarczane są materiały szkoleniowe. Urządzenie w takiej sytuacji jest traktowane jako nośnik.



Szkolenie zamknięte

Istnieje możliwość organizacji szkolenia zamkniętego w siedzibie klienta lub w naszych salach. Przy grupach 4 i więcej osób może to być korzystniejsze cenowo. Ponadto istnieje możliwość dostosowania programu szkolenia do potrzeb klienta.
Skontaktuj się z nami by dowiedzieć się więcej

Opis szkolenia

Szkolenie adresowane jest dla administratorów chcących zdobyć gruntowną wiedzę na temat instalacji, konfiguracji i rozwiązywania problemów w dużych klastrach Big Data. Każdy wykład poparty jest ćwiczeniami praktycznymi. Szkolenie ze względu na swój praktyczny charakter odbywa się w małych grupach i jest prowadzone przez praktyków z wieloletnim doświadczeniem.

Program

  1. Wprowadzenie
    • Czym jest Big Data
    • Cele i historia powstania
    • Typowe zastosowania
    • Przegląd Apache Hadoop & Family
    • Przegląd dostępnych dystrybucji
  2. Przygotowanie klastra obliczeniowego
    • Architektura rozwiązań Big Data
    • Organizacja infrastruktury i topologii klastra obliczeniowego
    • Instalacja i konfiguracja systemów operacyjnych
    • Instalacja i konfiguracja wybranych elementów ekosystemu Big Data
      • HDFS
      • YARN i MapReduce
      • HBase
      • Hive
      • Pig
      • Oozie
      • Spark
    • Instalacja klastra za pomocą Ambari
    • Instalacja komponentów z repozytoriów systemowych
  3. Przegląd narzędzi Big Data
    • HDFS
      • Architektura i topologia klastra
      • Konsola HDFS
      • Użytkownicy i system uprawnień do plików
      • Administracja HDFS
      • Rebalansowanie klastra
      • Snapshoty
      • WebHDFS, HttpFS
      • Montowanie w lokalnym systemie – NFS, Fuse
      • Tworzenie kopii zapasowych za pomocą narzędzia Distcp
    • YARN
      • Omówienie architektury złożonych klastrów opartych o YARN
      • Konfiguracja podstawowych parametrów
      • Scheduler – kolejkowanie zadań i współdzielenie zasobów pomiędzy usługami
      • Uruchamianie i zarządzanie procesami
    • MapReduce
      • Wprowadzenie do paradygmatu
      • Architektura działania MapReduce w oparciu o YARN
      • Uruchamianie zadań na klastrze obliczeniowym
      • Hadoop Streaming
      • Konfiguracja w celu podniesienia wydajności systemu
      • Rozwiązywanie typowych problemów
    • Oozie
      • Omówienie architektury
      • Uruchamianie i zarządzanie przepływem zadań w klastrze
      • Administracja
    • Hbase
      • Architektura
      • Konsola HBase
      • Integracja z MapReduce i Hive
      • Zarządzanie i konfiguracja
    • Agregacja danych za pomocą narzędzia Apache Flume
    • Spark
      • Wprowadzenie do rozproszonych kolekcji obiektów Resilient Distributed
      • Datasets (RDDs) i porównanie z Hadoop MapReduce
      • Przetwarzanie w pamięci a z dysku
      • Uruchamianie zadań na klastrze obliczeniowym
      • Architektura
      • Zagadnienia administracyjne
    • Hive
      • Architektura
      • Podstawy języka zapytań HiveQL
      • Rodzaje tabel i zarządzanie danymi w Hive
      • Administracja
      • Integracja z Apache Tez
    • Pig
      • Architektura
      • Podstawy języka Pig Latin
      • Administracja
    • Graficzny interfejs użytkownika na przykładzie Hue
  4. Pozostałe zagadnienia administracyjne
    • Monitorowanie usług
      • Ambari
      • Grafana
      • Ganglia
      • Nagios
    • Lokalizacja i wykorzystanie plików log
    • Aktualizacja narzędzi i całych dystrybucji do wyższych wersji
    • HA w ekosystemie Apache Hadoop & Family
    • Bezpieczeństwo danych i uprawnienia

Szkolenia poprzedzające

Szkolenia kontynuujące

Proponowane terminy

Termin od Do Miasto Cena Opcje
11-06-2018 14-06-2018 Kraków 2199 zł netto Rezerwuj Pokaż
11-06-2018 14-06-2018 Warszawa 2199 zł netto Rezerwuj Pokaż
11-06-2018 14-06-2018 Katowice 2199 zł netto Rezerwuj Pokaż
11-06-2018 14-06-2018 Wrocław 2199 zł netto Rezerwuj Pokaż
27-08-2018 30-08-2018 Kraków 2199 zł netto Rezerwuj Pokaż
27-08-2018 30-08-2018 Warszawa 2199 zł netto Rezerwuj Pokaż
27-08-2018 30-08-2018 Katowice 2199 zł netto Rezerwuj Pokaż
27-08-2018 30-08-2018 Wrocław 2199 zł netto Rezerwuj Pokaż
22-10-2018 25-10-2018 Kraków 2199 zł netto Rezerwuj Pokaż
22-10-2018 25-10-2018 Warszawa 2199 zł netto Rezerwuj Pokaż
22-10-2018 25-10-2018 Katowice 2199 zł netto Rezerwuj Pokaż
22-10-2018 25-10-2018 Wrocław 2199 zł netto Rezerwuj Pokaż
17-12-2018 20-12-2018 Kraków 2199 zł netto Rezerwuj Pokaż
17-12-2018 20-12-2018 Warszawa 2199 zł netto Rezerwuj Pokaż
17-12-2018 20-12-2018 Katowice 2199 zł netto Rezerwuj Pokaż
17-12-2018 20-12-2018 Wrocław 2199 zł netto Rezerwuj Pokaż