Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Najbliższe terminy tego szkolenia
Skuteczność
Program szkolenia
- Wprowadzenie
- Czym jest Big Data
- Cele i historia powstania
- Typowe zastosowania
- Big Data a Data Science
- Big Data a bazy relacyjne
- Przechowywanie danych i warstwa przetwarzania - Apache Hadoop
- Wprowadzenie
- HDFS
- Architektura
- Rozproszone przechowywanie informacji
- Bezpieczeństwo danych
- Korzystanie z CLI
- YARN
- Czym jest YARN i powody powstania
- Architektura klastrów obliczeniowych opartych o YARN
- Zarządzanie zasobami
- MapReduce
- Tez
- Uruchamiamy klaster na AWS (Część warsztatowa)
- HDFS CLI
- YARN CLI
- Metody przetwarzania danych - Hive
- Czym jest Hive?
- Zarządzanie strukturami danych
- HiveQL
- Metody dostępu do danych (Część warsztatowa)
- Hue
- CLI
- JDBC
- Formaty danych
- Partycjonowanie danych
- Rodzaje formatów danych
- Transformacja między formatami danych
- Przetwarzanie formatów danych (część warsztatowa)
- Metody przetwarzania danych - Spark
- Zasada działania
- Wykorzystanie z poziomu języków programowania
- Spark SQL
- Przykładowe zadanie w Sparku (część warsztatowa)
- HBase
- Wprowadzenie do baz NoSQL na przykładzie HBase
- Architektura
- Model danych
- Korzystanie za pomocą CLI
- Metody dostępu do danych
- Przegląd narzędzi w świecie Big Data
- Zarządzanie harmonogramami zadań (Oozie)
- Narzędzia ETL (Flume, Sqoop)
- Kafka
- Administracja
- Topologia klastrów obliczeniowych w Big Data
- Metody instalacji narzędzi
- Zarządzanie i Monitoring
- Warsztat - kompleksowe wdrożenie
- Uruchamiamy klaster
- Ładujemy dane z zewnętrznych źródeł
- Przetwarzamy i analizujemy dane
- Eksport danych do zewnętrznego systemu
Opis szkolenia
Szkolenie odbywa się na żywo z udziałem trenera. Nie jest to forma kursu video!O szkoleniu
Techniczne pięciodniowe wprowadzenie do zagadnień Big Data. Szkolenie ma na celu wprowadzenie osób nie mających styczności z Big Data do tej tematyki. Zawiera przegląd najpopularniejszych narzędzi wykorzystywanych w Big Data z uwzględnieniem ich praktycznych zastosowań. Każdy wykład poparty jest ćwiczeniami praktycznymi. Szkolenie ze względu na swój praktyczny charakter odbywa się w małych grupach i jest prowadzone przez praktyków z wieloletnim doświadczeniem.Podczas szkolenia zostanie pokazane realne wykorzystanie prezentowanych technologii.Dla kogo?
Dla bazodanowców, administratorów, programistów. Uczestnik powinien znać podstawy baz danych. Szkolenie przeznaczone jest dla osób mających doświadczenie w IT. Ze względu na warsztatową część wymagana jest znajomość podstaw SQL.Stanowisko robocze

Do tego szkolenia każdy uczestnik otrzymuje dostęp do indywidualnej wirtualnej maszyny w chmurze. Ma ona zainstalowane i skonfigurowane wszystko co potrzebne do realizacji szkolenia. Maszyna będzie dostępna przez cały okres szkolenia.
Gdy na jakiś termin zgłosi się minimalna liczba osób, termin oznaczamy jako gwarantowany.
Jeśli jakiś termin oznaczony jest jako gwarantowany to oznacza to, że na 100% się odbędzie we wskazanym czasie i miejscu.
Nawet gdyby część takiej grupy zrezygnowała lub przeniosła się na inny termin, raz ustalony termin gwarantowany takim pozostaje.
Ewentualne ryzyko ponosimy my jako organizator.
Przejdź do terminów tego szkolenia

Sprawdź, co mówią o nas ci, którzy nam zaufali
Trenerzy kategorii Big Data


Jestem programistą z 12-sto letnim doświadczeniem, związanym głównie z ekosystemem Javy, ale również Pythonem, bazami danych, zagadnienami DevOps (Docker, Kubernetes, CI/CD pipelines) i frameworkami JavaScriptowymi. Moja ścieżka kariery prowadziła mnie przez różne branże – od telekomunikacyjnej, przez medyczną, bankową, do giełdy energii – dzięki czemu mogłem poznać wiele technologii i ich zastosowań w poszczególnych obszarach. Od kilku lat zaangażowany jestem w prowadzenie szkoleń i warsztatów, bo wierzę, że najlepszym sposobem na naukę jest przekazywanie wiedzy innym.