Wprowadzenie do Big Data - szkolenie w formie warsztatowej
Najbliższe terminy tego szkolenia
Standardy JSystems
- Wszyscy nasi trenerzy muszą być praktykami i osiągać średnią z ankiet minimum 4.75 na 5. Nie ma wśród nas trenerów-teoretyków. Każdy trener JSystems ma bogate doświadczenie komercyjne w zakresie tematów z których prowadzi szkolenia.
- Wszystkie szkolenia mają format warszatowy. Każde zagadnienie teoretyczne jest poparte rzędem warsztatów w ściśle określonym formacie.
- Terminy gwarantowane na 100%. Jeśli jakiś termin jest oznaczony jako gwarantowany, oznacza to że odbędzie się nawet jeśli część grupy wycofa się z udziału. Ryzyko ponosimy my jako organizator.
- Do każdego szkolenia które wymaga jakiegokolwiek oprogramowania dostarczamy skonfigurowane, gotowe hosty w chmurze. Dzięki temu uczestnik nie musi nic instalować na swoim komputerze (i bić się z blokadami korporacyjnymi). Połączenie następuje przez zdalny pulpit lub SSH - w zależności od szkolenia.
Program szkolenia
- Wprowadzenie
- Czym jest Big Data
- Cele i historia powstania
- Typowe zastosowania
- Big Data a Data Science
- Big Data a bazy relacyjne
- Przechowywanie danych i warstwa przetwarzania - Apache Hadoop
- Wprowadzenie
- HDFS
- Architektura
- Rozproszone przechowywanie informacji
- Bezpieczeństwo danych
- Korzystanie z CLI
- YARN
- Czym jest YARN i powody powstania
- Architektura klastrów obliczeniowych opartych o YARN
- Zarządzanie zasobami
- MapReduce
- Tez
- Uruchamiamy klaster na AWS (Część warsztatowa)
- HDFS CLI
- YARN CLI
- Metody przetwarzania danych - Hive
- Czym jest Hive?
- Formaty danych
- Zarządzanie strukturami danych
- HiveQL
- Metody dostępu do danych (Część warsztatowa)
- Hue
- CLI
- JDBC
- Metody przetwarzania danych - Spark
- Zasada działania
- Wykorzystanie z poziomu języków programowania
- Spark SQL
- Przykładowe zadanie w Sparku (część warsztatowa)
- Przegląd narzędzi w świecie Big Data
- Zarządzanie harmonogramami zadań (Oozie)
- Narzędzia ETL (Flume, Sqoop)
- Kafka
- Całodniowy warsztat - kompleksowe wdrożenie
- Uruchamiamy klaster
- Ładujemy dane z zewnętrznych źródeł
- Przetwarzamy i analizujemy dane
- Eksport danych do zewnętrznego systemu
Opis szkolenia
Szkolenie odbywa się na żywo z udziałem trenera. Nie jest to forma kursu video!Stanowisko robocze
Do tego szkolenia każdy uczestnik otrzymuje dostęp do indywidualnej wirtualnej maszyny w chmurze. Ma ona zainstalowane i skonfigurowane wszystko co potrzebne do realizacji szkolenia. Maszyna będzie dostępna przez cały okres szkolenia.
Gdy na jakiś termin zgłosi się minimalna liczba osób, termin oznaczamy jako gwarantowany.
Jeśli jakiś termin oznaczony jest jako gwarantowany to oznacza to, że na 100% się odbędzie we wskazanym czasie i miejscu.
Nawet gdyby część takiej grupy zrezygnowała lub przeniosła się na inny termin, raz ustalony termin gwarantowany takim pozostaje.
Ewentualne ryzyko ponosimy my jako organizator.
Przejdź do terminów tego szkolenia
Sprawdź, co mówią o nas ci, którzy nam zaufali
Trenerzy kategorii Big Data
Jestem programistą z 12-sto letnim doświadczeniem, związanym głównie z ekosystemem Javy, ale również Pythonem, bazami danych, zagadnienami DevOps (Docker, Kubernetes, CI/CD pipelines) i frameworkami JavaScriptowymi. Moja ścieżka kariery prowadziła mnie przez różne branże – od telekomunikacyjnej, przez medyczną, bankową, do giełdy energii – dzięki czemu mogłem poznać wiele technologii i ich zastosowań w poszczególnych obszarach. Od kilku lat zaangażowany jestem w prowadzenie szkoleń i warsztatów, bo wierzę, że najlepszym sposobem na naukę jest przekazywanie wiedzy innym.