Szkolenia Big Data

by:

Dostępne szkolenia 8

Średnia ocena szkoleń tej kategorii Ocena pochodzi z ankiet

4.89/5

Big Data staje się strategicznym trzonem działalności coraz większej liczby firm zaś sam termin jest mocno dyskutowany na wszystkich konferencjach biznesowych na świecie. Eksperci mówią żartobliwie, że dzisiaj dane są tym samym czym kiedyś była ropa naftowa. Jednakże pomimo rosnącego zapotrzebowania na usługi Big Data, firmom coraz trudniej znaleźć dziś specjalistów do pracy. Według szacunków do 2020 roku deficyt zatrudnienia w tym sektorze w samych Stanach obejmie 4 mln stanowisk zaś „Big Data Scientist” czy „Big Data Architect” są już dziś jednymi z najczęściej poszukiwanych specjalistów w świecie IT. Przetwarzanie dużych zbiorów danych i ich efektywne wykorzystywanie jest dość trudnym zagadnieniem i wymaga szerokiego zakresu kompetencji począwszy od umiejętności administrowania rozproszonymi klastrami obliczeniowymi przez budowanie wydajnych systemów i procesów przetwarzających te dane aż po umiejętności zaawansowanej analizy tych danych.
Chcąc wyjść naprzeciw wyzwaniu jakie stawia dzisiejszemu rynkowi IT coraz większa ilość danych które gromadzimy i konieczność ich efektywnego wykorzystania, opracowaliśmy dla Państwa szereg szkoleń mając na celu pomoc w budowaniu kompetencji niezbędnych do pracy w projektach Big Data.

Terminy gwarantowane

Czy wiesz, że w ramach kategorii Big Data mamy
1 termin gwarantowany? Pokaż

Standardy JSystems

Wszyscy nasi trenerzy muszą być praktykami i osiągać średnią z ankiet minimum 4.75 na 5. Nie ma wśród nas trenerów-teoretyków. Każdy trener JSystems ma bogate doświadczenie komercyjne w zakresie tematów z których prowadzi szkolenia.
Wszystkie szkolenia mają format warszatowy. Każde zagadnienie teoretyczne jest poparte rzędem warsztatów w ściśle określonym formacie.
Terminy gwarantowane na 100%. Jeśli jakiś termin jest oznaczony jako gwarantowany, oznacza to że odbędzie się nawet jeśli część grupy wycofa się z udziału. Ryzyko ponosimy my jako organizator.
Do każdego szkolenia które wymaga jakiegokolwiek oprogramowania dostarczamy skonfigurowane, gotowe hosty w chmurze. Dzięki temu uczestnik nie musi nic instalować na swoim komputerze (i bić się z blokadami korporacyjnymi). Połączenie następuje przez zdalny pulpit lub SSH - w zależności od szkolenia.

Apache Hadoop

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

5 dni

4.77/5

Terminy online

Terminy gwarantowane

Więcej

O szkoleniu w skrócie

Techniczne 5cio dniowe wprowadzenie do zagadnień Big Data. Szkolenie ma na celu wprowadzenie osób nie mających styczności z Big Data do tej tematyki. Zawiera przegląd najpopularniejszych narzędzi wykorzystywanych w Big Data z uwzględnieniem ich praktycznych zastosowań.

Każdy wykład poparty jest ćwiczeniami praktycznymi. Szkolenie ze względu na swój praktyczny charakter odbywa się w małych grupach i jest prowadzone przez praktyków z wieloletnim doświadczeniem.Podczas szkolenia zostanie pokazane realne wykorzystanie prezentowanych technologii.

Dla kogo?

Dla bazodanowców, administratorów, programistów. Uczestnik powinien znać podstawy baz danych. Szkolenie przeznaczone jest dla osób mających doświadczenie w IT. Ze względu na warsztatową część wymagana jest znajomość podstaw SQL.

Cena udziału w szkoleniu 4500 PLN netto

Więcej szczegółów

Architektura systemów Big Data

2 dni

Terminy online

Terminy gwarantowane

Więcej

Szkolenie ma na celu wprowadzenie osób nie mających styczności z Big Data do tej tematyki. Szkolenie zawiera przegląd najpopularniejszych narzędzi wykorzystywanych w Big Data z uwzględnieniem ich praktycznych zastosowań. Szkolenie opisuje również zagadnienie wdrażania rozwiązań Big Data w ramach organizacji i budowania dodatkowych wartości dzięki temu. Grupa docelowa: Architekt, Kierownik, Project Manager (PM).

Cena udziału w szkoleniu 1800 PLN netto

Więcej szczegółów

Apache Kafka

Apache Kafka dla programistów aplikacji klienckich w Javie NOWOŚĆ!

4 dni

Terminy online

Terminy gwarantowane

Więcej

Dlaczego kompleksowe szkolenie z Kafki?

Łatwo jest zacząć używać klientów Kafki w swoich aplikacjach - ale bez dogłębnego zrozumienia tej technologii łatwo jest przeoczyć krytyczne aspekty, które mogą spowodować utratę lub uszkodzenie danych.

Możesz również stracić dużo czasu na rozwiązywanie dobrze znanych problemów w nieoptymalny sposób lub przegapić ważne funkcje, które mogą znacznie obniżyć koszty chmury.

Zakres szkolenia

Te warsztaty zapewnią Ci kompleksowy przegląd wszystkiego, co musisz wiedzieć podczas tworzenia aplikacji, które produkują lub konsumują wiadomości do/z Kafki. Dogłębnie omawiają architekturę Kafki, Producer API, Consumer API oraz wprowadzają do Kafka Connect i Debezium.

Nauczysz się o natywnym kliencie Javy, ale potem będziemy pracować w Spring Boot - jako najpopularniejszym frameworku, w którym tworzone są aplikacje Javy. Nauczysz się, jak konfigurować aplikację, rozumieć jej zachowanie, zapoznać się z różnymi semantykami dostarczania i jak skonfigurować obsługę błędów w sposób kompleksowy i wydajny.

Nauczysz się pisać czyste i efektywne testy integracyjne, jak używać i zarządzać schemami, jak działa bezpieczeństwo Kafki i jak można wykorzystać Kafka Connect i Debezium.

Ponieważ skupimy się na budowaniu aplikacji produkcyjnych, omówimy również distributed tracing i istotne aspekty monitorowania - zarówno dla klientów Kafki (metryki producenta i konsumenta), jak i Topików Kafki.

Co nie będzie omawiane:

Zarządzanie i obsługa klastra Kafka

Te warsztaty są dla deweloperów aplikacji klienckich, nie dotyczą obsługi klastra Apache Kafka, co zwykle robi dedykowany zespół.

Kafka Streams

Kafka Streams jest częścią Kafka API od lat, ale jego użycie maleje na rzecz dedykowanych platform do Stream Processingu, takich jak Flink lub RisingWave. Ze względu na złożoność Kafka Streams, często sytuacje w których mogłyby być użyte efektywnie - zamiast tego używany jest standardowy Consumer API.

Wymagane podstawy

Wcześniejsze doświadczenie z Kafką nie jest konieczne - zaczniemy od podstaw, ale ważne jest, aby mieć dobre podstawy inżynierii oprogramowania - klienci Kafki komunikują się asynchronicznie z systemem rozproszonym, więc aby w pełni wykorzystać te warsztaty - najlepiej mieć kilka lat doświadczenia.

Będziesz także musiał wiedzieć, jak pracować z Dockerem i mieć podstawową znajomość Javy i Springa.

Prowadzący szkolenie:
Jan Siekierski

Programista Java i Kotlin z 10-letnim doświadczeniem, z czego 5 lat jako Tech Lead.

Pasjonat Data Streamingu na którym obecnie koncentruje się w całości. Inne obszary w których się specjalizuje to Architektura Event-Driven, Mikroserwisy, DDD oraz Enterprise Data Architecture.

Obecnie niezależny Konsultant, Trener i Twórca, publikujący głównie na platformie LinkedIn.

Cena udziału w szkoleniu 3600 PLN netto

Więcej szczegółów

Zaawansowana Apache Kafka dla deweloperów aplikacji klienckich w Javie NOWOŚĆ!

2 dni

Terminy online

Terminy gwarantowane

Więcej

O szkoleniu w skrócie

Ten intensywny kurs jest przeznaczony dla doświadczonych deweloperów aplikacji klienckich Kafki, którzy chcą pogłębić swoje zrozumienie tej platformy. Nauczysz się budować wydajne, odporne na błędy aplikacje, unikać utraty danych i świadomie poruszać się w kompromisach między opóźnieniami, przepustowością i spójnością danych. Zbadamy również strategie optymalizacji kosztów i przedstawimy narzędzia open-source, które rozwiązują zaawansowane problemy.

Ćwiczenia z kodowania

To są warsztaty praktyczne, więc wiele tematów jest uzupełnionych o zazwyczaj krótkie ćwiczenia z kodowania.

Zakres szkolenia

Zgłębimy zaawansowane tematy związane z Kafka Producer API i Consumer API. Omówimy wybrane zaawansowane aspekty architektury Kafki oraz najnowsze zmiany, w tym Tiered Storage i Kafka Queues. Warsztaty obejmują również zwięzłe moduły dotyczące testowania klientów Kafki, integracji ze Spring Boot oraz integracji danych za pomocą Kafka Connect.

Co nie wchodzi w zakres

Podstawy Kafki

Uczestnicy powinni rozumieć, jak działa klaster Kafki, czym są partycje, konsumenci i producenci. Powinni również rozumieć działanie Consumer Groups, Consumers i Offsets.

Wskazane jest doświadczenie produkcyjne w tworzeniu aplikacji klienckich Kafki.

Schema Management i formaty serializacji

Chociaż jest to bardzo ważny temat, aby warsztaty były skoncentrowane, zarządzanie schematami nie wchodzi w ich zakres.

Zarządzanie klastrem

Te warsztaty są dla deweloperów aplikacji klienckich, a nie dla operatorów klastrów Apache Kafka, czym zazwyczaj zajmuje się dedykowany zespół.

Kafka Security

Aby zachować ścisłe skupienie na wydajności aplikacji, odporności i zaawansowanych wzorcach projektowych, te warsztaty nie obejmują konfiguracji bezpieczeństwa. Zakłada się, że uczestnicy znają podstawowe ustawienia bezpieczeństwa wymagane do połączenia się z ich klastrami.

Kafka Streams

Kafka Streams jest częścią Kafka API od lat, ale jego użycie maleje na rzecz dedykowanych platform do Stream Processingu, takich jak Flink czy RisingWave. Ze względu na złożoność Kafka Streams, często przypadki użycia, które mogłyby być dobrym dopasowaniem, są zamiast tego implementowane przy użyciu standardowego Consumer API.

Wymagane podstawy

Docker
Java i podstawy Spring Boot
Podstawy Apache Kafka

Prowadzący szkolenie:
Jan Siekierski

Programista Java i Kotlin z 10-letnim doświadczeniem, z czego 5 lat jako Tech Lead.

Pasjonat Data Streamingu na którym obecnie koncentruje się w całości. Inne obszary w których się specjalizuje to Architektura Event-Driven, Mikroserwisy, DDD oraz Enterprise Data Architecture.

Obecnie niezależny Konsultant, Trener i Twórca, publikujący głównie na platformie LinkedIn.

Cena udziału w szkoleniu 1800 PLN netto

Więcej szczegółów

Zarządzanie Schemami w Kafce dla deweloperów aplikacji Java NOWOŚĆ!

1 dzień

Terminy online

Terminy gwarantowane

Więcej

O szkoleniu w skrócie

Zarządzanie Schemami (Schema Management) jest krytycznym aspektem budowania złożonych ekosystemów Data Streaming. Zapewnia wydajność, przewidywalność i umożliwia zaawansowane integracje budowane na bazie Twoich strumieni danych. Jest to jednak często pomijane – ponieważ bez praktyki i wiedzy jest postrzegane jako dodające istotny narzut podczas dewelopmentu.

Te warsztaty są przeznaczone dla deweloperów, którzy już używają Kafki, ale albo nie używali Schem, albo mieli z nimi niewielki kontakt i chcą pogłębić swoje zrozumienie tematu. Obejmują zarówno podstawy, jak i zaawansowane tematy, które pomogą Ci stworzyć wydajny proces zarządzania Schemami, co przełoży się na płynny przepływ pracy i przewidywalną strukturę wiadomości w Topikach.

Szkolenie ma formę warsztatów z dwoma ćwiczeniami praktycznymi, które będą bardzo pomocne, jeśli chcesz zbudować lub ulepszyć sposób zarządzania Schemami w swoich projektach. Ze względu na intensywność warsztatów, nie będziemy budować wszystkiego od zera – nauczysz się, jak wygląda przepływ pracy w dojrzałym środowisku produkcyjnym. Zobaczysz jak wydajny może być ten proces i otrzymasz gotowy do użycia kod, który możesz wykorzystać.

Czego się nauczysz

Jak działa Confluent Schema Registry
Jak klienci Spring Boot Kafka serializują i deserializują wiadomości oraz używają Schema Registry
Podstaw formatu serializacji Avro
Jak mapować Schemy na Topiki i kiedy używać której strategii
Jak używać Schem w Kafka Connect i Kafka REST Proxy
Jak ewoluować swoje Schemy bez naruszania kompatybilności i jak wybrać Compatibility Type dla swoich Topików
Jak zbudować dedykowane repozytorium Schem (Schema repository) i jak je zintegrować z Twoimi klientami i środowiskami Schema Registry

Co nie wchodzi w zakres

Wdrażanie i utrzymywanie Schema Registry
Zabezpieczanie Schema Registry

Technologie używane na warsztatach

Confluent Schema Registry – istnieje wiele otwartych rejestrów Schem (schema registries) dla Kafki – ale Confluent Schema Registry jest najpopularniejszy i stanowi punkt odniesienia – większość alternatywnych rozwiązań implementuje API Confluent Schema Registry.
Spring Boot – najpopularniejszy framework Java z doskonałą integracją zarówno z Kafką, jak i Schema Registry.
Avro – najpopularniejszy format serializacji, więc będziemy go używać na otwartych warsztatach. Dedykowane warsztaty mogą być dostosowane do użycia Protobuf lub JsonSchema w ćwiczeniach.

Prowadzący szkolenie:
Jan Siekierski

Programista Java i Kotlin z 10-letnim doświadczeniem, z czego 5 lat jako Tech Lead.

Pasjonat Data Streamingu na którym obecnie koncentruje się w całości. Inne obszary w których się specjalizuje to Architektura Event-Driven, Mikroserwisy, DDD oraz Enterprise Data Architecture.

Obecnie niezależny Konsultant, Trener i Twórca, publikujący głównie na platformie LinkedIn.

Cena udziału w szkoleniu 1200 PLN netto

Więcej szczegółów

Apache Spark

Przetwarzanie danych Big Data z Apache Spark

4 dni

Terminy online

Terminy gwarantowane

Więcej

O szkoleniu w skrócie

To intensywne, praktyczne szkolenie wprowadzi Cię w realne zastosowania Apache Spark – jednego z najpotężniejszych silników obliczeniowych w świecie danych. Od podstaw aż po optymalizację – nauczysz się, jak efektywnie tworzyć, analizować i orkiestrwać potoki danych z użyciem PySpark i Spark SQL, pracując na rzeczywistej platformie Databricks. Wejdź na poziom Big Data i naucz się przetwarzać dane z prędkością błyskawicy.

Moduły szkolenia

👉 Moduł 1: Wprowadzenie do Big Data i Spark z użyciem PySpark

Poznasz kluczowe wyzwania świata Big Data (5V) i zobaczysz, jak Spark radzi sobie z ogromnymi, różnorodnymi i zmiennymi danymi.
Nauczysz się podstaw pracy z Apache Spark i jego strukturą rozproszoną.
Otrzymasz solidne podstawy pracy z PySpark DataFrame API: withColumn, filter, select, join, cast, write.
Zaczniesz pisać zapytania w Spark SQL, zarządzać tabelami, agregować dane i optymalizować transformacje.
Poznasz środowisko Databricks – idealne do pracy z klastrami Spark w chmurze.

🔧 Warsztat: Praca z rzeczywistym zbiorem danych – tworzenie i manipulacja DataFrame'ami w PySparku, pierwsze transformacje i zapis wyników.

👉 Moduł 2: Projektowanie kodu sparkowego i budowa architektury danych

Nauczysz się dobrych praktyk pracy z kodem PySpark – modularne notebooki, dbutils, parametryzacja, output notebooków.
Rozszerzysz znajomość PySparka o pracę z strukturami zagnieżdżonymi (array, struct), kolekcjami i dynamicznymi kwerendami.
Poznasz nowoczesne formaty danych: Parquet, JSON, Delta Lake – i nauczysz się, jak je czytać, zapisywać i konwertować w PySparku.
Poznasz architekturę Medallion – podejście do logicznej organizacji danych w Spark Lakehouse.

🔧 Warsztat: Przekształcanie nieustrukturyzowanych danych w uporządkowaną formę – praktyka z DataFrame'ami i SQL Sparka.

👉 Moduł 3: Orkiestracja potoków danych Spark

Nauczysz się zarządzać klastrami Spark – konfiguracje, typy instancji, dostępność i przydzielanie zasobów.
Poznasz Databricks Workflows – sposób na automatyzację procesów Spark i zarządzanie cyklem życia danych.
Nauczysz się projektować i uruchamiać złożone pipeline'y Sparkowe – od harmonogramowania po monitorowanie.

🔧 Warsztat: Automatyzacja i orkiestracja potoku danych z użyciem workflowów – od surowych danych po gotowe tabele Delta.

👉 Moduł 4: Dogłębna analiza działania Apache Spark

Zrozumiesz wewnętrzne mechanizmy działania Sparka: Driver, Executor, DAG, Stage, Task.
Nauczysz się świadomie używać transformacji i akcji PySparka – z uwzględnieniem kosztów obliczeniowych.
Będziesz analizować i optymalizować fizyczne plany wykonania (explain(), Spark UI) oraz debugować błędy.
Dowiesz się, jak monitorować klaster, wykrywać wąskie gardła i poprawiać wydajność kodu PySpark.

🔧 Warsztat: Diagnoza i optymalizacja rzeczywistych zapytań w PySparku – praktyka z logami, Spark UI i performance tuningiem.

💼 Dla kogo jest to szkolenie?

Dla analityków, data engineerów i programistów chcących efektywnie pracować z PySpark i Spark SQL,
Dla zespołów BI, które szukają skalowalnych rozwiązań do analizy danych,
Dla każdego, kto chce opanować Apache Spark na praktycznym, produkcyjnym poziomie.

🚀 Co zyskasz?

Zrozumiesz, jak działa Spark „pod maską” i jak pisać efektywny kod w PySparku,
Zbudujesz potok danych od A do Z: od wczytania surowych danych, przez transformacje, po zapis w Delta Lake,
Nauczysz się optymalizować, debugować i orkiestrwać zadania Sparkowe jak zawodowiec,
Otrzymasz dostęp do notebooków, które możesz od razu wdrożyć u siebie.

🔥 Zamień miliony wierszy danych w milisekundy decyzji.
Zostań ekspertem od PySparka i wejdź na poziom Big Data z Apache Spark i Databricks!

Wymagania co do uczestnika

Podstawowa znajomość SQL
Podstawowa znajomość Pythona
Podstawowa znajomość Git
Założenie konta na GitHub
Podstawowa znajomość technologii chmurowych nie jest obowiązkowa, ale przydatna

Terminy i definicje

System Rozproszony
System rozproszony to zbiór niezależnych komputerów lub urządzeń, które współpracują ze sobą poprzez sieć komputerową, tworząc logiczną całość. Każdy węzeł w systemie może działać niezależnie, ale wszystkie razem realizują wspólne cele.

Spark
Apache Spark to potężne, masowo skalowalne środowisko do przetwarzania danych, które umożliwia efektywne przetwarzanie dużych zbiorów danych w pamięci oraz na dysku. Jest podstawowym komponentem platformy Databricks.

Databricks
Databricks to platforma do zarządzania danymi, która łączy zalety systemów data lake i data warehouse. Wykorzystuje Apache Spark jako silnik przetwarzania i zapewnia scentralizowane środowisko do analizy danych, uczenia maszynowego i biznesowych zastosowań analitycznych.

Data Lake (jezioro danych)
Data Lake to centralne repozytorium danych przechowujące duże ilości danych w ich pierwotnej, surowej formie. W przeciwieństwie do tradycyjnych hurtowni danych, które wymagają uprzedniej strukturyzacji danych, data lake może przechowywać dane w dowolnym formacie, w tym: strukturyzowane, półstrukturyzowane i niestrukturyzowane.

Prowadzący szkolenie:
Dawid Grześków

Specjalista IT z pięcioletnim doświadczeniem w środowisku danowym. W swojej karierze przeszedłem przez budowanie narzędzi wewnętrznych, analitykę oraz tworzenie systemów raportowych. Aktualnie pracuję jako Inżynier Danych, gdzie Spark i Databricks stanowią moje główne narzędzia pracy.

Na co dzień pracuję z technologiami chmurowymi na platformie Azure. Programuję w Pythonie, SQL oraz Sparku. Tworzę modele, hurtownie oraz jeziora danych. Integruję rozwiązania DevOps z procesami biznesowymi. Tworzę zaplecza całych platform i rozwijam procesy integracyjne.

Projekty w których brałem udział to m.in.:

Integracja przepływów danych wspierających mi.n. SAPa, procesy korporacyjne
Budowanie jezior danych w celu scentralizowania zasobów przedsiębiorstwa
Budowanie modeli analitycznych, które dotychczas były niemożliwe do zrealizowania bez Sparka.
Wdrażanie rozwiązań DevOps/DataOps

Posiadam doświadczenie pracy w międzynarodowych firmach, gdzie wspierałem zespoły w przyswajaniu wiedzy procesowej oraz narzędziowej. Jako praktyk, wychodzę z założenia, że tylko praktyczne szkolenia dają satysfakcjonujące efekty.

Z takim założeniem stworzyłem również poniższy kurs.

Cena udziału w szkoleniu 2800 PLN netto

Więcej szczegółów

Przetwarzanie danych Big Data z Apache Spark - techniki zaawansowane i optymalizacja

2 dni

Terminy online

Terminy gwarantowane

Więcej

O szkoleniu w skrócie

Szkolenie poświęcone jest Apache Spark - nowoczesnemu narzędziu do przetwarzania danych, wykorzystywanym przez czołowe firmy z Doliny Krzemowej. Szkolenie odbędzie się w oparciu o platformę Databricks, a jego głównym celem jest optymalizacja czasu wykonywania kodu, przy zachowaniu optymalnego kosztu korzystania z narzędzia. To dwudniowe szkolenie skupia się na przedstawieniu szeregu technik pozwalających zapewnić optymalne procesowania danych, przy jednoczesnym zachowaniu wysokiej czystości kodu.

Cel szkolenia

Praca z systemem Spark oraz platformą Databricks. Opanowanie praktycznych umiejętności niezbędnych do skutecznej realizacji projektów danowych w nowoczesnym środowisku, które kształtuje współczesne standardy w obszarze Big Data. Szkolenie uzupełnia wiedzę z zawartą w "Szkolenie Podstawowe Spark" kładąc nacisk na metody optymalizacji wydajności w procesowaniu danych.

Dla kogo przeznaczone jest szkolenie?

Inżynierów Danych , którzy chcą pogłębić swoją wiedzę o Apache Spark, ze szczególnym naciskiem na optymalizację kodu
Specjalistów Data Science , pragnących lepiej zrozumieć Apache Spark i nauczyć się samodzielnie optymalizować kod w celu zwiększenia wydajności swoich projektów

Gdzie użyjesz nabytej wiedzy?

W codziennej pracy z Platformą Databricks oraz Sparkiem
W projektach wymagających elastycznego podejścia pod kątem wykorzystywanych zasobów
Przy budowaniu systemów analitycznych dla firmy

Czego się nauczysz?

Optymalizacji kosztów i wydajności w chmurze - dzięki umiejętności efektywnego zarządzania zasobami Spark na platformie Databricks
Optymalizacji egzekucji kodu - co pozwoli widocznie skrócić potrzebny do wykonania procesowania danych
Efektywnego debugowania kodu - co pozwoli na ograniczenie błędów oraz ułatwi wprowadzenie nowej funkcjonalności
Odnajdowania "wąskich gardeł" w procesie - na przykładach pokażę Ci jak odnajdywać operacje, które ograniczają zdolność i przepustowość całego programu

Wymagania co do uczestnika

Podstawowa znajomość Sparka/Databricks; idealnie - uczestnictwo w poprzednim szkoleniu "Szkolenie Podstawowe Spark"
Znajomość SQL
Podstawowa znajomość Pythona
Podstawowa znajomość Git
Założenie konta na GitHub
Podstawowa znajomość technologii chmurowych nie jest obowiązkowa, ale przydatna

Terminy i definicje

DAG (Directed Acyclic Graph)
W Spark to podstawowa koncepcja reprezentująca plan wykonania zadania. Jest to graf operacji które, są wykonywane w określonej kolejności, jednocześnie nie zawiera cykli ani pętli w planie wykonania.W Apache Spark DAG składa się z zestawu Jobów, Stagów oraz Tasków.

Prowadzący szkolenie:
Dawid Grześków

Specjalista IT z pięcioletnim doświadczeniem w środowisku danowym. W swojej karierze przeszedłem przez budowanie narzędzi wewnętrznych, analitykę oraz tworzenie systemów raportowych. Aktualnie pracuje jako Inżynier Danych, gdzie Spark i Databricks stanowią moje główne narzędzia pracy.

Na co dzień pracuje z technologiami chmurowymi na platformie Azure. Programuje w Pythonie, SQL oraz Sparku. Tworzę modele, hurtownie oraz jeziora danych. Integruję rozwiązania DevOps z procesami biznesowymi. Tworzę zaplecza całych platform i rozwijam procesy integracyjne.

Projekty w których brałem udział to m.in.:

Integracja przepływów danych wspierających mi.n. SAPa, procesy korporacyjne
Budowanie jezior danych w celu scentralizowania zasobów przedsiębiorstwa
Budowanie modeli analitycznych, które dotychczas były niemożliwe do zrealizowania bez Sparka.
Wdrażanie rozwiązań DevOps/DataOps

Z takim założeniem stworzyłem również poniższy kurs.

Cena udziału w szkoleniu 1800 PLN netto

Więcej szczegółów

Snowflake

Przetwarzanie danych z użyciem Snowflake

2 dni

4.86/5

Terminy online

Terminy gwarantowane

Więcej

O szkoleniu w skrócie

Na szkoleniu uczestnicy poznają Snowflake od podstaw. Poprzez zrozumienie architektury i sposobu działania uczestnicy będą potrafili podjąć świadomą decyzję o implementacji rozwiązania w swojej instytucji. Szkolenie zapewnia nie tylko solidne i holistyczne zrozumienie Snowflake, ale również warsztaty, które pozwolą poznać potencjał tego narzędzia oraz nauczą wykorzystywać Snowflake w środowisku produkcyjnym.

Po szkoleniu kursant będzie przygotowany do wdrożenia i świadomej pracy ze Snowflake wykorzystując atuty tej platformy.

Na szkoleniu celowo nie będziemy przechodzić przed podstawy SQL, by skoncentrować się na samej platformie Snowflake, także znajomość tego języka jest konieczną umiejętnością by w pełni wykorzystać potencjał szkolenia.

Prowadzący szkolenie:
Przemysław Starosta

Absolwent Uniwersytetu im. Adama Mickiewicza, Politechniki Poznańskiej i Wyższej Szkoły Bankowej. Właściciel firmy informatycznej, kierownik projektów, programista baz danych i wykładowca na Collegium da Vinci w Poznaniu. Specjalista z zakresu baz danych Oracle, SQL Server i PostgreSQL oraz procesów ETL. Programista C#. Pasjonat edukacji i analizy danych oraz możliwości biznesowych, które one odkrywają. Trener z ponad 10-letnim doświadczeniem. Na szkoleniach praktykuje zasadę: learning by doing – uczenie przez robienie. Prelegent SQL Day oraz Warszawskich Dni Informatyki. Prywatnie fan FC Barcelony oraz mieszanych sztuk walki.

Cena udziału w szkoleniu 1600 PLN netto

Więcej szczegółów

Trenerzy kategorii Big Data

Michał Schielmann

Jestem programistą z 12-sto letnim doświadczeniem, związanym głównie z ekosystemem Javy, ale również Pythonem, bazami danych, zagadnienami DevOps (Docker, Kubernetes, CI/CD pipelines) i frameworkami JavaScriptowymi. Moja ścieżka kariery prowadziła mnie przez różne branże – od telekomunikacyjnej, przez medyczną, bankową, do giełdy energii – dzięki czemu mogłem poznać wiele technologii i ich zastosowań w poszczególnych obszarach. Od kilku lat zaangażowany jestem w prowadzenie szkoleń i warsztatów, bo wierzę, że najlepszym sposobem na naukę jest przekazywanie wiedzy innym.

Dawid Grześków

Specjalista IT z pięcioletnim doświadczeniem w środowisku danowym. W swojej karierze przeszedłem przez budowanie narzędzi wewnętrznych, analitykę oraz tworzenie systemów raportowych. Aktualnie pracuje jako Inżynier Danych, gdzie Spark i Databricks stanowią moje główne narzędzia pracy.

Projekty w których brałem udział to m.in.:

Integracja przepływów danych wspierających mi.n. SAPa, procesy korporacyjne
Budowanie jezior danych w celu scentralizowania zasobów przedsiębiorstwa
Budowanie modeli analitycznych, które dotychczas były niemożliwe do zrealizowania bez Sparka.
Wdrażanie rozwiązań DevOps/DataOps

Jan Siekierski

Programista Java i Kotlin z 10-letnim doświadczeniem, z czego 5 lat jako Tech Lead.

Pasjonat Data Streamingu na którym obecnie koncentruje się w całości. Inne obszary w których się specjalizuje to Architektura Event-Driven, Mikroserwisy, DDD oraz Enterprise Data Architecture.

Obecnie niezależny Konsultant, Trener i Twórca, publikujący głównie na platformie LinkedIn.

Sprawdź, co mówią o nas ci, którzy nam zaufali

5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
29-11-2025 Pan Arek to dobry trener, wie co mówi :) Szymon Nowacki, Energa-Operator S.A.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
29-11-2025 Kompletne, elastyczne z dużą interakcją na zapytania uczestników. Wojciech Brożyński, Energa-Operator S.A.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
29-11-2025 Świetne szkolenie, bardzo dobre materiały, rewelacyjny prowadzący posiadający ogromną wiedzę teoretyczną jak i praktyczną. Jacek Kuligowski, Energa-Operator S.A.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
23-11-2024 Prowadzący bardzo sympatyczny, dobrze przekazywał wiedzę i tłumaczył Zuzanna Motylińska, Asseco Poland S.A.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
28-06-2024 Polecam , szkolenie przeprowadzone przez osobe z duza wiedza i bogatym doswiadczeniem , ciekawe zagadnienia i rozwiazania Arlan Akhmet, Ornsson Solutions Sp. z o.o.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
24-11-2023 Szkolenie bardzo fachowe, trener merytoryczny, ciekawa tematyka. Naprawdę warto. Rafał Ślubowski, Narodowy Bank Polski
4.74/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
22-09-2023 Bardzo ciekawe szkolenie dające ogląd na świat Big Data Joanna De-Boulangé-Woluntarska, Bank Gospodarstwa Krajowego
4.63/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
22-09-2023 Jeżeli chcesz ponać świat Big Data, jego części składowe, poczuć odrobinę potęgę rozwiązań, a przede wszystkim zapoznać się teoretycznie z cały przekrojem narzędzi to to szkolenie jest dla Ciebie. Raczej pierwszy krok w nauce niż pełne kompendium wiedzy. Tomasz Dłużniewski, Markant Services International Polska Sp. z o.o.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
30-06-2023 Szkolenie bardzo ciekawe, zachęcające to dalszego poszerzania swoich kompetencji w Big Data oraz w technologiach z nią związanych. Mateusz Wiktorek, OPITZ CONSULTING Polska Sp. z o.o.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
30-06-2023 Bardzo dobrze przeprowadzone szkolenie. Bardzo użyteczne dla osoby początkującej w obszarze BigData. Pozwoliło na usystematyzowanie wiedzy zdobytej w innych źródłach i rozpoczęcie przygody praktycznej. Radosław Laskowski, Polish Airports Academy Sp. z o.o.
5.0/5

Architektura systemów Big Data
30-11-2022 Szkolenie wysokiej jakość. Polecam. Kamil Bachanek, Aplikacje Krytyczne Sp. z o.o.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
26-08-2022 Arek to super trener z ogromna wiedzą na temat pracy z danymi. Jezeli ktos chce wskoczyc na wyzszy poziom analizy,gromadzenia i przesylania danych to Big Data to super rozwiazanie. Mariusz Stefański, Ośrodek Przetwarzania Informacji - Państwowy Instytut Badawczy
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
01-07-2022 Szkolenie świetnie poprowadzone, bardzo rozległa wiedza prowadzącego, trenera Arka Osińskiego. Wiedza przekazana w bardzo jasny i spójny sposób poparta wieloma praktycznymi przykładami. Praktycznie nie było pytania, na które prowadzący nie znałby odpowiedzi od razu. Ponadto odpowiedzi na pytania znacznie wykraczały poza zakres samego pytania. Świetne warsztaty na AWS i doskonale przygotowane materiały do przeprowadzanych ćwiczeń. Polecam w 100% i chętnie uczestniczyłbym w kolejnych szkoleniach prowadzonych przez Arka. Wit Grzesiak, Aplikacje Krytyczne Sp. zo.o.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
01-07-2022 Potwierdzają się opinie które czytałem przed szkoleniem, prowadzący jest pasjonatem technologii i praktykiem - to się przekłada pozytywnie na jakość szkolenia. Jest dobra proporcja między teorią i warsztatami, przygotowane ćwiczenia są ciekawe i pozwalają "poczuć" przetwarzanie BigData. Po częściach teoretycznych "ułożyły" mi się w głowie pojęcia/technologie z obszaru BigData. Jak najbardziej polecam szkolenie dla osób które zaczynają przygodę z BigData. Stefan Bryła, OSOBA PRYWATNA
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
26-11-2021 Super szkolenie jako kompleksowe wprowadzenie do Big Data i dalszy start w tym kierunku! Daniel Styrc, ista Shared Services Polska Sp. z o.o.
4.9/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
26-11-2021 Szkoda, że tak późno skorzystałem z tego skolenia. :-) Paweł Gąsiorowski, Edubroker Sp. z o.o.
4.9/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
15-10-2021 Super szkolenie na początek przygody z BIG DATA Michał Chronowski, Powszechny Zakład Ubezpieczeń na Życie SA
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
15-10-2021 Super Szkolenie polecam :) Joanna Ostrowska, UNIQUA Towarzystwo Ubezpieczeń SA
4.9/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
15-10-2021 Duży profesjonalizm i wiedza Andrzej Makuch, Atos Poland Global Services Sp. z o.o.
4.9/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
25-06-2021 Świetnie wyszkolony prowadzący, ma rozległą wiedzę, chętnie się nią dzieli. Na każdy temat ma coś do powiedzenia. Rewelacja. Jeżeli potrzebujesz szkolenia big data, śmiało możesz wybrać właśnie to. Paweł Sypniewski, Energa Obrót SA
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
25-06-2021 Teoria i praktyka (samodzielne ćwiczenia) w dobrej proporcji. Zakres szkolenia ciekawy. Tempo szkolenie w sam raz - jest czas na samodzielną pracę oraz eksperymentowanie, w razie potrzeby pod okiem prowadzącego. Szkolenie było w formie online i przebiegło bez problemów. Polecam! Marcin Smorenda, Signity SA
4.7/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
25-06-2021 Dobra organizacja, profesjonalny prowadzący Andrzej Imiełowski, Państwowa Wyższa Szkoła Techniczno-Ekonomiczna w Jarosławiu
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
27-11-2020 Szkolenie bardzo ciekawe, pozwala zajrzeć do świata BigData. Prowadzący z dużą wiedzą praktyczną, zdecydowanie na plus. Część warsztatowa bardzo dobrze przygotowana. Katarzyna Bancerz, AXA ŻYCIE TOWARZYSTWO UBEZPIECZEŃ SA
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
25-09-2020 Przydatne szkolenie dla osób chcących zapoznać się z tematyką. Jakub Szczepański, Volkswagen Poznań Sp. z o.o.
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
06-12-2019 Świetne szkolenie o bardzo dużym przekroju informacji związanych z Big Data. Świetne wprowadzenie w tematykę, tempo i zakres wiedzy na najwyższym poziomie. Jacek Kuligowski, Energa - Operator SA
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
29-11-2019 Wysoki poziom wiedzy prowadzacych - brawo ! Dariusz Koc, Samsung Electronics Polska Sp. z o.o.
4.92/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
11-10-2019 Pan Arek prezentuje imponującą wiedzę z zakresu Big Data, wykazuje się przy tym zainteresowaniem i wparciem dla kursantów. Jako wprowadzenie do świata Big Data, szkolenie wyczerpało tematykę. Adam Szwaczkiewicz, mBank SA
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
11-10-2019 Szkolenie "Kompleksowe wprowadzenie do Big Data" było jednym z lepszych szkoleń w jakich kiedykolwiek uczestniczyłem. Bardzo dobrze ułożona agenda i struktura kursu. Wysoki poziom merytoryczny dzięki świetnemu prowadzącemu, który w jasny sposób potrafił wytłumaczyć zaawansowane zagadnienia. Mateusz Tomżyński, Accenture Services Sp. z.o.o
5.0/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
12-04-2019 Świetne, kompleksowe wprowadzenie do świata Big Data, polecam ;) Adam Plinzner, ING Bank Śląski SA
4.85/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
12-04-2019 Polecam - dużo wiedzy Stanisław Nowak, Compendium Centrum Edukacyjne Spółka z o.o.
4.71/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
12-04-2019 Szkolenie BIG DATA prowadzone w profesjonalny sposób, z odpowiednim zakresem merytorycznym i w dobrych ramach czasowych. Polecam. Tomasz Tomczak, Compendium Centrum Edukacyjne Spółka z o.o.
4.78/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
30-11-2018 Zgodnie z założeniem - jest to kompleksowe wprowadzenie do technologii BigData. Sporo ćwiczeń warsztatowych i mnóstwo hintów praktycznych. Duża wiedza praktyczna Pana Arkadiusza. Rafał Sak, Eurocash S.A.
4.71/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
30-11-2018 Big Data to pasja prowadzącego. Podczas warsztatów jest dużo praktyki, często samemu można wybrać odpowiadającą sobie technologię dostępu do danych. Adrian Strugała, INCAT Sp. z o.o.
4.73/5

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej
30-10-2017 Pozdrawiam Michała Kowalika, polecam jako wykładowcę ;) Elastyczne podejście, zaangażowany... Michał Marciniak, Polskie Sieci Elektroenergetyczne SA

Sprawdź wszystkie opinie

Sprawdź nasze opinie w Google

Masz jakieś pytania? Skontaktuj się z nami!

Odpowiadamy na telefony i maile w godzinach 9:00-17:00 od poniedziałku do piątku.

Telefon 22 299 53 69

E-mail biuro@jsystems.pl

Napisz do nas

Nie znalazłeś interesującego Cię szkolenia? Skontaktuj się z nami:

Wiadomość wysłana

Przyjęliśmy Twoją wiadomość i skontaktujemy się z Tobą w tej sprawie

Klikając OK wrócisz do formularza

Szkolenia Big Data

Terminy gwarantowane

Standardy JSystems

Apache Hadoop

O szkoleniu w skrócie

Dla kogo?

Apache Kafka

Dlaczego kompleksowe szkolenie z Kafki?

Zakres szkolenia

Co nie będzie omawiane:

Zarządzanie i obsługa klastra Kafka

Kafka Streams

Wymagane podstawy

Prowadzący szkolenie: Jan Siekierski

O szkoleniu w skrócie

Ćwiczenia z kodowania

Zakres szkolenia

Co nie wchodzi w zakres

Podstawy Kafki

Schema Management i formaty serializacji

Zarządzanie klastrem

Kafka Security

Kafka Streams

Wymagane podstawy

Prowadzący szkolenie: Jan Siekierski

O szkoleniu w skrócie

Czego się nauczysz

Co nie wchodzi w zakres

Technologie używane na warsztatach

Prowadzący szkolenie: Jan Siekierski

Apache Spark

O szkoleniu w skrócie

Moduły szkolenia

👉 Moduł 1: Wprowadzenie do Big Data i Spark z użyciem PySpark

👉 Moduł 2: Projektowanie kodu sparkowego i budowa architektury danych

👉 Moduł 3: Orkiestracja potoków danych Spark

👉 Moduł 4: Dogłębna analiza działania Apache Spark

💼 Dla kogo jest to szkolenie?

🚀 Co zyskasz?

Wymagania co do uczestnika

Terminy i definicje

Prowadzący szkolenie: Dawid Grześków

O szkoleniu w skrócie

Cel szkolenia

Dla kogo przeznaczone jest szkolenie?

Gdzie użyjesz nabytej wiedzy?

Czego się nauczysz?

Wymagania co do uczestnika

Terminy i definicje

Prowadzący szkolenie: Dawid Grześków

Snowflake

O szkoleniu w skrócie

Prowadzący szkolenie: Przemysław Starosta

Trenerzy kategorii Big Data

Sprawdź, co mówią o nas ci, którzy nam zaufali

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Architektura systemów Big Data

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Kompleksowe wprowadzenie do Big Data - szkolenie w formie warsztatowej

Prowadzący szkolenie:
Jan Siekierski

Prowadzący szkolenie:
Jan Siekierski

Prowadzący szkolenie:
Jan Siekierski

Prowadzący szkolenie:
Dawid Grześków

Prowadzący szkolenie:
Dawid Grześków

Prowadzący szkolenie:
Przemysław Starosta