Sprawdź 141 GWARANTOWANYCH TERMINÓW SZKOLEŃ na rok 2026! Dofinansowanie do 100% — sprawdź możliwości z BUR i KFS!
Szkolenie Język R

Analiza danych z wykorzystaniem R – kurs zaawansowany

Po ukończeniu tego szkolenia uczestnik będzie potrafił: korzystać ze służących do przekształcania danych pakietów z rodziny tidyverse: dplyr, tidyr i reshape2 optymalizować...

więcej →
1800 PLN netto 2 214 PLN brutto Dofinansowanie BUR/KFS
Czas trwania 3 dni

Najbliższe terminy 9:00 – 16:00

Brak dostępnych terminów. Skontaktuj się z nami!

Powiadamiaj mnie o nowych terminach gwarantowanych tego szkolenia

Powiadomienia o terminach gwarantowanych

Na podany adres e-mail będziesz otrzymywać informacje o pojawiających się terminach gwarantowanych szkolenia Analiza danych z wykorzystaniem R – kurs zaawansowany.

Z powiadomień możesz wypisać się w dowolnym momencie.

Zorganizuj to szkolenie tylko dla swojego zespołu

To szkolenie można zorganizować w formie zamkniętej — z programem dopasowanym do potrzeb Twojego zespołu, w uzgodnionym terminie i formacie.

Dowiedz się więcej

Opis szkolenia

    Po ukończeniu tego szkolenia uczestnik będzie potrafił:
    • korzystać ze służących do przekształcania danych pakietów z rodziny tidyverse: dplyr, tidyr i reshape2
    • optymalizować organizację własnej pracy i tempo przetwarzania danych
    • tworzyć własne pakiety w R
    • korzystać z repozytorium GitHub
    • optymalizować prace programistyczną w zespole
    • tworzyć własne repozytoria kody
    • zarządzać współpracą z serwerem
    • sprawnie programować w środowisku serwerowym

Warunki uczestnictwa

Szkolenie skierowane jest do osób znających język R na poziomie średniozaawansowanym, poszukujących praktycznej wiedzy dotyczącej efektywnego przetwarzania danych w tym języku. Dobrym wstępem do szkolenia jest kurs „Analiza danych z wykorzystaniem R – kurs średniozaawansowany”, oferowany również w module szkoleń „Data Science z wykorzystaniem R”. W trakcie szkolenia, uczestnicy nie tylko poznają sposoby efektywnej pracy z danymi za pomocą branżowych pakietów, ale także posiądą wiedzę z dziedziny optymalizacji wykonywanych operacji i ich szczegółowego działania od strony serwera obliczeniowego. Co więcej, na szkoleniu uczestnicy dowiedzą się także, w jaki sposób tworzyć pakiety w języku R i jak dzielić się nimi ze szeroko pojętym środowiskiem data science za pomocą repozytoriów kodu GitHub/GitLab.
Przejdź do programu szkolenia

Trenerzy prowadzący szkolenia Język R

Program szkolenia

  1. Wprowadzenie
    • różnice pomiędzy klasycznym podejściem do pracy z danymi (base), a wykorzystywaniem pakietów specjalistycznych (tidyverse, dplyr), porównanie wad i zalet każdej z obranych metod
    • „domowa” praca nad skryptami, a pisanie ich pod specjalistyczne przypadki obliczeniowe – odpowiednia etyka pisania skryptów, skupienie się na kontroli przebiegu rozwiązań i ich debugowania
    • własne pakiety w R – dlaczego są ważne w środowisku data science, potencjalne problemy, które można napotkać w trakcie ich tworzenia, a także dobre praktyki przy ich tworzeniu
    • współpraca zespołowa – wyjaśnienie standardów wspólnej pracy nad problemami analitycznymi, dzielenie się wynikami własnej pracy ze światem, szukanie pomocy od bardziej doświadczonych badaczy
    • profesjonalne zarządzanie pakietami – dlaczego automatyczne testy i deployment pakietów jest ważny, w jaki sposób manualnie tworzone repozytoria mogą ułatwiać pracę data scientistów na co dzień
    • praca na środowisku obliczeniowym – rozróżnienie od pracy na komputerze lokalnym, dobre praktyki zarządzania zasobami na serwerze i przydatnych instrukcji w terminalu na codzień
    • dobre książki i kursy do nauki R i Data Science
  2. Efektywna praca z danymi
    • pakiet dplyr – przetwarzanie zbiorów
      • podstawy pakietu (wybór zmiennych, filtrowanie, sortowanie): funkcje select(), filter(), arrange(), mutate(), rename()
      • funkcje przydatne w codziennej pracy: użycie pipe’ów (%>%), starts_with(), ends_with(), top_n(), distinct()
      • grupowanie i podsumowywanie danych: group_by(), summarize(), ungroup()
      • łączenie zbiorów: left_join(), inner_join(), right_join()
      • zaawansowane aspekty pracy z pakietem i dobre praktyki:
        • wektoryzacja funkcji i opieranie ich na zmiennych
        • warunkowe tworzenie zmiennych (mutate if_else)
        • ograniczenia funkcji z bazwoej wersji R (base) w dplyr
        • kiedy lepiej używać base zamiast dplyr
        • kiedy lepiej używać dplyr zamiast base
    • pakiety tidyr i reshape2 – modelowanie zbiorów
      • rozdzielanie zbioru na podstawie wartości: tidyr::separate(), tidyr::spread()
      • łączenie zbioru na podstawie zmiennej: tidyr::gather()
      • zmiana wymiarów zbioru na podstawie jego kluczowych cech: reshape2::melt(), reshape2::dcast()
    • efektywne łączenie funkcji z pakietów dplyr, tidyr i reshape2
  3. Optymalizacja pracy ze skryptami
    • szybsze pętle for – instrukcje z rodziny apply, użycie pakietu purr (map) i broom
    • wielowątkowe obliczenia – biblioteka parallel
    • debugowanie pracy pętli: tryCatch(), stop(), warning(), print(), cat()
    • inne metody optymalizacji obliczeniowej:
      • wykonywanie tylko niezbędnych obliczeń
      • redukcja powtórzeń
      • optymalizacja sprzętowa operacji
      • odpowiednie wykorzystywanie zasobów serwerowych
  4. Tworzenie własnych pakietów w R
    • pakiet devtools – tworzenie pakietów
      • filozofia, źródła informacji, książka Hadleya Wickhama
      • podstawowa struktura pakietów: pliki DESCRIPTION, NEWS, README, R
      • funkcje przydatne w procesie tworzenia pakietów: devtools::create(), devtools::build(), devtools::check()
      • funkcje przydatne w przypadku instalacji pakietów z różnych źródeł: load_all(), install_local(), install_github()
    • pakiety roxygen2 i bookdown – dokumentacja pakietów
      • logika struktury lokalnej dokumentacji pakietów: folder man, pozczególne zapisy
      • tworzenie dokumentacji lokalnej za pomocą funckji roxygenize(), wywoływanie, edycja
      • tworzenie dokumentacji online za pomocą pakietu bookdown: folder docs, wygląd, sposób działania
    • pakiety testthat i lintr – testowanie pakietów
      • tworzenie testów jednostkowych – pakiet testthat i folder tests
      • tworzenie testów struktury kodu – pakiet lintr
  5. Współpraca zespołowa – GitLab / GitHub
    • filozofia świata open-source, logika i struktura repozytoriów
    • podstawowe komendy przydatne w pracy z gitem: init, push, pull, status, commit
    • dzielenie projektu na części i praca w zespole: branch, merge requests, fetch, stash, pop
  6. Profesjonalna praca nad projektami
    • struktura repozytoriów typu CRAN, tworzenie repozytorium lokalnego i serwerowego
    • proces git flow, code review, zgłaszania komentarzy do kodu, nanoszenia poprawek, tagowania wersji pakietów
    • automatyczne testowanie i deployment kodu
      • procesy GitLab CI/CD
      • tworzenie pliku gitlab-ci.yml
      • dockeryzowanie środowiska
      • dostarczanie gotowego pakietu do repozytorium
  7. Codzienna praca na środowisku serwerowym (Rstudio Server) od strony serwera obliczeniowego
    • zapoznanie z praktycznymi narzędziami: terminator, tmux, kitty
    • podstawowe instrukcje języka poleceń: pwd, cp, mv, ls, ps aux
    • instrukcje przydatne w codziennej pracy: screen, scp, kill
    • narzędzia wspomagające pracę: htop, ncdu, mc, stat, nano, vim, cron
  8. Podsumowanie
    • zapoznanie z praktycznymi narzędziami: terminator, tmux, kitty
    • podstawowe instrukcje języka poleceń: pwd, cp, mv, ls, ps aux
    • instrukcje przydatne w codziennej pracy: screen, scp, kill
    • narzędzia wspomagające pracę: htop, ncdu, mc, stat, nano, vim, cron

Terminy gwarantowane

Szkolenia oznaczone jako "termin gwarantowany" odbędą się w zaplanowanym terminie niezależnie od liczby zgłoszonych uczestników. Nie musisz się martwić, że szkolenie zostanie odwołane z powodu zbyt małej liczby zapisanych osób.

Szkolenia online

Szkolenie realizowane jest w formie zdalnej na żywo poprzez platformę ZOOM. Trener prowadzi szkolenie na żywo, a uczestnicy mogą na bieżąco zadawać pytania i wykonywać ćwiczenia. Format online zapewnia pełną interakcję z trenerem, identyczną jak przy szkoleniu stacjonarnym.

Szkolenie na żywo z trenerem — nie kurs video

To nie jest nagrany kurs video. Przez cały czas trwania szkolenia masz bezpośredni kontakt z doświadczonym trenerem-praktykiem. Możesz na bieżąco zadawać pytania, prosić o wyjaśnienie trudnych zagadnień, konsultować własne projekty i uzyskać odpowiedź na dowolne pytanie związane z tematyką szkolenia. To realne wsparcie eksperta, którego nie zapewni żaden kurs nagrany.

Certyfikat ukończenia szkolenia

Każdy uczestnik po ukończeniu szkolenia otrzymuje imienny certyfikat potwierdzający udział i zdobyte kompetencje. Certyfikat wystawiany jest przez JSystems — firmę z certyfikatem ISO 9001 — i jest honorowany przez pracodawców.

Zainteresowany? Zapisz się na szkolenie!

Zapisz się — wybierz termin

Sprawdź pozostałe szkolenia z kategorii:

Język R

Opinie uczestników

4.9/5
Analiza danych z wykorzystaniem R – kurs podstawowy

Szkolenie intensywne, ale wartościowe

Agnieszka Lisowska-Kierepka Uniwersytet Wrocławski
4.9/5
Analiza danych z wykorzystaniem R – kurs podstawowy

Dzięki za intensywne 3 dni z R :)

Marcin Krzystanek Wakacje.pl SA
4.9/5
Analiza danych z wykorzystaniem R – kurs podstawowy

Bardzo ciekawe szkolenie. Dużo uporządkowanych informacji. Zdecydowanie polecam zarówno dla osób, które chcą uporządkować swoją wiedzę i uzupełnić braki oraz dla osób, które nie mają jeszcze żadnego doświadczenia w pracy z językiem R.

Marzena Andrzejczak Comarch SA
4.8/5
Analiza danych z wykorzystaniem R – kurs podstawowy

Profesjonalna organizacja.

Kamil Iwański PKO Bank Polski SA
Pokaż wszystkie opinie Google Opinie w Google

Zaufali nam

...i wiele innych

5,0 - średnia ocena na podstawie 285 opinii

Dlaczego warto nas wybrać?

Terminy gwarantowane na 100%

Jeśli termin jest oznaczony jako gwarantowany, odbędzie się we wskazanym czasie — nawet jeśli część grupy wycofa się z udziału. Ryzyko organizacyjne ponosimy my, nie Ty.

100% format warsztatowy

Każde zagadnienie teoretyczne jest poparte ćwiczeniami praktycznymi o rosnącym poziomie trudności. Uczymy przez działanie, nie przez slajdy.

Trenerzy-praktycy z oceną min. 4.75/5

Każdy trener JSystems ma bogate doświadczenie komercyjne w technologiach których uczy i musi utrzymywać średnią z ankiet powyżej 4.75 na 5. Czerwony pasek to u nas minimum ;)

Gotowe środowiska w chmurze

Do każdego szkolenia wymagającego oprogramowania dostarczamy skonfigurowane, gotowe hosty w chmurze. Uczestnik nie musi nic instalować — łączy się przez zdalny pulpit lub SSH.

Dowiedz się dlaczego warto nas wybrać

A może nielimitowane szkolenia za
1 148 PLN brutto / mies.?
Sprawdź Karnet Open
KARNET OPEN na szkolenia
A może nielimitowane szkolenia za
1 148 PLN brutto / mies.?
Sprawdź Karnet Open
KARNET OPEN na szkolenia

📅 Przypomnij mi jutro

Wyślemy Ci przypomnienie z linkiem jutro rano.

Zanim wyjdziesz

Wyślemy Ci podsumowanie tego szkolenia z terminami i ceną — do przemyślenia w spokoju.

Żadnego spamu — tylko jedno podsumowanie.