Analiza danych z wykorzystaniem R - kurs średniozaawansowany

by:
Czas trwania 3 dni

Najbliższe terminy tego szkolenia

Cena szkolenia 1800 PLN (netto)

Standardy JSystems

  1. Wszyscy nasi trenerzy muszą być praktykami i osiągać średnią z ankiet minimum 4.75 na 5. Nie ma wśród nas trenerów-teoretyków. Każdy trener JSystems ma bogate doświadczenie komercyjne w zakresie tematów z których prowadzi szkolenia.
  2. Wszystkie szkolenia mają format warszatowy. Każde zagadnienie teoretyczne jest poparte rzędem warsztatów w ściśle określonym formacie.
  3. Terminy gwarantowane na 100%. Jeśli jakiś termin jest oznaczony jako gwarantowany, oznacza to że odbędzie się nawet jeśli część grupy wycofa się z udziału. Ryzyko ponosimy my jako organizator.
Zapisz się
Program szkolenia
  1. Wprowadzenie
    • obecny i prognozowany kierunek rozwoju języka R
    • object-oriented programming: obiekty i funkcje
    • przypomnienie składni i podstawowych funkcji języka R
    • przegląd zagadnień statystycznych i metod analitycznych omawianych podczas kursu
    • źródła wiedzy i doskonalenia umiejętności: literatura, kursy, blogi
  2. Definiowanie własnych funkcji
    • składnia funkcji
    • zmienne lokalne i globalne
    • argumenty wymagane i opcjonalne, deklarowanie domyślnych wartości
    • tryby zwracania wartości: return i invisible
    • obsługa błędów
    • uruchamianie funkcji z zewnętrznego pliku: source()
  3. Operacje w pętlach
    • pętle for
    • pętle while
    • pętle repeat
    • funkcje z rodziny apply() i ich przewaga nad pętlami ww. typów
  4. Wczytywanie danych z zewnętrznych źródeł
    • wczytywanie danych z plików tekstowych: read.table(), read.csv() i read.delim()
    • wczytywanie bardzo ciężkich plików: pakiety readr i data.table
    • import danych z zewnętrznych aplikacji, np. SPSS: pakiet foreign
    • wczytywanie danych wprost ze źródła w internecie
    • wczytywanie danych z API systemów informatycznych
    • wczytywanie danych w formacie JSON i ich zamiana w format tabelaryczny
  5. Czyszczenie danych
    • długi i szeroki format danych, sposoby zamiany jednego na drugi: spread() i gather() z pakietu tidyr
    • sprawdzanie logicznej spójności danych
    • rekodowanie zmiennych: ifelse() vs. car::recode()
    • radzenie sobie z brakami danych: na.omit() i tidyr::replace_na()
  6. Analiza tabelaryczna
    • opis parametryczny zmiennych
    • tabela rozkładu zmiennej i wizualizacja rozkładu: histogramy, wykresy słupkowe, wykresy gęstości rozkładu
    • tabele kontyngencji i ich formatowanie: janitor::tabyl()
    • istotność zależności: test chi-kwadrat
    • interpretacja współczynnika istotności statystycznej
    • siła zależności: współczynnik V Cramera
    • wizualizacja tabel kontyngencji
      • skumulowane wykresy słupkowe
      • mapy cieplne (heatmap)
    • porównania wartości średnich w podgrupach
      • możliwości funkcji aggregate()
      • statystyki w podgrupach z wykorzystaniem pakietu dplyr: group_by() %>% summarize()
    • testy różnic między średnimi
      • test t jednej próby
      • test t dla prób zależnych i niezależnych
      • analiza wariancji (ANOVA)
      • sprawdzanie czy spełnione są założenia modelu
      • metody poprawy modelu
    • wizualizacja różnic między średnimi
      • wykresy pudełkowe
      • wykresy liniowe
  7. Analiza korelacji
    • idea korelacji jako miernika siły współzależności
    • różnica między korelacją a wpływem / zależnością przyczynową
    • badanie liniowości związku na wykresie rozrzutu
    • nieliniowe przekształcanie zmiennych: rule of the bulge
    • wyliczanie współczynników korelacji
      • liniowe: r Pearsona
      • rangowe: rho Spearmana, tau Kendalla
      • dla zmiennych binarnych: Jaccard, Sørensen–Dice
      • dla zmiennych nominalnych: V Cramera, uncertainty coefficient
    • wizualizacja macierzy korelacji: korelogramy
    • radzenie sobie z brakami danych: metoda wyłączania przypadków parami (pairwise)
    • statystyczna istotność korelacji
  8. Modele regresyjne
    • model regresji jako narzędzie opisu i przewidywania
    • regresja liniowa: lm()
    • wizualizacja regresji jednej zmiennej: abline(lm())
    • interpretacja parametrów modelu
    • szacowanie siły wpływu: indeks Pratta
    • metody poprawy rozwiązania
      • sprawdzanie czy spełnione są założenia analizy regresji
      • testowanie normalności rozkładu
      • minimalizacja wzajemnego skorelowania predyktorów
      • ręczna i automatyczna selekcja predyktorów
      • eliminacja przypadków odstających
    • regresja wielomianowa
    • dodawanie do modelu interakcji między zmiennymi
  9. Analiza czynnikowa i analiza głównych składowych (PCA)
    • idea analizy czynnikowej
    • FA a PCA: podobieństwa i różnice
    • implementacja w R: funkcje princomp() i factanal()
    • wizualizacja wyników
    • dobór parametrów analizy
      • liczba czynników
      • selekcja zmiennych
      • metoda rotacji
    • interpretacja rozwiązania
    • zastosowania analizy czynnikowej
  10. Analiza skupień
    • zastosowania analizy skupień
    • znaczenie biznesowe segmentacji rynku
    • przygotowanie danych do analizy skupień
      • konstrukcja wskaźników
      • ortogonalizacja i standaryzacja zmiennych
      • eliminacja przypadków odstających
    • clustering hierarchiczny
      • wybór metody aglomeracji i metryki
      • podział zbioru na skupienia: hclust()
    • clustering k-średnich
      • wybór metody aglomeracji i metryki
      • podział zbioru na skupienia: kmeans()
    • selekcja rozwiązań
    • interpretacja wyników analizy skupień

Opis szkolenia

Szkolenie odbywa się na żywo z udziałem trenera. Nie jest to forma kursu video!
    Po ukończeniu tego szkolenia uczestnik będzie potrafił:
    • Samodzielnie pisać własne funkcje i uruchamiać je z kodu skryptu
    • Wykonywać operacje w pętlach, optymalizować szybkość działania pętli
    • Wczytywać dane z różnych źródeł: plików tekstowych, SPSS, ze stron WWW, API i baz JSON
    • Przeprowadzać obróbkę danych, będącą wstępem do ich analizy: zmiana struktury danych, rekodowanie etc.
    • Dokonywać opisu parametrów i rozkładów zmiennych oraz generować wizualizacje tych rozkładów
    • Generować i formatować tabele kontyngencji, opisywać kształt, siłę i istotność współzależności, wizualizować wyniki
    • Wyliczać wartości kluczowych parametrów zmiennych w podgrupach i wizualizować różnice między nimi
    • Stosować trzy rodzaje testów t oraz analizę wariancji do testować istotności różnic między średnimi w podgrupach
    • Diagnozować stopień spełnienia założeń teoretycznych modelu analizy regresji, i przywracać poprawność modelu
    • Mierzyć siłę i istotność korelacji między zmiennymi ciągłymi
    • Interpretować zawartość macierzy korelacji i wizualizować ją w postaci korelogramu
    • Budować modele regresji wielu zmiennych oraz interpretować wyniki analizy regresji
    • Diagnozować i usuwać przypadki pogwałcenia założeń teoretycznych modelu regresji
    • Ortogonalizować zestawy zmiennych z wykorzystaniem analizy czynnikowej i analizy głównych składowych
    • Wykonywać analizę skupień różnymi metodami (hierarchiczna, k-średnich)
    • Znać zastosowania ww. analiz w kontekście badawczym i marketingowym

Warunki uczestnictwa

Szkolenie kierowane jest do osób zajmujących się analizą danych, które chciałyby z jednej strony podnieść swoje kompetencje w zakresie statystyki, z drugiej zaś: „przesiąść” się z przestarzałych aplikacji (Excel, SPSS, Statistica, SAS, Stata etc.) na wyspecjalizowany język R o imponujących możliwościach w zakresie analizy i wizualizacji danych. Kurs jest dostosowany do profilu osób działających zarówno w obszarze nauki, jak i biznesu, ze szczególnym ukierunkowaniem na analizę wyników z badań rynku i opinii. Kurs jest też dobrym wprowadzeniem do zagadnień klasycznej statystyki oraz analizy danych marketingowych dla osób, wykorzystujących do tej pory R do innych celów. Kurs przeznaczony jest dla osób z podstawową znajomością R – tak, aby tłumaczenie składni języka lub znaczenia podstawowych funkcji nie odrywało nas od nauki nowych zagadnień. W szczególności: doskonałym wstępem jest odbycie kursu „Analiza danych z wykorzystaniem R – kurs podstawowy”. Wiedza statystyczna ani doświadczenie w programowaniu w innych językach nie są wymagane.
Terminy gwarantowane

Gdy na jakiś termin zgłosi się minimalna liczba osób, termin oznaczamy jako gwarantowany.

Jeśli jakiś termin oznaczony jest jako gwarantowany to oznacza to, że na 100% się odbędzie we wskazanym czasie i miejscu.

Nawet gdyby część takiej grupy zrezygnowała lub przeniosła się na inny termin, raz ustalony termin gwarantowany takim pozostaje. Ewentualne ryzyko ponosimy my jako organizator.

Przejdź do terminów tego szkolenia

Szkolenia online Szkolenia online odbywają się na żywo z udziałem trenera. Uczestniczy łączą się na szkolenie za pomocą platfomy ZOOM. Informacje o wymaganym niezbędnym oprogramowaniu oraz informacje organizacyjne uczestnicy otrzymują na 7 dni przed datą rozpoczęcia szkolenia.
Inne szkolenia tej kategorii Sprawdź pozostałe    szkolenia Język R!

Sprawdź, co mówią o nas ci, którzy nam zaufali

  • 5.0/5

    Administracja bazami danych Oracle

    30-03-2024 Polecam w 100% Wojciech Dawid, Wojskowa Akademia Techniczna
  • 5.0/5

    Kompleksowe szkolenie SQL w PostgreSQL

    30-03-2024 Świetne szkolenie ! Kolejne szkolenie w JSystems i kolejny raz się nie zawiodłem. Szczerze polecam każdemu. Dziękuję ! Zbigniew Wiaterski, Cloud & Devops Solutions Zbigniew Wiaterski
  • 4.83/5

    Administracja serwerem baz danych Microsoft SQL Server + High Availability

    30-03-2024 Śmiało zapisujcie się wiedza szeroka i przede wszystkim praktyczna ;) Szymon Nowakowski, Prokuratura Okręgowa w Płocku
  • 5.0/5

    Administracja serwerem baz danych Microsoft SQL Server + High Availability

    30-03-2024 Cena, treść oraz poziom wiedzy prowadzącego Godne Polecenia Adam Klatte, Prokuratura Okręgowa w Płocku
  • 4.9/5

    Kompleksowe szkolenie SQL w PostgreSQL

    30-03-2024 Szkolenie nastawione na praktykę. Dużo wiedzy popartych ciekawymi przykładami. Rafał Gasz, Politechnika Opolska
  • 5.0/5

    Kompleksowe szkolenie SQL w PostgreSQL

    30-03-2024 Polecam szkolenia firmy JSystems. Są one przeprowadzane w sposób warsztatowy, dają możliwość stałego kontaktu z trenerem oraz sprawdzenia swojej wiedzy podczas wykonywania zadań praktycznych. Patrycja Sałata, Cosibella Sp. z o.o.
  • 5.0/5

    Administracja bazami danych Oracle

    30-03-2024 Bardzo dobre i treściwe szkolenie. Prowadzący z bardzo dużą wiedzą teoretyczną jak i praktyczną. Zdecydowanie polecam! Adam Raflewski, IBS POLAND Sp. z o.o.
  • 5.0/5

    Programowanie w języku Python

    30-03-2024 Polecam - bardzo dobra zawartość merytoryczna szkolenia. Świetnie prowadzone. Dariusz Leśniewski, Polska Spółka Gazownictwa Sp. z o.o.
  • 5.0/5

    Programowanie w języku Python

    30-03-2024 Zdecydowanie polecam prowadzącego Łukasza. Potrafi w prosty sposób wytłumaczyć nawet zawiłe tematy. Posiada bardzo duża wiedzę związaną z Pythonem. Jacek Wachowiak, Volkswagen Poznań Sp. z o.o.
  • 5.0/5

    Programowanie w języku Python

    30-03-2024 Dotychczas pytona kojarzyłem w inny sposób... coś w okolicach frameworka ZOO :) . Po szkoleniu Python nabrał kształtów i okazał się niezłą "małpą", bo coś tam zaskoczyło i zaraziło tematem. Do tematu będę wracał, choć może nie w tak szerokim zakresie jak na szkoleniu. Niemniej jednak skutecznie i produktywnie udało się przekuć zwykłą złotówkę na wiedzę, która, niezależnie od stopnia, na pewno się przyda, i to bardzo. Dzięki Łukasz! I do zobaczenia JSystems... po rządny z Was szkoleniowiec. A nawet, cytując bieżące trendy, "swój chłop!". Aleksander Wyszyński, Centrum Unijnych Projektów Transportowych
  • 4.9/5

    Administracja bazami danych Oracle

    30-03-2024 Praktyczne informacje, kompetentny prowadzący, ciekawa tematyka. Polecam. Arkadiusz Curulak, Eltel Networks Energetyka SA
  • 5.0/5

    Administracja bazami danych Oracle

    30-03-2024 Świetne przygotowanie trenera, który udzielał wyczerpujących informacji oraz przedstawiał różne scenariusze. Nie szedł tylko zgodnie z materiałem, ale pokazywał również różne sztuczki wybiegające poza materiał a które mogą być przydatne w codziennej pracy administratora baz Oracle. Artur Szymański, Gas Storage Poland sp. z o.o.
  • 5.0/5

    Administracja bazami danych Oracle

    30-03-2024 Bardzo dobre wprowadzenie do tematu baz danych Oracle. Polecam. Bogusław Henrykowski, Centrum Informatyki Resortu Finansów
  • 5.0/5

    Zaawansowana administracja PostgreSQL: High Availability, Disaster Recovery, monitoring, skalowanie

    30-03-2024 Bardzo ciekawe szkolenie. Świetne materiały, dużo przykładów praktycznych. Prowadzący, który jest praktykiem i zdecydowanie wie o czym mówi. Krzysztof Klimek, SGB BANK S.A.
  • 5.0/5

    Administracja bazami danych Oracle

    30-03-2024 Polecam. Jacek Papierzyński, Symatic Sp. z o.o.
  • 5.0/5

    Terraform i Infrastruktura jako Kod (IaC) - szkolenie kompleksowe

    29-03-2024 Polecam, trener wyczerpująco odpowiada na wszelkie pytania Mateusz Milczarczyk, ESET Polska Sp. z o.o.
  • 5.0/5

    Terraform i Infrastruktura jako Kod (IaC) - szkolenie kompleksowe

    29-03-2024 Godne uwagi, kurs przygotuje do pracy nawet bez wiedzy na temat terraforma Marcin Gach, EduBroker Sp. z o.o.
  • 5.0/5

    Terraform i Infrastruktura jako Kod (IaC) - szkolenie kompleksowe

    29-03-2024 Program szkolenia przeprowadzony bardzo profesjonalnie, widać wiedzę i doświadczenie prowadzącego. Wiedza przekazywana w jasny i klarowny sposób, nie było absolutnie "wywyższania się", z czym niestety przy szkoleniach z innymi prowadzącymi miałem doświadczenie. Interakcja prowadzącego z uczestnikami wzorowa - odpowiadanie na pytania, rozszerzanie wiedzy. Kamil Bogusławski, Rossmann SDP Sp. z o.o.
  • 5.0/5

    Spring WebFlux: Programowanie reaktywne w Javie z wykorzystaniem frameworka Spring

    28-03-2024 Bardzo dobre wejście w świat reaktywnej javy, asynchroniczności i wielowątkowości Jakub Musialik, Ornsson Solutions Sp. z o.o.
  • 5.0/5

    Tworzenie Single Page Application z wykorzystaniem Angular

    28-03-2024 Świetne szkolenie, bardzo polecam prowadzącego, duża wiedza, duże doświadczenie, świetne prowadzenie szkolenia, bardzo dobra współpraca z ludźmi Łukasz Bińkowski, Rossmann Supermarkety Drogeryjne Polska Sp. z o.o.
  • 5.0/5

    Spring WebFlux: Programowanie reaktywne w Javie z wykorzystaniem frameworka Spring

    28-03-2024 Marcin świetnie prowadzi zajęcia, chętnie udziela odpowiedzi na nurtujące nas pytania. Przemysław Czerw, Ornsson Solutions Sp. z o.o.
  • 4.81/5

    Kompleksowe szkolenie SQL w Microsoft SQL Server

    23-03-2024 Intensywne, napakowane wiedzą szkolenie. Od laika do osoby, która świadomie korzysta z zapytań w SQL w kilka dni :) Oliwia Wojtas, ORNSSON SOLUTIONS Sp. z o.o.
  • 4.9/5

    Kompleksowe szkolenie SQL w Microsoft SQL Server

    23-03-2024 Polecam szkolenie SQL - prowadzący Przemo! Dużo praktyki - pełen przekrój wiedzy. Na plus materiały po szkoleniu. Łukasz Dachowski, KRUK GRUPA VAT
  • 5.0/5

    Spring Boot - budowanie aplikacji REST

    23-03-2024 JSystems świetna robota. Merytoryczni prowadzący co ważne z żyłką pedagogiczną :) Tak trzymać. Emil Dmowski, UNIQA Towarzystwo Ubezpieczeń S.A.
  • 5.0/5

    Spring Boot - budowanie aplikacji REST

    23-03-2024 Tak powinny być prowadzone wszystkie szkolenia Marek Kuźniar, UNIQA Towarzystwo Ubezpieczeń S.A.
  • 4.9/5

    Spring Boot - budowanie aplikacji REST

    23-03-2024 jestem zadowolony Mateusz Bernaczyk, UNIQA Towarzystwo Ubezpieczeń S.A.
  • 5.0/5

    Programowanie w języku Python - poziom średnio zaawansowany

    21-03-2024 Szkolenie wysokiej jakości, bardzo dużo przydatnych treści, tematyka idealna dla osoby pracującej na stanowisku Python Developera. Przemysław Nowiński, LINK4 TU S.A
  • 5.0/5

    Analiza danych w języku Python

    21-03-2024 Takie szkolenie jest doskonałym punktem startowym dla początkujących, którzy chcą rozpocząć swoją przygodę z analizą danych przy użyciu Pythona. Szkolenie zrealizowane zgodnie z agendą. Czas i tempo bardzo dobrze dostosowane do materiału szkoleniowego. Szkolenie przeprowadzone w miłej atmosferze :) Paweł Jezierski, Kimball Electronics Poland Sp. z o.o.
  • 5.0/5

    Analiza danych w języku Python

    21-03-2024 Świetnie przeprowadzone szkolenie, luźna atmosfera, ciekawe zagadnienia, dużo praktycznych ćwiczeń. Pełen profesjonalizm prowadzącego, polecam! Karolina Bobruk, Santander Bank Polska S.A.
  • 4.9/5

    Programowanie w języku Python - poziom średnio zaawansowany

    21-03-2024 Dobrze tłumaczone! Miłosz Kocyła, Dynacon Sp. z o.o.

Masz jakieś pytania? Skontaktuj się z nami!

Odpowiadamy na telefony i maile w godzinach 9:00-17:00 od poniedziałku do piątku.

Telefon 22 299 53 69
Napisz do nas

Potrzebujesz więcej informacji?

Wiadomość wysłana

Przyjęliśmy Twoją wiadomość i skontaktujemy się z Tobą w tej sprawie

Klikając OK wrócisz do formularza

Nasza strona korzysta z plików cookie. Możesz zmienić zasady ich używania lub zablokować pliki cookie w ustawieniach przeglądarki. Więcej informacji można znaleźć w Polityce prywatności. Kontynuując korzystanie ze strony, wyrażasz zgodę na używanie plików cookie.