Informujemy, że w związku z sytuacją gospodarczą i wzrostem kosztów z dniem 06 marca 2023 ceny wybranych szkoleń ulegną zmianie. Aktualny cennik szkoleń obowiązuje do 05.03.2023 włącznie.
Informujemy, że już w I kwartale 2023 ruszył nabór wniosków do Krajowego Funduszu Szkoleniowego 2023. Skontaktuj się z nami, chętnie pomożemy w uzupełnieniu wniosku.


Analiza danych z wykorzystaniem R – kurs podstawowy

by:
Czas trwania 3 dni

Najbliższe terminy tego szkolenia

20.03 22.03 Termin gwarantowany Szkolenie online
Zapisz się
19.06 21.06 Termin gwarantowany Szkolenie online
Zapisz się
16.10 18.10 Termin gwarantowany Szkolenie online
Zapisz się

Szkolenie
dedykowane
dla Twojego
zespołu

Cena szkolenia 1800 PLN (netto)

Skuteczność

W naszej pracy nadrzędną wartością jest skuteczność szkoleń. Jako programiści rozumiemy, że w nauce chodzi przede wszystkim o skuteczność. Wszystkie elementy procesu szkolenia, od doboru właściwego trenera do przemyślanej warsztatowej formuły są po to, by to osiągnąć. Doskonalimy się w tym od 2008 roku. Możesz więc na nas polegać!

Program szkolenia

  1. Wprowadzenie
    • charakterystyka języka R
    • object-oriented programming: obiekty i funkcje
    • R a inne programy statystyczne i języki programowania
  2. Instalacja narzędzi R
    • repozytorium CRAN
    • instalacja R
    • zapoznanie z konsolą
    • instalacja RStudio
    • praca w środowisku RStudio
    • konfiguracja środowiska pracy
    • porządkowanie skryptu: wcięcia, komentarze, spis treści
    • korzystanie z wbudowanej pomocy:
      • wywoływanie pomocy
      • podgląd kodu funkcji
      • dokumentacja pakietów
      • książki o języku R
  3. Pakiety
    • różnorodność i rola pakietów (packages)
    • najpopularniejsze pakiety i ich możliwości
    • instalacja i ładowanie pakietów
    • wpływ zmian w kolejnych wersjach R na działanie programów
  4. Typy zmiennych i operacje na nich
    • przypisywanie wartości zmiennym: notacja „strzałkowa” a znak równości
    • zmienne liczbowe: podstawowe operatory i funkcje arytmetyczne
      • operatory: +, -, *, /, %/%, %%, ^, **
      • funkcje arytmetyczne: sum(), cumsum(), prod(), cumprod(), factorial(), sqrt()
      • logarytmy: log(), log2(), log10(), exp()
      • zaokrąglenia: round(), trunc(), ceiling()
      • format wyświetlania liczb: funkcje format() i sprintf()
    • ciągi tekstowe: podstawowe funkcje przetwarzania tekstu
      • program „Hello World!”: funkcje print() i cat()
      • konkatenacja: funkcje paste() i paste0()
      • przekształcanie ciągów tekstowych: substr(), tolower(), toupper()
      • wybrane funkcje pakietu stringr
    • wartości logiczne
      • stałe logiczne TRUE i FALSE
      • operatory i wyrażenia logiczne
    • zmienne w formacie Date
      • zmiany formatu dat: funkcje as.Date() i format()
      • konwersje między datą a timestampem: as.POSIXct()
      • wybrane funkcje pakietu lubridate
    • wektory typu factor
      • ekstrakcja i edycja poziomów wartości i etykiet factorów
      • ryzyko związane z korzystaniem z factorów
    • konwersje między typami: as.character(), as.numeric(), as.logical(), as.Date(), as.factor()
  5. Wektory i operacje na nich
    • wektorowa „filozofia” języka R
    • tworzenie wektorów
      • łączenie elementów w wektor: funkcja c()
      • sekwencje: seq()
      • replikacje: rep()
    • generowanie wektorów liczb losowych
      • permutacje i losowanie ze zbioru: sample()
      • losowanie liczb wedle znanego rozkładu: runif(), rnorm()
      • ziarno a reprodukowalność wyników: set.seed()
      • praktyczne zastosowania generatora liczb pseudolosowych
    • operacje na wektorach
      • działania arytmetyczne na wektorach
      • sortowanie: sort() i order()
      • rekodowanie wartości: ifelse()
      • operacje na zbiorach: union(), intersect(), setdiff(), setequal()
    • odwoływanie się do elementów wektora
      • odwołania po adresie
      • filtrowanie elementów wektora za pomocą wyrażeń logicznych
      • filtrowanie wektora za pomocą funkcji filter() z pakietu dplyr
      • programowanie w potokach: operator %>% z pakietu magrittr
      • wyszukiwanie elementów: funkcje is.element(), which(), which.max() i which.min()
  6. Wielowymiarowe obiekty: tablice, macierze, listy i ramki danych
    • tworzenie obiektów wielowymiarowych:
      • łączenie wektorów: cbind() i rbind()
      • tablice: array, as.array()
      • macierze: matrix, as.matrix()
      • ramki danych: data.frame, as.data.frame()
      • format danych macierzowych tibble
    • selekcja przypadków i zmiennych
      • po adresie
      • po nazwach wierszy i kolumn
      • za pomocą wyrażeń logicznych
      • za pomocą funkcji select() i filter() z pakietu dplyr
      • wyszukiwanie elementów macierzy spełniających dany warunek: which(arr.ind = TRUE)
    • inne operacje na macierzach i ramkach danych
      • transponowanie macierzy: t()
      • sortowanie zbioru danych
      • dodawanie nowych zmiennych, będących funkcją istniejących
      • sumowanie i uśrednianie wierszy i kolumn: rowSums(), colSums(), rowMeans() i colMeans()
  7. Opis statystyczny jednej zmiennej
    • opis rozkładu zmiennej: table(), prop.table()
    • wizualizacja rozkładu: hist() i plot(density())
    • parametry poziomu wartości: min(), max(), mean(), median() i quantiles()
    • parametry rozproszenia: sd(), var() i IQR()
    • wyłączanie braków danych: na.rm = TRUE
    • definiowanie własnych funkcji statystycznych
      • składnia funkcji
      • zmienne lokalne i globalne
      • argumenty wymagane i opcjonalne, deklarowanie domyślnych wartości
      • uruchamianie funkcji z zewnętrznego pliku: source()
    • wyliczenia parametrów wszystkich zmiennych ze zbioru danych, z użyciem funkcji summary() i lapply()
    • rekodowanie zmiennych ciągłych na przedziały: funkcja cut()
    • formatowanie tabel rozkładu: funkcja tabyl() z pakietu janitor
    • formatowanie wykresów słupkowych: funkcja barplot() i jej argumenty graficzne
    • automatyczny eksport wykresów do postaci plików graficznych i PDF
  8. Wczytywanie danych z zewnętrznych źródeł
    • wczytywanie danych z plików tekstowych: read.table(), read.csv() i read.delim()
    • import danych z zewnętrznych aplikacji, np. SPSS: pakiet foreign
    • wczytywanie danych wprost ze źródła w internecie
    • długi i szeroki format danych, sposoby zamiany jednego na drugi: spread() i gather() z pakietu tidyr
  9. Analiza współzależności między zmiennymi
    • tabele kontyngencji
      • generowanie i formatowanie tabel kontyngencji
      • interpretacja zależności i sposób opisu wyników
      • istotność zależności: test chi-kwadrat
      • interpretacja współczynnika istotności statystycznej
      • siła zależności: współczynnik V Cramera
      • wizualizacja zależności: skumulowane wykresy słupkowe
    • zależność zmiennej ciągłej od zmiennej kategorialnej
      • porównania średnich w podgrupach: aggregate()
      • statystyki w podgrupach z wykorzystaniem pakietu dplyr: group_by() %>% summarize()
      • testy różnic między średnimi: test t dla prób niezależnych i jednoczynnikowa analiza wariancji
      • interpretacja wyników testów
      • wizualizacja różnic między średnimi: wykresy liniowe
    • analiza korelacji
      • wizualizacja zależności: wykresy rozrzutu
      • siła zależności: korelacje proste, macierze korelacji
      • wizualizacja korelacji: korelogramy
    • modele liniowe
      • regresja liniowa jednej zmiennej: lm()
      • wizualizacja zależności: abline(lm())
      • regresja liniowa wielu zmiennych
      • interpretacja współczynników modelu
    • formułowanie wniosków z analizy
  10. Analiza danych – od wczytania danych do wizualizacji

Opis szkolenia

Szkolenie odbywa się na żywo z udziałem trenera. Nie jest to forma kursu video!
    Po ukończeniu tego szkolenia uczestnik będzie potrafił:
    • Instalować R i RStudio, oraz sprawnie pozyskiwać i uruchamiać nowe pakiety
    • Korzystać z funkcjonalności RStudio, wspomagających programowanie w języku R
    • Korzystać z pomocy i dokumentacji wbudowanej w język R
    • Konfigurować ścieżkę katalogu roboczego, uruchamiać zapisane w nim skrypty i eksportować do niego wyniki analiz
    • Tworzyć zmienne różnych typów i przypisywać im wartości
    • Posługiwać się szeroką paletą funkcji do przetwarzania zmiennych tekstowych, liczbowych, logicznych oraz dat
    • Identyfikować typy zmiennych i dokonywać konwersji między nimi
    • Posługiwać się generatorem liczb pseudolosowych
    • Konstruować wektory, macierze i ramki danych, i na różne sposoby odwoływać się do ich zawartości
    • Definiować własne funkcje statystyczne
    • Wczytywać dane z zewnętrznych źródeł: pliki tekstowe, arkusze Excel, bazy SPSS, internet
    • Zmieniać strukturę danych z formatu baz relacyjnych („długiego”) na format „szeroki” i na odwrót
    • Filtrować i sortować dane, rekodować zmienne i wyliczać wartości nowych zmiennych na podstawie istniejących
    • Przeprowadzać i interpretować wyniki analiz statystycznych:
      • opis rozkładu zmiennej
      • opis parametryczny zmiennej
      • analiza tabel kontyngencji
      • porównania średnich w podgrupach
      • analiza korelacji
      • regresja liniowa
      • wykonywanie testów statystycznych: test chi-kwadrat, test t dla prób niezależnych, analiza wariancji
      • wizualizacja zależności: histogramy, wykresy gęstości, wykresy słupkowe i liniowe, korelogramy

Warunki uczestnictwa

Szkolenie kierowane jest do osób, które chciałyby na co dzień posługiwać się językiem R jako narzędziem prowadzenia analiz w biznesie lub na polu naukowym. Kurs podstawowy przeznaczony jest dla osób bez, lub z niewielkim doświadczeniem w posługiwaniu się językiem R. Do kursu może przystąpić każdy, kto wykazuje się minimalną biegłością w posługiwaniu się liczbami. Wiedza statystyczna ani doświadczenie w programowaniu w innych językach nie są wymagane.
Terminy gwarantowane Jeśli jakiś termin oznaczony jest jako gwarantowany to oznacza to że na 100% się odbędzie we wskazanym czasie i miejscu. Więcej
Szkolenia online i udział online Szkolenia online odbywają się na żywo z udziałem trenera. Uczestniczy łączą się na szkolenie za pomocą platfomy ZOOM. Informacje o wymaganym niezbędnym oprogramowaniu oraz informacje organizacyjne uczestnicy otrzymują na 7 dni przed datą rozpoczęcia szkolenia. W każdym szkoleniu stacjonarnym możesz brać udział online. Więcej
Inne szkolenia tej kategorii Sprawdź pozostałe    szkolenia Język R!

Sprawdź, co mówią o nas ci, którzy nam zaufali

  • 4.85/5

    Analiza danych z wykorzystaniem R – kurs podstawowy

    10-04-2019 Bardzo ciekawe szkolenie. Dużo uporządkowanych informacji. Zdecydowanie polecam zarówno dla osób, które chcą uporządkować swoją wiedzę i uzupełnić braki oraz dla osób, które nie mają jeszcze żadnego doświadczenia w pracy z językiem R. Marzena Andrzejczak, Comarch SA
  • 4.94/5

    Analiza danych z wykorzystaniem R – kurs podstawowy

    10-04-2019 Dzięki za intensywne 3 dni z R :) Marcin Krzystanek, Wakacje.pl SA
  • 4.78/5

    Analiza danych z wykorzystaniem R – kurs podstawowy

    05-12-2018 Profesjonalna organizacja. Kamil Iwański, PKO Bank Polski SA

Masz jakieś pytania? Skontaktuj się z nami!

Odpowiadamy na telefony i maile w godzinach 9:00-17:00 od poniedziałku do piątku.

Telefon 22 299 53 69
Napisz do nas

Potrzebujesz więcej informacji?

Wiadomość wysłana

Przyjęliśmy Twoją wiadomość i skontaktujemy się z Tobą w tej sprawie

Klikając OK wrócisz do formularza

Nasza strona korzysta z plików cookie. Możesz zmienić zasady ich używania lub zablokować pliki cookie w ustawieniach przeglądarki. Więcej informacji można znaleźć w Polityce prywatności. Kontynuując korzystanie ze strony, wyrażasz zgodę na używanie plików cookie.