fbpx
 
R dla badaczy
– poziom podstawowy
24 i 25 września 2020 r.
trener:
Marek Młodożeniec, Sotrender
Pakiety statystyczne wykorzystywane w agencjach badawczych rzadko łączą możliwości analizy danych z funkcją tworzenia estetycznych i w pełni konfigurowalnych wykresów. Język programowania R oferuje niemal nieograniczone możliwości analizy i wizualizacji danych. Jest elastyczny i wszechstronny

Pakiety statystyczne wykorzystywane w agencjach badawczych rzadko łączą możliwości analizy danych z funkcją tworzenia estetycznych i w pełni konfigurowalnych wykresów – każdy badacz i analityk zna frustrację, która towarzyszy przeklejaniu tabel wynikowych do Excela lub PowerPointa, a potem formatowaniu każdego wykresu oddzielnie. Nawet po zakończeniu pracy nad raportem, każde powtórzenie pomiaru wymaga wykonania szeregu czasochłonnych czynności, zanim powstanie raport z kolejnej edycji badania. Wszystko to wydłuża czas pracy, utrudnia jej automatyzację i zwiększa ryzyko błędów.
Język programowania R oferuje niemal nieograniczone możliwości analizy i wizualizacji danych. Jest elastyczny i wszechstronny – umożliwia analizę danych o dowolnej strukturze, w dokładnie taki sposób, jaki jest nam potrzebny. Umożliwia zarówno wykonywanie doraźnych analiz eksploracyjnych, jak i świetnie się nadaje do automatyzacji zadań powtarzalnych. Pozwala na tworzenie estetycznych, interaktywnych wykresów. Każdy badacz słyszał o możliwościach R, ale panuje powszechna obawa przed jego używaniem, ze względu na konieczność nauki programowania.
Zamierzam pokazać, że korzystanie z pakietu R wcale nie jest trudne, i umożliwić bezproblemowe przejście przez pierwszy etap nauki. Uczestnicy szkolenia zostaną wyposażeni w podstawowe umiejętności i szereg praktycznych podpowiedzi, które umożliwią im stopniowe zwiększanie biegłości w korzystaniu z R w toku codziennej pracy z danymi..

Szczegółowy zakres szkolenia:

  • Prezentacja zalet, możliwości i zastosowań R
  • Zapoznanie z edytorem RStudio
  • Pakiety: ich rola, możliwości, instalacja i ładowanie
  • Typy zmiennych, konwersje między typami
  • Przetwarzanie zmiennych tekstowych, logicznych i numerycznych
  • Tworzenie i przekształcanie dwuwymiarowych obiektów danych
  • Przeszukiwanie zbiorów danych i odwoływanie się do ich elementów
  • Wczytywanie danych z formatów .CSV (Excel) i .SAV (SPSS)
  • Rekodowanie zmiennych
  • Selekcja przypadków i zmiennych
  • Opis statystyczny jednej zmiennej
  • Opis i testowanie istotności współzależności między zmiennymi:
    • tabele kontyngencji
    • porównania średnich w podgrupach
    • analiza korelacji
    • model regresji liniowej
  • Wizualizacja wyników analiz: histogramy, wykresy słupkowe, liniowe i kołowe

Do kogo kierowane jest szkolenie:

Kurs podstawowy kierowany jest do badaczy ilościowych i analityków danych, którzy chcą zacząć wykorzystywać R do analizy danych z badań ankietowych i innych źródeł. Osoby mające doświadczenie w pracy z R mają szansę odświeżenia i uporządkowania posiadanej wiedzy. Warsztat stanowi wprowadzenie do posługiwania się R - sprawne wykorzystywanie go w pracy badawczej będzie wymagało dalszego szlifowania umiejętności po zakończeniu kursu.

Korzyści dla uczestników:

Po ukończeniu tego szkolenia uczestnik będzie potrafił:
  • Instalować R i RStudio, oraz sprawnie pozyskiwać i uruchamiać nowe pakiety
  • Korzystać z funkcjonalności RStudio, wspomagających programowanie w R
  • Korzystać z pomocy i dokumentacji wbudowanej w język R
  • Posługiwać się szeroką paletą funkcji do przetwarzania zmiennych numerycznych, logicznych i tekstowych
  • Tworzyć i przekształcać wielowymiarowe obiekty danych
  • Przeszukiwać zbiór danych i odwoływać się do jego zawartości
  • Wykorzystywać operator %>%  do tworzenia potoków operacji na danych
  • Wczytywać dane z zewnętrznych źródeł
  • Rekodować zmienne i dokonywać podstawowych operacji czyszczenia danych
  • Przeprowadzać podstawowe analizy statystyczne:
    • opis parametryczny jednej zmiennej
    • tabele rozkładu jednej zmiennej
    • tabele kontyngencji
    • porównania między średnimi (test t, ANOVA)
    • analiza korelacji
    • model regresji liniowej
  • Tworzyć wizualizacje ww. analiz w formie estetycznych wykresów
  • Eksportować dane, wyniki analiz i wykresy do zewnętrznych katalogów

Kluczowe pojęcia i zagadnienia:

Pojęcia z zakresu programowania: obiekt, zmienna, typ zmiennej, konwersja typów, konkatenacja, funkcja, argument funkcji, wektor, lista, macierz, ramka danych, adres, potok (pipeline)

Pojęcia statystyczne: średnia, mediana, kwartyl, minimum, maksimum, rozstęp, wariancja, odchylenie standardowe, odchylenie ćwiartkowe, zmienna kategorialna, zmienna ciągła, rozkład zmiennej, rekodowanie zmiennej, liczebność, częstość, rozkład brzegowy, rozkład warunkowy, rozkład łączny, tabela kontyngencji, niezależność stochastyczna, istotność statystyczna, test t, analiza wariancji, korelacja, współczynnik korelacji, regresja liniowa, histogram, wykres rozrzutu, parametry graficzne.

Forma szkolenia:

Szkolenie będzie miało formę warsztatową. Zdecydowaną większość czasu spędzimy, pisząc i testując kod na własnych komputerach. Moduły tematyczne składające się z teorii i przykładów będą przedzielane ćwiczeniami indywidualnymi, służącymi utrwaleniu materiału.

Stopień zaawansowania:

Kurs podstawowy przeznaczony jest dla osób bez, lub z niewielkim doświadczeniem w posługiwaniu się R. Doświadczenie w programowaniu w innych językach nie jest wymagane, aczkolwiek należy mieć świadomość, że praca na zajęciach polegać będzie na pisaniu kodu. Podstawowa wiedza na temat stosowanych w badaniach analiz, jak np. tabele krzyżowe, korelacje czy testy istotności będzie pomocna, ale zagadnienia te w razie potrzeby zostaną objaśnione.

pdf
Anna Mazerant
Marek
Młodożeniec
Sotrender

termin: 24 i 25 września 2020 r.
czas trwania: 16 godzin szkoleniowych w godz. 9.00-16.30
miejsce: PTBRiO, Szarotki 11, Warszawa
Uwaga! Ze względu na panującą pandemię organizator szkolenia zastrzega sobie prawo zmiany miejsca, terminu oraz formuły (stacjonarna/ online) szkolenia. O wszelkich ewentualnych zmianach uczestnicy szkolenia będą informowani na bieżąco.
w cenie: udział w szkoleniu, materiały, certyfikat, przerwy kawowe, lunch
najlepsza cena: do dnia:
1499 zł 3.IX
regularna cena:
1699 zł
zgłoś się
ceny netto

Chcesz wiedzieć więcej?

więcej informacji udzieli Ci koordynator szkoleń
Anna Chodkiewicz