– poziom podstawowy
Marek Młodożeniec, Sotrender
Język programowania R oferuje niemal nieograniczone możliwości analizy i wizualizacji danych. Jest elastyczny i wszechstronny – umożliwia analizę danych o dowolnej strukturze, w dokładnie taki sposób, jaki jest nam potrzebny. Umożliwia zarówno wykonywanie doraźnych analiz eksploracyjnych, jak i świetnie się nadaje do automatyzacji zadań powtarzalnych. Pozwala na tworzenie estetycznych, interaktywnych wykresów. Każdy badacz słyszał o możliwościach R, ale panuje powszechna obawa przed jego używaniem, ze względu na konieczność nauki programowania.
Zamierzam pokazać, że korzystanie z pakietu R wcale nie jest trudne, i umożliwić bezproblemowe przejście przez pierwszy etap nauki. Uczestnicy szkolenia zostaną wyposażeni w podstawowe umiejętności i szereg praktycznych podpowiedzi, które umożliwią im stopniowe zwiększanie biegłości w korzystaniu z R w toku codziennej pracy z danymi..
Szczegółowy zakres szkolenia:
- Prezentacja zalet, możliwości i zastosowań R
- Zapoznanie z edytorem RStudio
- Pakiety: ich rola, możliwości, instalacja i ładowanie
- Typy zmiennych, konwersje między typami
- Przetwarzanie zmiennych tekstowych, logicznych i numerycznych
- Tworzenie i przekształcanie dwuwymiarowych obiektów danych
- Przeszukiwanie zbiorów danych i odwoływanie się do ich elementów
- Wczytywanie danych z formatów .CSV (Excel) i .SAV (SPSS)
- Rekodowanie zmiennych
- Selekcja przypadków i zmiennych
- Opis statystyczny jednej zmiennej
- Opis i testowanie istotności współzależności między zmiennymi:
- tabele kontyngencji
- porównania średnich w podgrupach
- analiza korelacji
- model regresji liniowej
- Wizualizacja wyników analiz: histogramy, wykresy słupkowe, liniowe i kołowe
Do kogo kierowane jest szkolenie:
Kurs podstawowy kierowany jest do badaczy ilościowych i analityków danych, którzy chcą zacząć wykorzystywać R do analizy danych z badań ankietowych i innych źródeł. Osoby mające doświadczenie w pracy z R mają szansę odświeżenia i uporządkowania posiadanej wiedzy. Warsztat stanowi wprowadzenie do posługiwania się R - sprawne wykorzystywanie go w pracy badawczej będzie wymagało dalszego szlifowania umiejętności po zakończeniu kursu.Korzyści dla uczestników:
Po ukończeniu tego szkolenia uczestnik będzie potrafił:- Instalować R i RStudio, oraz sprawnie pozyskiwać i uruchamiać nowe pakiety
- Korzystać z funkcjonalności RStudio, wspomagających programowanie w R
- Korzystać z pomocy i dokumentacji wbudowanej w język R
- Posługiwać się szeroką paletą funkcji do przetwarzania zmiennych numerycznych, logicznych i tekstowych
- Tworzyć i przekształcać wielowymiarowe obiekty danych
- Przeszukiwać zbiór danych i odwoływać się do jego zawartości
- Wykorzystywać operator %>% do tworzenia potoków operacji na danych
- Wczytywać dane z zewnętrznych źródeł
- Rekodować zmienne i dokonywać podstawowych operacji czyszczenia danych
- Przeprowadzać podstawowe analizy statystyczne:
- opis parametryczny jednej zmiennej
- tabele rozkładu jednej zmiennej
- tabele kontyngencji
- porównania między średnimi (test t, ANOVA)
- analiza korelacji
- model regresji liniowej
- Tworzyć wizualizacje ww. analiz w formie estetycznych wykresów
- Eksportować dane, wyniki analiz i wykresy do zewnętrznych katalogów
Kluczowe pojęcia i zagadnienia:
Pojęcia z zakresu programowania: obiekt, zmienna, typ zmiennej, konwersja typów, konkatenacja, funkcja, argument funkcji, wektor, lista, macierz, ramka danych, adres, potok (pipeline)Pojęcia statystyczne: średnia, mediana, kwartyl, minimum, maksimum, rozstęp, wariancja, odchylenie standardowe, odchylenie ćwiartkowe, zmienna kategorialna, zmienna ciągła, rozkład zmiennej, rekodowanie zmiennej, liczebność, częstość, rozkład brzegowy, rozkład warunkowy, rozkład łączny, tabela kontyngencji, niezależność stochastyczna, istotność statystyczna, test t, analiza wariancji, korelacja, współczynnik korelacji, regresja liniowa, histogram, wykres rozrzutu, parametry graficzne.
Forma szkolenia:
Szkolenie będzie miało formę warsztatową. Zdecydowaną większość czasu spędzimy, pisząc i testując kod na własnych komputerach. Moduły tematyczne składające się z teorii i przykładów będą przedzielane ćwiczeniami indywidualnymi, służącymi utrwaleniu materiału.Stopień zaawansowania:
Kurs podstawowy przeznaczony jest dla osób bez, lub z niewielkim doświadczeniem w posługiwaniu się R. Doświadczenie w programowaniu w innych językach nie jest wymagane, aczkolwiek należy mieć świadomość, że praca na zajęciach polegać będzie na pisaniu kodu. Podstawowa wiedza na temat stosowanych w badaniach analiz, jak np. tabele krzyżowe, korelacje czy testy istotności będzie pomocna, ale zagadnienia te w razie potrzeby zostaną objaśnione.Młodożeniec
Sotrender
czas trwania: 16 godzin szkoleniowych w godz. 9.00-16.30
miejsce: PTBRiO, Szarotki 11, Warszawa
Uwaga! Ze względu na panującą pandemię organizator szkolenia zastrzega sobie prawo zmiany miejsca, terminu oraz formuły (stacjonarna/ online) szkolenia. O wszelkich ewentualnych zmianach uczestnicy szkolenia będą informowani na bieżąco.
w cenie: udział w szkoleniu, materiały, certyfikat, przerwy kawowe, lunch
Chcesz wiedzieć więcej?
więcej informacji udzieli Ci koordynator szkoleń
Anna Chodkiewicz