System statystyczny R (http://r-project.org) jest językiem programowania wyposażonym w tysiące bibliotek zawierających funkcje do analizy danych i modelowania. W ostatnich latach stał się narzędziem używanym praktycznie wszędzie: w firmach z najróżniejszych branż, instytucjach publicznych i naukowych. Darmowy do wszelkich zastosowań – język R – jest standardowym narzędziem współczesnej statystyki stosowanej i wypiera rozwiązania komercyjne. Jeśli nawet nie jest podstawowym narzędziem analizy danych w firmie, to uzupełnia systemy komercyjne.
Cel warsztatów:
Praca w R jest też niezbędną umiejętnością dla analityka i coraz częściej jego znajomość jest wymagana przez pracodawców. Niedawno powstały pakiety (biblioteki) bardzo ułatwiające pracę w tym systemie. Niestety, mimo obfitości materiałów i książek, samodzielna nauka R nie jest łatwa. Podczas tych warsztatów będzie można nauczyć się pracy z R, z wykorzystaniem tych nowoczesnych pakietów. Warsztaty będą przeprowadzone w sposób interaktywny, a uczestnicy dzięki pracy na własnych komputerach będą mogli wypróbować różne możliwości. Skorzystamy z ciekawych rzeczywistych danych.
Kluczowe korzyści z udziału w warsztatach – uczestnicy dowiedzą się:
- Jakie są zalety i wady R
- W jaki sposób pracować z R
- Jak oczyścić, przygotować i analizować dane
- Jakie operacje na danych można wykonać w R
- Jak przeprowadzać powtarzalne analizy
W programie warsztatów:
- Sposób pracy z R
- Przygotowanie danych do analizy z pakietem tidyr / reshape2
- Przekształcanie danych z wykorzystaniem dplyr
- Podstawy wizualizacji z wykorzystaniem ggplot2 (ew. ggvis)
- Kilka wybranych metod analitycznych
- Reproducible research / analysis z pakietem knitr oraz R Markdown – prezentacja
- Prezentacja interaktywnych aplikacji analitycznych z wykorzystaniem shiny
Wymagania:
Umiejętność programowania w jakimkolwiek języku wysokiego poziomu oraz jakiekolwiek doświadczenie w pracy z danymi, w dowolnym narzędziu. Warsztaty będą interaktywne, dlatego zapraszamy do zabrania ze sobą laptopa z zainstalowaną najnowszą wersją R oraz zainstalowanym RStudio
Maksymalna liczba uczestników: 30 - decyduje kolejność zgłoszeń
Wymagane oprogramowanie:
- Najnowsza wersja systemu statystycznego R
- RStudio
Prowadzący

dr inż. Artur Suchwałko
analityk i statystyk, programista, trener, założyciel i właściciel firmy QuantUp.plPrzez kilkanaście lat był statystykiem, a później ekspertem w Departamencie Ryzyka Kredytowego i Analiz Lukas Banku. Jest doktorem matematyki oraz autorem i współautorem kilkunastu prac naukowych. Przeprowadził kilkadziesiąt komercyjnych szkoleń z dziedziny zarządzania ryzykiem kredytowym, budowy i walidacji modeli scoringowych, statystyki, analizy danych i data miningu, spędzając w salach szkoleniowych ponad 1200 godzin i ucząc kilkaset osób. Kilka lat temu został dyrektorem naukowym (Chief Science Officer) szwedzkiej firmy bioinformatycznej MedicWave. Od roku 2012 jest dodatkowo Vice CEO tej firmy. Od paru lat rozwija z sukcesem swoją firmę QuantUp (http://quantup.pl) zajmującą się analizą danych, modelowaniem statystycznym i tworzeniem oprogramowania oraz szkoleniami z tych dziedzin. Używa R od kilkunastu lat, jest jego fanem i propaguje to narzędzie.