Warsztat II: Analiza danych w R - współczesna statystyka dla organizacji - Data + Manage Analyze Predict: Computerworld
Grafika tła


Warsztat II: Analiza danych w R – współczesna statystyka dla organizacji

PROFIL WARSZTATU: TECHNICZNY

PROWADZĄCY: Artur Suchwałko, Właściciel, QuantUp



System statystyczny R (http://r-project.org) jest językiem programowania wyposażonym w tysiące bibliotek zawierających funkcje do analizy danych i modelowania. W ostatnich latach stał się narzędziem używanym praktycznie wszędzie: w firmach z najróżniejszych branż, instytucjach publicznych i naukowych. Darmowy do wszelkich zastosowań – język R – jest standardowym narzędziem współczesnej statystyki stosowanej i wypiera rozwiązania komercyjne. Jeśli nawet nie jest podstawowym narzędziem analizy danych w firmie, to uzupełnia systemy komercyjne.

Cel warsztatów:

Praca w R jest też niezbędną umiejętnością dla analityka i coraz częściej jego znajomość jest wymagana przez pracodawców. Niedawno powstały pakiety (biblioteki) bardzo ułatwiające pracę w tym systemie. Niestety, mimo obfitości materiałów i książek, samodzielna nauka R nie jest łatwa. Podczas tych warsztatów będzie można nauczyć się pracy z R, z wykorzystaniem tych nowoczesnych pakietów. Warsztaty będą przeprowadzone w sposób interaktywny, a uczestnicy dzięki pracy na własnych komputerach będą mogli wypróbować różne możliwości. Skorzystamy z ciekawych rzeczywistych danych.

Kluczowe korzyści z udziału w warsztatach – uczestnicy dowiedzą się:

  • Jakie są zalety i wady R
  • W jaki sposób pracować z R
  • Jak oczyścić, przygotować i analizować dane
  • Jakie operacje na danych można wykonać w R
  • Jak przeprowadzać powtarzalne analizy


W programie warsztatów:

  • Sposób pracy z R
  • Przygotowanie danych do analizy z pakietem tidyr / reshape2
  • Przekształcanie danych z wykorzystaniem dplyr
  • Podstawy wizualizacji z wykorzystaniem ggplot2 (ew. ggvis)
  • Kilka wybranych metod analitycznych
  • Reproducible research / analysis z pakietem knitr oraz R Markdown – prezentacja
  • Prezentacja interaktywnych aplikacji analitycznych z wykorzystaniem shiny

Wymagane oprogramowanie:
Najnowsza wersja systemu statystycznego R
RStudio

Prowadzący

Artur Suchwałko

dr inż. Artur Suchwałko

analityk i statystyk, programista, trener, założyciel i właściciel firmy QuantUp.pl

Przez kilkanaście lat był statystykiem, a później ekspertem w Departamencie Ryzyka Kredytowego i Analiz Lukas Banku. Jest doktorem matematyki oraz autorem i współautorem kilkunastu prac naukowych. Przeprowadził kilkadziesiąt komercyjnych szkoleń z dziedziny zarządzania ryzykiem kredytowym, budowy i walidacji modeli scoringowych, statystyki, analizy danych i data miningu, spędzając w salach szkoleniowych ponad 1200 godzin i ucząc kilkaset osób. Kilka lat temu został dyrektorem naukowym (Chief Science Officer) szwedzkiej firmy bioinformatycznej MedicWave. Od roku 2012 jest dodatkowo Vice CEO tej firmy. Od paru lat rozwija z sukcesem swoją firmę QuantUp (http://quantup.pl) zajmującą się analizą danych, modelowaniem statystycznym i tworzeniem oprogramowania oraz szkoleniami z tych dziedzin. Używa R od kilkunastu lat, jest jego fanem i propaguje to narzędzie.