Microsoft R Server - nowa platforma analityczna big-data

Bez rozgłosu Microsoft udostępnił oprogramowanie Microsoft R Server, czyli platformę analityczną do analiz Big Data dla platform Windows, Linux, Hadoop oraz Teradata.

Bez specjalnego rozgłosu Microsoft udostępnił oprogramowanie Microsoft R Server, czyli napisaną w języku programowania R platformę analityczną do analiz big-data. Nowy produkt dostępny jest dla platform Windows, Linux, Hadoop oraz Teradata, a firma stworzyła go w oparciu o rozwiązania firmy Revolution Analytics.

Revolution Analytics została w kwietniu ubiegłego roku kupiona przez Microsoft. Już wtedy analitycy spekulowali, że firma z Redmond zechce wykorzystać know-how przejmowanego przedsiębiorstwa do rozszerzenia swojego portfolio oprogramowania analitycznego. I tak się właśnie stało. Microsoft postanowił rozbudować swoją ofertę w zakresie narzędzie do analizowania ogromnych zbiorów danych, a jej efektem jest właśnie premiera R Server. Oprogramowanie to jest aktualnie dostępne dla użytkowników Microsoft Developer Network oraz Microsoft DreamSpark (programu edukacyjnego, w ramach którego firma udostępnia swoje produkty studentom).

Efekt przejęcia

Wydaje się, że R Server w znacznej mierze oparty jest na stworzonym i rozwijanym przez Revolution Analytics narzędziu o nazwie Revolution R Enterprise – Microsoft co prawda zmienił nazwę produktu w wersjach dla Linux, Hadoop oraz Teradata versions, jednak pozostawił skrót RRE w nazwie wydania dla Windows.

Dodajmy, że do korzystania zarówno z R Server 2014, jak i RRE for Windows 2016 niezbędne jest oprogramowanie Microsoft R Open, które przedstawiciele firmy z Redmond nazywają „rozbudowaną dystrybucją R od Microsoftu”.

Warto zaznaczyć, że jako pierwsza o pojawieniu się R Server poinformowała Mary Jo Foley – dziennikarka serwisu ZDNet.co.uk, od lat słynącą z doskonałego zorientowania w działaniach i planach Microsoftu (w tym konkretnym przypadku Foley powołuje się na tweet Tero Alhonena).

Microsoft na razie nie komentuje tych doniesień i nie udostępnia szerszych informacji o nowym produkcie (poza umieszczeniem go w katalogu wymienionych powyżej programów partnerskich). Przypomnijmy jednak, że we wrześniu ubiegłego roku RRE oficjalnie zadebiutował w ramach usługi Azure, a miesiąc później wsparcie dla języka R zostało wprowadzone do Microsoft SQL Server 2016.

R Server, czyli zestaw narzędzi

„Platforma R Server oferuje cały zestaw rozmaitych narzędzi służących do analizy ogromnych zbiorów danych, tworzenia modeli matematycznych, prognozowania, korzystania z funkcji uczenia maszynowego itp. Wszystkie te narzędzia są w pełni kompatybilne z językiem programowanie R” – wyjaśnił Lee Stott, pełniący funkcję technical evangelist w brytysjkim oddziale Microsoftu. Dodał też, że użytkownicy mogą uruchamiać skrypty R w wysokowydajnej architekturze i korzystać z przetwarzania równoczesnego (paralelnego) by analizować dane, a także tworzyć modele i prognozy na masową skalę.

“Język R stał się ostatnio niezmiernie powszechny w zastosowaniach z dziedziny statystyki i analizy. Przejmując Revolution Analytics Microsoft szukał możliwości rozbudowania własnych narzędzi z zakresu zaawansowanej analityki danych. A jako, że prowadzenie zaawansowanych analiz np. w SQL nie jest zadaniem prostym, to firma chciała, by R stał się „punktem wejścia” do takich zastosowań” – komentuje Nik Rouda, starszy analityk z firmy Enterprise Strategy Group.

Zdaniem Nika Roudy, widać tu wyraźnie przemyślany, konsekwentnie realizowany od kilkunastu miesięcy plan Microsoftu – niedawna premiera R Server jest tylko potwierdzeniem tej tezy.

Alternatywy dla R

“Stworzona przez Microsoft technologia Machine Learnig również może korzystać z R – niejako za kulisami, do wstępnego przygotowania danych do analizy, statystyki i uczenia maszynowego” – dodaje Mike Gualtieri, główny analityk firmy Forrester Research. „Oczywiście jest to dobry kierunek – Microsoft podjął dobrą decyzję, jednak mam nadzieję, że nie postawią wszystkich swoich działań z zakresu zaawansowanej analizy danych na jedną kartę – kartę R. Ten język jest niezmiernie popularny wśród specjalistów zajmujących się tą dziedziną nauki i informatyki, jednak sądzę, że większość z nich przyzna, iż nie jest to najbardziej elegancki, wydajny czy skuteczny język… w żadnym z zastosowań” – dodaje Mike Gualtieri. Jego zdaniem, rozsądnym działaniem byłoby w przyszłości wsparcie R przez np. Pythona lub innego, bardziej współczesnego języka programowania.

Przypomnijmy (za Wikipedią): R jest interpretowanym językiem programowania oraz środowiskiem do zaawansowanych obliczeń statystycznych oraz wizualizacji wyników. Powstał jako implementacja języka S stworzonego w Bell Laboratories (obecnie Lucent Technologies) przez zespół Johna Chambersa – przygotowali ją Robert Gentleman i Ross Ihaka (to od pierwszej litery ich imion wzięła się nazwa R). R jest niezmiernie popularny m.in. w bioinformatyce (za sprawą repozytorium Bioconductor), wyjątkowo dobrze sprawdza się w analizach w ramach badań klinicznych. Microsoft oczywiście nie jest jego jedynym promotorem i użytkownikiem w biznesie – używają go również choćby Facebook, Google, LinkedIn, Mozilla czy Twitter. Kod źródłowy R opublikowany jest na zasadach licencji GNU GPL.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200