Big Data rewolucjonizuje rynek baz danych

  • Computerworld/KB,

Wszelkie takie dane muszą być ze sobą spójne, by organizacje były w stanie przeanalizować interesujące dla nich zagadnienia. W kontekście zakupów online takim zagadnieniem może być to, dlaczego użytkownicy nie kupują butów określonej marki po kliknięciu w przycisk wyboru koloru.

Wcześniej raczej nie zaprzątano sobie głowy takimi problemami.

Platforma Hadoop jest zawodnikiem wagi ciężkiej w grupie nowych graczy wkraczających dziś na rynek. Chociaż sama w sobie nie jest bazą danych, spełnia kluczową rolę z perspektywy firm zmagających się z ogromnymi zbiorami danych. Zasadniczo, Hadoop to platforma skupiona wokół danych służąca do obsługi wysoce równoległych aplikacji, która zapewnia niezwykle wysoki poziom skalowalności.

Zobacz również:

Umożliwia firmom raczej skalowanie “na zewnątrz” na zasadzie dystrybucji niż skalowanie „w górę” za pośrednictwem dodatkowych, kosztownych serwerów. Dzięki temu organizacje są w stanie stworzyć jeden gigantyczny zbiór danych, który dopiero po połączeniu ze sobą wszystkich źródeł informacji jest poddawany analizie.

Jednym z najnowszych rozwiązań alternatywnych w stosunku do systemów RDBMS jest rodzina baz danych NoSQL, do których należą między innymi MongoDB – obecnie czwarty najbardziej popularny system do zarządzania bazami danych według DB-Engines – i MarkLogic.

- Relacyjne systemy zarządzania bazami danych doskonale sprawdzały się przez ostatnie 30 lat. Powstały jednak w zupełnie innej erze, kiedy to bariery technologiczne i potrzeby rynkowe były całkowicie odmienne – mówi Joe Pasqua, wiceprezes ds. rozwoju produktów w firmie MarkLogic.

Big Data nie jest jednolitym zbiorem danych. Mimo to, homogeniczność jest podstawowym wymogiem w przypadku wielu tradycyjnych technologii.

- Wyobraźmy sobie, że jedyny program zainstalowany na naszym komputerze to Microsoft Excel, a my chcemy monitorować posty naszych znajomych albo stworzyć umowę prawną. To niewykonalne, jeżeli mamy do dyspozycji wyłącznie arkusze z kolumnami i wierszami – wyjaśnia Joe Pasqua.

Szczególnie trudnym wyzwaniem jest łączenie szczególnie dużych zbiorów danych.

- Relacyjne bazy danych wymagają podjęcia decyzji o sposobie uporządkowania kolumn jeszcze przed połączeniem wszystkich zbiorów danych w jeden. Można zdecydować się na dowolny format lub sposób uporządkowania i niezwłocznie zacząć z nich korzystać – dodaje Joe Pasqua.