Big Data rewolucjonizuje rynek baz danych

Wszelkie takie dane muszą być ze sobą spójne, by organizacje były w stanie przeanalizować interesujące dla nich zagadnienia. W kontekście zakupów online takim zagadnieniem może być to, dlaczego użytkownicy nie kupują butów określonej marki po kliknięciu w przycisk wyboru koloru.

Wcześniej raczej nie zaprzątano sobie głowy takimi problemami.

Platforma Hadoop jest zawodnikiem wagi ciężkiej w grupie nowych graczy wkraczających dziś na rynek. Chociaż sama w sobie nie jest bazą danych, spełnia kluczową rolę z perspektywy firm zmagających się z ogromnymi zbiorami danych. Zasadniczo, Hadoop to platforma skupiona wokół danych służąca do obsługi wysoce równoległych aplikacji, która zapewnia niezwykle wysoki poziom skalowalności.

Zobacz również:

  • Asystent AI Copilot wkroczył do platformy Azure SQL Database

Umożliwia firmom raczej skalowanie “na zewnątrz” na zasadzie dystrybucji niż skalowanie „w górę” za pośrednictwem dodatkowych, kosztownych serwerów. Dzięki temu organizacje są w stanie stworzyć jeden gigantyczny zbiór danych, który dopiero po połączeniu ze sobą wszystkich źródeł informacji jest poddawany analizie.

Jednym z najnowszych rozwiązań alternatywnych w stosunku do systemów RDBMS jest rodzina baz danych NoSQL, do których należą między innymi MongoDB – obecnie czwarty najbardziej popularny system do zarządzania bazami danych według DB-Engines – i MarkLogic.

- Relacyjne systemy zarządzania bazami danych doskonale sprawdzały się przez ostatnie 30 lat. Powstały jednak w zupełnie innej erze, kiedy to bariery technologiczne i potrzeby rynkowe były całkowicie odmienne – mówi Joe Pasqua, wiceprezes ds. rozwoju produktów w firmie MarkLogic.

Big Data nie jest jednolitym zbiorem danych. Mimo to, homogeniczność jest podstawowym wymogiem w przypadku wielu tradycyjnych technologii.

- Wyobraźmy sobie, że jedyny program zainstalowany na naszym komputerze to Microsoft Excel, a my chcemy monitorować posty naszych znajomych albo stworzyć umowę prawną. To niewykonalne, jeżeli mamy do dyspozycji wyłącznie arkusze z kolumnami i wierszami – wyjaśnia Joe Pasqua.

Szczególnie trudnym wyzwaniem jest łączenie szczególnie dużych zbiorów danych.

- Relacyjne bazy danych wymagają podjęcia decyzji o sposobie uporządkowania kolumn jeszcze przed połączeniem wszystkich zbiorów danych w jeden. Można zdecydować się na dowolny format lub sposób uporządkowania i niezwłocznie zacząć z nich korzystać – dodaje Joe Pasqua.


TOP 200