Analityka na aktualnych danych

Subskrybuj RSS A A A
1 czerwca 2010
Piotr Waszczuk

Bazy danych działające bezpośrednio w pamięci operacyjnej mogą zrewolucjonizować rynek rozwiązań analitycznych. Z drugiej strony, nowe rozwiązania raczej nie zastąpią rozbudowanych systemów BI. Będą ich uzupełnieniem.

Sercem rozbudowanych systemów analitycznych jest dziś baza, czy raczej hurtownia danych, do której spływają praktycznie wszystkie możliwe informacje o prowadzonej działalności. Im szerszy horyzont gromadzonych danych, tym większa i trudniejsza do przetworzenia baza danych. I tu zaczynają się schody. Wąskim gardłem staje się nie tyle niewystarczająca moc obliczeniowa, co kwestia fizycznego składowania danych w macierzach dyskowych i czasów dostępu do informacji. Rozwiązaniem tego problemu może być - skądinąd coraz trudniejsza -optymalizacja sposobu zapisu i działania systemu zarządzania bazą danych, czy wykorzystywanie rozbudowanych klastrowych pamięci masowych. W tę stronę podąża Oracle z linią produktów bazodanowo-sprzętowych Exadata.

Innym rozwiązaniem problemu ma być przeniesienie całej bazy danych do pamięci operacyjnej i wykorzystanie do tego celu technologii przetwarzania in-memory. Dla nowoczesnych pamięci czas dostępu do danych wynosi zaledwie kilkadziesiąt nanosekund. W przypadku dysków twardych jest to zaś kilka milisekund. W uproszczeniu można więc przyjąć, że dostęp do danych przechowywanych w pamięci operacyjnej jest nawet kilkanaście milionów razy szybszy. W tym właśnie kierunku chce iść - konkurujący z Oracle - niemiecki SAP.

Z dysku do pamięci

Podejście takie nie jest niczym nowym. Wraz ze wzrostem szybkości układów DRAM, na przestrzeni ostatnich lat istotnie spadł koszt ich zakupu w przeliczeniu na jednostkę pojemności. Wzrosła więc liczba firm, które potencjalnie stać na zakup serwera wyposażonego w - bagatela - kilka terabajtów pamięci operacyjnej. Nie pozostało to niezauważone przez producentów rozwiązań bazodanowych.

Mechanizmy oparte na przetwarzaniu danych bezpośrednio w pamięci operacyjnej wykorzystują w rozwiązaniach m.in. IBM, Oracle i Sybase, którego przejął właśnie SAP. Nie brak również - opartych na tej technologii - rozwiązań open source oraz hybrydowych systemów zarządzania bazami danych, które wykorzystują algorytmy przetwarzania w pamięci operacyjnej do zwiększenia wydajności całej bazy. Warto wspomnieć, że z dobrodziejstw przetwarzania rozbudowanych struktur danych w pamięci operacyjnej korzysta już dziś SAP. Stosowne mechanizmy indeksowania i przetwarzania dużych wolumenów ustrukturyzowanych danych w czasie rzeczywistym są częścią modułu wyszukiwania platformy SAP NetWeaver - TREX. Zawiera on rozbudowane algorytmy kompresji danych i technologię agregacji danych w czasie liniowym. Znakiem czasów jest też rosnąca popularność rozwiązań analitycznych operujących na danych znajdujących się w pamięci. Większość dostępnych na rynku rozwiązań tej klasy - jak choćby system analityczny QlikView - to rozwiązania dedykowane głównie małym i średnim organizacjom biznesowym. Ograniczeniem jest tu najpewniej właśnie wielkość analizowanego wolumenu danych.

Oceń artykuł

średnio: 0 liczba ocen: 0
1  2  dalej »

Komentarze (0)

Najnowsze

Państwo do konsolidacji

Obywatele uważają administrację publiczną za jeden organizm. W rzeczywistości jest to kilka tysięcy oddzielnych struktur, obrosłych biurokratycznymi naroślami. Czy można zracjonalizować działanie państwa? Jak w tym może pomóc informatyka?

Zarządzanie po japońsku

W praktyce przemysłowej wypracowano szereg skutecznych metod zarządzania. Wiele powstało w Japonii. Dlaczego, mimo ich efektywności, nie zawsze są stosowane w biznesie?

e-Sąd z odsieczą sprawiedliwości

Polski wymiar sprawiedliwości postrzegany jest jako skostniały i opieszały. Tymczasem kolejne e-usługi udostępniane przez Ministerstwo Sprawiedliwości ułatwiają życie przedsiębiorcom i usprawniają pracę sądów.

e-Zdrowie w Polsce i na świecie

Projekty informatyzacji służby zdrowia realizowane są na świecie z różnym powodzeniem. Skąd Polska mogłaby czerpać wzorce? A może jesteśmy skazani na własne rozwiązania?

Raport Państwo 2.0, czyli nowa wizja informatyzacji państwa

Michał Boni, minister administracji i cyfryzacji, zaprezentował raport "Polska 2.0. Nowy start dla e-administracji". Przedstawia on informacje na temat stanu realizacji projektów będących w gestii nowo utworzonego ministerstwa oraz prezentuje kierunki dalszych działań związanych z informatyzacją i cyfryzacją administracji publicznej w naszym kraju.

Cyberprzestępcy podążają za użytkownikami

Już dwie na trzy polskie firmy odnotowały ataki lub awarie, które spowodowały spadek produkcji. Co trzecia firma utraciła dane. Liczba takich przypadków będzie rosła, bo hakerzy biorą na cel najbardziej masowe technologie. Szybko reagują też na zmiany w firmowej architekturze.

Jak zaplanować karierę w branży IT

Doświadczenia łączone na różnych stanowiskach w firmach o odmiennych profilach są szczególnie cenione przez pracodawców. Dlatego warto głęboko przeanalizować możliwości rozwoju kariery, które obecnie stwarza rynek IT.

Rekomendacje



Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści - Prenumerata: Computerworld, Networld, PC World
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88