Szybciej, coraz szybciej

Dostawcy specjalizujący się w dziedzinie składowania danych coraz powszechniej wykorzystują pamięci półprzewodnikowe, by osiągać wyższą wydajność.

Rozwój urządzeń storage przebiega w dwóch kierunkach - skalowalności (mierzonej pojemnością zasobów) oraz szybkości pracy. Ten pierwszy trend daje się zauważyć na przykład w ofercie firmy Teradata, która dostarcza urządzenia o pojemności mierzonej w petabajtach. Od maksymalnej pojemności składowania danych znacznie ważniejsza jest jednak dobra szybkość pracy przy dużej pojemności. Przy eliminacji wąskich gardeł wydajności producenci coraz częściej wykorzystują pamięci półprzewodnikowe (zarówno , jak i SDRAM), które charakteryzują się bardzo krótkim czasem dostępu przy losowym odczycie i zapisie.

Aby jak najlepiej wykorzystać możliwości szybkich pamięci, producenci odpowiednio konfigurują architekturę swoich urządzeń. W ten sposób firma Oracle rozwinęła swoje urządzenia Exadata v2 Database Machine. Ponieważ pamięci SSD umożliwiają bardzo szybką transmisję danych, zamiast dołączać do kontrolerów, opracowano zestaw kart PCI Express zawierających pamięć półprzewodnikową. Dzięki takiej organizacji, serwery korzystają z szybkiej pamięci podręcznej, która jest połączona magistralą udostępniającą szerokie pasmo transmisji danych. Dzięki bardzo szybkiej pamięci podręcznej, czas odpowiedzi podsystemu wejścia/wyjścia jest dziesięciokrotnie krótszy niż w tradycyjnym modelu, gdzie dyski są łączone do kontrolerów. Zrównoleglona architektura oraz dwa poziomy szybkiej pamięci cache umożliwiają osiągnięcie tej samej wydajności aplikacji przy użyciu 10 razy mniejszej ilości dysków mechanicznych.

Można jeszcze szybciej

Podobną koncepcję wykorzystuje firma ParAccel w swoim serwerze bazodanowym Scalable Analytic Appliance II. Jak twierdzi producent, zastosowanie kart SSD łączonych za pomocą magistrali PCI Express piętnastokrotnie przyspiesza odczyt danych. W urządzeniu stosowane są karty produkowane przez lidera branży, firmę Fusion-io (założona przez Steve Wozniaka, współtwórcę firmy Apple). ParAccel już deklaruje opcjonalną współpracę SAA II z macierzami EMC wyposażonymi w pamięci SSD.

Serwer SAA II ukaże się w sprzedaży w obecnym kwartale bieżącego roku; prowadzone są już pierwsze testy w warunkach produkcyjnych.

Tym, co wyróżnia SAA II, jest ilość pamięci flash. Serwery firmy ParAccel obsługują jej aż 640 GB na urządzenie, znacznie więcej niż w produkcie Oracle. Barry Zane, CTO firmy ParAccel, mówi: "Produkty konkurencji wykorzystują znacznie mniej pamięci flash niż nasze. Ma to wielki sens w przypadku zastosowań transakcyjnych (OLTP), ale w hurtowniach analizuje się bardzo duże ilości danych. Tu potrzeba znacznie więcej bardzo szybkiej pamięci".

W gronie firm, które ogłosiły opracowanie nowych urządzeń, jest także Teradata, planująca wydanie Extreme Performance Appliance 4555. Urządzenie to będzie wykorzystywać dyski SSD połączone do kontrolerów, a zatem według Zane'a, "będzie borykać się z problemami wydajnościowymi, związanymi z kontrolerami dyskowymi, które nie są przystosowane do tak szybkich dysków". Urządzenie Extreme Performance Appliance 4600 (nazwa tymczasowa: Blur) będzie obsługiwać 24 TB pamięci SSD, połączonej w tradycyjny sposób z użyciem kontrolerów. Chociaż w teorii architektura ta jest wolniejsza, jest jednocześnie znacznie łatwiejsza do użycia przy równoważeniu obciążenia.

Liczy się efektywność

Dla wielu klientów pamięci półprzewodnikowe są zbyt kosztowne per bajt, ale dla niektórych firm, potrzebujących bardzo dużej wydajności, moduły flash mogą być sensowną alternatywą. Już teraz charakteryzują się porównywalnym kosztem per MB/s pasma do dysków mechanicznych, oferują przy tym bardzo krótki czas losowego odczytu i zapisu.

Kluczem do większej popularyzacji modułów flash może być zatem jak najsprawniejsze ich wykorzystywanie. W tym kierunku rozwijano SAAII, kładąc nacisk na kompresję danych, a usuwając m.in. materializowane perspektywy. Baza danych wykorzystywana w SAA zajmuje znacznie mniej miejsca niż u konkurencji, ponadto jest 5 do 500 razy szybsza, nie wymagając przy tym strojenia zapytań ad-hoc. Obecny produkt firmy ParAccel oferuje prędkość zasilania danymi na poziomie 9 TB/h przy liniowej skalowalności. Inżynierowie producenta podają, że w typowej instalacji hurtowni danych, o rozmiarze rzędu 10 TB, maszyna ParAccel działa około 10 razy szybciej od Oracle Exadata Database Machine. Jeśli potwierdzą się osiągnięcia SAA II w produkcyjnych instalacjach, będzie to najszybciej działająca hurtownia danych w swojej klasie.