Eksperci ostrzegają - dyski SSD nie są tak niezawodne, jak twierdzą ich producenci

Naukowcy z HP Labs i University of Ohio doszli do zaskakujących wniosków po przetestowaniu 15 dysków SSD wyprodukowanych przez pięć firm. Okazało się bowiem, że po niespodziewanym wyłączeniu zasilania, aż 13 dysków daje różnego rodzaju błędy. W przypadku, gdy dyski takie obsługują ważne biznesowe aplikacje, firmy muszą się wtedy liczyć z poważnymi stratami.

Naukowcy zawarli wyniki badań w dokumencie zatytułowanym "Understanding the Robustness of SSDs Under Power Fault". Z lektury dokumentu wynika, że każda firma powinna mieć świadomość tego, że decydując się na wprowadzenie do centrum danych dysków SSD, ryzyko utraty danych znacznie wzrasta. Wiąże się to z tym, że po nagłym odcięciu zasilania, dyski dają różnego rodzaju błędy. Może to być uszkodzenie poszczególnych bitów, metadanych czy całego dysku. W dokumencie nie ma informacji o tym, które firmy produkowały testowane dyski.

Badania przeprowadzono chcąc przekonać się, czy dyski SSD pracują rzeczywiście na tyle niezawodnie, że mogą w centrach danych zastępować tradycyjne dyski twarde. Zwolennicy - jak i producenci - dysków SSD twierdzą bowiem, że pracują one już na tyle niezawodnie (bo to, że pracują szybciej niż dyski twarde, jest oczywiste), że można je z powodzeniem i bez obaw wprowadzać do centrów danych. Prosty test polegający na wyłączeniu zasilania pokazał jednak co innego.

Zobacz również:

Testowaniu poddano 15 dysków SSD. W większości były to dyski klasy "enterprise" (czyli dedykowane dla centrów danych). Test polegał na niespodziewanym odcięciu zasilania. Po przeprowadzeniu kilku tysięcy takich prób, bezbłędnie pracowały tylko dwa dyski. Wszystkie pozostałe gubiły dane. Objawy były jednak różne: w przypadku dwóch dysków były to masowe błędy, jeden dysk odmówił w ogóle posłuszeństwa po przywróceniu zasilania, a w przypadku jeszcze innego do ok. 30% bloków z danymi nie można było uzyskać dostępu.

Naukowcy odnotowali sześć rodzajów błędów - uszkodzenia poszczególnych bitów, uszkodzenia metadanych (błędy warstwy FTL; Flash Translation Layer), błędy typu "shorn writes" (zakończenie operacji zapisu danych w środku sektora), błędy typu "unserializable writes" (spowodowane faktem, że na skutek wyłączenia zasilania operacje nie były wykonywane we właściwej kolejności), błędy typu "flying writes" (prawidłowo uformowane rekordy kończyły się z złym miejscu) i uszkodzenie całego dysku. Analizując je naukowcy zwracają uwagę na fakt, że dyski SSD operują na poziomie bloków, co powinno być ważną wskazówką dla projektantów systemów pamięci masowych.

Ponieważ dwa rodzaje błędów występowały bardzo często (uszkodzenia bitów i błędy typu "shorn writes"), do dysków SSD należało by wprowadzić w pierwszej kolejności rozwiązania zabezpieczające dane na poziomie całych bloków. Pamięci masowe (szczególnie te, które obsługują bazy danych czy systemy plików) zapewniają danym spójność dzięki temu, że wykonują operacje sekwencyjnie w określonej kolejności. Dlatego należy też zwrócić uwagę na błędy serializacji, które są dla takich systemów szczególnie niebezpieczne.

Ostateczny wniosek sformułowany przez naukowców brzmi: póki co, nie używać dysków SSD do przechowywania krytycznych danych. Jeśli jest to jednak konieczne, wybierać dyski, które nie generują błędów w przypadku zaniku zasilania, testując je wcześniej na tę okoliczność.


TOP 200