Petabajty za grosze

Jak zasilić taki sprzęt

Ponieważ nie jest to typowy komputer klasy PC, napotkano nietypowe problemy. Standardowe zasilacze dostarczają większość mocy przez magistrale o dwóch różnych napięciach: 5 V i 12 V. W każdej jednostce zastosowano dwa zasilacze, ponieważ 45 napędów pobiera mnóstwo energii z linii 5 V, a wysokowydajne, silne zasilacze większość swojej mocy podają na linię 12 V. Nie dzieje się tak przez przypadek: zasilacze ATX o mocy 1,5 kW i więcej są projektowane dla silnych kart graficznych z akceleracją 3D, które potrzebują osobnego źródła napięcia 12 V. Oczywiście, można było użyć zasilaczy serwerowych, ale dwa klasyczne są tańsze. Zasilacz nr 1 napędza dyski oraz trzy frontowe wiatraki i pięć kart backplane, zasilacz nr 2 - całą resztę. Każdy mnożnik portu posiada dwa gniazda zasilania.

Dyski twarde większość dostarczanej im mocy pobierają w czasie rozruchu, więc uruchomienie obu zasilaczy jednocześnie wywoła uderzeniowy pobór prądu z sieci energetycznej (do 14 A z sieci o napięciu 120 V). Jest to na tyle duży impuls, że może być poważnym obciążeniem dla sieci zasilającej centrum danych. Rozwiązaniem jest wcześniejsze włączanie zasilania dysków (z zasilacza nr 1) i kontynuowanie startu po ich uruchomieniu. Pobór prądu z sieci 120 V oscyluje pomiędzy 4,8 A w stanie spoczynku i 5,6 A przy pełnym obciążeniu. Jest to dość oszczędne energetycznie rozwiązanie, także dlatego, że zasilacze pracują dość blisko optimum obciążenia.

Oprogramowanie rządzi sprzętem

Jednostka nie jest kompletna, dopóki nie zostanie w pełni uruchomiona i połączona do sieci. Obsługuje ją 64-bitowa wersja Debiana w wersji 4 (Etch) z systemem plików JFS. Komunikacja w całości przebiega pod kontrolą protokołu HTTPS. Na każdym z 45 napędów połączonych przez kontrolery SATA utworzono jedną partycję za pomocą standardowego narzędzia fdisk, a następnie tworzy się z 15 dysków wolumin RAID-6 (z dwoma dyskami parzystości) za pomocą narzędzia mdadm. Na takim woluminie tworzy się system plików JFS z księgowaniem, dane są udostępniane z poziomu aplikacji Backblaze przez serwer aplikacyjny Apache Tomcat 5.5. W efekcie uzyskujemy użyteczną przestrzeń o rozmiarze 87% surowej sumarycznej przestrzeni wszystkich dysków.

Najważniejszą koncepcją leżącą u podstaw pomysłu jest dostęp jedynie przez bezpieczny protokół HTTPS. Żadna z technologii (np. iSCSI, NFS, SQL, Fibre Channel) nie jest tak skalowalna, tania, wydajna i prosta w zarządzaniu, jak samodzielne serwery z własnym IP obsługujące żądania HTTPS. Backblaze Storage Pod sprawdza się znakomicie jako samodzielny serwer do przechowywania danych. Prawdziwa "inteligencja" stojąca za decyzjami gdzie przechowywać dane, jak je szyfrować, deduplikować i indeksować znajduje się poziom wyżej. Budowa taniego, rozproszonego centrum przechowywania danych wymaga tanich "cegiełek" - jak je uzyskać, opisano wyżej. Następnym krokiem jest oprogramowanie, które to wszystko połączy w jedną sieć i umożliwi efektowne zarządzanie i zabezpieczenie danych.


TOP 200