Od akademii do komercji

Projekt Clusterix to jedno z najambitniejszych przedsięwzięć polskiej nauki ukierunkowane na rozwiązywanie problemów biznesu.

Projekt Clusterix to jedno z najambitniejszych przedsięwzięć polskiej nauki ukierunkowane na rozwiązywanie problemów biznesu.

Przepustowości łączy WAN między ośrodkami obliczeniowymi mierzy się dziś w gigabitach na sekundę. Przy zastosowaniu wielu zabiegów możliwe jest połączenie lokalnych klastrów w jeden spójny "organizm obliczeniowy". Dzięki komputerom PC z Linuxem koszt budowy takiej rozproszonej geograficznie instalacji jest niewielki w porównaniu z efektami, jakie można uzyskać, zaprzęgając ją do rozwiązywania problemów biznesowych. Udowodniły to już zresztą liczne eksperymenty z udziałem głównych ośrodków akademickich i największych dostawców technologii informatycznych.

Na przeszkodzie do pełnej komercjalizacji środowisk grid stoi jednak kilka problemów. Przede wszystkim brak jest sprawdzonych, uniwersalnych mechanizmów zarówno bezpiecznego, jak i łatwego dołączania nowych węzłów czy całych klastrów do już istniejącej, działającej rozproszonej instalacji. Drugie ważne wyzwanie dotyczy zarządzania uprawnieniami użytkowników sieci grid i innymi jej usługami, a także zleconymi zadaniami obliczeniowymi. W obu przypadkach pewne wycinkowe mechanizmy owszem, istnieją, nie można jednak w żadnym razie mówić o ich uniwersalności. Ta zaś jest konieczna dla automatyzacji procesów w ramach rozproszonych sieci grid, przekładającej się na powtarzalność operacji i w efekcie na niski jednostkowy koszt usługi obliczeniowej.

Powyższych problemów nie adresuje obecnie w pełni praktycznie żaden pakiet oprogramowania typu grid - ani te powstające w ramach środowiska open source, ani nawet komercyjne. Sytuację tę ma szansę zmienić, koordynowany przez prof. dr. hab. inż. Romana Wyrzykowskiego z Instytutu Informatyki Teoretycznej i Stosowanej Politechniki Częstochowskiej, projekt o nazwie Clusterix. Rozpoczęty w listopadzie br. i przewidziany na 30 miesięcy, zakłada stworzenie w pełni funkcjonalnego produkcyjnego środowiska, łączącego 12 największych miast Polski.

Stworzona na potrzeby projektu sieć grid obejmie ok. 100 komputerów, z których każdy będzie wyposażony w co najmniej dwa 64-bitowe procesory oraz 2 GB pamięci RAM. Będą one połączone dedykowanymi kanałami wydzielonymi w ramach wchodzącej właśnie do użytku sieci PIONIER.

Sztuka sprawnego zarządzania

Od strony inżynierskiej najważniejszą częścią projektu jest stworzenie w pełni funkcjonalnego oprogramowania umożliwiającego łatwe dołączanie dodatkowych węzłów czy całych klastrów do działającego środowiska grid. Drugim istotnym zagadnieniem jest elastyczne zarządzanie, monitorowanie oraz użytkowanie usług obliczeniowych i wykorzystywanej przez nie infrastruktury. Chodzi np. o możliwość uruchamiania pewnych zadań tylko w nocy lub na serwerach obciążonych w niewielkim stopniu. Mechanizmy tego rodzaju już istnieją, nie są jednak łatwo przenaszalne między poszczególnymi domenami obliczeniowymi. Mechanizmy zawarte w oprogramowaniu Clusterix mają wprowadzić w tym względzie rozwiązania uniwersalne.

Oprogramowanie Clusterix będzie się opierać na rozwijanym od kilku lat przez Poznańskie Centrum Superkomputerowo-Sieciowe (PCSS) systemie uwierzytelniania i kontroli uprawnień zwanym systemem użytkowników wirtualnych VUS (Virtual User System). Oprogramowanie to działa już na kilku polskich klastrach, jednak na potrzeby Clusterixa zostanie dodatkowo zoptymalizowane lub rozszerzone. VUS umożliwia łatwe zarządzanie użytkownikami bez potrzeby zakładania kont dla poszczególnych osób na wszystkich klastrach, co powinno zasadniczo uprościć i obniżyć koszty wykonywania nawet bardzo dużych zadań obliczeniowych. System zawiera także mechanizmy w znaczący sposób ułatwiające podłączanie kolejnych klastrów oraz automatyzację uwierzytelniania komponentów programowych i użytkowników.

Projekt Clusterix przewiduje także stworzenie narzędzi pozwalających precyzyjnie monitorować działanie sieci grid. Dzięki nim użytkownicy będą mogli uzyskać wszystkie niezbędne informacje na temat aktualnego stanu uruchomionych przez nich aplikacji i zadań obliczeniowych. Administratorzy otrzymają z kolei statystyki dotyczące działania infrastruktury sieci grid oraz zyskają narzędzia do rozliczania użytkowników z wykorzystanej przez nich mocy obliczeniowej. Billing usług ma bardzo duże znaczenie, gdyż kładzie to podwaliny pod wykorzystanie systemów typu grid do świadczenia usług komercyjnych.

Z IPv6 nam po drodze

Czynnikiem dodatkowo wyróżniającym Clusterix spośród innych tego typu projektów jest pełna zgodność z protokołem IPv6. Pełne wykorzystanie jego zalet - tj. większej niż wykorzystywanego obecnie IPv4 niezawodności, gwarancji jakości usług oraz większej możliwości sterowania pasmem - zdecydowanie usprawni jakość działania całego rozwiązania. Oczywiście, przewidziana jest także pełna zgodność z protokołem IPv4.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200