Hub na gorąco

Kosztem 2,5 mln USD Poland.com stworzyła od podstaw infrastrukturę informatyczną huba internetowego. Realizacja projektu trwała zaledwie 6 tygodni.

Kosztem 2,5 mln USD Poland.com stworzyła od podstaw infrastrukturę informatyczną huba internetowego. Realizacja projektu trwała zaledwie 6 tygodni.

Zasadniczy wpływ na wybór rozwiązań miały 4 kryteria: szybkość wdrożenia, niezawodność, wydajność i skalowalność. Ze względu na to, że Poland.com chciała uniknąć rozproszenia dostawców technologii, ograniczono się do IBM-a, Cisco i Microsoftu. IBM dostarczył serwery, centralną macierz dyskową, bibliotekę taśmową, bibliotekę dysków magnetooptycznych oraz oprogramowanie do zarządzania. Microsoft natomiast przekazał platformę systemową oraz zaawansowany system do budowy portali - Microsoft Commercial Internet System. Była to pierwsza w Polsce tak pełna instalacja oprogramowania MCIS. Uczestniczyli w nim pracownicy polskiego oddziału, a także osoby z centrum kompetencyj-nego Microsoftu z Holandii i Niemiec. Firma Cisco była odpowiedzialna za dostawę routerów, przełączników i firewalli.

Składanie zamówień zbiegło się w czasie z wyborem miejsca pod centrum danych. W większości rozważanych lokalizacji problematyczne było szybkie uzyskanie redundantnych źródeł zasilania. Poland.com określiła potrzeby na poziomie co najmniej 30 kVA. Kolejną barierą okazały się także, stawiane przez Poland.com, wymagania co do jakości, niezawodności i skalowalności połączenia z Internetem. Jedyną lokalizacją spełniającą te warunki była warszawska serwerownia dostawcy Internetu - Internet Partners. "Nie mieli w pełni zadowalającej nas klimatyzacji i redundantnego źródła elektryczności, ale szybko się z tym uporali. Pozostali proponowali terminy rzędu kilku miesięcy" - mówi Piotr Stecki, kierownik projektu ze strony Computer Communication Systems.

Tony i terabajty

Siłą napędową Poland.com są 33 serwery IBM NetFinity 5000 (Pentium III 600 MHz, 0,5 MB cache, 512 MB - 1 GB RAM) i 6 serwerów IBM NetFinity 5500 M20 (Pentium III Xeon 550 MHz, 1 MB cache, 1 GB RAM). Sieć wewnętrzną zbudowano z wykorzystaniem przełączników Cisco z serii Catalyst 6500. Karty sieciowe Fast Ethernet używane obecne zostaną wkrótce wymienione na Gigabit Ethernet. Obecnie centrum danych podłączone jest do Internetu poprzez przełącznik Cisco, stanowiący część systemu Internet Partners i połączenie Fast Ethernet, jednak już w lipcu zostanie ono zamienione na łącza ATM OC-3/STM-1 przy użyciu routera Cisco serii 7500. Pomieszczenia serwerowni i wiązki przewodów o łącznej długości ponad 1,5 km, umieszczone pod podłogą, są klimatyzowane.

Za składowanie danych odpowiada centralna macierz dyskowa IBM Enterprise Storage System 2105 model E20 o nazwie kodowej Shark. Szafa o wymiarach ok. 139 x 91 x 192 cm waży 1200 kg i pobiera moc rzędu 5 kVA ze źródła trójfazowego. Egzemplarz zakupiony przez Poland.com zawiera dyski o łącznej pojemności 1,6 TB (terabajtów), można go jednak łatwo rozbudować do 11 TB. Pamięć podręczna systemu ma pojemność 6 GB. Urządzenie jest wewnętrznie zarządzane przez klaster typu HACMP (High Availability Cluster Multiprocessing) dwóch czteroprocesorowych serwerów IBM RS/6000, pracujący pod kontrolą systemu AIX. Ze względów funkcjonalnych Shark działa obecnie jako macierz podłączona do serwerów przez 16 różnicowych interfejsów SCSI (istnieje możliwość dodania kolejnych 16). Shark może być również skonfigurowany jako "zamknięta w pudełku" sieć SAN (Storage Area Network). Według IBM-a, jest to już ósmy egzemplarz Sharka w Polsce.

Zapasowe kopie danych wykonywane są automatycznie przez bibliotekę taśmową IBM Magstar 3494, mającą 420 kaset o pojemności 20 GB (bez kompresji). Robot wyposażony w dwa chwytaki (podstawowy i zapasowy) umieszcza kasety w 4 niezależnych napędach. Każdy z nich umożliwia wykonywanie kopii z prędkością ok. 50 GB/godz. (z kompresją ok. 150 GB). Dodatkowym narzędziem archiwizacyjnym jest biblioteka magnetooptyczna IBM 3995, zawierająca 20 stacji o pojemności 5,2 GB, służąca głównie do archiwizowania logów systemowych.

Zarządzanie pamięciami masowymi odbywa się za pomocą oprogramowania Tivoli Storage Manager (TSM). Główna część TSM działa na wydzielonym serwerze Windows NT, natomiast na pozostałych pracują tzw. agenty, koordynujące proces tworzenia spójnych kopii zapasowych systemu.

Skalowanie w centrum

Architekturę centrum danych zaplanowano pod kątem wysokiej skalowalności. W najwyższej warstwie znajdują się usługi: poczta, spersonalizowane strony WWW i inne. Każdą usługę umieszczono na oddzielnym klastrze WLBS w systemie Windows NT (Windows NT Load Balancing Service), dzięki czemu obsługa każdej z nich może być realizowana przez maksymalnie 32 serwery. Poniżej znajdują się dane użytkowników: baza profili, poczta, baza treści itd. Serwery w tej warstwie są zabezpieczone przez klastry MSCS (Mic-rosoft Cluster Server). Najniżej znajduje się system składowania danych, czyli macierz Shark.

Aby maksymalnie skrócić czas trwania projektu, Poland.com wykorzystała oprogramowanie Microsoft Commercial Internet System (MCIS), działające na platformie Windows NT 4.0. Moduły funkcjonalne MCIS pozwalają na dość łatwą budowę bazy profili użytkowników, usług poczty POP/IMAP i poczty na WWW, pogawędek, spersonalizowanych stron WWW i wiadomości. Według zapewnień Microsoftu, MCIS może obsłużyć nawet kilka milionów profili. Platforma MCIS umożliwia także budowę rozwiązań handlu elektronicznego. Przedstawiciele Poland.com twierdzą jednak, że ich wykorzystania należy się spodziewać dopiero pod koniec roku. MCIS łączy się z bazą SQL Server 7 oraz innymi produktami z serii BackOffice.

Oprogramowanie większości dostępnych dla użytkowników serwisów opracował zespół technologiczny Poland.com. Automatyzuje ono proces pobierania, obróbki danych i ich późniejszej prezentacji na stronach huba. Oprócz aplikacji udostępniających użytkownikom wiele serwisów informacyjnych, firma opracowała inteligentny system pamięci podręcznej serwerów WWW. "Przy wysokim stopniu personalizowania serwisów prawdopodobieństwo powtórzenia się tej samej, dynamicznie tworzonej strony jest niewielkie. Zastosowanie klasycznego W3cache byłoby mało efektywne, dlatego zdecydowaliśmy się na opracowanie innego rozwiązania" - mówi Piotr Wyrzykowski, dyrektor ds. technologii w Poland.com sp. z o.o. z Wrocławia. Wdrożony przez Poland.com system cache przechowuje wyniki najczęściej powtarzających się zapytań SQL, minimalizując obciążenie serwerów baz danych. W pamięci podręcznej przechowywane są także najczęściej powtarzające się elementy składowe stron.

Z perspektywy

Po zakończeniu budowy infrastruktury, CCS przejmuje w formie outsourcingu obsługę techniczną centrum danych Poland.com i będzie odpowiedzialny za utrzymanie sprzętu i systemów operacyjnych. Zarządzanie będzie przeprowadzane zdalnie z Wrocławia, m.in. poprzez usługi terminalowe zapewniane przez system Windows 2000. Zarządzanie treścią i wprowadzanie nowych usług przez Poland.com również ma się odbywać zdalnie. CCS podpisał umowę z Internet Partners, na mocy której wyznaczeni pracownicy IP będą wykonywać proste czynności techniczne na rzecz Poland.com.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200