Wizyty kontrolowane

Wśród pytań często zadawanych zarządcom serwerów webowych są te dotyczące zagadnień statystycznych: które strony są najczęściej odwiedzane, kiedy jest największy ruch itp. Pięć produktów prezentowanych w niniejszym przeglądzie reprezentuje dostępne na rynku narzędzia do analizy logów serwerów webowych, pomocne w uzyskiwaniu odpowiedzi na te pytania.

Wśród pytań często zadawanych zarządcom serwerów webowych są te dotyczące zagadnień statystycznych: które strony są najczęściej odwiedzane, kiedy jest największy ruch itp. Pięć produktów prezentowanych w niniejszym przeglądzie reprezentuje dostępne na rynku narzędzia do analizy logów serwerów webowych, pomocne w uzyskiwaniu odpowiedzi na te pytania.

Oprogramowanie analizujące logi serwerów webowych może stanowić znakomitą pomoc w przygotowywaniu odpowiedzi na te pytania, choć na rynku trudno znaleźć produkt idealny dla każdej intrasieci.

WebTrends Log Analyzer firmy WebTrends i Net.Analysis 3.4 firmy Net.Genesis dają najbardziej użyteczne i interesujące raporty "wprost z pudełka", minimalizując potrzebę kastomizowania pakietu czy też dopisywania dodatkowych narzędzi. Net.Analysis obsługuje wiele platform, Site Server 3.0 Microsoftu natomiast jest ograniczony tylko do platformy Windows NT. Produkty WebTrends i Hit List Commerce 4.0 firmy Marketwave przetwarzają logi i dostarczają raporty stosunkowo szybko, a Site Server i Netlntellect 3.0.2 firmy WebManage Technologies potrzebują na ten proces dużo więcej czasu.

Wizyty kontrolowane

HitList - konfigurowanie właściwości elementów raportu

Podstawowe funkcje wszystkich pięciu produktów są niemal identyczne - reprezentują one wszystko to, co można zrobić z plikami logów serwera webowego. Zawierają możliwość harmonogramowania podstawowych zadań, takich jak wydobywanie plików logu, uruchamianie raportów oraz przechowywanie i przesyłanie raportów.

Wszystkie prezentowane programy umożliwiają sprowadzanie plików logów w czasie najmniejszego obciążenia sieci i zaplanowanie operacji raportowania na porę nocną - w okresach cotygodniowych lub comiesięcznych. Wszystkie też zawierają wbudowane raporty standardowe, chociaż zestawy tych raportów w jednych produktach są bardziej, a w innych mniej wyczerpujące.

Wizyty kontrolowane

HitList - konfigurowanie filtrów

Produkty testowano na platformie Windows NT. Hit List, WebTrends i Netlntellect obsługują Windows 95 i NT, Net.Analysis "dorzuca" do tego wsparcie Solaris i AIX. Site Server pracuje tylko na NT, ale za to zawiera wbudowane w produkt bazowy dodatkowe mechanizmy zarządzania webem, takie m.in. jak analiza zawartości ośrodka webowego.

Istotne różnice między analizatorami logów serwerów webowych dotyczą wydajności, liczby i typów raportów tworzonych standardowo oraz zdolności obsługi bardzo dużych objętościowo, z punktu widzenia wielkości tworzonych zapisów logu, wizyt.

Najwolniejszym analizatorom proces przetwarzania danych zabiera kilkakrotnie więcej czasu niż produktom najszybszym. Jeżeli pliki logów przekraczają kilkadziesiąt megabajtów dziennie, to wydajność staje się sprawą kluczową, ponieważ w skrajnych przypadkach może okazać się niemożliwe przetworzenie danych w rozsądnym przedziale czasowym.

Wizyty kontrolowane

HitList - raport o przeglądarkach używanych przez wizytujących

Większość analizatorów po prostu generuje raporty i dostarcza je w dowolne miejsce. Jeżeli raporty generowane są dla wizyt tworzących niewielkie pozycje logów, to jest to praktycznie wszystko, co potrzeba. Ale jeżeli planuje się dystrybucję kilkudziesięciu różnych raportów dla kilkunastu różnych odbiorców, to potrzebna jest również duża wydajność analizatora. Net.Analysis oraz (w mniejszej skali) WebTrends i Hit List tworzą oddzielny subsystem do zarządzania raportami olbrzymich rozmiarów.

Pobieranie logów

Pobranie pliku logu do analizatora jest operacją stosunkowo prostą. Wszystkie prezentowane narzędzia mogą przejmować pliki logów z dysków lokalnych lub serwerów FTP. Web Trends, Hit List i Site Server mogą także ściągać logi za pośrednictwem ODBC (Open Database Connectivity) Microsoftu. Przy tym okazuje się, że niezwykle istotne jest to, aby pliki logu były przenoszone do systemu analizującego oddzielonego od serwera webowego. Test wykonany na tygodniowym pliku logu o wielkości 250 MB wykazał znaczące obciążenie analizatorów pracujących na Pentium Pro 200 MHz ze 128 MB RAM. Analizatory były zajęte od ok. dwóch (w przypadku Hit List i Web Trends) do kilkunastu godzin (Netlntellect i Site Server).

Wizyty kontrolowane

WebTrends - edycja profilu analizy logu

Z chwilą, gdy plik logu znajdzie się na dysku lokalnym analizatora, większość produktów wstępnie przetwarza je i przenosi do bazy danych. Hit List pracuje z dowolną bazą danych ODBC; Net.Analysis wymaga SQL Server Microsoftu; Site Server jest dostarczany z Microsoft Access, ale może używać też SQL Server. Netlntellect i Web Trends wyróżniają się tym, że używają własnego wewnętrznego formatu do przechowywania plików logu.

Istnieje niewiele powodów, dla których można by preferować jedną z metod przechowywania plików logu, z jednym wyjątkiem: zarządcy intrasieci planujący uruchamianie wielu raportów opartych o te same dane, z różnymi filtrami, powinni upewnić się, czy przetwarzane logi są magazynowane w bazie danych, skąd mogą być ściągane z pomocą innych narzędzi.

Wizyty kontrolowane

WebTrends - edytor stylu pozwala kastomizować wygląd każdego raportu

Większość analizatorów pozbywa się wykorzystanych już lub nieistotnych danych w celu zaoszczędzenia miejsca w pamięci zewnętrznej i zwiększenia wydajności. Powszechne jest np. wyrzucanie przez analizatory zapisów obrazów, takich jak pliki GIF i JPEG, ponieważ wprowadzają one niewiele istotnych informacji do raportów. Ta cecha może prowadzić do ogromnych oszczędności - w wielu przypadkach ponad polowa wizyt dotyczy form graficznych. Należy jednak zachować ostrożność: wiele analizatorów nie pozwala na odzyskanie danych, które zostały usunięte, bez ponownego sortowania całego pliku logu. W przypadku WebTrends wyprodukowanie nowego raportu opartego na tych samych danych zajmuje programowi około godziny. Natomiast Netlntellect i HitList są zdolne do generowania kolejnego raportu w czasie liczonym w sekundy. Ani Site Server, ani net.Analysis nie wymagają pełnego przeładowania bazy danych, jednak każdy z tych pakietów potrzebuje kilku godzin na skompletowanie kolejnego raportu.

Jeżeli planuje się wywołanie tego samego raportu raz za razem, to należy wziąć pod uwagę zarówno obciążenie pamięci zewnętrznej, jak i szybkość działania produktu. W przypadku dużej liczby raportów należy rozważyć czas analizy i sporządzania raportów. Jeżeli planuje się tworzenie różnych raportów na tych samych danych, to można brać pod uwagę Hit List, który zapewnia najlepszy czas przygotowania takich raportów. Netlntellect i SiteServer, z uwagi na ich wydajność, raczej nie można polecać, chyba że pliki logów są niezbyt "opasie" i dysponuje się szybką stacją roboczą, na której pracuje

analizator.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200