Katalogowanie chaosu

Im więcej treści w Internecie, tym bardziej jego użytkownicy potrzebują dostępu do uporządkowanych, rzetelnych i aktualnych informacji. Czy katalogi internetowych zasobów mogą pełnić te same funkcje co znane od dawna katalogi w bibliotekach?

Im więcej treści w Internecie, tym bardziej jego użytkownicy potrzebują dostępu do uporządkowanych, rzetelnych i aktualnych informacji. Czy katalogi internetowych zasobów mogą pełnić te same funkcje co znane od dawna katalogi w bibliotekach?

Porządek i cisza. Rzędy równo poustawianych szafek z jednakowymi szufladkami. W każdej, jedna za drugą, jednakowe, równo poukładane fiszki. Miejsce każdej z nich określone dokładnie przez nieubłaganą logikę podziałów, układów, klasyfika-cji. Geometryczna dokładność i powtarzalność zagospodarowania przestrzeni stanowią tylko uzewnętrznienie obowiązujących w tym miejscu reguł postępowania. Klimat tego miejsca zna każdy, kto chociaż raz był w bibliotece. To katalog. Magiczne słowo i magiczne miejsce. Brama do przepastnych zasobów bibliotecznych magazynów. Wiedza poukładana, uporządkowana niczym rzędy tekturowych karteczek. Zaszufladkowana. Wymagająca wtajemniczenia, znajomości algorytmów poruszania się między szafkami. Coś jakby test, sprawdzenie predyspozycji i umiejętności przed przejściem do następnego etapu - możliwości oddania się lekturze.

W Internecie miało być inaczej. Zawarta w nim wiedza miała stanąć przed każdym otworem. Żadnych kategorii, hierarchii, struktur. Dostęp do informacji nie przez katalogi, indeksy, arbitralne, naukowe rozstrzygnięcia, lecz metodą hipertekstu - swobodne, niczym nie ograniczone skojarzenia, przechodzenie ze strony na stronę, żeglowanie od dowiązania do dowiązania, od adresu do adresu, od serwera do serwera. Samemu, indywidualnie, na własną odpowiedzialność i ryzyko.

Początek był nawet obiecujący. Niewielka ilość informacji sprzyjała radosnej penetracji najgłębszych zakątków sieci. Z czasem jednak okazało się, że idea swobodnego dostępu do informacji obróciła się przeciwko niej samej. Rosnące lawinowo zasoby stawały się chaosem. Podstawowa, pionierska zasada demokracji sieciowej, że każdy może być zarówno odbiorcą, jak i nadawcą, nie znajdowała dostatecznego potwierdzenia w skuteczności docierania do informacji. Każdy może opublikować wszystko, ale wcale nie oznacza to, że każdy może ze wszystkim się zapoznać. Co wybrać, jak odnaleźć to, co potrzebne, gdzie sprawdzić, co jest wartościowe - to podstawowe sprawy dla błądzących po omacku w morzu informacji. Pojawiły się nawoływania o przewodników, prośby o ład i porządek, projekty wytyczania głównych tras i peryferyjnych ścieżek.

Internet nie mógł obyć się bez katalogu. Nie wystarczyły technologiczne udogodnienia - szperacze, agenty czy wyszukiwarki. Stało się jasne, że chaos stworzony przez człowieka jest w stanie uporządkować tylko człowiek. Według włas-nych, stworzonych przez siebie reguł i podziałów.

Katalogi internetowych stron są dzisiaj codziennością sieciowej rzeczywistości. Bez nich trudno wyobrazić sobie funkcjonowanie internetowych portali. Według jakich zasad działają takie katalogi? Ile mają wspólnego ze swymi poprzednikami z bibliotecz-nych zaciszy?

Katalogowanie inaczej

Twórcy katalogów internetowych inaczej niż bibliotekarze definiują pojęcie katalogowania. "Tradycyjnie katalogowanie służy przede wszystkim dokumentacji poszczególnych składników zbioru" - wyjaśnia Monika Niemirowska, redaktor katalogu w portalu Onet.pl. - "Określenie sposobów do- stępu, jakkolwiek ważne dla czytelnika, w przypadku katalogowania ma znaczenie drugorzędne". Dokumentacja to opis, który identyfikuje dokument czy eksponat, odróżnia go od innych, a nawet pozwala na jego rekonstrukcję.

W katalogach zasobów sieciowych tę hierarchię odwrócono. Pierwszoplanowym, nadrzędnym zadaniem stało się budowanie mechani- zmów komunikacyjnych. "Nasze działania idą w kierunku tworzenia czytelnych dróg dostępu do stron internetowych" - mówi Monika Niemirowska. - "To, co robimy, nie jest zatem katalogowaniem w ścisłym sensie. Opis strony pełni funkcje pomocnicze w stosunku do kategorii wyszukiwawczych".

Różnice wynikają z charakteru poszczególnych typów zbiorów. Księgozbiory naukowe są statyczne, trwałe. Udostępnianie książek jest podporządkowane idei zachowania dorobku naukowego dla przyszłych pokoleń. Natomiast serwisy internetowe są dynamiczne, ciągle się zmieniają, służą raczej wymianie informacji niż jej archiwizowaniu. Ich zawartość zależy w dużej mierze od przemijających mód, aktualnych potrzeb czy indywidualnych zainteresowań. "Internet ma własną, niepowtarzalną specyfikę" - twierdzi Marcin Chmielecki, redaktor katalogu w portalu Wirtualna Polska. - "To, co ważne lub popularne w życiu czy innych mediach, nie zaw-sze znajduje odzwierciedle- nie w stronach internetowych, i na odwrót. Pewne rzeczy w In- ternecie są wręcz kultowe, pozostając nie znanymi poza siecią".

Redaktorzy serwisów internetowych stawiają na pragmatyzm. Priorytetem jest dostępność, nie zaś systematyczność. Najważniejszym zadaniem jest stworzenie systemu klasyfikacyjnego, czytelnego dla odbiorcy. Katalog tworzony jest bardziej na podstawie obiegowych terminów i pojęć niż systemu pojęć utrwalonych na gruncie nauki, ale hermetycznych dla przeciętnego odbiorcy. "Obiektywizm podziału zbiorów jest utopią nie zrealizowaną nawet w katalogach bibliotek naukowych" - uważa Monika Niemirowska. - "Próby jego osiągnięcia stały się przysłowiowym gwoździem do trumny dla katalogów systematycznych. Dzisiaj coraz częściej są one już zastępowane językami haseł przedmiotowych i indeksowaniem tematycznym".

Dla każdego o wszystkim

Na zasady prowadzenia katalogów w portalach internetowych znaczący wpływ ma ich użytkownik, czyli klient. Jego nawyki, oczekiwania czy posiadana wiedza stanowią jed-ną z podstawowych przesłanek organizacji zbiorów oraz określania ścieżek dostępu. "Jedną z najważniejszych spraw przy katalogowaniu stron jest wiedza, co jest popularne w Internecie i kto korzysta z jego zasobów" - wyjaśnia Marcin Chmielecki.

Przy tworzeniu poszczególnych kategorii tematycznych portale korzystają z pomocy specjalistów oraz klasyfikacji proponowanych w literaturze fachowej. Wiele propozycji polega jednak na odzwierciedleniu klasyfikacji zdroworozsądkowych. Wiele działów pojawia się w wyniku sezonowej popularności zjawisk, ludzi czy wydarzeń (np. Big Brother, Małysz, Pokemony itp.). Informacje w katalogu muszą być usystematyzowane, tak aby można było do nich jak najłatwiej dotrzeć. Katalog jest dla użytkowników, a nie odwrotnie - podkreślają zgodnie przedstawiciele zespołów obu największych polskich portali. "Ustalanie reguł na siłę nie ma żadnego sensu" - przekonuje Marcin Chmielecki. - "Co z tego, że informacja będzie sklasyfikowana poprawnie pod względem znaczeniowym czy formalnym, skoro użytkownicy intuicyjnie będę szukać jej gdzie indziej?". Z tego powodu właśnie WP przeprowadza ankiety w rodzaju "Gdzie szukałbyś informacji x, y czy z?". Redakcja katalogu przyjmuje też wszelkie uwagi i sugestie użytkowników, dotyczące stosowanych podziałów i klasyfikacji. Każdy może zaproponować własną kategorię lub wskazać na możliwość zmiany istniejących przyporządkowań lub opisów. Trafne pomysły, usprawniające funkcjonowanie katalogu, są uwzględniane przez jego redaktorów.

Prowadzenie katalogów stron in- ternetowych musi uwzględniać stosowane w Internecie technologie i dostępne narzędzia wyszukiwawcze. Popularność wyszukiwarek internetowych sprawiła, że kategorie katalogu Onetu odwołują się do słów kluczowych, którymi mogą posługiwać się internauci, szukający informacji niezależnie od hierarchicznych ścieżek dostępu przez katalog. Wśród wyników wyszukiwania w Onecie na pierwszym miejscu znajdują się zawsze odwołania do konkretnej kategorii katalogu. Ta sama zasada obowiązuje w Wirtual- nej Polsce.

Ważne i ciekawe

Jednym z podstawowych problemów, z którym muszą się uporać specjaliści zajmujący się tworzeniem internetowych katalogów, jest wiarygodność funkcjonujących w sieci serwisów i stron. Internet jest środowiskiem bardzo dynamicznym, zmiennym. Strony pojawiają się i znikają, by za chwilę znowu zaistnieć pod zmienionym adresem czy w innej formule redakcyjnej. Katalog wymaga więc nieustannej aktualizacji, sprawdzania adekwatności istniejących w nim opisów do rzeczywistej zawartości stron. Wykonującym te zadania ludziom przychodzi z pomocą technologia informatyczna. W Onecie funkcjonuje samodzielnie opracowany program, który stale monitoruje zawartość sieci i m.in. automatycznie eliminuje z katalogu nie istniejące adre- sy (znany każdemu użytkownikowi WWW Error 404). Oprogramowaniem komputerowym posiłkuje się też zespół katalogu Wirtualnej Polski. Technika ma jednak, zdaniem Marcina Chmieleckiego, drugorzędne znaczenie wobec pracy wykonywanej przez ludzi. To od redaktorów katalogu zależy, jakie strony zostaną przyporządkowane danej kategorii i czy zostaną utworzone nowe działy i grupy tematyczne.

Twórcy internetowych katalogów liczą też na zaangażowanie internautów i autorów serwisów. Na stronach katalogów znajdują się specjalne formularze, na których można zgłaszać nowe serwisy, informować o zmianach ich zawartości lub nowych adresach.

Dużym problemem jest rozbieżność wartości informacyjnej poszczególnych serwisów. Zwykła reklamówka soku pomarańczowego nie może mieć takiej samej wagi informacyjnej jak artykuł naukowy, poświęcony technologii przetwarzania owoców. Redaktorzy katalogów radzą sobie z tym problemem na różne sposoby. Częściowym rozwiązaniem jest odpowiedni układ kategorii. Dział gromadzący oferty firm jest przeznaczony dla tych, którym do podjęcia decyzji o zakupie wystarczy krótka prezentacja. Ci, którzy potrzebują rozpoznać rynek w celach handlowych, powinni szukać stosownych danych w dziale informacji gospodarczych.

Kłopoty sprawia również zrównoważenie rangi informacyjnej stron w ramach kategorii. Na przykład w dziale astronomia można znaleźć zarówno profesjonalne serwisy redagowane przez ośrodki badawczo-naukowe, jak i amatorskie strony hobbystów. Rozwiązaniem tego problemu jest m.in. odwołanie się do oceny fachowców z danej branży czy dziedziny i prowadzenie punktacji stron. Trzeba jednak pamiętać, że katalog musi mieć walor uniwersalności - powinien obejmo- wać całość zasobów Internetu oraz uwzględniać potrzeby wszystkich użytkowników na różnym poziomie przygotowania i w różnym wieku. Oczywiście nie oznacza to, że trzeba zamieszczać w katalogu wszystkie istniejące strony. Specjaliści podkreślają, że najważniejsza jest odpowiednio ustalona hierarchia ważności informacji. Użytkownik powinien mieć gwarancję, że w poszczególnych kategoriach katalogowych znajdzie strony wartościowe pod względem zawartości informacyjnej. Czy ten postulat rzeczywiście udaje się spełnić, wiedzą najlepiej internauci.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200