Poeta pamięta SGML i XML

Obiektowa baza danych POET zarządza danymi o swobodnej strukturze informacyjnej.

Obiektowa baza danych POET zarządza danymi o swobodnej strukturze informacyjnej.

Firma Poet Software oferuje zestaw programów Content Management Suite, przeznaczony do zarządzania nie tylko dokumentami nie mającymi sztywnej struktury informacyjnej, lecz także danymi o ustalonej strukturze, przechowywanymi w lokalnej bazie danych.

Dokumenty SGML

Język do opisu struktury dokumentów SGML jest znany od lat i zapewnia nieporównywalną z innymi formatami elastyczność w definiowaniu struktury dokumentów, niezależnie od platformy, na której są tworzone, zapamiętywane i drukowane. SGML oddziela strukturę dokumentu od jego prezentacji, co oznacza, że pojedynczy dokument może służyć do wielu celów - drukowania na papierze, przesyłania w formie elektronicznej, dostarczania w różnych formatach. Ponieważ semantyka różnych części dokumentu jest ściśle zdefiniowana, istnieje możliwość zadawania precyzyjnych zapytań dotyczących zawartości całości dokumentu lub jego części.

Ważną częścią każdego pakietu do zarządzania dokumentami SGML jest analizator składniowy (parser), sprawdzający poprawność dokumentu składowanego w systemie ze zdefiniowanymi uprzednio typami dokumentów. Wobec ogromnej złożoności składni SGML, wiele systemów obsługi dokumentów zapewnia sprawdzenie jedynie ograniczonej części definicji dokumentów; system Poet Software oferuje pełną analizę składniową SGML i XML.

Obiektowe repozytorium SGML/XML

Dokumenty tekstowe można przechowywać w postaci plików, zapisywanych w drzewiastej strukturze katalogowej na dysku, w obiektowo-relacyjnej bazie danych lub w czysto obiektowej bazie danych. Firma Poet Software jest producentem obiektowej bazy danych POET, toteż preferuje ten sposób przechowywania dokumentów zgromadzonych w systemie.

Dowolny dokument składowany w hierarchicznej strukturze bazy można wybrać i sprawdzić za pomocą Navigatora, służącego do administrowania repozytorium. Dokumenty można zmieniać i przetwarzać dzięki użyciu programów redakcyjnych SGML i XML. Pakiet pozwala na zdefiniowanie ziarnistości przetwarzania: całego dokumentu lub tylko pewnego akapitu. W tym ostatnim przypadku pozostałą część dokumentu może opracowywać inny użytkownik systemu. Pobranie całości lub części dokumentu do przetwarzania blokuje ją dla innych użytkowników.

Podobnie jak w innych systemach obsługi dokumentów, pakiet Content Management Suite pozwala na zapisywanie zmian dokumentów w celu umożliwienia powrotu do określonej wersji lub stworzenie wersji ostatecznej na podstawie dokumentów cząstkowych.

Więzy integralności dokumentów

Podobnie jak w bazach relacyjnych sprawdza się więzy integralności danych, bazy obiektowe pozwalają na sprawdzanie integralności pojmowanej znacznie szerzej - między obiektami. W tym przypadku każde odniesienie z jednego do innego dokumentu będzie zachowane niezależnie od tego, w jakie miejsce struktury repozytorium przenosimy dokumenty.

Nie ma obawy zerwania połączenia, ponieważ są one przechowywane oddzielnie w bazie danych, gdzie łatwo sprawdzić ich poprawność.

W pakiet Content Management Suite wbudowano motor przeszukiwania pełnotekstowego SEARCH '97 (firmy Verity), pozwalający na utworzenie indeksu do każdego słowa całego dokumentu lub wybranych części (tytuł, nagłówek, streszczenie, autor, słowa kluczowe, in.).

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200