Dokument mobilny

Język XML zapewnia przenośność danych w Internecie i intranetach. XML nie jest konkurentem HTML, tradycyjnie wykorzystywanego w sieci !WWW. Raczej uzupełnia jego właściwości.

Język XML zapewnia przenośność danych w Internecie i intranetach. XML nie jest konkurentem HTML, tradycyjnie wykorzystywanego w sieci !WWW. Raczej uzupełnia jego właściwości.

Standard Generalized Markup Language (SGML) powstał przed ok. 20 laty dla celów publikacyjnych, zapewniając możliwości określenia struktury dokumentu, niezależnie od tekstu, który można w tę strukturę "wlać". W efekcie można np. określić standardową postać do prac naukowych, referatów konferencyjnych lub sprawozdań z eksperymentów. Tworzący je naukowiec nie musi zajmować się formatowaniem dokumentu, wystarczy, że zapełni go treścią, a wszystkie dokumenty oparte na tym samym wzorcu będą wyglądały tak samo.

Rozbudowana specyfikacja SGML (dokument ok. 500-stronicowy) nie kwalifikuje się do dokumentów, które muszą być publikowane szybko. Specyfikację HTML zawierającą ograniczony podzbiór SGML, złożony z ok. 70 znaczników (tags) i 50 atrybutów, można z powodzeniem wykorzystać w sieci !WWW. Jednak czasem istnieje potrzeba pobrania danych z dokumentu HTML do dalszego przetworzenia. Przykładowo przy zamówieniu zakupu: jedna osoba potrzebuje je wydrukować, inna zaś chce pobrać dane i zapisać je do bazy danych. Do dokumentu HTML dane wstawia się łatwo, ale pobiera trudniej.

XML do pobierania danych

XML nie jest konkurentem HTML, raczej uzupełnia jego właściwości. XML to próba stworzenia takiej specyfikacji dokumentów, aby można je było łatwo publikować i określić ich strukturę, a także za pomocą prostego programu analizatora składniowego pobrać z nich dane.

Konsorcjum W3C, które zaakceptowało specyfikację XML 1.0 w lutym ub.r., określa XML "jako składnię do wyrażania struktury danych". XML nie jest więc stricte językiem, lecz narzędziem do tworzenia innych języków opisu dokumentów zawierających dane. Jest znacznie prostszy niż SGML (specyfikacja ma tylko 30 stronic) i ma "80% właściwości funkcjonalnych SGML przy 20% jego złożoności".

XML jest rozszerzalny i każdy użytkownik może zdefiniować dowolną liczbę własnych znaczników, określających strukturę danych w dokumencie. Na przykład użytkownik może określić kilka znaczników i zadać, że między nimi może znajdować się tylko liczba (podawana w złotówkach). Analizator dokumentu, znając jego strukturę, łatwo wyciągnie z dokumentu cenę produktu i jego nazwę zawartą między znacznikami.

Elementy dokumentu mogą tworzyć strukturę hierarchiczną, dostosowaną do potrzeb konkretnej aplikacji, a właściwe zdefiniowanie znaczników znacznie zmniejsza ilość kodu, który trzeba napisać w celu stworzenia aplikacji, operującej na dokumentach.

Struktura dokumentu

Efektywną analizę dokumentu można zapewnić przez określenie jego struktury logicznej za pomocą oddzielnego dokumentu Document Type Definition (DTD). DTD definiuje elementy strony, znaczniki i ich atrybuty oraz zależności między nimi (reguły syntaktyczne). Pozwala na wstawianie danych i pobieranie ich z dokumentu źródłowego w celu dalszego przetworzenia za pomocą prostego programu w dowolnym języku skryptowym.

Definicja DTD nie jest jednak obowiązkowa; do prostych aplikacji można używać standardowych definicji lub nie używać ich wcale. Analizator składniowy - po stwierdzeniu poprawności składniowej dokumentu - może pobrać z niego dane nawet bez wzorca DTD.

Arkusze stylów

Dla celów publikacyjnych w XML można korzystać z arkuszy stylów, podobnie jak w HTML. Do definiowania arkuszy stylów służy język Extensible Style Language (XSL).

Język XSL jest rozszerzalny, pozwala więc na dostosowanie prezentacji dokumentu do możliwości medium: inna będzie prezentacja na przeglądarce Web, inna zaś w telefonie komórkowym lub podręcznym asystencie cyfrowym typu Palm Pilot lub Psion.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200