Słownik BBC

Angielski producent programów radiowych i telewizyjnych - BBC (British Broadcasting Corporation), wydał przed kilkoma miesiącami słownik języka angielskiego: ''BBC English Dictionary''. Hasła słownika opracowano na podstawie liczącej 70 mln słów komputerowej bazy, na którą złożyły się teksty emitowane (BBC Electronic Distribution System) na antenie Serwisu Światowego BBC w ostatnich 4 latach.

Angielski producent programów radiowych i telewizyjnych - BBC (British Broadcasting Corporation), wydał przed kilkoma miesiącami słownik języka angielskiego: ''BBC English Dictionary''. Hasła słownika opracowano na podstawie liczącej 70 mln słów komputerowej bazy, na którą złożyły się teksty emitowane (BBC Electronic Distribution System) na antenie Serwisu Światowego BBC w ostatnich 4 latach.

Dodatkowych porównań dokonywano na podstawie komputerowej bazy danych uniwersytetu w Birmingham - COBUILD (COllins Birmingham UnIversity Language Database), zawierającej 100 mln słów, 10-milionowej próbki tekstów wiadomości z National Public Radio z Waszyngtonu i dwóch najnowszych wydań COBUILD Collinsa.

Praca nad słownikiem trwała dwa lata. Kierował nią prof. John Sinclair z Birmingham, który stanął na czele grupy lingwistów i leksykografów. Analizowali oni posiadaną bazę słów posługując się m.in. specjalnym oprogramowaniem. Pozwalało ono oceniać częstotliwość używania słów, a więc powszechność ich występowania. Jednak na obliczeniach nie zawsze można było polegać. Czasem jakieś słowo pojawiało się wielokrotnie, ale tylko jednego dnia (w wielu powtarzanych komunikatach BBC), by następnie pójść w zapomnienie. Takie wyjątki należało oczywiście eliminować - oceniając je indywidualnie. Nie zawsze jednoznaczna bywała też pisownia słów. Ustalano ją często dopiero po długich dyskusjach zespołu redakcyjnego ("Moldova" czy "Moldavia"?).

Słownik, zasadniczo pomyślany jako brytyjski, musiał też brać pod uwagę nieco amerykanizmów. Jednak decyzję o tym, czy zwrot jest amerykanizmem i czy należy go włączyć, podejmowano już bez pomocy programu. Postanowiono np., że wyrażenie "doing lunch" obok brytyjskiego "having lunch" (jeść śniadanie) jest na tyle ważne, iż powinno zostać uwzględnione.

Bezradność komputerowego wspomagania ujawniła się także przy opisywaniu znaczeń słów, choćby w przypadku wyrazu "broker": rzeczownika oznaczającego agenta zajmującego się sprzedażą. Słowo to w pewnych przypadkach ostatnio bywa używane w znaczeniu czasownikowym ("to broker an agreement"). Podobnie rzecz się miała ze słowami o jednakowej pisowni, ale różnych akcentach ("convict" z akcentem na pierwszą sylabę oznacza skazanego, a z akcentem na drugą jest czasownikiem - udowadniać winę). Kolejny nieoceniony pakiet służył do wychwytywania wzorców składniowych. Ale i tu często ostatecznie musiał decydować człowiek, traktujący pracę tego pakietu jako niezobowiązującą, choć użyteczną podpowiedź.

Zaletą nowego słownika jest podawanie wyrazów we wszystkich formach oraz ilustrowanie ich cytatami wprost z żywej mowy. W tym przypadku technika komputerowa okazała się pomocna. Całkowicie natomiast zrezygnowano z etymologii, co na pewno nie jest zaletą publikacji.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200