Serwer wszystko słyszy

Subskrybuj RSS A A A
5 kwietnia 2004
Wiesław Pawłowicz

Microsoft Speech Server 2004 może wywołać duże zamieszanie na niszowym rynku systemów rozpoznawania mowy.

Microsoft Speech Server 2004 może wywołać duże zamieszanie na niszowym rynku systemów rozpoznawania mowy.

Microsoft zaprezentował Speech Server - oprogramowanie do rozpoznawania mowy. "Naszym celem jest wprowadzenie tej technologii na rynek masowy" - mówi James Mastan, odpowiedzialny za marketing nowego produktu. Jak deklaruje, system ma być łatwiejszy w użyciu i tańszy niż systemy konkurencyjne. Zobaczymy. Speech Server będzie konkurować z produktami takich firm, jak IBM, Nuance Communications i ScanSoft, które od lat zajmują się opracowywaniem tego typu systemów.

Telefon na WWW

Speech Server 2004 umożliwia dodawanie funkcji rozpoznawania mowy do istniejących aplikacji WWW Microsoftu tworzonych przy użyciu kodu opartego na XML i SALT (Speech Application Language Tags) w Visual Studio .Net. W efekcie oprogramowanie to pozwala na budowę systemów obsługujących głosowe połączenia telefoniczne i jednocześnie udostępniających treści zapisane na stronach WWW.

Aplikacja pracuje pod kontrolą Windows Server 2003. Jest dostępna w wersjach Standard Edition i Enterprise Edition. Ta druga wymaga instalacji oprogramowania na oddzielnym serwerze fizycznym, a przeznaczona dla mniejszych firm Standard Edition może być uruchamiana w tym samym komputerze co serwer WWW.

Zamieszanie na rynku

Wejście Microsoftu na ten wciąż niszowy rozwijający się rynek wywoła na nim zamieszanie. Speech Server jest nowym produktem, który musi udowodnić swoje zalety w praktyce, a budowa systemu rozpoznawania mowy jest zadaniem znacznie bardziej złożonym, niż wynikałoby to z towarzyszących premierze pakietu marketingowych przechwałek. Amerykańscy analitycy giełdowi są do nowego produktu Microsoftu nastawieni raczej sceptycznie.

Art Schoeller, analityk Yankee Group, ostrzega potencjalnych klientów, iż "niebezpieczne jest założenie, że każdy programista zajmujący się tworzeniem stron WWW będzie mógł zbudować dobrą aplikację z funkcjami rozpoznawania mowy, bo wymaga to specjalistycznej wiedzy, doświadczenia i umiejętności projektowania dialogów". Z drugiej strony, jak inaczej można się tego nauczyć niż poprzez praktykę...

Steve Cramoysan, analityk Gartnera, uważa, że choć wejście Microsoftu na rynek systemów rozpoznawania rzeczywiście zmienia układ sił, to jednak pierwsza edycja Speech Server nie będzie żadnym przełomem. Dopiero druga, a być może nawet trzecia edycja ma szanse stać się poważną konkurencją dla producentów oferujących analogiczne rozwiązania już od kilku lat. Według niego względnie niska cena licencji nie musi oznaczać oszczędności w dłuższej perspektywie. Wysokie mogą się okazać bowiem koszty tworzenia i utrzymania systemu opartego na technologiach zawartych w Speech Server 2004.

Na razie bez strachu

Kevin Chatow z konkurującej z Microsoftem firmy Nuance Communications mówi, że "Microsoft proponuje tanią alternatywę dla profesjonalnych systemów rozpoznawania mowy, która umożliwi łatwą budowę kiepskich aplikacji". Podkreśla on jednocześnie, że oprogramowanie Nuance jest zgodne z uznanym standardem Voice-XML 2.0, a nie SALT, którego proces standaryzacji jeszcze trwa.

Zwraca też uwagę, że systemy Nuance oferują uniwersalność w postaci możliwości uruchamiania ich nie tylko na platformie Windows, ale także Solaris, a wkrótce także Linux - chodzi o nową, przygotowywaną właśnie wersję Nuance Voice Platform Release 3.0.

VoiceXML kontra SALT
VoiceXML - obszerny standard powszechnie stosowany w praktyce. Oficjalna wersja specyfikacji 2.0 zostanie opublikowana przez organizację W3C w najbliższych tygodniach.

SALT - lekki, zorientowany na konkretne zastosowania standard opisu mowy. Tu proces standaryzacji jest dopiero w początkowej fazie, ale wsparcie dla SALT jest dość duże. Założycielami organizacji SALT Forum są m.in. Cisco Systems, Intel, Microsoft, Philips Electronics, HP i Siemens.

Oceń artykuł

średnio: 0 liczba ocen: 0

Komentarze (0)

Najnowsze

Państwo do konsolidacji

Obywatele uważają administrację publiczną za jeden organizm. W rzeczywistości jest to kilka tysięcy oddzielnych struktur, obrosłych biurokratycznymi naroślami. Czy można zracjonalizować działanie państwa? Jak w tym może pomóc informatyka?

Zarządzanie po japońsku

W praktyce przemysłowej wypracowano szereg skutecznych metod zarządzania. Wiele powstało w Japonii. Dlaczego, mimo ich efektywności, nie zawsze są stosowane w biznesie?

e-Sąd z odsieczą sprawiedliwości

Polski wymiar sprawiedliwości postrzegany jest jako skostniały i opieszały. Tymczasem kolejne e-usługi udostępniane przez Ministerstwo Sprawiedliwości ułatwiają życie przedsiębiorcom i usprawniają pracę sądów.

e-Zdrowie w Polsce i na świecie

Projekty informatyzacji służby zdrowia realizowane są na świecie z różnym powodzeniem. Skąd Polska mogłaby czerpać wzorce? A może jesteśmy skazani na własne rozwiązania?

Raport Państwo 2.0, czyli nowa wizja informatyzacji państwa

Michał Boni, minister administracji i cyfryzacji, zaprezentował raport "Polska 2.0. Nowy start dla e-administracji". Przedstawia on informacje na temat stanu realizacji projektów będących w gestii nowo utworzonego ministerstwa oraz prezentuje kierunki dalszych działań związanych z informatyzacją i cyfryzacją administracji publicznej w naszym kraju.

Cyberprzestępcy podążają za użytkownikami

Już dwie na trzy polskie firmy odnotowały ataki lub awarie, które spowodowały spadek produkcji. Co trzecia firma utraciła dane. Liczba takich przypadków będzie rosła, bo hakerzy biorą na cel najbardziej masowe technologie. Szybko reagują też na zmiany w firmowej architekturze.

Jak zaplanować karierę w branży IT

Doświadczenia łączone na różnych stanowiskach w firmach o odmiennych profilach są szczególnie cenione przez pracodawców. Dlatego warto głęboko przeanalizować możliwości rozwoju kariery, które obecnie stwarza rynek IT.

Rekomendacje



Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści - Prenumerata: Computerworld, Networld, PC World
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88