Google w poszukiwaniu nowych źródeł danych

Subskrybuj RSS A A A
17 września 2006
(dot)

Google interesuje się oprogramowaniem do rozpoznawania znaków i chce zatrudnić specjalistów w tej dziedzinie.

Google interesuje się oprogramowaniem do rozpoznawania znaków i chce zatrudnić specjalistów w tej dziedzinie.

"Obecnie czytamy prawie każdą stronę internetową na świecie. Pomóż nam przeczytać również wszystkie materiały drukowane!" - wzywa Google w ogłoszeniu dotyczącym pracy dla inżynierów specjalizujących się w programach OCR (www.google.com/support/jobs/bin/answer.py?answer=23733). Niejako przy okazji Google przypomina, że kilka miesięcy temu udostępnił ruchowi open source kod źródłowy systemu OCR Tesseract, opracowanego przez HP w latach 1985-1995.

W połowie lat 90. XX w. HP zawiesił rozwój tego programu. Dwa lata temu kilku specjalistów z HP zdecydowało się jednak zaproponować Uniwersytetowi w Las Vegas wspólne wypuszczenie go na rynek open source. Uniwersytet poprosił z kolei o pomoc specjalistów z Google, którzy po dokonaniu kilku poprawek uznali, że system nadaje się do publicznego udostępnienia.

Można podejrzewać, że nagłośnienie tego w tej chwili jest po pierwsze zabiegiem public relations, umożliwiającym zwiększenie kapitału sympatii dla Google po stronie ruchu open source. Po drugie jest elementem polowania na OCR-owe talenty, które mogą ujawnić się w trakcie prac nad udostępnionym do publicznej obróbki oprogramowaniem. Po trzecie zaś jest przejawem nadziei na wypracowanie w ramach open source nowego, bardziej efektywnego niż dotychczasowe podejścia do rozpoznawania znaków.

W gruncie rzeczy może chodzić o to, aby stworzyć powszechnie dostępne oprogramowanie OCR dla indywidualnego użytkownika, dzięki któremu mógłby przenieść do Internetu posiadane zasoby słowa pisanego - coś w rodzaju zgooglowanej wersji Projektu Gutenberga - i w ten sposób przyczynić się do zwiększenia ilości danych dostępnych w Internecie. Danych, które Google będzie mógł później wykorzystać w strategii reklamowej. Google prawdopodobnie doszedł do wniosku, że PDF-owe wersje książek udostępniane w serwisie Google Book Search nie umożliwiają pełnego wykorzystania ich reklamowego potencjału i należy pochylić się z troską nad zwykłym .txt.

Oceń artykuł

średnio: 0 liczba ocen: 0

Komentarze (0)

Najnowsze

Państwo do konsolidacji

Obywatele uważają administrację publiczną za jeden organizm. W rzeczywistości jest to kilka tysięcy oddzielnych struktur, obrosłych biurokratycznymi naroślami. Czy można zracjonalizować działanie państwa? Jak w tym może pomóc informatyka?

Zarządzanie po japońsku

W praktyce przemysłowej wypracowano szereg skutecznych metod zarządzania. Wiele powstało w Japonii. Dlaczego, mimo ich efektywności, nie zawsze są stosowane w biznesie?

e-Sąd z odsieczą sprawiedliwości

Polski wymiar sprawiedliwości postrzegany jest jako skostniały i opieszały. Tymczasem kolejne e-usługi udostępniane przez Ministerstwo Sprawiedliwości ułatwiają życie przedsiębiorcom i usprawniają pracę sądów.

e-Zdrowie w Polsce i na świecie

Projekty informatyzacji służby zdrowia realizowane są na świecie z różnym powodzeniem. Skąd Polska mogłaby czerpać wzorce? A może jesteśmy skazani na własne rozwiązania?

Raport Państwo 2.0, czyli nowa wizja informatyzacji państwa

Michał Boni, minister administracji i cyfryzacji, zaprezentował raport "Polska 2.0. Nowy start dla e-administracji". Przedstawia on informacje na temat stanu realizacji projektów będących w gestii nowo utworzonego ministerstwa oraz prezentuje kierunki dalszych działań związanych z informatyzacją i cyfryzacją administracji publicznej w naszym kraju.

Cyberprzestępcy podążają za użytkownikami

Już dwie na trzy polskie firmy odnotowały ataki lub awarie, które spowodowały spadek produkcji. Co trzecia firma utraciła dane. Liczba takich przypadków będzie rosła, bo hakerzy biorą na cel najbardziej masowe technologie. Szybko reagują też na zmiany w firmowej architekturze.

Jak zaplanować karierę w branży IT

Doświadczenia łączone na różnych stanowiskach w firmach o odmiennych profilach są szczególnie cenione przez pracodawców. Dlatego warto głęboko przeanalizować możliwości rozwoju kariery, które obecnie stwarza rynek IT.

Rekomendacje



Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści - Prenumerata: Computerworld, Networld, PC World
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88