Jak Google chce przeszukiwać serwisy społecznościowe

Subskrybuj RSS A A A
07 maja 2010 8:56
Dorota Konowrocka

TAGI: Google; Facebook; Twitter; serwisy społecznościowe; wyszukiwanie; przeszukiwanie

W jaki sposób dokonać rozbioru gramatycznego i syntaktycznego krótkiego wpisu na Twitterze? Pięć lat temu takie pytanie wydałoby się niedorzeczne - dziś jest zasadne.

W jaki sposób dokonać rozbioru gramatycznego i syntaktycznego krótkiego wpisu na Twitterze? Pięć lat temu takie pytanie wydałoby się niedorzeczne - dziś jest zasadne. To właśnie pytanie intryguje Amita Singhala kierującego pracami Google nad włączeniem w wyniki wyszukiwania w czasie rzeczywistym - przy zachowaniu i rozwinięciu mechanizmów pozycjonowania - zawartości serwisów społecznościowych, a w szczególności wpisów aktualizujących status użytkownika.

Czytaj też:
Każdego roku redaktorzy magazynu MIT Technology Review wybierają 10 niedawno powstałych i szybko rozwijających się technologii, które uznają za przyszłościowe. Oto kilka z opisywanych w tym roku przez nich tematów:

Najtrudniejszym aspektem przeszukiwania wpisów jest analiza ich treści i znaczeń oraz oszacowania ich ważności. Jakość wyników społecznego wyszukiwania powinna być tak samo wysoka, jak jakość wyszukiwania tradycyjnego, bo tego oczekują internauci, ale w przypadku sieci społecznościowych nie działają tradycyjne techniki szacowania ważności strony poprzez m.in. zliczanie prowadzących do niej linków.

Informacje publikowane w sieciach społecznościowych mogą tracić ważność w ciągu kilku godzin, czy minut i Google ma niewiele czasu na ich analizę i ocenę. Do szacowania ważności poszczególnych wpisów używa się m.in. tak narzucających się miar autorytetu użytkowników Twittera, jak liczba śledzących je osób, czy liczba ich wpisów, które są powielane przez innych.

Miarą wartości użytkowników Facebooka zaś jest m.in. liczba znajomych oraz ich znajomych, ale kolejne brane pod uwagę czynniki są już znacznie bardziej subtelne. To, czego szuka Google, to nieoczekiwane odstępstwa od językowego wzorca. Nagłe, nieoczekiwane pojawienie się w strumieniu wiadomości pewnego słowa - np. tornado - może sygnalizować ważne wydarzenie i ze względu na tę informację wpis może zasługiwać na wypromowanie. Pojawienie się we wpisie na często podejmowany temat nietypowej frazy może sygnalizować nową informację lub świeże spojrzenie autora na zagadnienie.

Językowe nieciągłości to nie wszystko. Ważność wpisu może determinować powiązana z nim informacja geograficzna uzyskiwana za pomocą oprogramowania zainstalowanego na smartfonach lub aplikacji, takich jak FourSquare. Informacja o położeniu osoby nadającej strumień wiadomości może mieć ogromne znaczenie; relacja z epicentrum trzęsienia ziemi jest prawdopodobnie znacznie bardziej wartościowa niż informacja nadawana przez kogoś znajdującego się na drugiej półkuli.

Więcej na ten temat
W jaki sposób można analizować nasze dane
Z dr Jerzym Surmą z Kolegium Nauk o Przedsiębiorstwie SGH, kierownikiem Studium Podyplomowego BI rozmawiamy o roli Business Intelligence w czasach powszechnego wykorzystania Internetu.

Kradzież tożsamości w Facebooku - 1,5 mln kont do sprzedania
Internetowy przestępca przedstawiający się jako Killros ma do sprzedania 1,5 mln skradzionych kont użytkowników serwisu społecznościowego Facebook. Ceny zaczynają się od 25 USD za 1000 kompletów login + hasło.

Raport z cyberprzestępczego podziemia
Cyberprzestępcy radzą sobie coraz lepiej z kradzieżą pieniędzy i informacji o transakcjach elektronicznych oraz z organizowaniem nielegalnego przepływu gotówki. Tworzą niewidoczne, bardzo dobrze zorganizowane podziemne struktury. Jak one działają?

Oceń artykuł

średnio: 0 liczba ocen: 0

Komentarze (0)





Najnowsze

Ile kosztuje dowód osobisty

Rząd jako jeden z powodów anulowania przetargu na blankiety e-dowodu podaje brak środków. Sprawdziliśmy, ile kosztowałoby to podatników i jaka jest cena za dokumenty tożsamości na świecie.

Państwo do konsolidacji

Obywatele uważają administrację publiczną za jeden organizm. W rzeczywistości jest to kilka tysięcy oddzielnych struktur, obrosłych biurokratycznymi naroślami. Czy można zracjonalizować działanie państwa? Jak w tym może pomóc informatyka?

Zarządzanie po japońsku

W praktyce przemysłowej wypracowano szereg skutecznych metod zarządzania. Wiele powstało w Japonii. Dlaczego, mimo ich efektywności, nie zawsze są stosowane w biznesie?

e-Sąd z odsieczą sprawiedliwości

Polski wymiar sprawiedliwości postrzegany jest jako skostniały i opieszały. Tymczasem kolejne e-usługi udostępniane przez Ministerstwo Sprawiedliwości ułatwiają życie przedsiębiorcom i usprawniają pracę sądów.

e-Zdrowie w Polsce i na świecie

Projekty informatyzacji służby zdrowia realizowane są na świecie z różnym powodzeniem. Skąd Polska mogłaby czerpać wzorce? A może jesteśmy skazani na własne rozwiązania?

Raport Państwo 2.0, czyli nowa wizja informatyzacji państwa

Michał Boni, minister administracji i cyfryzacji, zaprezentował raport "Polska 2.0. Nowy start dla e-administracji". Przedstawia on informacje na temat stanu realizacji projektów będących w gestii nowo utworzonego ministerstwa oraz prezentuje kierunki dalszych działań związanych z informatyzacją i cyfryzacją administracji publicznej w naszym kraju.

Cyberprzestępcy podążają za użytkownikami

Już dwie na trzy polskie firmy odnotowały ataki lub awarie, które spowodowały spadek produkcji. Co trzecia firma utraciła dane. Liczba takich przypadków będzie rosła, bo hakerzy biorą na cel najbardziej masowe technologie. Szybko reagują też na zmiany w firmowej architekturze.

Rekomendacje




Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści - Prenumerata: Computerworld, Networld, PC World
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88