Chatboty firmy OpenAI będą się szkolić na danych publikowanych przez serwis Reddit

Treści publikowane na witrynie Reddit będą wykorzystywane przez OpenAI do szkolenia jego bota ChatGPT. Będzie to możliwe dzięki porozumieniu zawartemu w zeszłym tygodniu przez obie firm. Przewiduje ono, że firma OpenAI uzyska dostęp do interfejsu API należącego do Reddit, co zapewni jej dostęp w czasie rzeczywistym do postów Reddit.

W ramach partnerstwa Reddit uzyska dostęp do dużych modeli językowych OpenAI (LLM), które wykorzysta w swej działalności. Warto przypomnieć, że Reddit zawarł na początku tego roku podobną umowę z Google. Umowa przewiduje też, że OpenAI zacznie umieszczać na witrynie Reddit swoje reklamy. Obie firmy nie ujawniły jak dotąd warunków finansowych umowy. Biorąc jednak od uwagę fakt, że partnerstwo Reddit z Google oceniono na 60 milionów dolarów, może to być podobna kwota.

Należy przypomnieć, że prawie równo rok temu Reddit zaczął pobierać opłaty za dostęp do swojego interfejsu API obsługującego danych. Ruch ten spowodowało iż wiele firm musiało zawiesić swojej usługi wykorzystujące treści publikowane na Reddit, co spotkała się ostrą krytyką użytkowników korzystających z takich usług. Reddit bronił się twierdząc, że zawieranie umów licencyjnych na dane jest podstawową częścią jego działalności. Wykorzystania treści generowanych przez użytkowników do napędzania modeli sztucznej inteligencji, bez otrzymywania przez użytkowników wynagrodzenia, budzi od dawna kontrowersje

Zobacz również:

  • Usługa Apple Maps wkroczyła do przeglądarek
  • Kolejny gigant mediów społecznościowych wszedł wczoraj na giełdę
  • Powstała pięciostopniowa skala mierząca inteligencję rozwiązań AI

Porozumienie z Reddit powoduje, że OpenAI staje przed nowym wyzwaniem. Chodzi o to, że treści zamieszczane na witrynie Reddit będą zapewne zawierać nieprawdziwe informacje, co przełoży się na błędną pracę korzystającej z nich sztucznej inteligencji. Pomimo tego wiele firm zajmujących się generatywną sztuczną inteligencją chętnie korzystają z dostępu do treści publikowanych na takich witrynach jak Reddit, co rodzi wątpliwości dotyczące tej metody szkolenia różnego rodzaju botów AI.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200