Meta otwiera dostęp do dużego modelu językowego do badań nad sztuczną inteligencją

Meta podała, że jej model jest pierwszym modelem językowym o 175 miliardach parametrów, który został udostępniony szerszej społeczności badaczy sztucznej inteligencji

Meta otwiera dostęp do dużego modelu językowego do badań nad sztuczną inteligencją

rufio1/Pixabay

„Duże modele językowe” to systemy przetwarzania języka naturalnego, które są trenowane na ogromnych ilościach tekstu i są w stanie odpowiadać na pytania dotyczące czytania ze zrozumieniem lub generować nowy tekst.

We wpisie na blogu Meta czytamy, że udostępnienie jej modelu „Open Pretrained Transformer (OPT-175B)” poprawi zdolność naukowców do zrozumienia, jak działają duże modele językowe.

Zobacz również:

  • IDC CIO Summit – potencjał drzemiący w algorytmach
  • Komisja Europejska bierze pod lupę trzech amerykańskich gigantów rynku IT
  • Facebook i Instagram bez reklam, ale za dodatkową opłatą

Firma stwierdziła, że ograniczenia w dostępie do takich modeli „utrudniały postęp w wysiłkach zmierzających do poprawy ich odporności i łagodzenia znanych problemów, takich jak tendencyjność i toksyczność".

Technologia sztucznej inteligencji, która jest kluczowym obszarem badań i rozwoju dla kilku głównych platform internetowych, może utrwalać ludzkie uprzedzenia społeczne dotyczące kwestii takich jak rasa i płeć. Niektórzy badacze mają obawy co do szkód, jakie mogą się rozprzestrzeniać za pośrednictwem dużych modeli językowych.

Meta stwierdziła, że „ma nadzieję na zwiększenie różnorodności głosów określających etyczne aspekty takich technologii”.

Gigant technologiczny powiedział, że aby zapobiec nadużyciom i „zachować integralność”, udostępnia model na niekomercyjnej licencji, aby skupić się na przypadkach użycia w badaniach naukowych.

Według Meta, dostęp do modelu będą mieli badacze akademiccy i osoby związane z rządem, społeczeństwem obywatelskim i organizacjami akademickimi, a także laboratoria badawcze przemysłu. Udostępnienie będzie obejmować wstępnie wytrenowane modele oraz kod do ich wytrenowania i wykorzystania.

Źródło: Reuters

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200