Technologia Hyena jest nawet stukrotnie wydajniejsza od GPT-4

Trwają intensywne prace nad rozwojem sztucznej inteligencji. Naukowcy z Uniwersytetu Stanforda i kanadyjskiego instytutu MILA (Montreal Institute for Learning Algorithms) opracowali nową technologię AI. Ma ona pracować wielokrotnie szybciej i wydajniej od opracowanej przez firmę OpenAI technologii GPT-4.

Pierwsze testy technologii Hyena pokazują, że może to być kolejny przełom w rozwoju sztucznej inteligencji. Autorzy oprogramowania Hyena poddali je różnym testom, z których jeden nosi nazwę The Pile. Ma on do dyspozycji zbiór tekstów o olbrzymiej pojemności 825 GB, co odpowiada zawartości 250 tysięcy książek. Zbiór taki został opracowany trzy lata temu przez organizację non-profit Eleuther.ai, która zajmuje się rozwojem sztucznej inteligencji. Zbiór zawiera teksty pobierane nie z Facebooka czy Twittera, ale z takich profesjonalnych źródeł, jak PubMed, GitHub czy Urząd Patentowy USA.

Pomimo tego, że oprogramowanie Hyena zajmuje w pamięci komputera dużo, ale to dużo mniej miejsca niż GPT-4 czy nawet GPT-3, jego wydajność robi wrażenie.

Zobacz również:

  • Oficjalna premiera modelu Llama 3
  • Ta inicjatywa ma ułatwić firmom zadanie wdrażania systemów AI
  • Musk ostrzega, że ludzkość nie docenia sztucznej inteligencji

Hyena potrafi osiągnąć taki sam wynik jak ChatGPT, wykonując o 20% mniejszą liczbę operacji obliczeniowych. To też się liczy, gdyż wszystkie chatboty są wyjątkowo wymagające, jeśli chodzi o zasoby potrzebne do ich funkcjonowania. W innych zadaniach Hiena osiągała wyniki równe lub zbliżone do wyników wersji GPT, mimo tego iż była trenowana z mniej niż połową danych.

A oto przykład obrazujący dobrze możliwości oprogramowania Hyena. Podczas gdy GPT-3 ma do dyspozycji 175 mld parametrów, to nawet największa wersja programu Hyena ma ich tylko 1,3 mld. A to oznacza, że Hyena jest kilkadziesiąt razy wydajniejsza nawet wtedy, gdy ma do dyspozycji sto razy mniej parametrów. To robi wrażenie i wydaje się świadczyć o tym, że mamy do czynienia z technologią, która otworzy być może nowy rozdział w rozwoju sztucznej inteligencji.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200