Powstał model AI, który recenzuje pracę innego modelu AI

OpenAI wprowadziło do oferty pod koniec zeszłego tygodnia nowy model sztucznej inteligencji, który wyłapuje błędy popełnione przez jego inny model AI. To specyficznego rodzaju kontroler noszący nazwę CriticGPT, identyfikujący błędu znajdujące się w kodzie wygenerowanym przez model ChatGPT.

Narzędzie usprawnia proces szkolenia systemów sztucznej inteligencji wspierając technologią kryjącą się za skrótem RLHF (Reinforcement Learning from Human Feedback; wzmocnienie procesu uczenia się poprzez wykorzystani informacji zwrotnych uzyskanych od ludzi). Technologia taka powoduje, że odpowiedzi dużych modeli językowych stają się z czasem coraz dokładniejsze.

Zbudowany na bazi flagowego modelu GPT-4, model CriticGPT jest recenzentem odpowiedzi generowanego przez ChatGPT. Pierwsze testy pokazują, że CriticGPT nadaje się doskonale do analizowania kodu i identyfikowania błędów w nim błędów, eliminując zjawisko halucynacji, które dotyka wiele modeli AI. sami mogą nie zauważyć. Informatycy szkolili model CriticGPT na zestawie danych zawierającym próbki kodu zawierające błędami, które zostały wstawione celowo, po to aby model mógł rozpoznawać i wskazywać błędy znajdujące się w kodzie.

Zobacz również:

  • AI Act opublikowany
  • Powstała pięciostopniowa skala mierząca inteligencję rozwiązań AI

Użytkownicy mogą również dostosować dokładność narzędzia podczas wyszukiwania błędów i sprawować większą kontrolę nad jego tendencją do halucynacji lub do wyłapywanie błędów, które nie istnieją. Oprócz popadania w stan halucynacji, narzędzie ma również inne wady, na przykład może mieć trudności z oceną dłuższych i bardziej złożonych zadań, ponieważ jest szkolone na stosunkowo krótkich odpowiedziach. Ponadto często podczas kodowania halucynacje AI pojawiają się po rozproszeniu błędów w wielu różnych ciągach kodu, co jeszcze bardziej utrudnia modelowi CriticGPT zadanie identyfikowania źródła problemu.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200