Falcon 180B to nowy, najsilniejszy na świecie otwarty LLM

Stworzony w Technology Innovation Institute w ZEA nowy model zajmuje 1. miejsce na liście najlepszych algorytmów LLM o otwartym dostępie opracowanej przez Hugging Face. Model obejmujący 180 miliardów parametrów jest trenowany na podstawie 3,5 bilionów tokenów, z 4 razy większymi zasobami obliczeniowymi niż model LLaMA 2 firmy Meta. Falcon 180B jest w otwartym dostępie dla naukowców i użytkowników komercyjnych.

Brett Sayles/ Pexels

Technology Innovation Institute (TII) w Abu Zabi Zjednoczonych Emiratach Arabskich uruchomił kolejną zaawansowaną iterację swojego flagowego dużego modelu językowego - Falcon 180B. Podobnie jak poprzednik, Falcon 180B zaoferowano jako model o otwartym dostępie do celów badawczych i komercyjnych.

Po niezwykłym sukcesie Falcon 40B, modelu sztucznej inteligencji o otwartym dostępie, który szybko zajął pierwsze miejsce na liście najlepszych algorytmów LLM opracowanej przez Hugging Face w maju 2023 r., TII, filar Advanced Technology Research Council (ATRC) w Abu Zabi poświęcony badaniom stosowanym, nadal przoduje w dziedzinie generatywnej sztucznej inteligencji. Falcon 40B stanowił jeden z pierwszych modeli o otwartym źródle zarówno dla naukowców, jak i użytkowników komercyjnych oraz był uznawany za pionierskie rozwiązanie w tej dziedzinie.

Zobacz również:

  • Snowflake Arctic - nowy model językowy LLM klasy korporacyjnej

Jego Ekscelencja Faisal Al Bannai, sekretarz generalny Advanced Technology Research Council, podkreślił pozytywny wpływ modelu Falcon na rozwój sztucznej inteligencji i powiedział, „Mamy wizję przyszłości, w której transformacyjna moc sztucznej inteligencji jest w zasięgu każdej osoby. Jesteśmy zobowiązani do demokratyzacji dostępu do zaawansowanej sztucznej inteligencji, gdyż nasza prywatność i potencjalny wpływ sztucznej inteligencji na ludzkość nie powinny być kontrolowane przez wybraną garstkę osób. Chociaż możemy nie dysponować wszystkimi odpowiedziami, nasza misja pozostaje niezachwiana: współpraca ze społecznością wykorzystującą oprogramowanie o otwartym źródle i zapewnianie w nią wkładu, tak aby korzyści ze sztucznej inteligencji odczuwali wszyscy”.

Falcon 180B  to nowy, najsilniejszy na świecie otwarty LLM

Źródło: TII

Dzięki liczbie 180 miliardów parametrów i trenowaniu na podstawie 3,5 biliona tokenów, Falcon 180B został umieszczony 1. miejscu na liście najlepszych trenowanych algorytmów LLM opracowanej przez Hugging Face. Osiąga lepsze wyniki niż uznani konkurenci tacy jak model LLaMA 2 firmy Meta względem różnych poziomów odniesienia takich jak testy rozumowania, kodowania, biegłości i wiedzy.

Wśród najlepszych algorytmów LLM o zamkniętym dostępie Falcon 180B zajmuje drugie miejsce po najnowszym modelu GPT 4 firmy OpenAI, na równi z modelem PaLM 2 Large firmy Google wspierającym narzędzie Bard – mimo iż jest od niego dwa razy mniejszy. Ramy licencjonowania modelu opierają się na „Licencji Falcon 180B TII”, która wykorzystuje Apache 2.0.

Dr Ebtesam Almazrouei, dyrektor wykonawczy i pełniący obowiązki główny badacz w AI Cross-Center Unit w TII, komentuje: „Uruchomienie Falcon 180B odzwierciedla nasze zobowiązanie do przesuwania granic sztucznej inteligencji – i jesteśmy bardzo podekscytowani możliwością dzielenia się jego nieograniczonym potencjałem ze światem. Falcon 180B zapowiada nową erę generatywnej sztucznej inteligencji, w ramach której potencjał rozwoju naukowego jest udostępniany dzięki otwartemu dostępowi, wspierającemu innowacje przyszłości. Podczas gdy sięgamy poza granice nauki i technologii, nasza wizja znacznie wykracza poza innowacje; dotyczy ona pielęgnowania głębokiej więzi w celu stawiania czoła globalnym wyzwaniom w drodze przełomowych rozwiązań opartych na współpracy.

Dzięki współpracy z 12 milionami deweloperów przyjmujących i wdrażających pierwszą wersję Falcon, ta istotna aktualizacja ma potencjał, by stać się podstawowym modelem dla wielu dziedzin, od chatbotów po generowanie kodów i wiele więcej”.

Model Falcon 180B jest kompatybilny z następującymi językami: angielskim, niemieckim, hiszpańskim i francuskim, z ograniczonymi zdolnościami w językach włoskim, portugalskim, polskim, niderlandzkim, rumuńskim, czeskim i szwedzkim.

Więcej informacji można znaleźć na stronie FalconLLM.tii.ae.

TII to część Advanced Technology Research Council (ATRC) w Abu Zabi, skupiona na badaniach stosowanych.

Źródło: The Technology Innovation Institute

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200