Google przedstawia Gemini – nowy model AI

Od dzisiaj Bard będzie używał Gemini Pro. Będzie on dostępny w języku angielskim w ponad 170 krajach i regionach, a w najbliższej przyszłości planowane jest rozszerzenie dostępnych opcji oraz udostępnienie usługi w kolejnych miejscach i językach.

Fot. Google

Od 13 grudnia deweloperzy i klienci biznesowi będą mieli dostęp do modelu Gemini Pro poprzez Gemini API w Google AI Studio lub Google Cloud Vertex AI.

Model Gemini powstał w efekcie szeroko zakrojonej współpracy wielu zespołów w Google, w tym Google DeepMind i Google Research, i jest największym projektem naukowo-inżynierskim w historii Google.

Zobacz również:

  • Google ostrzega przed monopolem Microsoftu w chmurze
  • Google zmienia nazwę usługi Bard
  • Microsoft zaprezentuje najnowsze osiągnięcia AI na konferencji Nvidia GTC

Gemini to model sztucznej inteligencji. Został on zbudowany od podstaw z założeniem, że ma być modelem multimodalnym, czyli takim, który może generalizować i z łatwością rozumieć, wykorzystywać i łączyć różne rodzaje informacji, w tym tekst, obrazy, dźwięki, filmy i kod.

Gemini jest jak dotąd najbardziej elastycznym z modeli Google, ponieważ działa sprawnie na dowolnych urządzeniach – od centrów danych po urządzenia mobilne. Dzięki swoim ultranowoczesnym możliwościom będzie mieć znaczący wpływ na sposób, w jaki deweloperzy i klienci biznesowi tworzą i skalują swoje działania z wykorzystaniem AI.

Jak podaje Google na swoim blogu, modele Gemoni były sprawdzane w różnorodnych zadaniach - od rozumienia naturalnych obrazów przez rozumowanie matematyczne po analizę materiałów audio i wideo. Wyniki Gemini Ultra przewyższają obecne osiągnięcia w 30 z 32 powszechnie stosowanych testów i standardów akademickich stosowanych w badaniach i rozwoju dużych modeli językowych (LLM).

„Z wynikiem 90,00% Gemini Ultra jest pierwszym modelem, który przewyższa w działaniu ekspertów w zakresie MMLU (masowe wielozadaniowe rozumienie języka). MMLU wykorzystuje połączenie 57 dziedzin nauki, takich jak matematyka, fizyka, historia, prawo, medycyna czy etyka, w celu testowania zarówno światowej wiedzy, jak i możliwości rozwiązywania problemów.

Nasze nowe wzorcowe podejście do MMLU umożliwia Gemini wykorzystanie zdolności rozumowania do dokładniejszego przemyślenia przed udzieleniem odpowiedzi na trudne pytania, co prowadzi do znacznych ulepszeń” – napisano na blogu.

Gemini 1.0 został wytrenowany, aby w tym samym czasie rozpoznawać i rozumieć tekst, obrazy, dźwięki i wiele więcej. Dzięki temu lepiej rozumie niuanse zawarte w informacjach i może odpowiadać na pytania dotyczące skomplikowanych zagadnień. Pomoże też uczniom w matematyce i fizyce.

W jaki sposób będzie wspomagał kodowanie? Pierwsza wersja Gemini może zrozumieć, wyjaśnić i wygenerować kod w najpopularniejszych na świecie językach programowania takich jak Python Java, C++ i Go.

„Gemini Ultra wyróżnia się w kilku testach porównawczych kodowania, w tym HumanEval, ważnym standardzie branżowym służącym do oceny wydajności zadań związanych z kodowaniem, oraz Natural2Code, naszym wewnętrznym zestawie danych, który wykorzystuje źródła generowane przez autorów zamiast informacji internetowych” – podaje Google.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200