Google przedstawia Gemini – nowy model AI
- Computerworld,
- 06.12.2023, godz. 16:54
Od dzisiaj Bard będzie używał Gemini Pro. Będzie on dostępny w języku angielskim w ponad 170 krajach i regionach, a w najbliższej przyszłości planowane jest rozszerzenie dostępnych opcji oraz udostępnienie usługi w kolejnych miejscach i językach.
Od 13 grudnia deweloperzy i klienci biznesowi będą mieli dostęp do modelu Gemini Pro poprzez Gemini API w Google AI Studio lub Google Cloud Vertex AI.
Model Gemini powstał w efekcie szeroko zakrojonej współpracy wielu zespołów w Google, w tym Google DeepMind i Google Research, i jest największym projektem naukowo-inżynierskim w historii Google.
Zobacz również:
- Sztuczna inteligencja wkroczyła do aplikacji Speaking Practice
- Na rynku AI toczy się ostra walka o prymat. Dwaj główni rywale to ChatGPT i Gemini
- Sztuczna inteligencja od Apple wymagać może nowych procesorów
Gemini to model sztucznej inteligencji. Został on zbudowany od podstaw z założeniem, że ma być modelem multimodalnym, czyli takim, który może generalizować i z łatwością rozumieć, wykorzystywać i łączyć różne rodzaje informacji, w tym tekst, obrazy, dźwięki, filmy i kod.
Gemini jest jak dotąd najbardziej elastycznym z modeli Google, ponieważ działa sprawnie na dowolnych urządzeniach – od centrów danych po urządzenia mobilne. Dzięki swoim ultranowoczesnym możliwościom będzie mieć znaczący wpływ na sposób, w jaki deweloperzy i klienci biznesowi tworzą i skalują swoje działania z wykorzystaniem AI.
Jak podaje Google na swoim blogu, modele Gemoni były sprawdzane w różnorodnych zadaniach - od rozumienia naturalnych obrazów przez rozumowanie matematyczne po analizę materiałów audio i wideo. Wyniki Gemini Ultra przewyższają obecne osiągnięcia w 30 z 32 powszechnie stosowanych testów i standardów akademickich stosowanych w badaniach i rozwoju dużych modeli językowych (LLM).
„Z wynikiem 90,00% Gemini Ultra jest pierwszym modelem, który przewyższa w działaniu ekspertów w zakresie MMLU (masowe wielozadaniowe rozumienie języka). MMLU wykorzystuje połączenie 57 dziedzin nauki, takich jak matematyka, fizyka, historia, prawo, medycyna czy etyka, w celu testowania zarówno światowej wiedzy, jak i możliwości rozwiązywania problemów.
Nasze nowe wzorcowe podejście do MMLU umożliwia Gemini wykorzystanie zdolności rozumowania do dokładniejszego przemyślenia przed udzieleniem odpowiedzi na trudne pytania, co prowadzi do znacznych ulepszeń” – napisano na blogu.
Gemini 1.0 został wytrenowany, aby w tym samym czasie rozpoznawać i rozumieć tekst, obrazy, dźwięki i wiele więcej. Dzięki temu lepiej rozumie niuanse zawarte w informacjach i może odpowiadać na pytania dotyczące skomplikowanych zagadnień. Pomoże też uczniom w matematyce i fizyce.
W jaki sposób będzie wspomagał kodowanie? Pierwsza wersja Gemini może zrozumieć, wyjaśnić i wygenerować kod w najpopularniejszych na świecie językach programowania takich jak Python Java, C++ i Go.
„Gemini Ultra wyróżnia się w kilku testach porównawczych kodowania, w tym HumanEval, ważnym standardzie branżowym służącym do oceny wydajności zadań związanych z kodowaniem, oraz Natural2Code, naszym wewnętrznym zestawie danych, który wykorzystuje źródła generowane przez autorów zamiast informacji internetowych” – podaje Google.