Padła propozycja przyjęcia standardu definiującego format danych obsługiwany przez systemy SI

Chcąc przyspieszyć rozwój systemów wykorzystujących sztuczną inteligencję, firmy Intel, Arm i Nvidia opracowały i opublikowały projekt specyfikacji, która określi format danych używanych przez takie systemy.

Jest to specyfikacja wykorzystująca 8-bitowy, zmiennoprzecinkowy format FP8, który może w zamyśle jego twórców znacznie przyspieszyć rozwój sztucznej inteligencji poprzez optymalizację wykorzystania przez takie systemy pamięci.

Opracowując system sztucznej inteligencji, deweloper musi zawsze podjąć kluczową decyzję dotyczącą formatu danych używanych do prezentowania tzw. wag. To ważne, ponieważ to właśnie wagi decydują o tym, jak system SI przetwarza dane w całym procesie uczenia się. Systemy SI używają obecnie najczęściej takie formaty danych, jak FP16 i FP32.

Zobacz również:

  • Asystent AI Copilot wkroczył do platformy Azure SQL Database
  • Sam Altman: AI nie jest „istotą”, a jednym z kolejnych narzędzi
  • Bezpieczeństwo pasażerów PKP wzmocni sztuczna inteligencja

Jednak wiele firm projektujących systemy SI – w tym Intel, Arm i Nvidia – uważa, że idealnym formatem będzie tu FP8. Architektura Nvidii GH100 Hopper natywnie implementuje już format FP8, podobnie jak intelowski chipset Gaudi2 AI. W opinii analityków wspólny format FP8 przyniósłby również korzyści rywalom projektujących systemy SI , takim jak AMD, IBM czy Cerebras — z których wszyscy eksperymentowali lub przyjęli jakąś formę formatu FP8 do rozwoju swoich systemów.

Zwolennicy formatu FP8 twierdzą, że wykazuje on porównywalną dokładność z 16-bitową precyzją we wszystkich przypadkach użycia. Firmy Intel, Arm i Nvidia twierdzą przy tym, że udostępniają swój format FP8 bez licencji (czyli w otwartym formacie) i zapowiadają iż opracowany przez nie projekt specyfikacji zostanie w najbliższym czasie przesłany do IEEE, profesjonalnej organizacji, która weryfikuje i akceptuje standardy, które są następnie oficjalnie ratyfikowane.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200