Powstał jeden z najszybszych na świecie akceleratorów aplikacji AI

Google wprowadziło w tym tygodniu do oferty zaktualizowaną wersję swojego chmurowego akceleratora Cloud TPU v5e (którego premiera miała miejsce na początku tego roku), nadając mu nazwę Cloud TPU v5p. Są to akceleratory zaprojektowane z myślą o budowaniu i trenowaniu dużych modeli AI typu LLM (Large Language Model).

Grafika: Google

Jednostki obliczeniowe TPU (Tensor Processing Unit) są dziełem firmy Google i zostały zaprojektowane z myślą o przyspieszaniu procesów związane z uczeniem maszynowym. Usługa Cloud TPU opiera się na własnym frameworku do uczenia maszynowego, który nosi nazwę TensorFlow. Akcelerator Cloud TPU v5p składa się z 8960 układów scalonych, które komunikują się ze sobą za pośrednictwem bardzo szybkich połączeń, zapewniających przepustowość dochodzącą do 4800 Gb/s.

Moduł akceleratora ma wydajność (chodzi o 16-bitowe operacje zmiennoprzecinkowe) ok. 459 TFLOPów, wspieranych przez szybsze połączenie międzysieciowe. Według Google, nowy akcelerator może trenować duże modele językowe (takie jak GPT3-175B), prawie trzy razy razy szybciej niż akcelerator Cloud TPU v5e. Nowy akcelerator TPU v5p nie jest jeszcze ogólnie dostępny i z jego usług może obecnie korzystać wybrana grupa deweloperów, którzy przez najbliższe tygodnie będą go intensywnie testować.

Zobacz również:

  • Superkomputer do obliczeń AI od Nvidia
  • Google wypróbowuje eksperymentalną funkcję bezpieczeństwa w Singapurze
W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200