OpenAI prezentuje nowe API zapewniające dostęp do narzędzi ChatGPT

Firma zaprezentowała w ostatnich dniach nowe interfejsy API, zapewniające programistom dostęp do jej rozwiązań oferowanych przez ChatGPT. Znajduje się wśród nich API obsługujące model DALL-E 3, którego premiera miała miejsce w wrześniu tego roku. To model zamieniający tekst na grafikę.

Grafika: OpenAi

Podobnie jak w przypadku rozwiązań zapewniających dostęp do poprzednich wersji modelu (w tym do DALL-E 2), nowe API zawiera wbudowaną moderację, która pomaga chronić przed ewentualnymi nadużyciami. Interfejs API DALL-E 3 wspiera różne formaty grafiki i jej jakości, jak również rozdzielczości (od 1024 × 1024 do 1792 × 1024). Jeśli chodzi o ceny API, to zaczynają się one od 0,04 USD za jeden wygenerowany obraz.

W porównaniu z API obsługującym DALL-E 2, interfejs DALL-E 3 ma jednak pewne ograniczenia. Nie można go np. używać do tworzenia edytowanych wersji obrazów poprzez zastąpienie przez model niektórych obszarów wcześniej istniejącego obrazu lub utworzenie różnych nowych odmian istniejącego obrazu. OpenAI udostępnia też programistom interfejs API obsługujący zamianę tekstu na mowę. To rozwiązania noszące nazwę Audio API, które oferuje sześć gotowych głosów: Alloy, Echo, Fable, Onyx, Nova i Shimer. W tym przypadku ceny zaczynają się od 0,015 USD za wprowadzone 1000 znaków.

Zobacz również:

  • Google udostępnia AI Gemma dla developerów
  • OpenAI warte 80 mld USD
  • 2024 – czego spodziewać się od technologii?
W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200