Poznaj voice coding, czyli programowanie za pomocą głosu

Komendy głosowe stają się poleceniami dla komputera, a konkretnie - kodem programistycznym. Zamiast wpisywać poszczególne znaki na klawiaturze, pisanie kodu będzie realizowane przy pomocy wypowiadanych poleceń. Jak to możliwe?

Voice coding

Voice coding

Obecnie od lat już wykorzystujemy polecenia głosowe do obsługi wielu gadżetów, takich jak Alexa i Siri, czy też Apple CarPlay i Android Auto. Nie brakuje też aplikacji mobilnych, które reagują na polecenia głosowe. Co zatem stoi na przeszkodzie, aby "pisać" kod programistyczny w taki sposób? Wygląda na to, że nic.

Zobacz: Dark Net

Zobacz również:

  • Premiera GitHub Copilot Enterprise

Voice coding, czyli kodowanie głosowe, nie jest jednak tak proste, jak może się wydawać. W programowaniu istnieją bowiem specjalne znaki i wyrażenia, dlatego musimy się nauczyć, jak je wypowiadać. Dla przykładu aplikacja Serenade, która służy do voice codingu, ma specjalny silnik speech-to-text, który odpowiednio zamienia mowę w kod programistyczny. Kiedy programista wypowiada komendy na głos, silnik SErenade przekazuje go do swojej warstwy przetwarzania języka naturalnego. Następnie modele uczenia maszynowego, które zostały przeszkolone w identyfikowaniu i tłumaczeniu typowych konstrukcji programistycznych na poprawny składniowo kod, wykonują swoje zadania i tak powstaje nasz "wypowiedziany kod".

Serenade pozyskała w 2020 r. aż 2,1 mln dol. finansowania na dalszy rozwój. Jej współzałożyciel Mat Wiethoff był ponoć tak wyczerpany pisaniem kodu, że nabawił się stałej kontuzji i nie mógł dłużej pisać. Miał więc wybór: zmiana kariery albo... no właśnie. Uznał, że stworzy odpowiednie oprogramowanie, które umożliwi voice coding.

Podobnie postąpił Ryan Hileman, który porzucił pracę na pełny etat jako programista, ponieważ doświadczał coraz silniejszego bólu ręki. Rozpoczął więc prace nad Talon, platformą do kodowania bez użycia rąk. Talon ma kilka elementów: rozpoznawanie mowy, śledzenie wzroku, a także rozpoznawanie hałasu. Silnik platformy opiera się na automatycznym systemie rozpoznawania mowy Wav2letter Facebooka, który Hileman rozszerzył i teraz uwzględnia on również rozpoznawanie komend programistycznych. Z kolei pozostałe dwa elementy symulują nawigację za pomocą myszy (przesuwanie kursowa po ekranie na podstawie ruchu oczów i klikanie na podstawie ruszania ustami).

Sprawdź: Business Intelligence

Czy voice coding to przyszłość programowania? Prawdopodobnie nie, jednak zdecydowanie są to ciekawe platformy dla osób, które są zmęczone pisaniem. Dodatkowo kodowanie głosowe umożliwia programowanie osobom, które z jakiegoś powodu nie mogą używać rąk. Zdecydowanie jest to nisza, która ma w sobie potencjał.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200