Strojenie głosu przez IP

Translacja NAT

Ważnym aspektem transmisji VoIP jest podział ruchu na dwie ścieżki: sygnalizacyjną i głosową. Gdy podnosimy słuchawkę aparatu IP, sygnalizuje on początek procesu zestawiania rozmowy (call-setup). W większości systemów IP PBX serwer komunikacyjny zestawia, kończy i monitoruje połączenia. Ale konwersacja głosowa zapakowana w pakiety jest przeprowadzana bezpośrednio między punktami końcowymi bez jakiejkolwiek interwencji ze strony serwera back-end. Ten charakter komunikacji sprawia, że połączenie IP między stronami wykorzystującymi technologię translacji adresów NAT jest problemem: sygnalizacja pochodzi spod innego adresu (serwer komunikacyjny) niż potok transmisji głosowej (telefon IP). Dzieje się tak, ponieważ NAT działa w warstwie trzeciej. Komunikacja głosowa peer-to-peer jest przeprowadzana przez protokół RTP, który obudowuje adresy źródła i docelowy w nagłówki warstwy siódmej, adres zwrotny jest więc niedostępny dla standardowego mechanizmu NAT.

Współpraca z zaporą z kontrolą stanu jest równie problematyczna. Wychodząca komunikacja VoIP tworzy furtki na zaporze dla ruchu powrotnego. Jednak przychodzący ruch głosowy chce dostać się do sieci, używając innych informacji dotyczących gniazda (socket) i w konsekwencji zapora blokuje ruch RTP.

Rozwiązaniem obu problemów jest wykorzystanie zapory z funkcjonalnością proxy aplikacyjnego. Dzięki temu porty na zaporze są otwierane i zamykane na podstawie analizy protokołów głosowych. Obsługa protokołów telefonii IP może być dodana do starszych urządzeń przez uaktualnienie oprogramowania albo dołączenie odpowiednich rozwiązań sprzętowych.

Praktyka czyni mistrza

Kiedy pakiety głosowe dołączą do danych wędrujących przez naszą sieć, nie można zapomnieć, że jest to ciągle nowa technologia i należy poświęcić jej więcej uwagi. Wybór właściwego rozwiązania to tylko początek, jego utrzymanie jest prawdziwym wyzwaniem. Poznanie sieci, zapewnienie odpowiedniej jakości połączeń głosowych i odpowiednie zabezpieczenie serwera komunikacyjnego to kolejne zadania. Z czasem dochodzi do rozbudowy sieci.

O tym, jak najczęściej przebiega rozbudowa sieci, mówi Piotr Kedra: W większości przypadków klienci najpierw kupują małe systemy składające się z jednego serwera telefonicznego i kilku telefonów jako uzupełnienie tradycyjnej infrastruktury telefonicznej. Bardzo często, po zapoznaniu się z technologią, decydują się na rozszerzenie wdrożenia poprzez dokupienie aparatów telefonicznych, podniesienie bezpieczeństwa systemu poprzez tworzenie klastra serwerów telefonicznych i wdrożenie systemu awaryjnej obsługi telefonów oraz rozbudowę o dodatkowe aplikacje, takie jak IVR i poczta głosowa itp.

Czy taka stopniowa rozbudowa małych sieci i jednocześnie wdrożenie dużych systemów "pod klucz" sprawią, że wkrótce głos w pakietach stanie się powszechnie dostępnym medium? Co do tego nie ma wątpliwości Jacek Kuźmicki: Oceniając perspektywy telefonii IP, nie mogę się powstrzymać przed pokusą przywołania początków telefonii komórkowej dziesięć lat temu. Posiadanie dużej i ciężkiej "komórki" było wówczas oznaką prestiżu i wysokich dochodów, zaś sama telefonia mobilna była w praktyce dostępna jedynie dla wybranych. Nikt wówczas w najśmielszych marzeniach nie przewidywał, że zaledwie po dekadzie z telefonów komórkowych będzie korzystać ponad połowa dorosłej ludności kraju, a mieszczący się w dłoni aparat będą dostawać nawet dzieci jadące na kolonie i obozy.

Niektóre standardy i protokoły Voice over IP
Komplet protokołów H.323
Różnice między H.323 A SIP
H.323 to protokół standaryzowany przez ITU (International Telecommunications Union). Zapewnia specyfikacje dla wideokonferencji, wymiany danych, dźwięku i wideo w czasie rzeczywistym. Do określonych zadań H.323 wykorzystuje wiele dodatkowo opracowanych protokołów, w związku z czym jest uważany za wyjątkowo złożony.

MGCP (Media Gateway Control Protocol) - protokół kontroli połączeń VoIP przez zewnętrzne elementy sterujące: Media Gateway Controlers (MGC) lub Call Agents (CA).

RTP (Real-time Transport Protocol) - przesyłanie multimediów w czasie rzeczywistym wymaga mechanizmów zapewniających prawidłową rekonstrukcję odbieranych danych. Datagramy muszą być zestawione w odpowiedniej kolejności oraz z uwzględnieniem ewentualnych opóźnień i ich fluktuacji (jitter). Rozwiązaniem jest buforowanie danych przez urządzenie odbierające tak, aby można było je później odtwarzać ze stałą częstością. W tym celu opracowano protokoły RTP i RTCP (RTP Control Protocol). RTCP zapewnia sprzężenie zwrotne w jakości medium transmisyjnego. RTP transportuje zdigitalizowane dane. Protokoły te nie zmniejszają całkowitego opóźnienia ani nie zapewniają poziomu jakości usługi.

SIP (Session Initiation Protocol) - protokół sygnalizacyjny dla multimedialnych przekazów peer-to-peer. Opiera się na kodzie ASCII, przypomina HTML i wykorzystuje istniejące protokoły IP, takie jak DNS, SDP i inne, do zapewnienia dostępu do medium transmisyjnego. Zaprezentowany w połowie lat 90. spotkał się z dużym zainteresowaniem producentów rozwiązań VoIP. Uważa się, że SIP stanie się standardem de facto przy budowie sieci głosowych i zastąpi H.323. W modelu SIP większość "inteligencji" związanej z zestawianiem połączeń i funkcji umieszczono w aparatach IP albo oprogramowaniu soft-phone na komputerach PC, co zapewnia większe możliwości agentom i pracę w trybie bliskim komunikacji peer-to-peer. Tym SIP różni się od H.323, w którym większość operacji związanych z kontrolą i przetwarzaniem połączeń odbywa się w sposób scentralizowany - na serwerze lub centrali.


TOP 200