Rytmy z Rio

Psychoakustyka

Podstawą każdej kompresji danych jest algorytmiczne "ściskanie" bitów. Dopiero jednak podejście interdyscyplinarne, wykraczające poza aspekty czysto informatyczne, daje pożądane efekty. Przykładem mogą tu być dokonania psychoakustyki. Dziedzina ta zajmuje się specyfiką odbioru dźwięku przez ludzkie ucho. Nie wszystkie dźwięki, dające się zarejestrować maszynowo, są przez nas słyszalne. Można je zatem "wyrzucić". Efekt będzie mierzalny, ale niesłyszalny. W ten sposób oszczędzamy miejsce na nośniku danych. Bywa też tak, że bardzo ciche tony są często przygłuszane przez mocniejsze. Nie warto zatem zapamiętywać tych pierwszych.

Podstawowym problemem psychoakustyki jest wymierność ludzkich doznań słuchowych. W jaki sposób zmierzyć to, co jest niemierzalne za pomocą urządzeń pomiarowych? W końcu algorytm MP3 musi w jednoznaczny sposób "wiedzieć", w jaki sposób zakodować każdy fragment muzyczny. Nie pozostaje nic innego jak subiektywna ocena słuchacza, który porównuje dźwięk oryginalny z jego skompresowaną kopią. Jedna z popularnych metod, testowana na grupie słuchaczy przez firmy tworzące algorytmy MP3, wygląda następująco: słuchacz zapoznaje się z oryginałem dźwiękowym, a następnie naprzemiennie (losowo) z oryginałem i kopią; różnice są notowane w skali punktowej.

Najcenniejsze są uwagi doświadczonych "kiperów", obdarzonych tzw. słuchem absolutnym. Wrażenia notowane przez "złote uszy" są podstawą dla programistów modyfikujących swoje algorytmy. Tego typu doświadczenia doprowadziły w swoim czasie do powstania pierwszych mierników psychoakustycznych, które okazują się jednak mniej doskonałe niż ludzkie ucho. A zwłaszcza skojarzony z nim ludzki mózg. Jakże inaczej będzie przecież odbierał Obrazki z wystawy, które wyszły spod pióra Emersona, Lake'a i Palmera, ktoś zaznajomiony z klasycznym pierwowzorem Musorgskiego.

Muzyka to również słyszenie tego, czego nie ma w nutach. Pozamuzyczna impresja, sprowokowana przez kompozytora czy muzyka, albo zupełnie indywidulane, subiektywne wzbogacanie dzieła przez słuchacza. Proces słuchania to coś więcej niż fale dźwiękowe skupiane przez małżowinę uszną i przetwarzane dalej kombinacją: błony bębenkowej, kosteczek ucha środkowego, ślimaka wewnętrznego, endo- i perylimfy czy komórkami rzęsatymi Cortiego. Muzyka to również złożone asocjacje o charakterze kulturowym, fantazje, gusta i samosugestie z trudem przekładalne na częstotliwościowe spektra. I to właśnie dostrzegli twórcy MP3.

Fani hi-fi często lekceważąco wyrażają się o tym standardzie, dla nich jedynymi miarami jakości dźwięku są herce i decybele. Ba - w zakresie studyjno-profesjonalnym mają rację, ale czy podobne zdanie prezentuje masowy odbiorca? Czy auto osiągające prędkość 270 km/godz. jest lepsze od pojazdu, który pojedzie "tylko" 230? I nawet nie chodzi o to, że w korkach czy w mieście oba wehikuły będą poruszać się z podobną szybkością. Bardzo rzadko z tak dużych prędkości w ogóle da się skorzystać. Że szybsze auto ma większą moc silnika, która może się przydać? A tu już mówimy o zupełnie innym parametrze i do tak teoretycznych rozważań warto od razu wciągnąć konstrukcję typu "czarny ciągnik, pojemność dwa czterysta". Twórcy MP3 reprezentują bowiem bardzo praktyczny punkt widzenia.

Jakże często i chętnie słuchamy muzyki "w tle". Właśnie w samochodzie, przy czytaniu czy jedzeniu, gotowaniu, sprzątaniu bądź innej pracy. Albo podczas joggingu, gdy możemy wykorzystać zalety odtwarzaczy MP3. W każdym razie praktyka dowodzi, że różnice między jakością dźwięku ze źródła MP3 i z klasycznego CD są, w statystycznie typowej sytuacji, pomijalnie małe.

Źle uzasadnione obawy

Klasyczny dysk CD odpowiada pojemności 650 MB, co przeliczone na muzyczny czas daje 74 minuty dźwięku. Nikt zatem wcześniej nawet się nie zastanawiał, żeby bawić się w zapamiętywanie tak dużej ilości danych na dyskach magnetycznych. Bo i po co? Do niedawna zresztą jednym laserokrążkiem można byłoby skutecznie zapchać "twardziela" przeciętnego komputera PC. A ściągać to przez Internet? Jak? To znaczy: jak długo? W końcu każdą minutę muzyki trzeba byłoby okupić czekaniem na transfer (i kosztami) 10 MB danych. A jeśli za minutę Pink Floyd czy Budki Suflera "zapłacimy" zaledwie jednym megabajtem, a nawet mniejszą ilością danych? Aaa, to jest zupełnie inna rozmowa, pardon, słuchanie.

MP3 umożliwia bowiem kompresję muzyki ze współczynnikiem od 9 do 13 razy. Są to wartości, które niewiele mówią bez komentarza. Owszem, można przyjąć, że minuta muzyki w formacie MP3 to 1 MB pamięci, ale przy założeniu poziomu częstotliwości ponad 40 kHz. Zejście na poziom 20 kHz (jakość! jakość!) to już tylko 500 KB itd. Liczba tytułów muzycznych, które w tym formacie można znaleźć w Internecie, sięga miliona i wciąż rośnie. Czy branża muzyczna ma się czego obawiać? Zgodnie z zasadą, że lepsze jest wrogiem dobrego, oczywiście tak. Natomiast obawy sugerujące, że MP3 jest "pirackim" formatem, mającym prowadzić do zapaści w branży, są nieuzasadnione. Tego typu straszenie to specjalność "poinformowanych inaczej" bądź tych, którzy z wygodnych stołków argumentują, że jest dobrze, bo tak było "od zawsze".


TOP 200