Budowa ucha to temat z fizjologii, natomiast odbieranie dźwięków i analizowanie tego odbioru to psychologia. Fale dźwiękowe uderzając w ucho, uruchamiają lawinę następujących po sobie wypadków, w wyniku, których sygnał o istnieniu fal zostaje przesłany przez komórki nerwowe do mózgu. Budowa i istota działania ucha jest powszechnie znana, ale wciąż nie do końca wiemy, w jaki sposób dźwięki interpretujemy i rozpoznajemy.
Istnieje w tej sprawie kilka teorii:
- Teoria fali biegnącej lub wędrownej (G. von Bécésy, 1942) uważa, że drgania strzemiączka tworzą na błonie bębenkowej fale, których maksimum określa słyszaną częstotliwość. Analiza tego, co słyszymy następuje w uchu. Naszą zdolność do rozróżniania niewielkich zmian częstotliwości, teoria tłumaczy właściwościami naszego układu nerwowego.
- Teoria fali stojącej twierdzi, że na błonie podstawnej tworzą się fale stojące i na tej podstawie wyodrębniamy słyszaną częstotliwość. Całą analizę prowadzi mózg.
- Teoria rezonansowa (H.von Helmholtz, 1863) nazywana teorią harfy, zakłada, że drgania strzemiączka rozchodzą się po całej objętości ślimaka i tam następuje analiza tego, co słyszymy. Nie tłumaczy to jednak naszej dużej wrażliwości na nieznaczne różnice częstotliwości. Pomija też udział wyższych pięter drogi słuchowej w procesie analizy dźwięku.
- Teoria telefoniczna (E. Rutherforda, 1866) zakłada, że ucho spełnia rolę mikrofonu, który przekazuje włóknami nerwowymi sygnał do mózgu. Całkowicie pomija dzianie ślimaka.
Dwie ostatnie teorie nie znalazły potwierdzenia we współczesnych badaniach. Żadna z pozostałych nie wyjaśnia też problemu całkowicie.
Informacja o dźwięku, dociera do naszego narządu słuchu, dwoma drogami:
a) droga powietrzną – przez małżowinę uszną, zewnętrzny przewód słuchowy, jamę ucha środkowego, okienko okrągłe i owalne, błony i płyny ucha wewnętrznego, narząd spiralny;
b) droga kostną – przez powierzchnię i kości czaszki, puszkę kostną błędnika i płyny ucha wewnętrznego.
Bodziec docierający drogą kostną jest słabszy. Gdy element drgający jest przyłożony bezpośrednio do czaszki jest to różnica 30-40 dB, a w przypadku bodźców akustycznych nawet 50-60 dB. Gdy słyszymy swój głos, ta proporcja jest inna i dlatego nagranie naszego głosu jest dla nas zaskoczeniem.
Przewodnikiem dźwięku są także mechanoreceptory, reagujące na dotyk i wibracje (np. fale dźwiękowe). Pod wpływem tych bodźców generowane są impulsy nerwowe, które docierają do ośrodkowego układu nerwowego. Dlatego przebywanie w hałasie, czy słuchanie głośnej muzyki tak bardzo nas pobudza. Mechanoreceptory rozmieszczone są na całym ciele. Najwięcej jest ich na opuszkach palców, języku i w ustach, ale także są na ślimaku ucha wewnętrznego.
Percepcja ludzkiego słuchu jest jedną z najwyższych wśród gatunków świata. Transjenty, czyli krótkie stany nieustalone występujące w strukturze dźwięku, są dla nas zauważalne już przy przesunięciu rzędu 20 ms. One decydują o percepcji barwy. Również rozumienie mowy to nie tylko sprawa zrozumienia kodu, jakim jest język mówiony, ale zauważenia mikroskopijnych, szybko następujących po sobie zmian.
Wysokość słyszanych dźwięków zależy od miejsca, w którym znajdują się pobudzone zakończenia nerwowe i częstotliwości ich drgania. Włoski drgają w różnych kombinacjach, które odtwarzają częstotliwości słyszanych dźwięków, ich składowych oraz ich wzajemne relacje. Im głośniejszy dźwięk, tym więcej impulsów wędruje do mózgu.
Problemy ze słuchem ma prawie 10% populacji. Początkowo są to zmiany niezauważalne, jednak z czasem się powiększają. Małą cześć tych przypadków można leczyć farmakologicznie. Reszta wymaga urządzeń wspomagających. Wady słuchu w pewnym zakresie można korygować przy pomocy aparatów słuchowych. Dla niedosłuchu przewodzeniowego jest to zestaw złożony z mikrofonu i słuchawki, która przekazuje do ucha wzmocniony dźwięk.
Konstruktorem pierwszego aparatu słuchowego był w 1933 r. G. Marconi (ten od radia). Nowoczesne aparaty słuchowe dopasowywane są indywidualnie do krzywej słyszenia danej osoby. Dzięki filtrom można zmniejszyć moc dźwięków niepożądanych (sztućce, naczynia, papier). Kierunkowy mikrofon może reagować na głos ludzki. Urządzenia te stają się bezradne, jeżeli w uchu zaszły zmiany mechaniczne, chemiczne, albo, jeżeli niesłyszenie wynika z jego wadliwej konstrukcji.
Niedosłuch odbiorczy może dotyczyć jednego, lub obu uszu. Najczęstszym jego przypadkiem są zaburzenia spowodowane obumieraniem komórek słuchowych. Gdy się rodzimy jest ich ok. 50 tys., ale nie mają zdolności do odtwarzania się. W przypadku uszkodzenia komórek słuchowych następuje całkowita głuchota, a jedyną szansą na kontakt ze światem jest implant ślimakowy.
Zadaniem słuchu jest informowanie gdzie i co się znajduje. Wykonuje tu podobną pracę jak wzrok, tylko, że połączeń oka z mózgiem jest ok. 1 mln, natomiast ucho ma jeden taki kanał. Dlatego mózg posługuje się szeregiem innych wskazówek. Odległość między uszami człowieka to kilkanaście centymetrów. Sygnał, który dotrze do ucha bardziej oddalonego od źródła dźwięku, będzie spóźniony w stosunku do sygnału, który otrzyma ucho bliższe źródłu. Będzie się też różnił głośnością i barwą. Porównanie otrzymanych sygnałów umożliwia lokalizację źródła dźwięku.
Słuch kontroluje całą przestrzeń wokół osoby słuchającej. Warto o tym pamiętać na planie zdjęciowym. Widzimy tylko to, co pokazuje kamera, ale słyszymy nie tylko dźwięki z obszaru jej widzenia. Można nakręcić, stojąc tyłem do ruchliwej ulicy, scenę wiejską, czy historyczną, ale dźwięk nagrany na takim planie będzie zawierał odgłosy ruchu ulicznego. Mówimy o binauralnej percepcji dźwięku przez człowieka, czyli słyszeniu w kilku wymiarach. Są to: przód – tył, prawa – lewa, dół – góra oraz daleko – blisko.
Dźwięk jest zjawiskiem przestrzennym. Przy pomocy słuchu możemy obiekt zlokalizować, scharakteryzować jego ruch, stwierdzić, że się zbliża, stoi, oddala, zatrzymuje i z jaką prędkością się porusza. Umiemy określić zmiany zachodzące w obiekcie w trakcie obserwacji, a więc rodzaj ściany, w którą pukamy i zmiany w strukturze w różnych jej fragmentach (puste przestrzenie, miejsca wypełnione innym materiałem). Wiadomości, które można odczytać z wrażeń dźwiękowych dotyczą też ośrodków (środowiska) w jakich znajdują się źródło i słuchacz.
Precyzja ucha jest znacznie mniejsza, niż oka, a cechy, według których opisuje przedmiot – inne. Właściwa interpretacja danych zależy od doświadczenia odbiorcy i tego jak z przeszłości zapamiętał zróżnicowanie sygnałów akustycznych oraz ich zmiany pod wpływem różnych parametrów. Gdy występuje dysfunkcja jednego z uszu system ulega załamaniu.
Minimalne opóźnienie, które odbieramy, jako zmianę kierunku, wynosi 30 ms. Największe opóźnienie (630 ms) uzyskamy, gdy dźwięk będzie padał pod kątem 90º. Lokalizacja dźwięku na podstawie opóźnienia jest realnie możliwa w przedziale od 100 Hz-1 kHz. Nie lokalizujemy dźwięków poniżej 150 Hz. Dla częstotliwości 20 Hz (długość fali rzędu 17 m), różnica w czasie dotarcia do obu uszu jest pomijalnie mała. Lokalizacja trudna jest dla 100 Hz, gdy fala ma długość 3-4 m, bo gdy słuchamy w niewielkich pomieszczeniach, zanim fala zdąży się rozwinąć, już się odbija i nie jesteśmy w stanie odróżnić dźwięku bezpośredniego i odbitego.
Jeżeli dźwięk pada pod pewnym kątem, różnica natężenia dźwięku wynika z efektu maskowania głowy. Efekt ten powiększa się ze wzrostem częstotliwości dźwięku. Dla kąta 90º i częstotliwości w okolicach 300 Hz są to 2-3 dB, dla 1-2 kHz różnica wzrasta do 20 dB. Lokalizujemy dźwięki na podstawie różnicy natężenia w przedziale od 400 Hz. Dla niższych dźwięków różnica natężenia jest za mała. Jeżeli różnica w natężeniu pomiędzy uszami przekroczy 15 dB, to pozorne źródło dźwięku zlokalizujemy z boku.
Najmniej istotnym czynnikiem w ocenie kierunku, z jakiego dochodzi dźwięk, jest barwa. Różnica jest zauważalna tylko przy bardzo złożonych i skomplikowanych widmowo sygnałach.
Najlepszą lokalizację uzyskujemy dla dźwięków znajdujących się na wprost obserwatora – dla częstotliwości poniżej 1 kHz wynosi ona 1º. Pogarsza się, gdy kąt dochodzenia dźwięku się zmienia. Średnio jest to 3°, a dla dźwięków dochodzących z tyłu 6°. Lokalizacja wzrokowa jest lepsza o dwa rzędy wielkości. Lokalizacja pozioma jest dokładniejsza od pionowej. Nasza dokładność w oznaczaniu kierunku dźwięków dochodzących z różnych wysokości wynosi: z przodu 15°, a z tyłu 30°.
Ocena odległości źródła dźwięku jest jeszcze bardziej skomplikowana i niedokładna. Odległość oceniamy na podstawie narastania i zanikania dźwięków o częstotliwościach niskich, i aby zrobić to precyzyjnie, dźwięki te nie mogą ulegać żadnym deformacjom. Odbieramy spadek natężenia dźwięku i mówimy o zjawisku tłumienia czoła fali przez powietrze. Dźwięk dociera do nas zawsze, jako suma sygnału bezpośredniego i sygnałów odbitych. Informacją o odległości jest wzajemna proporcja tych sygnałów. Z odległością dźwięku bezpośredniego ubywa.
Jest to również informacja o rodzaju pomieszczenia, w jakim znajduje się źródło dźwięku. Rozpoznajemy je między innymi po charakterze odbić, jakie powstają. Praktyka wykazuje, że identyczne dźwięki, zależnie od otaczającego je środowiska brzmią różnie i różnie się rozchodzą. Różne materiały w różny sposób odbijają i chłoną dźwięki o różnej częstotliwości. Ma to wpływ na deformację barwy słyszanego finalnie dźwięku. W dźwiękach odbitych przeważają niskie częstotliwości, gdyż częstotliwości wysokie łatwiej zanikają.
Lepiej lokalizujemy kierunki i odległości w środowiskach, gdzie dźwięk rozchodzi się wolno. Tam, gdzie dźwięk rozchodzi się szybko, a tłumienie jest mniejsze, nasza orientacja jest gorsza lub całkiem niemożliwa. Pod wodą słyszymy monofonicznie, mamy problem zarówno z ustaleniem kierunku i odległości źródła dźwięku.