Akustik-Grundlagen, Folge 4
Akustik-Grundlagen, Folge 4
Wissen: Akustik-Grundlagen Folge 4 Hören
Wenn wir uns in der abschließenden Folge unseres Akustik-Grundkurses mit dem Hören befassen, muss uns klar sein, dass alle Erkenntnisse über das Gehör aus wahrnehmungspsychologischen Experimenten stammen. Denn die Hörempfindung ist wie jede Sinneswahrnehmung individuell sehr unterschiedlich, weswegen die systematische Psychoakustik, welche auf Arbeiten des Physikers und Psychologen Gustav Theodor Fechner (1801 bis 1887) zurückgeht, eine Wissenschaft im Grenzgebiet zwischen Psychologie und Physik ist. Demgegenüber beschäftigt sich die Physiologie des Gehörs mit der physikalischen und biologischen Funktionsweise der Hörorgane. Wir werden uns im Folgenden zunächst knapp und konzentriert der Physiologie des Ohres widmen. Danach behandeln wir Erkenntnisse über die Schallwahrnehmung, welche die Psychoakustik in der vergleichsweise kurzen Zeitspanne von Fechners Grundlagenwerk „Elemente der Psychoakustik“ von 1860 bis heute gewinnen konnte.
Wahrnehmungen
Schematischer Aufbau des Ohrs
Schnitt durch die Cochlea mit ihren wichtigesten Elementen
Aufgrund von Wechselwirkungen zwischen der Tonhöhe eines reinen Tons und einem breitbandigem Störgeräusch, erhöht ein tieffrequentes Störgeräusch den wahrgenommenen Ton, ein hochfrequentes verringert die Tonhöhe.
Interessant ist auch die Wahrnehmung der sogenannten Residualtonhöhe. In komplexen Schallsignalen kann das Gehör nämlich fehlende Grundtöne rekonstruieren, wenn nur ein ausgeprägtes Obertonspektrum vorhanden ist. Das Ohr schließt aus der Obertonstruktur auf den Grundton, auch wenn dieser im Signal nicht mehr vorhanden ist. Die Residualtonhöhe wird daher auch als virtuelle Tonhöhe bezeichnet und ist ganz typisch für unser Gehör. Meistens ist uns nicht mal bewusst, dass wir nicht vorhandene Töne hören. Das ist durchaus praktisch: Bei der Musikwiedergabe über kleine, im Frequenzgang stark beschnittene Lautsprecher, hören wir dennoch die fehlenden Grundtöne mit. Das Wahrnehmungsfenster auf die unendlich ausgedehnte Ebene möglicher Kombinationen von Schalldruckpegel und Frequenz wird Hörfläche genannt. Die Grafik auf Seite XX illustriert die Hörfläche, die nach unten von der Hörschwelle (auch unter dem englischen Begriff Hearing Threshold geläufig) und nach oben von der Schmerzschwelle oder Schmerzschwelle, auf Englisch Threshold of Pain begrenzt ist. Betrachten wir die horizontale Frequenzachse, findet sich linksseitig, also zu den tiefen Frequenzen hin, der Bereich des unhörbaren Infraschalls, rechts zu den hohen Frequenzen der des unhörbaren Ultraschalls. Die vertikale Achse beschreibt die Ohrdynamik, also die Empfindlichkeit unseres Ohrs. Sie beträgt bei mittleren Frequenzen 120 Dezibel. Die Hörschwelle ist frequenzabhängig und von Mensch zu Mensch verschieden. Die durchschnittliche Hörschwelle bei einem Kilohertz ist als Referenzschalldruck pO festgelegt: pO = 2 . 10-5 Pa -> Lp = 0dB. Das ist also der Mindestschalldruck, bei dem die Nervenfasern der Basilarmembran überhaupt erst eine Reizung erfahren. Nach DIN 1318 ist der Referenzschalldruck als eine Lautstärke von 0 Phon genormt. Die Schmerzgrenze wird auch als Schmerzempfindungsschwelle bezeichnet, was insoweit instruktiver ist, als dass sie nicht allgemeingültig eindeutig festlegbar ist. Die Festlegung auf 100 Pa = 134 dB ist willkürlich. Sicher ist, dass ab 120 dB die Empfindung sehr unangenehm wird und dauerhafte Hörschäden bei längerer Beschallung programmiert sind. Die Bandbreite des Gehörs, also sein maximaler Frequenzumfang beträgt zehn Oktaven und reicht durchschnittlich von 16 Hertz bis 16 Kilohertz, im Hochtonbereich sind es in jungen Lebensjahren sogar etwa 20 Kilohertz. Das ist zwar im Vergleich zu einigen Tieren vergleichsweise dürftig, allerdings im – sinnvolleren – Vergleich zu unserem Auge richtig beeindruckend. Das Auge nimmt nämlich nur Frequenzen in einem Bereich von nicht mal einer Oktave wahr. Interessanterweise sind aber die sogenannte Flimmergrenze, wonach das Auge noch ein Einzelbild und das Gehör einen einzigen tiefen Ton erkennen kann, gleich: Im Durchschnitt beträgt die untere Grenzfrequenz beidesmal 16 Hertz. Deswegen findet sich Flimmergrenze mitunter als die Bezeichung der unteren Grenzfrequenz des Gehörs. Die Maßeinheit der psychoakustischen Größe Lautstärkepegel, auf Englisch Loudness Level, ist das Phon. Es dient dazu, die empfundene Lautstärke zu beschreiben, mit der ein Mensch ein Schallereignis als Hörereignis wahrnimmt. Der Wert in Phon gibt an, welchen Schalldruckpegel in dB ein reiner Sinuston mit einer Frequenz von 1000 Hertz besitzt, der gleich laut ist wie das Schallereignis, das eine andere Frequenz besitzt, empfunden wird. Die Lautstärkewahrnehmung ist stark frequenzabhängig, die Abhängigkeit der Lautstärkewahrnehmung von der Frequenz fällt darüber hinaus für unterschiedliche Lautstärkepegel unterschiedlich aus. Die bekannten und daher immer wieder gerne ins Spiel gebrachten Kurven gleicher Lautstärkepegel zeigen den Schalldruckpegel in Abhängigkeit von der Frequenz, bei dem die gleiche Lautstärkewahrnehmung hervorgerufen wird – allerdings nur, das wird oft nicht beachtet, für reine Sinustöne. Diese Kurven werden häufig – und falsch – als „Fletcher-Munson-Kurven“ bezeichnet, gehen aber auf die Messungen von Robison und Dadson aus dem Jahr 1956 zurück. Allerdings haben auch diese alten Messungen bei der aktuellen ISO-Norm keine Gültigkeit mehr, da diese gleichwohl immer noch verbreiteten Kurven partielle Messfehler von mehr als zehn Dezibel haben. Da aber das Gehör bei geringen Pegeln für tiefe Frequenzen viel weniger empfindlich ist, haben findige Ingenieure die in der Rückschau berühmt-berüchtigte „gehörrichtige Lautstärkeentzerrung“ erdacht: Mittels einer entsprechenden Schaltung in HiFi-Verstärkern sollte der Frequenzgang des über Lautsprecher oder Kopfhörer dargebotenen Signals an den Wiedergabepegel angepasst werden. Paradoxerweise werden bei eingeschalteten „Loudness“ oder „Contour“-Filtern sowohl die Tiefen als auch die Höhen angehoben. Ganz allgemein ist die Wirkung dieser „gehörrichtigen“ Lautstärkeregelung begrenzt, denn unser Gehör ist an das Phänomen der „Kurven gleicher Lautstärkepegel“ gewöhnt und wir empfinden diese Korrekturen eher als unnatürlich. Sinnvoller ist es, in der tontechnischen Praxis bei der Nachbearbeitung diese Kurven zu berücksichtigen, was insbesondere bei Änderungen von Gesamtpegel und Dynamik gilt. Neben der Pegellautstärke bedarf es noch einer weiteren Größe zur psychoakustischen Beurteilung der Lautstärke, die einen möglichst linearen Zusammenhang zwischen objektivem Zahlenwert und psychoakustischem Effekt besitzt. Dies leistet die psychoakustische Größe Lautheit mit ihrer Einheit Sone. Einem Geräusch, das die Pegellautstärke von 40 phon hat, wird per definitionem die Lautheit 1 sone zugewiesen. Oberhalb von 40 phone besteht ein logarithmischer Zusammenhang zwischen Sone und Phone. Eine Zunahme der Pegellautstärke um zehn Phon entspricht einer Verdopplung der empfundenen Lautstärke.
In der Tontechnik ist die Unterscheidung von Pegel und Lautheit von größter Bedeutung: Ob ein digitales System übersteuert wird, liegt allein am Spitzenpegel (peak level) und hat nichts mit der Lautheit zu tun. So kann ein als leiser empfundenes Signal durchaus einen höheren Spitzenpegel haben, während ein Signal mit hoher Lautheit noch Aussteuerungsreserven haben könnte. Daher würde es sich eigentlich empfehlen, auch im Studio die Pegellautstärke in Phone oder die Lautheit in Sone zu messen. Das ist aber nicht praktikabel, weswegen zur Ermittlung der Lautheit sogenannte bewertete (Schalldruck)Pegel herangezogen werden.
Die Hörfläche mit Hörschwelle, Schmerzgrenze und Lästigkeitsgrenze und desn sog. Isophonen
Ein weiteres Phänomen unseres Gehörs, das eine hohe tontechnische Relevanz hat, ist der Verdeckungseffekt, der auch unter dem Begriff Masking geläufig ist. Werden dem Ohr zwei Schallsignale angeboten, so kann eines der beiden unhörbar sein, falls die Signale in Zeit- und Frequenzbereich nah beieinander liegen. Wir sprechen von Simultanverdeckung, wenn die beiden Signale gleichzeitig dargeboten werden. Durch die Simultanverdeckung, die eine Verdeckung im Frequenzbereich ist, wird aus der Hörschwelle die Mithörschwelle. Es gibt auch Verdeckungseffekte bei nacheinander dargebotenen Signalen: Wir sprechen von Nachverdeckung, wenn ein starker Ton einen schnell folgenden schwächeren Ton verdeckt. Interessanterweise wird dieser Effekt im Englischen als Forward Masking bezeichnet. Bei der Vorverdeckung – auf Englisch Backward Masking – wird ein schwacher Ton von einem schnell folgenden stärkeren Ton verdeckt. Verdeckungseffekte sind keineswegs immer unerwünscht. So sind sie die Grundlage der wahrnehmungsbasierten Datenreduktion.
Unsere bisherigen Betrachtungen haben sich ausschließlich mit dem monoauralen, also einohrigen Hören befasst. Wenn wir uns im Folgenden mit dem zweiohrigen oder binauralen Hören befassen, geht es um die räumliche Wahrnehmung. Die Fähigkeit des räumlichen Hörens in der Horizontalebene gründet sich hauptsächlich auch interaurale Laufzeit- und Pegeldifferenzen, sprich Differenzen zwischen den beiden Ohrsignalen.
Die räumliche Wahrnehmung ist von Natur aus für die Orientierung in der Horizontalen (Azimutebene) optimiert. Seine maximale Ortungsschärfe von etwa einem Grad erreicht das Ohr bei frontalen Schallquellen. Eine seitlich auf den Kopf treffende ebene Welle erreicht das abgewandte Ohr später als das zugewandte Ohr. Der durchschnittliche Ohrabstand beträgt rund 17 Zentimeter, der maximale Schallumweg über den Umfang des Kopfes ungefähr 21 Zentimeter bei einem Schalleinfallswinkel von 90 Grad. Daraus resultiert eine maximale Laufzeitdifferenz zwischen den Ohrsignalen von 0,61 Millisekunden. Bei einer Signalverschiebung von rund 0,6 Millisekunden kommt es zur vollständigen Seitwärtsortung. Der kleinsten wahrnehmbaren Richtungsänderung einer Schallquelle von einem Grad entspricht eine minimal wahrnehmbare Laufzeitdifferenz von 0,01 Millisekunden. Aus der Richtungsortung über Laufzeitdifferenzen leitet sich die Laufzeitstereofonie ab. Laufzeitdifferenzen erlauben aber nur denn eine eindeutige Richtungsortung, wenn die Schallwellenlänge größer als der Schallumweg ist, beziehungsweise die Periodendauer länger als die Laufzeitdifferenz ist. Anderenfalls kann es zu Fehlortungen, hervorgerufen durch eine Mehrdeutigkeit der Phasenlage, kommen.
Ebenfalls ursächlich für unsere Fähigkeit der Richtungsortung sind die Pegelunterschiede zwischen den Ohrsignalen. Sofern die Wellenlänge einer seitlich auf den Kopf treffenden ebenen Welle klein im Vergleich zum Kopfdurchmesser ist, wird sie reflektiert. Am zugewandten Ohr entsteht ein Druckstau, am abgewandten ein Schallschatten. Bei dem durchschnittlichen Kopfdurchmesser von 17 Zentimetern ist eine Schallreflexion für alle Frequenzen zu erwarten, die größer/gleich zwei Kilohertz sind. Aus dieser Form der Richtungsortung leitet sich die Intensitätsstereofonie ab.
Das räumliche Orientierungsvermögen ist im Frequenzbereich von 1,6 bis zwei Kilohertz am Besten, wobei die Ortung über Pegeldifferenzen schon bei tieferen Frequenzen wirksam ist. Besonders gut können wir impulshafte Schallereignisse orten, während die Ortbarkeit bei tiefen Frequenzen zunehmend schlechter wird. Nicht ganz korrekt ist in diesem Zusammenhang die Behauptung, dass Frequenzen unterhalb 100 Hertz nicht mehr ortbar seien. Die Ortbarkeit ist nur viel schwerer als bei mittleren und hohen Frequenzen. Ein unterhalb 100 Hertz angekoppelter Subwoofer ist schon ortbar, seine Ortbarkeit wird aber durch die Dominanz der Satelliten erschwert.
Die Kurven gleicher Lautstärke zeigen die Frequenzabhängigkeit der Lautstärkewahrnehmung
Kommentare
Kategorien
Anzeige
3319 












