Cookie Consent by Free Privacy Policy Generator website
MyOwnMusic

Magazin

Wissen Digitale Formate und Optimierungsmöglichkeiten – Teil 2

Optimal Digital
Wissen Digitale Formate und Optimierungsmöglichkeiten – Teil 2

Im zweiten Teil unserer Wissens-Serie diskutieren wir das Für und Wider hoher Samplingraten, Sie erhalten Einblick in die Wordclock und die Spezifikationen der gebräuchlichsten digitalen Schnittstellen.

Von Igl Schönwitz

Das Wandeln analoger Signalströme in digitale Zahlenformate ist seit Anbeginn dieser Technik bestimmten, fest definierten Gesetzmäßigkeiten unterworfen, die es zu beachten gilt, möchte man das klangliche Optimum aus solchen Prozessen herausholen. Einige dieser Gesetzmäßigkeiten – Stichwort: Abtastrate und Wortbreite – haben Sie im letzten Heft bereits kennengelernt. Die Frage, welche Abtastrate und Wortbreite für Produktionen die beste ist, wird allerdings im Profi-Bereich heiß diskutiert. Jeder Tonschaffende hat dazu eine ganz eigene Meinung, um nicht zu sagen Philosophie, die nicht zuletzt auch von der Praxis geprägt ist. Unterm Strich gibt es jedoch keine einheitliche, eindeutige Regel, um mit Hilfe der heutigen Technik das bestmögliche Ergebnis zu erzielen. Ein Mehr an Abtastrate führt nicht zwangsläufig zu besseren Ergebnissen, denn nach wie vor treffen Standards aus den Anfangstagen der digitalen Signalverarbeitung auf die technischen Möglichkeiten von heute, was gleichzeitig Segen und Fluch ist.

Schauen wir als Erstes noch einmal zurück: Bei Einführung der CD war Speicherplatz rar, das Format für das damals neue digitale Medium wurde daher auf 44,1 Kilohertz Abtastrate und 16 Bit Wortbreite festgelegt. Dies gilt bis heute und alles andere ist deshalb nicht CD-kompatibel. Gleichzeitig existierte auch eine Abtastrate von 48 Kilohertz, was vornehmlich in der Filmvertonung auch heute noch Anwendung findet. Auch Consumer-DAT (Digital Audio Tape, ein heute praktisch bedeutungsloses Format) arbeitete mit 48 Kilohertz, vor allem, weil die Musikindustrie Angst vor direkten digitalen Kopien hatte, was angesichts der heutigen Situation ein geradezu groteskes Szenario darstellt. Wichtig ist jedoch, wie man die Leistungsfähigkeit der modernen Technik mit den Vorgaben von damals auf optimale Weise verbindet.

In der Studiopraxis wird heute in den allermeisten Fällen mit 24 Bit gewandelt, was aufgrund der weit überlegenen Dynamik unbedingt sinnvoll ist. Gleichzeitig haben sich mehrere Normen von höheren Sample Rates etabliert, die allesamt Vielfache der anfangs definierten Abtastraten sind. Üblich sind außer 44,1 und 48 Kilohertz mittlerweile auch die Abtastraten 88,2 Kilohertz, 96 Kilohertz, seltener jedoch 176,4 und 192 kHz oder noch höher. Zum Sinn und Unsinn von hohen Abtastraten kommen wir gleich noch. Wichtig zu wissen: Innerhalb eines Projekts in einer DAW lassen sich Files mit unterschiedlichen Wortbreiten in der Regel problemlos gleichzeitig einsetzen – es kann aber immer nur eine Sample Rate geben. Wer also in einer 44,1 kHz-Session ein 48 kHz-File einsetzen möchte, muß dieses vorher konvertieren. Ansonsten wird es zu tief und zu langsam wiedergegeben, ähnlich einer Schallplatte, die zu langsam abgespielt wird.

Sicherlich lässt sich anhand einer höheren Sample Rate als 44,1/48 Kilohertz alleine noch nicht die Qualität eines Wandlers ablesen. In einer Studie im Rahmen einer Tonmeister-Diplomarbeit des Erich-Thienhaus-Instituts in Detmold wurden über 50 Testpersonen Aufnahmen mit verschiedenen A/D-Wandlern und unterschiedlichen Abtastraten im Blindtest vorgespielt.1 Das erstaunliche Ergebnis war, dass die absolute Wandlerqualität für einen natürlichen Klangeindruck letztlich ausschlaggebender zu sein schien als die Sample Rate.

Daraus folgern zu wollen, höhere Sample Rates seien nicht sinnvoll oder notwendig, ist trotzdem vorschnell. Ich hatte im Frühjahr 2013 die Gelegenheit, George Massenburg auf einer Workshop-Tour durch vier Topstudios zu begleiten und habe sowohl George wie auch viele Kollegen zu dieser Thematik in der Praxis befragt. George meinte dazu ganz klar, es gäbe zwar bis heute keine empirische wissenschaftliche Untersuchung, die einwandfrei belege, dass 96 Kilohertz Sample Rate besser klänge. Nichtsdestotrotz träfe er bei Produktionen mit 96 Kilohertz andere Entscheidungen im Mix. Viele Studiokollegen bestätigten diese Einschätzung. Auch in den Amazing Sound Studios arbeiten wir inzwischen mit einer Abtastrate von 96 Kilohertz und sind der Meinung, dass unsere Produktionen davon maßgeblich profitieren, selbst wenn sie am Ende auf CD gepresst werden. Die Aufnahmen erscheinen bei 96 Kilohertz, gerade in einem Mehrspurkontext, insgesamt aufgeräumter und durchsichtiger, selbst bereits vor einer endgültigen Abmischung. Im Mischvorgang scheinen die einzelnen Instrumente nach unserer Empfindung insgesamt einfacher positionierbar zu sein, auch viele Plug-ins arbeiten spürbar akkurater.

Abseits von subjektiven persönlichen Eindrücken gibt es durchaus einige nachvollziehbare Begründungen für den Einsatz von höheren Sample Rates in der Studioproduktion. Denn die zitierte Diplomarbeit klammert tatsächlich einige für unsere Studioarbeit relevante Aspekte aus, sieht man zusätzlich davon ab, dass die Arbeit schon etwas älter ist und die Wandler-technik seitdem nicht stehengeblieben ist. Zum einen wurden nur Stereo-Files getestet, ein Test in einer Mehrspur-Umgebung fand nicht statt. Zum anderen wurden die Signale auf der digitalen Ebene nicht nachbearbeitet. Viele natürliche Instrumente besitzen Obertöne die bis hinauf 30 Kilohertz und mehr reichen. Diese sind selbstverständlich nicht hörbar, allerdings können sie in einer Mischung Interferenzen bilden, die auch im Hörbereich stattfinden. Solche Details können bei 96 Kilohertz aufgelöst werden, bei 44,1 Kilohertz bleiben sie aufgrund des steilflankigen Aliasingfilters außen vor. So bricht in der Nachbearbeitung beispielsweise eine Anhebung über ein digitales High-Shelf-Filter bei einer Sample Rate von 44,1 Kilohertz aufgrund des Aliasingfilters bei 22 Kilohertz steilflankig nach unten ab. Solche extremen Filteränderungen sind dabei ohne Welligkeiten und Phasenverschiebungen im Hörbereich praktisch nicht zu realisieren. Bei 96 kHz Sample Rate müssen erst Frequenzen ab 48 kHz ausgefiltert werden, hier kann ein wesentlich flacheres Filter zum Einsatz kommen, was grundsätzlich unproblematischer zu lösen ist. Dies ist übrigens ein Grund dafür, warum das von uns häufig eingesetzte EQ-Plug-in „Epure II“ der französischen Software-Schmiede Flux intern ein Upsampling auf 384 Kilohertz durchführt. Plug-ins anderer Hersteller, wie etwa die Pultec-Clones von Universal Audio oder die T-Racks-Prozessoren von IK Multimedia arbeiten ebenfalls intern mit Upsampling.

Die Perspektiven für künftige Produktions-Standards dürften sich jedoch verbessern. Denn nicht erst seit heute liegt die Zukunft der Musikvermarktung wohl hauptsächlich im Download, wobei der Marktführer Apple mittlerweile Richtlinien herausgegeben hat, die erfreulicherweise Wert auf maximale Audioqualität legen. Das von Apple favorisierte Format heißt ganz klar 24 Bit / 96 Kilohertz, so dass davon auszugehen ist, dass sich dieses Format langfristig als neuer Standard durchsetzen wird. Obwohl zwar heutzutage technisch machbar, werden Abtastraten oberhalb 96 Kilohertz in der Fachwelt sehr kontrovers diskutiert. Eine Theorie besagt, dass eine obere Nutzsignal-Grenzfrequenz jenseits von 48 Kilohertz in der Audioproduktion wohl definitiv nicht mehr sinnvoll ist. Hinzu kommt, dass alle Prozesse in der digitalen Bearbeitung durch die entstehenden großen Datenmengen massiv belastet werden, so daß diese Sample Rates tatsächlich mehr Nach- als Vorteile bringen. An dieser Stelle möchte ich mich an dieser Diskussion jedoch nicht weiter beteiligen, gebe aber zu bedenken, dass selbst Wandler der Referenzklasse wie etwa der Lavry Gold oder auch der
Stagetec Truematch RMC nur Abtastraten bis maximal 96 Kilohertz unterstützen.

 

Für die Praxis lässt sich bislang folgendes zusammenfassen: Selbstverständlich ist es überhaupt nicht sinnvoll, ein 96-Kilohertz-Master anzufertigen, wenn in 44,1 Kilohertz produziert wurde, schließlich müssen die zusätzlichen Informationen, die die höhere Auflösung bringen soll, bereits aufnahmeseitig vorhanden sein. Eine mit 44,1 Kilohertz gewandelte Aufnahme hat jedoch bereits ein Anti-Aliasing-Filter durchlaufen, so dass ein nachträgliches Upsampling auf 96 Kilohertz keinen Gewinn an Auflösung mehr bringen kann. Wer für CD produziert, sollte sich zudem überlegen, in 88,2 Kilohertz zu arbeiten. Der Grund: Das Konvertieren ins CD-Format geschieht einfacher, verlustfreier und mit deutlich weniger Rundungsfehlern, da im Prinzip nur durch Zwei dividiert werden muss. Natürlich sollte man ein Vinyl-Master in möglichst hoher Auflösung belassen.

Übrigens ist zwischen 44,1 und 48 Kilohertz beziehungsweise zwischen 88,2 und 96 Kilohertz kein Unterschied hörbar – es ist also Unsinn, wegen vermeintlich besserer Qualität eine CD-Produktion in 48 Kilohertz zu fahren – die Konvertierung auf die CD-Norm wird das Ergebnis vielmehr eher verschlechtern, da erst einmal grundsätzlich jede Signalbearbeitung zu Artefakten führt. Bei der Audioproduktion für Filme sollte wie schon erwähnt jedoch stets in 48 oder 96 Kilohertz gearbeitet werden.

Unter klanglichen Aspekten ist es sicherlich so, dass sich auch in 44,1 Kilohertz gut arbeiten lässt, solange die restliche Übertragungskette stimmt und die Wandlerqualität adäquat ist. Viele Produzenten aus dem Werbe- oder auch Schlagerbereich arbeiten bis heute erfolgreich mit 44,1 Kilohertz. Auch die meisten Elektro- und HipHop-Produktionen werden in dieser Auflösung gefahren, auch weil dort mit vielen Software-Instrumenten gearbeitet wird und die Rechner mit einer Abtastrate von 96 Kilohertz wesentlich mehr belastet würden. Hier scheinen also die Nachteile der höheren Auflösung wie die höhere erforderliche Rechenleistung schwerer zu wiegen als der klangliche Vorteil. Bei hochwertigen Produktionen „handgemachter“ Musik halte ich jedoch eine Auflösung von 88,2 respektive 96 Kilohertz jedoch für unbedingt sinnvoll. Auf 24 Bit sollte allerdings in keinem Fall verzichtet werden.

 

Unter der Wordclock versteht man ein Signal, das den Takt der Sample Rate vorgibt, also 44,1 oder 96 Kilohertz erzeugt. Die Genauigkeit dieser Clock ist dabei von nicht zu unterschätzender Wichtigkeit. Ungenaue Clocks führen zu sogenanntem „Jitter“, also Schwankungen im Digitalsignal. Jitter ist erst einmal direkt nicht hörbar. Er führt aber zu Phasenproblemen und zu digitalen Fehlern, die meist durch eine Fehlerkorrektur aufgefangen werden, das Signal aber trotzdem maßgeblich verschlechtert. Die dabei auftretenden Phänomene sind vor allem ungenaue Transienten, eine schlechtere Räumlichkeit sowie mangelhafte Auflösung im Bassbereich, vor allem in einer Mehrkanalumgebung.

Die meisten digitalen Schnittstellen in Wandlern führen ein Wordclock-Signal mit. In einem Verbund mit mehreren digital verbundenen Geräten gilt für die Wordclock vor allem: Es kann nur eine geben. Wenn zwei Geräte zwar die gleiche Sample Rate, aber eine unterschiedliche Clock benutzen, so werden die Datenpakete an verschiedenen Zeitpunkten abgerufen, was sich durch Verzerrungen, Knackser und Dropouts bemerkbar macht. Manche Geräte verweigern bei unklarer Clock-Zuordnung konsequenterweise auch komplett den Dienst. Daraus ergibt sich zwangsläufig, dass innerhalb eines Digitalverbundes grundsätzlich erst einmal nur mit einer gemeinsamen Sample Rate gearbeitet werden kann. Setups mit gemischten Sample Rates erfordern aufwändige Clock-Generatoren sowie Interfaces mit integrierter, echtzeitfähiger Sample Rate Conversion. Derlei Systeme sind hauptsächlich im Broadcastbereich anzutreffen und spielen in der reinen Musikproduktion kaum eine Rolle, wenngleich Modelle wie der RME ADI-8 DS MKIII-Wandler (Test in Heft 8/2013) oder das jüngst von uns getestete Prism Sound Lyra 2 Interface (Test in Heft 2/2014) durchaus darüber verfügen.

In fast jeder Audio-Hardware mit integrierten Digitalschnittstellen lässt sich festlegen, ob sie beim Senden und Empfangen von Wordclock-Signalen als „Master“ oder „Slave“ fungieren soll. Generell muss in einem Verbund immer genau ein Gerät der „Master“ sein. Er gibt den Takt vor an den sich alle anderen Geräte zu halten haben und auf den sie sich synchronisieren müssen. Sie führen also entsprechend die Rolle als „Slaves“ aus. Dabei ist es sinnvoll, das hochwertigste Gerät als Master zu definieren, da die Clock-Qualität im Einzelfall hörbarer sein kann als beispielsweise eine hohe Abtastrate.

Zur Übertragung der Wordclock über diverse digitale Audio-Schnittstellen gibt es allerdings noch eine professionelle Alternative: die Übertragung über eine dezidierte Wordclock-Leitung. Dies ist eine spezielle Schnittstelle mit BNC-Steckverbindern, an die eine 75-Ohm Coaxial-Leitung angeschlossen wird und ausschließlich Wordclock-Signale transportiert. Für audiophile Ansprüche und größere Setups ist die Verwendung eines dezidierten Wordclock-Generators, der alle digitalen Audiogeräte sternförmig über BNC-Schnittstellen mit sauberster Clock versorgt, dringend anzuraten. Auf diese Weise lässt sich fast jeder Wandler klanglich maßgeblich verbessern.

 

Mittlerweile existieren viele unterschiedliche Schnittstellen-Normen für Digital Audio, wobei selbst Homerecording-Interfaces teils über mehrere Optionen zur digitalen Signalführung verfügen. Wichtig: Im Gegensatz zur Analog-Technik können verschiedene digitale Schnittstellenformate in der Regel nicht einfach über Adapterkabel zusammengeschlossen werden, da die digitalen Übertragungsformate zu unterschiedlich sind. Ausnahme bilden hier lediglich S/PDIF- und AES/EBU Verbindungen.

Bei der Konfiguration gilt es in der Praxis darauf zu achten, immer die passenden Einstellungen zu wählen – so gibt es beispielsweise unterschiedliche Übertragungsarten von hohen Abtastraten:

Moderne Schnittstellen unterstützen höhere Sampleraten mittlerweile direkt. Dies war jedoch keineswegs immer der Fall. So war beispielsweise die von Alesis für Ihre ADAT-Recorder (siehe unten) entwickelte gleichnamige Schnittstelle ursprünglich nur für acht Kanäle ausgelegt, die maximal 24 Bit und 48 Kilohertz führen. Als höhere Sample Rates aufkamen, bediente man sich eines Tricks, des sogenannten Sample-Multiplexing-Verfahrens, kurz S-MUX: Hierbei werden die Daten des 88,2/96 Kilohertz-Audiosignals auf zwei Kanäle mit jeweils der halben Sample Rate verteilt. In Konsequenz verliert man dabei sowohl im ADAT-Recorder wie auch an der Schnittstelle die Hälfte der Kanäle, ADAT bietet also im S-MUX2-Betrieb nur noch vier Kanäle. Im sogenannten S-MUX4-Modus, in dem Signale ab 176,4 Kilohertz geführt werden, sind es schließlich nur noch zwei Kanäle.

Der ungleich modernere MADI-Standard (Multi Channel Audio Digital Interface) unterstützt heute beide Betriebsarten – also 96 Kilohertz wahlweise direkt oder gesplittet in Form von 2 x 48 Kilohertz. Wichtig ist hierbei, dass alle Geräte im MADI-Verbund gleich konfiguriert sind, sonst kommt es zu Problemen. Darüber hinaus existieren bei MADI unterschiedliche Normen in der Kanalzahl. Mehr dazu gleich noch.

Während AES/EBU-, S/PDIF-, ADAT- und Dante-Schnittstellen ein Wordclock-Signal mitführen, also selbsttaktend sind, ist dies bei MADI nicht der Fall. Zwar kann empfängerseitig auch hier aus dem Datenstrom ein Clock-Signal gewonnen werden, es wird aber nicht dezidiert als solches mit übertragen. Daher ist es bei MADI-Übertragungen generell ratsam, gleichzeitig eine separate Wordclock-Leitung zu legen. Abseits dessen wird die mehrkanalige Übertragung von Digital Audio über die Ethernet-Schnittstelle auch im Tonstudio-Bereich immer interessanter und wichtiger. Außer dem Dante- und AES 50-Protokoll existieren mittlerweile diverse weitere Protokolle, teils in proprietärer Form von verschiedenen Herstellern. Im Live-Bereich ist diese Form der Audio-Übertragung, etwa das Verbinden von Mischpult und Stageboxen, schon längst angekommen. Focusrite präsentierte mit seiner RedNet-Serie vergangenes Jahr als erster Hersteller Interfaces für den Studio-Bereich, die zentral auf dem Dante-Protokoll aufsetzen (siehe Test in Heft 12/2013). Der Stagetec Truematch RMC-Wandler mittlerweile ebenfalls in einer Dante-Version erhältlich (Test in Heft 5/2011). Weitere Hersteller dürften demnächst folgen und die künftige Entwicklung in jedem Fall spannend ausfallen.

In der nächsten Folge erläutern wir Ihnen, was es beim Aufnahme- und Mischprozess in der Praxis zu beachten gilt unter Berücksichtigung der Besonderheiten der digitalen Technik.

-----------------------------------------------------------------------------


Die zurzeit gebräuchlichen digitalen Schnittstellen

Um Ihnen einen Überblick zu geben, stellen wir Ihnen jetzt kurz die gängigsten Digital-Schnittstellen zur Audioübertragung einmal vor. Formate wie USB, Firewire oder Thunderbolt lassen wir dabei bewusst außen vor: Zwar werden auch über diese Schnittstellen Audiodaten übertragen, allerdings erfolgt dies herstellerspezifisch beziehungsweise innerhalb einer per Betriebssystem definierten Treiberstruktur. Hierauf näher einzugehen, würde den Rahmen dieses Artikels allerdings sprengen, weshalb wir uns nur auf die allgemein für Digital Audio genormten Schnittstellen konzentrieren. Den Pro Tools HD-Port werden wir als Hersteller-spezifisches Format aus dem gleichen Grund ebenfalls nicht behandeln.

S/PDIF (Sony/Phillips Digital Interface Format)
Format aus dem Consumer (HiFi-) Bereich, das von Sony und Phillips zur Einführung der CD etabliert wurde. Besonderheit ist das SCMS – „Serial Copy Management System“ zum Verhindern mehrfacher digitaler Kopien.
Kabelformat: Cinch oder optisch Toslink
Kanäle: Zwei bei 32, 44,1 und 48 kHz, maximal 24 Bit

AES/EBU (Audio Engineering Society/European Broadcast Union)
Das Profi-Pendant zum “Consumerformat” S/PDIF, kann direkt adaptiert werden und unterscheidet sich technisch nur durch ein Statusbit. Während bei S/PDIF als Consumer-format vor allem das Verhindern mehrerer digitaler Kopien im Vordergrund steht (SCMS), bietet AES/EBU professionelle Features wie eindeutige Zuordnungen verschiedener Quellen und Empfänger, Fehlerkorrekturbits und größtmögliche Zuverlässigkeit. Im sogenannten „Double Wire“-Modus können Sampleraten von 88,2 und 96 Kilohertz übertragen werden, allerdings steht hier pro Kabel (Wire) nur noch ein Kanal zur Verfügung – für Stereoübertragung sind in dem Fall also zwei AES/EBU-Strecken nötig.
Kabelformat: XLR oder BNC, 110 Ohm empfohlen.
Kanäle: Zwei bei 32, 44,1, 48 kHz (Single Wire); 88,2 und 96 kHz (Double Wire), maximal 24 Bit

ADAT (Alesis Digital Audio Tape)
Der Hersteller Alesis stellte Anfang der 1990er Jahre erstmals die ADAT-Recorder vor, die in der Lage waren, acht Spuren digital auf VHS-Videocassetten aufzuzeichnen. Die dazugehörige Digital-Schnittstelle ist bis heute gebräuchlich und nutzt das gleiche optische Toslink-Kabel wie S/PDIF. Bei vielen Interfaces kann die Schnittstelle daher softwareseitig zwischen ADAT und S/PDIF umgeschaltet werden.
Kabelformat: optisch Toslink
Kanäle: Acht bei 44,1 und 48 kHz; Vier bei 88,2 und 96 kHz (S-MUX2); Zwei bei 176,4 und 192 kHz (S-MUX4), maximal 24 Bit

MADI (Multi Channel Audio Digital Interface)
Ursprünglich von Sony, Mitsubishi, Neve und SSL entwickelt, ist MADI heute das meistverbreitete Profiformat. Es erlaubt die optische Übertragung von bis zu 64 Kanälen bei Leitungslängen bis zwei Kilometer. Über koaxiale Verbindungen sind bis zu 100 Meter möglich. MADI besitzt zwei schaltbare Formate. Im Standard-Modus stehen 56 Kanäle bei 48 Kilohertz, respektive 27 Kanäle bei 96 Kilohertz zur Verfügung, während der Extended-Modus 64 beziehungsweise 32 Kanäle bietet. Im Standard-Modus lassen sich optional und herstellerspezifisch gleichzeitig Steuerdaten über die gleiche Leitung schicken. Die Modi lassen sich innerhalb eines Verbundes jedoch nicht mischen, daher muß hier auf richtige Konfiguration geachtet werden.
Kabel: Optisch Lichtwellenleiter; BNC
Kanäle: 56/64 bis 48 kHz, 27/32 bis 96 kHz, 16 bis 192 kHz, 24 Bit

Dante
Ein vom australischen Hersteller Audinate neu entwickelter Schnittstellen-Standard, der Realtime Audio über herkömmliche Computer-Netzwerk-Schnittstellen sendet; selbst handelsübliche Hubs können zwecks Aufbau eines Geräte-Verbunds eingebaut werden. Über die Audinate Virtual Soundcard Software kann dabei der Ethernetport des Rechners als Audio Interface genutzt werden.
Kabel: RJ45 Ethernet
Kanäle: 512 bidirektional bei 48 kHz, 256 bidirektional bei 96 kHz, 24 Bit

AES50 / SuperMac
AES 50 ist ein offener Standard der Audio Engineering Society zur Übertragung von Realtime-Audio über Ethernet. SuperMac ist ein auf AES50 aufsetzendes Protokoll der Unternehmen Midas und Klark Teknik, das vor allem im Livebereich als Verbindung zwischen digitalen Mischpulten und Stageboxen Verwendung findet.
Kabel: RJ45 Ethernet
Kanäle: 24 bidirektional bei 96 kHz; 48 bidirektional bei 48 kHz, 24 Bit



Kommentare


von  Professional audio am 31.03.2014
Aufrufe  3931



Anzeige


Weitere interessante Artikel