Tango DJing 2.3: Audio Dateien

08/04/2015 by Richard Stoll

Musik, aufgenommen durch ein Mikrofon ist ein wildes Gemisch von Schwingungen unterschiedlichster Frequenzen und Amplituden. Bei der Digitalisierung misst ein A/D Wandlerchip die Starke des Signals und speichert diesen Messwert. Dieser Prozess wird mit hoher Geschwindigkeit (und damit hoher Frequenz) wiederholt, es laufen bei jedem Messvorgang Daten an, die entsprechend sequenziell in eine Datei geschrieben werden.

Je höher die sogen. Samplingfrequenz und je feiner der A/D Wandler auflöst, desto besser. Wenn wie bei der CD eine Abtastrate (Samplingfrequenz) von 44.1 kHz verwendet wird, so sind das dann 44100 einzelne Zahlen pro Sekunde die in einer Datei aufgezeichnet werden müssen. Nach dem Nyquist-Shannon Theorem kann so eine Frequenz von maximal Fa/2=22 kHz abgebildet werden. Die Genauigkeit der Digitalisierung beträgt 16 Bit pro Sample. Multipliziert mit 2 für beide AudioKanäle, erhält man für einen dreiminütigen Tango eine Datenmenge von ca. 255 Mbit, in der Realität ist die Datenmenge größer, weil zusätzliche Fehlerkorrektur und Verwaltungsdaten geschrieben werden. Berechnet man hieraus die Menge an Daten pro Sekunde, erhält man die sog. Bitrate (2*44100*16) von 1411.2 kbit/s (oder kBps).

Die Datenmenge auf einer CD ist also sehr groß und war bis in die späten 90er Jahre von PCs nur sehr schwer zu beherrschen. Überigens werden manche Musikstücke z.B. für Audio DVD mit noch größeren Samplingfrequenzen (96 und 192 kHz) digitalisiert.

Die Größe der Musikdateien ist nicht bequem. Man kann aber die Datei schlicht als eine Menge von beliebigen Daten ansehen und damit aus der Informatik bekannte verlustfreie Kompressionsverfahren anwenden. Um z.B. die Bitfolge (1000000001111001) zu komprimieren, kann man schreiben (1, 8*0, 4*1, 001). Solche Verfahren verkleinern die Datei signifikant und ermöglichen es, sie korrekt wieder herzustellen. Kompressionsraten zwischen 40% und 70% der Ausgangsgröße sind hierbei möglich [4].

Eine Verlustbehaftete Kompressionsmethode wurde ab 1982 unter Leitung von Hans-Georg Musmann und Karlheinz Brandenburg am Fraunhofer Institut für integrierte Schaltkreise in Erlangen entwickelt, als Teil des MPEG-1 Standards festgeschrieben und schließlich in 1995 als MP3 (ISO MPEG Audio Layer 3) veröffentlicht. Das Verfahren verwendet psychoakustische Informationen und Annahmen, Ähnlichkeiten zwischen den Kanälen und statistische Vorhersagen um zu besseren Kompressionsraten zu gelangen, eine intensive Einführung geben [3,4]. Damit sind im Vergleich zur Orginaldatei Kompressionsfaktoren bis zu 7x möglich. Ein Maß für die Qualität ist hier die Bitrate. Beim klassischen MP3-Verfahren kann sie zwischen 8 und 320 kB/s liegen. Generell liefern Bitraten jenseits vom 96 kB/s gute Höreindrücke.

Das Programm, welches zur Kompression und Dekompression verwendet wird (der sogen. CODEC), bestimmt die Qualität der Musikwiedergabe neben anderen Faktoren wie Bitrate, Komplexität des Musiksignals, Qualität des Wandlers für das Rohsignal und nicht zuletzt die verwendete Wiedergabetechnik. Die Qualität der Codecs wurde seit den späten 90ern maßgeblich verbessert [3]. Für MP3 Dateien wird heute gerne der frei verfügbare LAME Codec verwendet.

Audiodaten enthalten heutzutage zusätzlich zur Musik auch Metadaten. Hier können verschiedenste Informationen wie Titel, Interpret, Jahr der Aufnahme gespeichert werden um die Musikstücke leichter zu verwalten [5].

Für den Umgang mit Musikdateien ist also folgender Arbeitszyklus erforderlich:

a) Auslesen des Datenstroms von CD (sog. grabben), alternativ die Digitalisierung einer analogen Aufnahme.

b) Kompression mit dem gewünschten CODEC

c) Einspeisen der Metainformation (taggen)

d) Abspielen nach gleichzeitiger Dekompression durch den zugehörigen CODEC

Bei der Wahl des verwendeten CODECS gibt es folgende Möglichkeiten

1. Verlustfreie CODECS (lossless)

Üblich sind hier die Formate

– ATRAC (adaptive transforming acoustic coding) der Firma Sony

– Apple Lossless (.m4a oder .mp4)

– FLAC (Free lossless audio Codec)

– MPEG4 Audio Lossless Coding (ALS)

– WMA lossless (Windows Betriebssystem)

wobei FLAC einige Verbreitung hat. Gegenüber dem unkomprimierten Material ist die erreichbare Kompressionsrate jedoch gering.

2. Verlustbehaftete CODECS

– MP3 (.mp3)

– Ogg Vorbis (.ogg)

– WMA (Windows Media Audio, .wma)

hierbei erfreuen sich MP3 und Ogg Vorbis einiger Beliebtheit. Bei Windows PCs ist auch das WMA-Format üblich.

Eine Tabelle mit weiteren Kompressionsverfahren gibt es hier [6]. Manche Formate beinhalten zusätzlich die Möglichkeit eines digitalen Rechtemanagements.

3. Qualitätsdiskussion

Waren verlustbehaftete Audiodateien wie MP3 mit einer Bitrate von 128 kB/s noch 1997 von minderer Qualität, wird ihnen bei heutigen CODECS bereits für die Mehrheit der Zuhörer das Attribut “transparent” (nicht unterscheidbar) zugesprochen. Das bedeutet, dass individuell nicht mehr zwischen der Originalaufnahme und der komprimierten Version unterschieden werden kann. Auch wenn einzelne Autoren beschreiben, dass sie diese Unterscheidung (“golden ear”) spontan und fehlerfrei treffen können, sollte hier ein statistisches Blindverfahren namens ABX angewendet werden. Hierbei liefert eine Software blinde Hörproben, die ein Zuhörer charakterisieren muss. Für aktuelle CODECS ist ein Unterschied bei höheren Bitraten als 96 kB/s praktisch nicht mehr festzustellen. Um den Test selbst zu machen benötigt man die Abspielsoftware foobar 2000 mit einem speziellen ABX plugin für Windows Computer [7, 8], auch für Apple Computer ist eine entsprechende Software verfügbar.

4. Resume

Diese Lehreinheit war langweilig und man fragt sich, was hat das mit Tango Musik zu tun. Ein Tango DJ muss heutzutage seine Musik sammeln und diese als Audiodateien speichern. Berücksichtigt man, dass heute (2015) Speicherplatz (Standard: externe Disk 2 TB, interne 4-6 TB) billig ist, ist Kompression nicht mehr das wichtigste Kriterium für die Herangehensweise.

Für den heutigen Tango DJ sind zwei andere Kriterien wichtiger. Eines ist die Möglichkeit Metadaten zu speichern und ein anderes die bestmögliche Kompatibilität mit den Softwareplayern, die für DJ Anwendungen verwendet werden. Hier ist die Unterstützung von verlustfreien CODECS noch gering. Es wird für DJ-Anwendungen generell empfohlen, bei MP3 Kodierung mit hohen Bitraten zu bleiben [9]. Ich kann aber zumindest logisch den Standpunkt der Unterstützer verlustfreier Verfahren verstehen.

Viel Spass,

-DJ Ricardo

P.S.: In der nächsten Folge wird es dann praktisch. wir rippen und kodieren eine Tango CD.

1 http://de.wikipedia.org/wiki/Abtastrate
2 http://en.wikipedia.org/wiki/Compact_Disc_Digital_Audio
3 http://de.wikipedia.org/wiki/MP3
4 http://de.wikipedia.org/wiki/Audiodatenkompression
5 http://de.wikipedia.org/wiki/ID3-Tag
6 http://de.wikipedia.org/wiki/Audioformat#Liste_g.C3.A4ngiger_Audioformate
7 http://lifehacker.com/5903625/mp3-or-lossless-see-if-you-can-hear-the-difference-with-this-test
8 http://techland.time.com/2012/03/02/can-you-hear-the-difference-between-lossless-and-lossy-audio
9 http://www.digitaldjtips.com/2011/02/dj-music-files-formats/

The educated Tanguero

Essential Tango Knowledge

Tango DJing 2.3: Audio Dateien