Fallstudie mp3-Hörtest / Home

Der 1. Test

Mit den insgesamt rund 14 Minuten Original-Audiosignalen à 1-3 Minuten ergibt sich eine nicht gerade geringe Testzeit: Original hören und mit mp3 vergleichen, bei Unsicherheiten Wiederholung. Zusätzlich wurde bei einigen Aufnahmen auch gestetet, ob sich die Qualität verschlechtert, wenn das mp3 noch einmal durch den Kodierer läuft. Um den Grad der mp3-Verzerrungen abzuschätzen, wurden drei Aufnahmen von den Original-CDs auch analog über eine einfache PCI-Soundkarte (Ensoniq von Creative) vom Kopfhörerausgang des CD-Players über ein hochwertiges 12m-Kabel als WAV durchgeführt. Anschließend wurde im Wave-Editor die Lautstärke den CD-Originalen angepaßt, da schon kleine Lautstärkeunterschiede einen Hörtest beeinflussen können.

Auch wenn es natürlich eine gewisse Beeinflussung des Hörtests darstellt: Zunächts wurden die synthetischen Signale mit CoolEdit ausgewertet, da dazu kein aufwendiger Hörtest notwendig ist: Das Pulssignal erweist sich dabei als recht deutlich verzerrt, insbesondere sind Überschwinger von einigen Prozent festzustellen. Interessanterweise werden beide Kanäle des Monosignals mitunter merklich unterschiedlich verarbeitet. Bei zweimaligen mp3-Durchlauf ändert sich die Signalform praktisch nicht zusätzlich. Analoge Verstärker wären diesbezüglich merklich besser, Lautsprecher allerdings erheblich schlechter. Die Unterschiede zu den zwei weiteren Decodern waren relativ gering (Überschwingen und Rauschfahnen in der selben Größenordnung). Zum mp3-Kodieren zeigte sich mpeg Encoder V.0.06 jedoch als merklich besser (keine Überschwinger, Rauschenfahnen in der selben Größenordnung), dafür arbeitete er wesentlich langsamer (ca. 25 Minuten für 1´30´´ Musik auf einem 233MHz-PC!). Zwar kann man einwenden, daß solche künstlichen Signale mit Musik wenig zu tun haben, jedoch gilt dies im Techno-Zeitalter keinesfalls mehr.

Spannend war auch die Auswertung des 2-Tonsignals: Bei analogen Schaltungen würden sich durch deren Nichtlinearitäten zusätzliche diskrete Spektrallinien ergeben, z.B. Summen- und Differenzfrequenzen. Bei mp3 sieht das Signal im Zeitbereich nur minimal verrauscht aus. Die Frequenzanalyse per FFT bringt Klarheit: Es entstehen keine neuen diskreten Verzerrungen, sondern eine Rauschschleppe um die beiden ursprünglichen Signale herum. HF-Techniker kennen solche Rauschformen z.B. vom Phasenrauschen bei Oszillatoren her. Auch hier schadet die doppelte Konversion nicht signifikant. Nach analogen Gesichtspunkten schlägt sich mp3 also gut, immerhin kein Grundrauschen, kein Brummen, keine Intermodulation und auch keine Frequenzgangabfall, wie ein zusätzlicher Test mit weißem Rauschen zeigte.

mp3-Verhalten bei Sinus-Bursts

Bild 1 : mp3-Verhalten bei Sinus-Bursts. Einige Enkoder liefern weniger Überschwingen, die Rauschfahnen sind jedoch typisch. Nur der LAME-Enkoder war schon bei 128kBit/s praktisch perfekt, andere benötigten ca. die doppelte Rate!





Bild 2 : mp3-Verzerrungen im Spektrum bei einem 2-Tonsignal, darunter das Original. Auch hier war nur der LAME-Enkoder bei 128kBit/s (fast) mängelfrei, andere selbst bei 256kBit/s nicht.

Nach diesen Erfolgen bei der detektivischen Arbeit wurde die Beethovenaufnahme wegen seiner vielen Impulse näher untersucht. Auch hier sieht man im Wave-Editor schöne Impulse, die aber diesmal bei mp3 optisch gut erhalten bleiben. Anschaulich ist dies aber auch klar, da ja hier etwaige Über- und Nachschwinger sich mit den folgenden Tönen vermischen. Genaueres kann man aber erfahren, wenn man einfach das Differenzsignal bildet, was ohne Übertragungsmängel Null sein müßte. Ganz so einfach ist es jedoch nicht, da schon eine - eigentlich nicht störende - Laufzeit eine Differenz ungleich Null nach sich ziehen würde. So ist es dann auch der Fall. Bild 3 zeigt deutlich, die Zeitverschiebung von ca. 23ms.



Bild 3 : oben mp3 und unten das Original, jeweils der linke Kanal



Bild 4 : Detailansicht: oben mp3 und unten das Original, nach Ausgleich der Laufzeit

Führt man den Laufzeitausgleich durch, so bleiben im Zeit- und Frequenzbereich optisch marginale Unterschiede, welche wesentlich weniger auffallend sind als bei den synthetischen Signalen. Auch von Rauschfahnen optisch keine Spur. Lediglich wenn man (nach Delay-Ausgleich) die Differenz bildet zeigt sich, daß sich das Auge doch täuschen läßt und die Unterschiede doch erheblich sind. Dies muß allerdings nicht komplett auf nichtlineare Verzerrungen zurückzuführen sein, sondern z.B. auch auf Gruppenlaufzeitschwankungen über der Frequenz. Insgesamt geht diese Runde also an mp3. Das es allerdings auch besser geht, zeigt die Durchführung der Prozedur mit der Analogaufnahme (Bild 5).



Bild 5 : Was ist das Original? CD versus Analogüberspielung (unten) bei „Without You" von Mariah Carey

Aber so schnell wollten wir uns nicht geschlagen geben und haben deshalb zum ruhigen Anfang von „Without You" einige Sinus-Bursts überlagert. Um Übersteuerungen zu vermeiden lag der Burstpegel nur bei -26dB (0dB=Vollaussteuerung) und war deshalb nur als leises Piepsen zu höhren. Nach der mp3-Kompression und der Subtraktion der ebenfalls komprimierten Burst waren wir gespannt. Aber wie beim WAV-Format war der Burst nahezu verschwunden, auch wenn man im Wave-Editor noch minimale Reste erkennen konnte. Per Soundkarte und Kopfhörer war nichts Störendes zu hören. Deshalb wurde derselbe Test mit vergrößerten Burstpegel von nun -9dB wiederholt, wobei man immernoch deutlich vom Clipping-Pegel entfernt bliebt. Hier zeigten sich dann deutlich hör- und sichtbare Beeinflussungen. Die Spitzen in Bild 6 wirken akustisch so wie Kratzen auf alten Schallplatten. Bei all den Vorabtests fragt man sich nun : Was sagt das Ohr zu mp3 bei normaler Musik?



Bild 6 : mp3-Signal mit Burst maltretiert

Der Hörtest - Der Nachschlag
Detektivarbeit - Wieso, weshalb, warum?
Fazit

Die verwendete Audiogeräte

T&A TMR 1 Boxen
Onkyo-Vollverstärker Integra A8780
Sennheiser-Kopfhörer HD 580 precision
CD-Player Sony X33 ES
Soundkarte Ensoniq von Creative in einem PII-PC mit 233MHz
Yamaha CD-Brenner (gebrannt wurde mit 2x Geschwindigkeit)

Insgesamt untere Spitzenklasse mit gutem Preisleistungsverhältnis.

Die verwendete Software

Als Enkoder : CDex Version 1.10 mit internen Enkoder (zum Vergleich auch mpeg Encoder V.0.06, NexEncode 2.0, Sound Limit 2.5, Ultimate Encoder 1.05, MpegDJ Encoder 1.97 mit XING-Enkoder, LAME 3.87 und MusicMatch 5.10 mit FhG-Enkoder, nur für die Testsignale : Fraunhofer MP3ENC V. 3.1)
Als Dekoder : Dema mp3-Softwareplayer Version 2.0.0 (zum Vergleich auch Audioactive MP3 Decoder V1.1.2, CoolDecode 1.4 und MusicMatch 5.10)
Zur Analyse und Signalgenerierung : CoolEdit 96
Zum Brennen : WinOnCD 3.5

Sämtliche Programme sind im Internet verfügbar. Bei den Enkodern wird für die eigentliche Kodierung oft auf Standardmodule zurückgegriffen und nur die Oberfläche eigens programmiert. Hinter den 8 Programmen verbergen sich gehörmäßig 5 unterschiedliche Enkoder.

Hörerkommentare

• Wenn man bei Napster endlich einige seiner langgesuchte Lieblingslieder findet, kann man schon euphorisch werden. Wenn es sich um ältere Songs handelt, dann ist auch meist die Klangqualität akzeptabel. Angesichts der Testergebnisse stellt sich jedoch die Frage, ob CD-Brenner nicht doch die größere Gefahr für die Musikindustrie sind.
• Zwar ist mp3 nicht perfekt, aber viele werden den Unterschied kaum merken. Was will man mehr für umsonst? Neue Komprimierungsverfahren werden sich nur durchsetzen, wenn sie ebenfalls frei kopierbar sind.
• Den Komprimierungsverfahren gehört die Zukunft, denn der Einsatzbereich wird sich dank UMTS, DAB und digitalem Fernsehen weiter ausdehnen.
• Komisch, daß die Klangqualität des Originals relativ wenig Einfluß auf mögliche mp3-Probleme hat. Bei Klassik sind Fehler keineswegs leichter zu hören.
• Ist das ein Schrott, hört sich komisch, da ist ´was faul.

Nach oben - Zur Homepage - Zur mp3-Glosse

Copyright © 2000 Stephan Weber. Alle Rechte vorbehalten.
Stand: Dezember 08, 2000.