Es gibt prinzipiell keine Liste "Beste XXX", sobald ein Gerät mehr
als eine Eigenschaft hat. Und dies ist ziermlich schnell erfüllt, oder
anders ausgedrückt, kennt jemand technische Geräte, die durch genau eine
Eigenschaft charakterisiert werden können???
Für eine Liste benötigt man eine Ordnungsrelation. Was ist das? Man muß zwei
Elementen genau einer der folgenden Eigenschaften zuordnen können:
* a < b
* a = b
* a > b
Außerdem:
* aus a < b und b < c folgt a < c
Wenn diese Bedingungen nicht erfüllt ist, kann sich jeder ausmalen, was das
für so eine Liste bedeutet. Wenn ein Gerät durch eine Eigenschaft
charakterisiert ist, ist alles ganz einfach, man muß nur noch wissen, wo das
gute und wo das böse Ende ist ;-)
Wenn ein Gerät mehrere Eigenschaften hat, dann kann man zeigen, daß man eine
Funktion benötigt, die diese Eigenschaften in einen reellwertigen Wert
umrechnet:
f (x1, x2, x3, x4, x5, x6, ..., x7162, x7163 )
Diese Funktion kann sonstwie aussehen, sie ist meistens nicht mal schreibbar
oder bekannt. Ein paar grobe Eigenschaften weiß man meist, das sind meist
Eigenschaften, die zu starken Abwertungen führen.
Diese Funktion ist teilweise personenspezifisch, tageszeitenspezifisch,
koffeinspiegelabhängig,... Weiterhin hängt sie auch davon ab, was die
Prerenzen sind, der eine will Bässe bis zum Anschlag, der nächste eine
deutlich neutralere Wiedergabe.
Was macht man nun?
Man nimmt Weihwasser. Naja, nicht ganz. Aber das, was Audiophile etwa so
fürchten wie der Teufel das Weihwasser.
Man führt Doppelblindtests durch und wertet die abgegebenen Bewertungen
statisch aus.
Doppelblindtest: Ein komischer Wort, sagt aber nur aus, daß sowohl Probandt
wie auch Testleiter nicht wissen, was gerade getestet wird, der Testleiter
damit weder wissentlich noch unwissentlich den Probandten beeinflußt. Warum
blind? Ich will ja den Klang testen, nicht die Reputation der
Herstellermarke oder des Produkts.
Statistische Auswertung: Hier wird das Rauschen vom Nutzsignal abfilltriert.
Dann wird die Wahrscheinlichkeit ausgerechnet, daß a besser als b besser als
c ... ist.
Üblicherweise wird dafür der Friedman-Test verwendet, jeder Teilnehmer hat
als Ergebnis keinen Wert, sondern einen Wertebereich:
In diesem Beispiel kann man z.B. sagen:
- AAC ist am schlechtesten
- Ogg -q0 und Ogg -br 64 sind besser
- mp3pro und wma8 sind besser als Ogg
Dass der eine Balken etwas höher oder niedriger steht, führt zu keinen
signifikanten Unterschieden, die nicht auch durch Rauschen verursacht werden
können. Selbst diese Reihenfolge ist nicht ganz sicher, Balken, die sich
gerade so berühren haben immer noch eine Irrtumswahrscheinlichkeit von 5%.
Und schon wenn man ein etwas anderes Musikstück nimmt, sieht alles etwas
anders aus:
http://ff123.net/64test/results.html
Wenn man sich mit den Problemen von statistischen Auswertungen nur mal
ansatzweise beschäftigt hat, dann bekommt man bei den meisten Tests einen
Lachkrampf.
Sobald man in irgendeiner Zeitung so was feinaufgeteiltes wie eine
Punkteliste a la Audio/Stereoplay/Stereo findet, weiß man, daß man gerade
Futter für das nächste Lagerfeuer in den Händen hält.
Achso, und noch was letztes: Solche statistischen Auswertungen interessiert
nicht, warum es zu den festgestellten Unterschieden kommt. Sie stellen
einfach nur fest, daß da was sein muß.