Ich schreibe mal ein paar Bemerkungen dazu.
* Abtastrate.
Nach meinen Erfahrungen reichen Abtastraten ab 37 kHz zur transparenten
Übertragung aus. Die Tests dazu haben sich über einen Monat hingezogen.
Die Ausgabe erfolgte dabei über eine 96 kHz-Soundkarte°°), die mit 96 kHz Abtastrate lief. Da ich nicht verschiedene Soundkarten gegeneinander
testen will, sondern, ob die Abtastrate xx kHz ausreicht, wurden
96 kHz Aufnahmen genommen, auf xx kHz umgerechnet, abgespeichert
und dann wieder auf 96 kHz hochgesampelt. Das entspricht in der
"normalen" Welt dem Aufbau
--> Analog Input
--> AD: Delta-Sigma-Wandler mit 49,152 MHz
--> AD: Dezimierungsfilter auf 96 kHz
--> Postprod: Dezimierung auf xx kHz
--> Pressen auf Datenträger und verkaufen
--> Oversampling im Abspielgerät auf 96 kHz
--> DA-Wandler, 96 kHz
--> Analog Output
also der Auslieferung von Musik mit einer Abtastrate von xx kHz auf einem
Datenträger.
Mit Modifikation des Post Production Dezimierungsfilters kann man
in Software jetzt alle Abtastraten zwischen 0 und 96 kHz ausprobieren.
Das Umschalten ist problemlos knackfrei implementierbar (cos²-Fading
in 50 ms, event. mit Int-Lanczos-Fading).
Es lassen sich weiterhin auch verschiedene Dezimierungsfilter und
Oversamplingfilter testen (ein paar Zeilen Code, die weiterhin den
Vorteil haben, daß man weiß, welchen Algorithmus man testet).
Bei hochtonhaltiger Musik ist der Übergang ziemlich abrupt, bis 31 kHz
hört man im Direktvergleich problemlos Unterschiede, ab 35 kHz wird
es kompliziert und bei 37 kHz muß ich kapitulieren. Jüngere Mitmenschen
kommen vielleicht noch 1 kHz weiter.
Die Messung erfolgt dabei mit der "Maus"methode. Computer wählt
zufällig die auf xx kHz reduzierte oder die 96 kHz-Aufnahme aus
und spielt sie ab. Der Hörer hat eine Maus in der Hand und drückt
ungezwungen im Sessel die linke oder die rechte Maustaste, je nachdem,
ob er gerade denkt, die "gute" oder die "schlechte" Aufnahme zu hören.
Der Computer bricht die Messung ab, wenn eine ausreichende Signifikanz erreicht ist (bei Fehlerfreiheit nach 7 Hörbeispielen). Gut hörbare Unterschiede führen zu Tests, die in 10 Sekunden vorbei sind. Kaum oder
nicht hörbare Unterschiede ziehen sich über mehr als eine halbe Stunde
hin und sollten dann abgebrochen werden.
Das Verfahren wurde schon vorher zum Tunen des Musepack-Encoders
verwendet und hat sich bewährt.
wie "rniko" empfinde ich auch, dass es wesentlich mehr auf den künstlerischen Inhalt und auf die "Basis-Qualität" einer Aufnahme ankommt, als auf die vielleicht gerade noch hörbaren Grenzen durch die Aufnahme-Technologie...
Ich sage immer ganz böse, daß die Qualität der CD, teilweise selbst
von mittelmäßigen MP3s ausreicht, um problemlos die heutzutage
eher die Regel als die Ausnahme darstellenden Masteringfehler
zu hören. Wenn man die Qualität verbessern will, dann sollte erst mal
das Mastering von CDs verbessert werden.
Hörraum- und Lautsprecher-Qualität sind ungleich wichtiger....
Uneingeschränkt ja. Ich würde hier aber noch die Bearbeitungschritte
zwischen Datenquelle und Lautsprecher einfügen (gutes Boxenmanagement, keine klangverschlechternden Bugs in der Software).
Man braucht eine wesentlich höhere Bandbreite, wenn man alle Differenztöne beibehalten will, die in den Bereich bis 20 kHz fallen.
Die Frage ist eher, ob das wichtig, oder überhaupt hörbar ist.
(Die Differenztöne, die durch Mischung von Frequenzen von beispielsweise 35 und 39 kHz entstehen, sind mit dem Spektrumanalysator deutlich sichtbar und sollten auch hörbar sein.)
Diese Differenztöne sind im Original nicht vorhanden und stellen einen
Fehler in der Wiedergabekette dar. An den Grenzen des Hörbereichs
(sowohl 25 Hz wie 18 kHz) hat man das Problem, daß selbst in
hochwertigen Anlagen geringste Verzerrungen ausreichen, um in
benachbarten Frequenzbereichen hörbare Verzerrungen zu erzeugen.
Da diese aber in einer perfekten Anlage wieder verschwinden, sind
das technische Dreckeffekte und keine Nutzsignale, auch wenn man
sie benutzen kann, um zwischen einer nichtperfekten 48-kHz- und einer
nichtperfekten 96-kHz-Anlage zu unterscheiden.
Durch "Maskierungs-Effekte" werden einige diese Differenz-Töne verdeckt (oder bleiben unwichtig).
Im normalen Audio-Band und bei normalen Signalen werden diese sehr
schnell maskiert. Sobald ich unhörbare Signale nehme, gibt es keine
Maskierung mehr. Man kann dann sofort zeigen, was für ein Schrott-Teil
ein 5000 €-Stereoverstärker ist und was für übelste Teile analoge
Drehregler für die Lautstärkeregler sind (Hochtöner abklemmen, 25 kHz
aus dem Generator oder einer DVD-A draufgeben und mal aufdrehen und
wieder zudrehen. Der Tieftöner gibt dabei Geräusche wie ein Bandschleifer
von sich). Für die Musikwiedergabe ist das aber irrelevant, es sei denn,
man hört sich synthetisch berechnete Signale an.
Das Ergebnis (mit auf 40 kHz linearisierten Gewebe-Kalotten) war:
eindeutig (mit Trefferquote von 100%) im Doppel-Blindtest hörbar.
- Uns ging es um die "treffsichere Unterscheidbarkeit". - Ob es allerdings für das Klangempfinden "wirklich wichtig" ist, war dabei eher zweitrangig.
Ich wäre an einem genauen Versuchsaufbau interessiert.
Die Erläuterungen zum Boxenvergleich (500 gegen 125) haben gezeigt,
daß Sie mit der Tücke von Vergleichstests vertraut sind (nennen
sie das gewünschte Ergebnis und ich sage ihnen, wie man den Versuch aufbauen muß ;-)))), aber vielleicht lerne ich was draus oder finde Fehler.
Ich selbst kann mich aber noch gut daran erinnern:
Bei synthetischen Signalen, die vom Generator stammten, war die Trefferquote 100%. (20 / 40 kHz Lowpass-Filter-Umschaltung, "Spezialfilter" 4. Ordnung mit linearem Group delay) zwischen Generator und Verstärker.)
Das klingt zum Beispiel nach mechanischen Schaltern.
Ich überlege gerade, ob man die Fehlerquellen von mechanischen
Schaltern noch auf eine DIN-A4-Seite bekommt.
Elektronische Schalter sind schon besser, aber immer noch fehlerbehaftet.
Sauber bekommt man Umschaltvorgänge erst mit Digitalschaltern hin.
Aber selbst dort kann man problemlos Fehler machen (besonders,
wenn man an den Grenzen des Audio-Frequenzbandes) arbeitet.
Dort ist z.B. 1+cos² als Überblendfunktion ungeeignet, das
Integral der Lanczos-Funktion 6. oder 8. Ordnung ist dort besser geeignet.
Wir haben ausgiebige Hörvergleiche mit verschiedensten digitalen
Systemen gemacht, die noch nicht mit FIR-Filtern zur
"group delay Kompensation" versehen waren. Dabei haben wir
den Eindruck gewonnen, dass immer das oberste Drittel des
Übertragungsbereiches (in Abhängigkeit von der Filtercharakteristik
des D/A-Wandlers) von dieser metallischen Einfärbung betroffen
ist.
Bei den bisherigen 44.1-kHz-Systemen geht der Frequenzgang
bis ca. 21 kHz. Es gab keine klanglich erkennbaren Unterschiede
durch zusätzliche Wandlungen, wenn das analoge Eingangssignal
nur bis etwa 14 kHz reichte. Wenn die Musikbeispiele
Frequenzen bis 20 kHz enthielten, wurde der Einfluss des
Wandlers erstaunlicherweise auch von erfahrenen älteren Hörern
eindeutig erkannt, obwohl deren Hörbereich nur bis 12 kHz
reichte.
Der Effekt ist bekannt. Wer ihn sich anhören möchte, greife am
besten zu einem Pioneer CD-Spieler mit Legato-Link. Dort ist er
ab 14 kHz hörbar. Normale CD-Spieler benötigen Signalkomponenten
ab 17 kHz. Das ganze ist mit einem TX-7830 von Onkyo bestimmt worden.
Mit guten°) Verstärkern (mit Schaltnetzteilen) können diese Frequenzen
noch auf 13 bzw. 16 kHz nach unten rutschen.
Ein CD-Spieler gibt bei Wiedergabe von 18 kHz auch Reste der
Spiegelfrequenz von 44,1-18 kHz = 26,1 kHz wieder. Durch
Intermodulation entsteht 26,1-18 kHz = 8,1 kHz, der problemlos
hörbar ist. Kann man mit jeder Test-CD verifizieren.
Diese Töne sind keine harmonischen Verzerrungen, erzeugen bei
Hörbarkeit Dissonanzen und Rauigkeiten.
Weitere Problem sind Übersteuerungen in DA-Wandlern.
Aufbau DA-Wandler (Beispiel):
--> Input 96 kHz
--> 2fach 256-Tap-FIR-Oversampling-Filter + Korrekturfilter
--> 4fach 32-Tap-FIR-Oversampling-Filter
--> Multibit-ADC-Wandler
--> Analogtiefpaß 3. Ordnung Potenz mit f-3dB = 25 kHz
Der Korrekturfilter dient zur Korrektur aller Fehler im Frequenzgang,
z.B. von Fehlern im Analogfilter. Der Analogfilter setzt eigentlich zu zeitig
ein, wird aber digital z.B. bis 40 kHz auf +-0,1 dB gehalten. Dazu
muß der Korrekturfilter z.B.
* 16 kHz um ca. 0,3 dB
* 20 kHz um ca. 1 dB
* 25 kHz um ca. 3 dB
* 32 kHz um ca. 7 dB
* 40 kHz um ca. 12 dB
anheben. Im Kleinsignalbereich gibt das keine Probleme.
Nachteilig an dieser Konstruktion ist die leichte Übersteuerbarkeit
mit Signalen mit hochfrequenten Musikanteilen. Dies ist sogar der
Stereoplay mal aufgefallen, weil die Frequenzgangmessung eines
höherwertigen CD-Spielers bei -10 dB FS anders als bei -20 dB aussah.
Normalerweise kennt man den Effekt nur von Magnetbandgeräten
oder in Systemen mit Preemphasis.
Insgesamt habe ich noch keine Vorteile von mehr als 48 kHz
bei der Konservierung von Musik gefunden. Das die CD diese
furchtbar krumme Frequenz von 44100 Hz hat, gefällt mir zwar nicht,
sie ist aber ausreichend.
Im Falle von Echtzeitverarbeitung ist der Einsatz von 96 kHz oder gar
192 kHz aber sinnvoll, weil die Latenzzeiten der AD- und DA-Wandlung
deutlich geringer als bei 48 kHz oder gar 44,1 kHz sind. Es gibt
auch noch andere kleine Vorteile, die aber in dieser Diskussion
nicht relevant sind.
°) gut im Sinne, daß der Rauschteppich bei Aussteuerung nicht sonderlich ansteigt.
°°) Terratec EWX 24/96