Nubert Lautsprecher, HiFi- und Surround-Elektronik

Weyoun hat geschrieben:...
Wobei es wohl zwei Extreme geben soll, bei dem wohl sogar ich (kurzzeitig) den "Maximalpegel" einstellen würde:
1) Peter Tschaikowski mit 6 fach piano an der leisesten und 5 fach forte an der lautesten Stelle
2) György Ligeti mit 8 fach piano und forte
Das ist aber deutlich über dem Niveau des CD-Standards (allein die instrumentale Umsetzung ist äußerst schwierig),...

Ja, ich denke auch, das sind eher plakative Dynamikauszeichnungen für Musikkritiker, als dass man solche Abstufungen überhaupt praktisch spielen könnte.

Wie auch immer - für mich bleibt die Frage, ob die 16 Bit eine in irgendeiner Hinsicht relevante Einschränkung für Musikwiedergabe darstellen.

Der Autor des Artikels sagt nein und ich neige dazu, ihm das zu glauben, aber wirklich beurteilen kann ich es nicht. Den Sprung von den rechnerischen 96 dB auf die 120 dB habe ich nicht verstanden, auch nicht die Darstellung von Werten kleiner 1 Bit und diesen "dither". Wenn jemand dazu nähere Informationen, Tipps zum Verständnis oder Links hat, würde mich das interessieren.

Im Audiobereich heißt Dither, dass einem Signal, bevor es quantisiert wird, Rauschen hinzuaddiert wird.

Macht man das nicht, dann gehen Signale, die ungefähr in der Größenordnung des Quantisierungsfehlers liegen, mit der Quantisierung eine unschöne Allianz ein. Was vor der Quantisierung wie ein Sinus klang, klingt jetzt eher wie ein Rechteck. Signale unterhalb des kleinstens Quantisierungsschritts gehen verloren.

Mit hinzugefügtem Rauschen klingt das Ergebnis eben wie ein Sinus + Rauschen. Man hat die unnatürlich klingende Verzerrung der Quantisierung durch ein recht natürliches Rauschen mit ähnlichem Pegel ersetzt. Signale unterhalb des kleinsten Quantisierungsschritts werden durch das Rauschen ab und zu über die Quantisierungsschwelle gehoben und landen somit auch in der quantisierten Fassung.

Innerhalb eines Rauschens kann der Mensch Töne wahrnehmen, deren Pegel deutlich unterhalb des Rauschpegels liegt (sagen wir mal 1/4 so laut, also -20dB). Dadurch erklärt sich, dass man bei 16-Bit Quantisierung einen Ton -105dB unterhalb das Maximalpegels hören kann, obwohl er von Dither-Rauschen bei ungefähr -96dB umgeben ist.

Was nimmt man nun für ein Rauschen? Im ersten Ansatz kann man weißes Rauschen nehmen, bei dem im Schnitt bei jeder Frequenz der gleiche Pegel herrscht.

Im zweiten Ansatz kann man den Pegel bei Frequenzen absenken, wo das menschliche Ohr besonders empfindlich ist (um die 2-4 kHz). Um das Quantisierungsrauschen effektiv zu ersetzen, muss man im Gegenzug an anderer Stelle den Pegel erhöhen, was man üblicherweise bei hohen Frequenzen (> 15kHz) macht, wo das Ohr weniger empfindlich ist.

Wichtig ist, dass in einem gewissen Frequenzband das Dither-Rauschen tatsächlich einen geringeren Pegel hat, als das ursprünglich vorhandene Quantisierungsrauschen. Sagen wir mal -10dB Gegenüber ungeditherten -96dB. Nimmt man dann noch die -20dB von weiter oben hinzu, kommt man für dieses Band auf -126dB hörbaren Dynamikumfang.

Bei der ganzen Sache muss man sich klarmachen, dass auch das sehr hässlich klingende Quantisierungsrauschen extrem leise im Vergleich zum Maximalpegel ist. Und selbst das leiseste Abhörzimmer der Welt bringt nichts, solange man atmet und einem das Blut durch die Ohren rauscht. Ein gewisser Grundpegel bleibt immer. Selbst ohne den ganzen Dither Kram kommt man gegenüber diesem Pegel mit dem Dynamikumfang einer CD von unhörbar bis Ohrenbetäubend.

Fazit: 16-Bit ist für die Musikwiedergabe vollkommen ausreichend. Umso mehr, wenn Dither eingesetzt wird.

Danke für die Erklärung.

Ich hab das zwar noch nicht komplett verstanden, habe jetzt aber wieder ein paar Stichworte, mit denen ich selbst recherchieren kann. Wichtig war der Hinweis, dass das Rauschen hinzugefügt wird, das war mir absolut nicht klar.

Edit: Als Nichtraucher konnte ich das Rauchen da nicht stehen lassen!

horch! hat geschrieben:Wichtig war der Hinweis, dass das Rauchen hinzugefügt wird, das war mir absolut nicht klar.

Nix für Ungut, fands nur witzig.

Vita hat geschrieben:
Fazit: 16-Bit ist für die Musikwiedergabe vollkommen ausreichend.

Dito. Wenn wir ausreichend durch überdimensioniert ersetzen.

???

Ich würde es an der Daten"dichte" festmachen wollen. Wie wir wissen, sind aber einer Datenrate von 320kbit/s mp3´s von CD nicht zu unterscheiden, da Bandbegrenzungen, wie sie bei niedrigeren Raten ( in diesem Format ) fehlen und lediglich psychoakustische Verdeckungseffekte zum Tragen kommen.

Die Tonspuren von Surround-Verfahren ( DD 5.1 / dts 5.1) zeigen im Einzelkanal Datenraten von rd. 350 - 750kbit/s. Die klanglichen Möglichkeiten und Ergebnisse kennt wohl jeder.

1411 ist für den Endverbraucher bzgl. F-Gang und Dynamik schlicht overdosed; produktionsseitig sind Reserven nicht nur nicht das schlechteste sondern nötig.

Stefan

horch! hat geschrieben:Wichtig war der Hinweis, dass das Rauschen hinzugefügt wird, das war mir absolut nicht klar.

Man darf das nur nicht falsch verstehen im Sinne von:
mit Dither: rauscht --> schlecht
ohne Dither: rauscht nicht --> gut

Richtiger ist:
mit Dither: rauscht --> harmlos
ohne Dither: hässliche Verzerrungen durch die Quantisierung + Signale unterhalb der Quantisierungsschwelle gehen verloren --> schlecht

Technisch betrachtet ist Dither überaus sinnvoll und quasi umsonst zu haben und daher ein "no-brainer". Im Rahmen von CD Audio sind die angesprochenen Negativpunkte, wenn Dither nicht zum Einsatz kommt, durch den überaus geringen Pegel für den Verbraucher aber irrelevant.

Gibt es hier einen Upload-Bereich? Der Thematik täten Bilder und Soundschnippsel ganz gut.

Vita hat geschrieben:Gibt es hier einen Upload-Bereich? Der Thematik täten Bilder und Soundschnippsel ganz gut.

Bilder kann man direkt hochladen und einbinden, Sound nicht.

Was ich ehrlich gesagt noch nicht ganz kapiert habe, ist die Verbindung zu Martins elektrotechnischer Deutung der Dynamik weiter oben. Auch das Rauschen muss doch letztlich irgendwie in Spannungen abgebildet sein!?

Geht mein weiter oben geäußerter (laienhafter!) Gedanke in die richtige Richtung: Dass es nämlich nicht sinnvoll ist, die Dynamik auf Ebene einzelner Samples (oder wie nennt man das? Ich meine eine einzige Abtastung von den 44T pro s) zu betrachten; all das, was du sagst, macht wahrscheinlich erst Sinn, wenn "längere" Abfolgen betrachtet werden. So wie ein einzelnes Molekül auch keine Temperatur hat. Geht das in die richtige Richtung?

Edit:

Am Ende des Wikipedia-Artikels https://de.wikipedia.org/wiki/Quantisierungsrauschen gibt es Hörbeispiele.

Interessant, dass die Sprachverständlichkeit bei 1 Bit noch recht gut ist, obwohl die Dynamik nach obiger Formel 0 sein müsste.

horch! hat geschrieben:Was ich ehrlich gesagt noch nicht ganz kapiert habe, ist die Verbindung zu Martins elektrotechnischer Deutung der Dynamik weiter oben. Auch das Rauschen muss doch letztlich irgendwie in Spannungen abgebildet sein!?

Für die Dynamik ist es nicht wichtig, welche Spannung zu einem Bitmuster zugewiesen wird. Die Dynamik ist das Verhältnis von dem größtmöglichen Wert zu dem kleinstmöglichen wert und dabei würden sich Spannungswerte wegkürzen.
Das Rauschen wird rechnerisch hinzugefügt: sagen wir mal, dass Format im Studio sei nach der bearbeitung 32Bit und 44100 Samples/s . Dann wird zuerst "leises" Rauschen addiert, indem für jedes Sample eine 32Bit zahl, wo nur ca. die niederwertige hälfte der Bits zufällig sind, addiert. Und anschließend wird diese Zahl gerundet in dem man z.B. die niederwertigen 16 bits wegfallen lässt. Die übriggebliebenen Bits sind das fertig geditherte 16bit Signal.

horch! hat geschrieben:Geht mein weiter oben geäußerter (laienhafter!) Gedanke in die richtige Richtung: Dass es nämlich nicht sinnvoll ist, die Dynamik auf Ebene einzelner Samples (oder wie nennt man das? Ich meine eine einzige Abtastung von den 44T pro s) zu betrachten; all das, was du sagst, macht wahrscheinlich erst Sinn, wenn "längere" Abfolgen betrachtet werden. So wie ein einzelnes Molekül auch keine Temperatur hat. Geht das in die richtige Richtung?

Genau. Da ein Ton immer über die Zeit ausgedehnt ist (sonst wäre er ein knall) müssen für die Tonwiedergabeeigenschaften auch mehrere Samples gemeinsam betrachtet werden.
Dither sorgt dafür dass sich die "Mittelwerte" der Gruppe von Samples sich durch Runden der einzellnen Sample nur gering ändert. Je größer die Gruppe ist, desto geringer ist diese änderung.

Die lautstärke eines enthaltenen Sinustons ist mit dem Wert eines gewichteten Mittelwerts vergleichbar. Deswegen kann man, wenn man eine unbegrenzte anzahl samples zu verfügung hätte, ein Sinuston in einem beliebig verrauschten Signal detektieren.

Beim hören von Tönen in Rauschen gibt es aber Wahrnehmungsgrenzen, da unser Gehör nicht beliebig lange Zeiträume "zusammenrechnen" kann.

Ein 1Bit Signal hat trotz der geringen dynamik ein Spektrum mit weit unterschiedlich lauten Frequenzen und kann deswegen Sprache wiedergeben. Welcher zusammenhang zwischen dynamik und Spektrum besteht, weiß ich nicht. vielleicht bedeutet Dynamik, wieviel der durchschnitt über alle Frequenzen Schwankt.

Nubert Lautsprecher, HiFi- und Surround-Elektronik

High Definition Aufnahmen - Eine andere Betrachtungsweise

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis

Re: High Definition Aufnahmen - Eine andere Betrachtungsweis