OSPAC - Mono, Stereo, Räumlich, Multichannel

Wir haben uns schon mehrfach über die Frage Stereo oder Mono oder die Formate unterhalten. In ospac ist genau der Vorschlag von @rstockm und das von @lobodingbauer gelobte Vorgehen enthalten und noch mehr. Die verschiedenen Abmischungen möchte ich hier mal mit Tonbeispielen und Wellenformen vorstellen und diskutieren. Im Repository habe ich den Text auch englischer Sprache hinterlegt.

Mono

Ich habe die Zahlen 1-5 aufgesprochen und zweimal ins Projekt genommen- das ergibt ein etwa 10s langes Stück, das man in ein ein-kanaliges Mono-File mischen kann:

ospac --mono \
      --voice {1,2,3,4,5}.wav --voice {5,4,3,2,1}.wav \
      --output mono-test.wav
ospac --raw mono-test.wav --plot mono-test.ppm

Das Resultat sieht dann so aus:

Und hört sich so wie bei @martinruetzler’s RadioMono an:

Ein kleiner Hinweis noch zu Mono: Der Mixdown erfolgt ohne Dämpfung, wer also Stereodateien mit --mix oder --raw einspielt, sollte --factor, --normalize oder --leveler auf diesem Segment verwenden.

Stereo

Es gibt viele Arten Stereo zu erzeugen- der Standardmodus von Ospac erzeugt Stereo mit Intensitätsunterschieden zwischen dem rechten und linken Kanal. Die Standardeinstellung verwendet einen maximalen Faktor von 0.9, d.h. der Kanal ganz links ist um 10% links angehoben und 10% rechts abgesenkt. Zwischen den beiden Extremen werden ab 3 Kanälen alle weiteren gleichmäßig aufgeteilt.

Hier das zugehörige Beispiel mit Standardeinstellung:

ospac \
      --voice {1,2,3,4,5}.wav --voice {5,4,3,2,1}.wav \
      --output stereo-test.wav
ospac --raw stereo-test.wav --plot stereo-test.ppm

Ist ein stärkeres Panorama erwünscht, so kann man das mit --set-stereo-level einstellen:

ospac --set-stereo-level 0.25 \
      --voice {1,2,3,4,5}.wav --voice {5,4,3,2,1}.wav \
      --output stereo-strong.wav
ospac --raw stereo-strong.wav --plot stereo-strong.ppm

Man kann auch den Stereo-Effekt mit dem Einstellung --set-stereo-level 1 komplett abschalten, um einen Sprachteil in Mono innerhalb einer Stereo-Datei zu erzeugen:

ospac --set-stereo-level 1 \
      --voice {1,2,3,4,5}.wav --voice {5,4,3,2,1}.wav \
      --output stereo-mono-test.wav
ospac --raw stereo-mono-test.wav --plot stereo-mono-test.ppm

Räumlich

Intensitätsunterschiede sind eher für hohe Frequenzen der Weg, wie unsere Ohren einen Klang räumlich verorten, da unser Kopf diese Frequenzen abschirmt. Für tiefe Frequenzen sind die Laufzeitunterschiede wichtig, da ab einer Wellenlänge in der Größenordnung unseres Kopfes dieser kein wirkliches Hindernis mehr darstellt. Dafür hat ospac den --spatial Modus, mit dem ein Laufwegunterschied in Metern angegeben werden kann- dieser kann 0m ein für Signal von vorne, oder etwa 0,22m für ein Signal von der Seite (das ist etwa die Distanz zwischen unseren Ohren). Die Standardeinstellung sind sehr moderate 0,09m Laufwegunterschied, die zusätzlich zum Standard-Intensitätsfaktor von 0,9 einberechnet wird:

ospac --spatial \
      --voice {1,2,3,4,5}.wav --voice {5,4,3,2,1}.wav \
      --output spatial-test.wav
ospac --raw spatial-test.wav --plot spatial-test.ppm

Den Effekt kann man natürlich noch steigern- hier bis nah ans Maximum mit 0,2m Laufwegunterschied:

ospac --spatial --set-stereo-spatial 0.2 \
      --voice {1,2,3,4,5}.wav --voice {5,4,3,2,1}.wav \
      --output spatial-strong.wav
ospac --raw spatial-strong.wav --plot spatial-strong.ppm

Multichannel

Nur zur Vollständigkeit hier auch der --multi-Modus, in dem ospac ein Multichannel-Wavefile erzeugt. Damit kann man einzelne Filter benutzen, ohne die Mehrkanal-Struktur zu verlieren:

ospac --multi \
      --voice {1,2,3,4,5}.wav --voice {5,4,3,2,1}.wav \
      --output multi-test.wav
ospac --raw multi-test.wav --plot multi-test.ppm

Fazit

Die Verwendung von Stereo im Podcast kann große Vorteile für die Verständlichkeit haben, besonders wenn Personen ähnliche Stimmen haben. Es gibt aber auch einiges zu bedenken: Oft werden Podcasts nur mit einem Lautsprecher abgespielt (iPhone), der entweder ein Mono-Mischsignal oder nur einen Kanal abbildet. Es gibt auch Personen, die nur einen Kanal hören können. Dazu kann ein zu starkes Panorama mit der Zeit echt nerven: Wenn mich jemand von der Seite anspricht, drehe ich mich zu der Person und lasse sie nicht immer nur ein Ohr besprechen. Mit den Kopfhörern geht das aber nicht, und das nervt. Und letztlich gibt es auch ein Qualitäts- oder Kompressionsproblem: Je mehr Stereosignal, um so schlechter kann komprimiert werden- bzw. bei fester Bitrate wird weniger Qualität übertragen.

Die Abbildung als Mono-Signal oder mit nur einem Kanal ist bei der Mono-Abmischung natürlich perfekt. Aber dafür gibt es keinerlei Stereo-Abbildung.

Die Standardeinstellung für Stereo hat einen gewissen Stereo-Effekt, hat perfekte Mono-Abmischung und die leichten Absenkungen sind bei Abbildung auf nur einem Kanal ein vernünftiger Kompromiss. Der Effekt ist auch so gering, dass der Nervfaktor sehr gering sein sollte.

Im Gegensatz dazu bewirken starke Intensitätsunterschiede einen stärkeren Stereo-Effekt und die Mono-Abmischung ist auch noch in Ordnung. Die Abbildung auf nur einen Kanal ist aber sehr bedenklich und es nervt, wenn jemand nur von einer Seite spricht.

Die Standardeinstellung mit Laufwegsunterschieden hat einen deutlich stärkeren Stereo-Effekt bei gleicher Abbildung auf einzelne Kanäle, wie bei Stereo. Das Mono-Mischsignal wird aber plötzlich etwas schlechter- besonders beim Abspielen einer komprimierten Fassung. Je nach Kompression äußert sich das in fehlenden Höhen oder Ghosting- im Grunde entspricht das aber dem Effekt, wenn das UKW-Radio von Mono auf Stereo umstellt: Das Monosignal wird normal übertragen und klingt bei echten Stereosignalen dumpfer, wird auf Stereo umgeschaltet, wird das Differenzsignal berücksichtigt und die Höhen kommen wieder. Trotz des stärkeren Stereo-Effekts ist das Resultat aber ebenso gut hörbar und wenig nervig, wie das Stereo-Signal.

Die Version mit den stärksten Laufwegunterschieden hat den stärksten Stereo-Effekt mit ebenso guter Ein-Kanal-Abbildung. Meines Erachtens nervt es aber nach einiger Zeit und das Mono-Signal wird ebenso Qualitätsprobleme haben.

Das kurze Beispiel mit 5 Kanälen ist nicht wirklich repräsentativ, aber die MP3-Bitraten bei fester Qualitätsstufe zeigen den Trend:

  1. Mono: 43kbit/s
  2. Mono in zwei Kanälen: 47kbit/s
  3. Intensitäts-Stereo (Standard): 54kbit/s
  4. Laufweg & Intensitäts-Stereo (Standard): 59kbit/s
  5. Intensitäts-Stereo (Stark): 60kbit/s
  6. Laufweg & Intensitäts-Stereo (Stark/Standard): 63kbit/s

Alle Ton- und Bildbeispiele sind Teil der Testfälle im Ospac-Repository.

1 „Gefällt mir“