Asymmetrische Mikrofonaufnahme?

Dies ist die rohe Wellenform einer DT-297-PV Aufnahme mit einem ZOOM H6: (Leider nur als Bild, da Rohdatei eine Aufnahme eines Gastes war.)

Die Aufnahme hat keinen DC-Offset, aber dennoch ist der Positiv-Bereich deutlich sensibler als der Negativ-Bereich.

Klanglich merke ich noch keinen Unterschied, aber so ganz richtig sieht das nicht aus.

Habt ihr sowas auch schon erlebt? Ist das normal oder auf eine bestimmte Aufnahmesituation zurückzuführen, oder ist es eine Fehlfunktion, die ich Beyerdynamic vorlegen sollte?

Und sollte man so etwas automatisch im Postprocessing korrigieren?

Ja, das habe ich so auch schon bei meinen Sprachaufnahmen gesehen - ganz gleich, mit welchem Interface oder Mikrofon.
Es gibt dafür irgendwo in den Tiefen des Netzes auch eine logische Erklärung, die ich spontan aber nicht griffbereit habe.

Kurzzusammenfassung: Kein Fehler, keine korrekturwürdige Erscheinung.
Listen and enjoy. :sunglasses:

Gruß, Uli

1 „Gefällt mir“

Danke für den Tipp! Der passende Suchbegriff heißt “Microphone asymmetric wave form”.

Die meissten Seiten erzählen etwas davon, dass das alleine von den “Harmonics” (also Obertöne) kommt, aber das spielt nur eine kleine Rolle. Natürlich kann man mit kombinierten Sinus-Schwingungen genau das Verhalten hinbekommen, aber nur damit wäre die feste Seite der Asymmetrie über die ganze Aufnahme hinweg nicht erklärbar.

Die einzig sinnvolle Erklärung erscheint mir, dass positions- und ausrichtungsbedingt unterschiedliche Druckverhältnisse “vor” und “nach” der Mikrofonmembran entstehen und so unterschiedlich starke Auslenkungen bewirken.

Ich denke bei einer Aufnahme mit Headset entsteht das Verhalten, wenn die Kapsel schräg zur Schallrichtung steht und damit die Eigenabdeckung der Kapsel genau den Zusammenhang bewirken kann.

Für die Qualität der Aufnahme ist das ganze also unproblematisch, für die Verarbeitung in der Audio-Engine ist es aber unschön. Ziemlich sicher ändert es aber auch das Frequenzverhalten des Mikros (Stimme klingt z.B. leicht dumpfer oder heller), aber wenn man sich bei der Aufnahme nicht daran stört- macht das wohl eher nichts.

Ah, cool. Du hast mich dann weiter neugierig gemacht und ich bin auf folgenden, deutschen Thread gestoßen:
http://tonthemen.de/viewtopic.php?t=2509

Allerdings bin ich nicht so der Theoretiker, Mathematiker und Physiker, um das sofort in die Hirnwindungen aufzusaugen. Ich halte es da eher mit einem pragmatischen “des g’hört soo!”.

Die These mit der Mikrofonmembran teile ich nicht, aber da müsste ich mich selber noch mal fachkundig machen.

Praktische Grüße

Schöne Zusammenstellung in dem Thread!

Die unterschiedlichen Erklärungen liegen für mich in der betrachteten Skala: Einmal schaut man sich die Wellenform über ein paar wenige Wellenlängen eines Klanges an- dann ist die Illustration über die Obertöne korrekt und das Resultat nicht verwunderlich. Über lange Zeit hingegen (da oben 30 Minuten) geht es um ganz unterschiedliche Tonhöhen und Silben- dass da zufällig die Obertöne tendenziell oft in die gleiche Richtung den Peak zeigen- also das wäre ein unglaublicher Zufall.

Da der Verlauf der Wellenform etwa der Membranstellung entspricht, muss es sich um einen Unterschied vor und hinter der Membran handeln- irgendwie verhält sich die Membran bei bestimmten Aufnahmen auf der einen Seite “steifer”, hat also quasi eine andere Federkonstante. Und wenn das über 30 Minuten über viele Frequenzen anhalten soll- da erscheint mir eine schräge Kapsel plausibel.

Man könnte da ja mal experimentieren… Hm, das riecht aber irgendwie nach Physik. Das lasse ich dann doch lieber die Spezialisten machen. =)

So weit ich das verstanden habe ist das insbesondere bei Instrumenten mit asymmetrischer Tonerzeugung der Fall, klassisch dann Geiger (da kann die Seite nicht frei schwingen) oder durch Lippen gepresste Luft (Bläser, Singstimme), wo die Hin-Schwingung beschleunigt, das Rückkehren zum Ausgangszustand aber abgebremst wird. Dort sind die Obertöne in Hin- und Rückschwingung unterschiedlich verteilt und v.a. unterschiedlich laut. Im Gesamtklang hört man das nicht als so asymmetrisch wie es dann aber tatsächlich aufgezeichnet wird.

Vielleicht wird das klarer, wenn man eine Zeitlupentrompete simuliert, also langsam Einzelpruster macht: beim Lippen-auseinander-pusten macht es ein “P”, wenn die aber zusammenkommen nur noch ein “mb”. Das lautere “P” ist aber immer auf der Luft-Schub-Seite (in der Waveform oben), das “mb” immer auf der Gegenphase (in der Waveform-Grafik dann unten).

Anders wäre es, wenn ich eine schön symmetrische Wellenform habe, die aber (einschließlich des Leer-Rauschens) zum Nullpegel versetzt ist (BIAS offset / DC offset) - dann habe ich ein technisches Problem und vmtl. eine Gleichstromspannung auf dem Eingang. Das sollte dann schnellstmöglich behoben werden.

So lange Leisepegel / das Leer-Rauschen auf technisch Null liegt ist aber alles okay - auch bei asymmetrisch aussehenden Wellenformen, insbesondere bei Sängern, Blechbläsern oder Streichern.

Du sprichst von dem lokalen Phänomen in der Skala von Wellenlängen. Das ist einfach auf Basis der Überlagerung von harmonischen Wellen- hier ein Beispiel eines Tons (grün), wo die Oktave höher phasenversetzt als Oberton (rot) mitschwingt (lila):

Töne, die hart klingen, wie Trompeten und bestimmte Vokale im Gesang, haben viele Obertöne. Daher sieht man das lokal und über die Länge eines Tons sehr gut.

Bei Aufnahmen über 30 Minuten, also Millionen von Wellenlängen wie bei der ursprünglichen Frage, müsste sich der Effekt meiner Meinung nach über viele Klangfarben, Positionsänderungen im Wellenlängenbereich und Töne herausmitteln. D.h. Lokal sieht man den Effekt oben immer wieder, aber mal mehr Peaks nach oben, mal mehr Peaks nach unten.

Da es aber oben über die 30 Minuten anhält, gehe ich davon aus, dass es ein anderer Effekt ist, der die unterschiedliche anscheinende Elastizität der Membran bewirkt. Aber Sorgen mache ich mir deswegen nun nicht mehr. =)

So weit ich das verstanden habe, sind das eben nicht Überlagerungen schön harmonischer Wellen(FFT, geradezahlige vs. ungeradzahlige Obertonreihe), sondern eben asymmetrische Wellen, da das Medium nicht frei schwingt: bei Gesang oder Blechbläsern kann die (Stimm)Lippe nach dem “Popp” nicht frei zurückschwingen wie eine Saite, sondern wird vom sich aufstauenden Luftdruck hinter den sich wieder schließenden bzw bereits geschlossenen Lippen abgebremst. Daher ist die Rückschwing-Amplitude auch kleiner als die der Rauspopp-Stoßwelle. Und das findet sich dann auch in der angezeigten asymmetrischen Wellenform wieder.

Nebenbei verformt es auch die Wellenform bzw. Frequenzanalyse - die ist dadurch kein klassischer Sinus+Obertonreihen der Holzbläser oder Saiteninstrumente, sondern ein anderes, “verbogeneres” Gebilde.

Schön, dass dich das Thema auch so fasziniert.

Überlagerungen von (zwei) Wellen, die nicht in einem ganzzahligen Verhältnis zueinander stehen, ergeben grundsätzlich keine wiederkehrende Muster. Gäbe es wiederkehrende Muster, hätten sie ein kleinstes gemeinsames Vielfaches- und ergo gäbe es ein ganzzahliges Verhältnis zwischen ihnen. Mit jeder endlichen Anzahl von Wellen verhält es sich genauso. Und abgesehen davon hat der Plot doch gezeigt, dass genau schon eine Oktavoberwelle den Effekt in dieser Skala erzeugt und diese Oberwelle ist eine der stärksten bei der Trompete. Für die Frage, warum der Effekt entsteht, gibt es eine sehr einfache Erklärung ohne “verbogene Gebilde”.

Die Klangfarbe von Holzinstrumenten unterscheidet sich von Blechbläsern darin, dass Blechbläser einfach mehr Obertöne besitzen. Eine herkömmliche Blockflöte erzeugt fast keine Obertöne- je mehr härtere Materialien und damit Schwingkörper hinzukommen- werden mehr Obertöne erzeugt und die Wellenform wird “eckiger”. Und nein- nicht “resonante Schwingungen” oder “nicht freie Schwingungen” können nicht ohne weitere aktive Elemente im Musikinstrument erzeugt werden; sie werden schlicht nicht zum Schwingen angeregt.

Die diskrete Fouriertransformation (oder auch die schnelle Fouriertransformation FFT) kann jedes zeitdiskrete Signal zerlegen- da geht es überhaupt nicht um Obertöne. Aber man kann am Ergebnis der FFT ablesen, welche Frequenzen vorhanden sind- und damit auf die aktuelle Tonhöhe und Obertöne abschätzen. Leider nur schätzen, da bei z.B. einer Fenstergröße von 4096 Samples eben nur genau 4096 Frequenzen aufgelöst werden können, und es zusätzlich noch das Unschärfeprinzip gibt: Je mehr Samples um so größere Frequenzauflösung, jedoch um so weniger Zeitauflösung.

Die Lippenanspannung beim Blechbläser erzeugt beim Herauspressen der Luft ein “Summen” in den Lippen. Tatsächlich wird dabei Luft herausgeblasen- und im Gegensatz zu z.B. Lautsprechern ein echter Lufttransport bewirkt. Doch bläst man dann in einen riesigen umgekehrten Trichter- vom Luftransport bleibt da nichts mehr übrig- die Asymmetrie auf Skala der Wellenlänge kann daher nicht in dem einseiten Lufttransport liegen, sondern verbleibt den Obertönen geschuldet. Oder anders gesagt- wäre der Effekt am Mund überhaupt ausschlaggebend, so könnte man mit dem Lippensummen die Trompete überstimmen.

Aber lass’ uns doch lieber bei den Sprachpodcasts bleiben… So viele Musiker werden wir hier wahrscheinlich nicht haben.

1 „Gefällt mir“