RØDECaster Pro - Versprechen und Wirklichkeit

rstockm · 1. Juli 2019 um 22:03

Hintergrund

Das RØDECaster Pro Soundinterface hat wie kaum ein anderes Stück Hardware in den letzten Monaten die Phantasie der Podcastingwelt angeregt.

https://www.thomann.de/de/rode_rodecaster_pro.htm?offid=1&affid=706

Seit dem Zoom H6 gab es keinen vergleichbaren Hype, und Røde kann sich zugute halten das erste, dezidiert für Podcasting ausgelegte Interface überhaupt gebaut zu haben.

Der ersten Begeisterung nach den (lauten) Ankündigungen folgte - zumindest bei einigen - herbe Enttäuschung: grundlegende Features wie Multitrack Recording waren nicht vorgesehen. Das ganze Drama lässt sich immer noch mit einer Tüte Popkorn hier nachlesen:

Dann kam ein redemption arc wir man ihn selten gesehen hat: schon mit dem nächsten Firmware Update wurde das Multitrack-Recording über USB nachgereicht, mit dem zweiten Update auch auf SD-Karte.

Das zeigt zwei Dinge:

RØDE ist eine Firma, die noch zuhört. Die Kritik am Fehlen des Multitrack war deutlich, aber der ganz überwiegende Teil der „Tests“ und „Reviews“ sind darauf nicht einmal eingegangen. Dennoch haben sie es zügig nachgebessert.
Der Fall zeigt die Vorteile, wenn ich Dinge (nur) in Software mache - ganz offensichtlich hat der im RØDECaster verbaute DSP-Stein genug Reserven, so ein Feature entspannt nachzuliefern.

Auf Punkt 2 werde ich mich im Folgenden noch oft, sehr oft beziehen.

Was mich in den letzten Wochen aber massiv gestört hat: meines Erachtens wurden die entscheidenden Fragen zum RØDECaster noch immer nicht gestellt, geschweige denn beantwortet. Auch nicht hier im Sendegate.

Dass es für das Gerät wirklich keine Anleitung (bis auf den Quick Start Guide) gibt, ist nebenbei ein Skandal. Zu den Auswirkungen auch weiter unten mehr. RØDE direkt dazu:

Genie und Wahnsinn liegen bei dieser Firma wirklich dicht beieinander.
Technische Details wie ein Blockschaltbild sucht man natürlich auch vergebens: also muss man dann eben reverse engineering betreiben.

Fragen an das RØDECaster

Der Begriff, den ich in US-Reviews am häufigsten gelesen habe ist: Gamechanger für das Podcasting. Das legt die Latte ziemlich hoch, und das ist auch der Grund warum ich mir jetzt etliche Abende um die Ohren geschlagen habe (und die Ultraschall 3.2 Release warten muss).
Schauen wir zunächst auf die Eigenbeschreibung des Pults (Hervorhebungen von mir):

Der RØDECaster Pro™ ist das weltweit erste, vollintegrierte Podcast-Studio. Ob Sie gerade erst beginnen, oder schon ein erfahrener Rundfunk-Experte sind - das RØDECaster Pro™ Podcast-Studio bietet Ihnen alles, was Sie brauchen.

Die 4 hochwertigen Mikrofonkanäle unterstützen sowohl Kondensator-Studio-Mikrofone, als auch konventionelle dynamische Mikrofone. Sie können ganz schnell und einfach Mikrofone für Sie und Ihre Gäste anschließen, mit automatischer Pegeleinstellung und Aufnahmen auf eine microSD-Karte mit nur einem Klick. Sie können Ihren ersten Podcast wortwörtlich innerhalb weniger Minuten nach dem Auspacken des RØDECaster Pro™ starten.

Wollen Sie einen Gast interviewen, der weit entfernt ist? Verbinden Sie Ihr Telefon ganz einfach per Bluetooth™ oder mithilfe eines TRRS-Kabels mit dem RØDECaster Pro™. Der RØDECaster Pro™ bietet automatisch „Mix-Minus“-Audio, damit der Anrufer kein Echo hört, sodass Sie keine speziellen und teuren Zusatzgeräte kaufen müssen. Telefoninterviews mit entfernten Gästen haben noch nie so gut geklungen!

A-Klasse Vorverstärker mit Bias-Einstellung Die tadellosen Vorverstärker und Ausgänge des RØDECaster Pro™ verfügen über eine A-Klasse-Schaltung, so wie Aufnahmekonsolen für Rundfunk-Studios, die hunderttausende Dollars kosten. Die A-Klasse-Vorverstärker bieten eine viel klarere Verstärkungsstruktur mit niedrigeren Störungspegeln, und erzeugen ein unglaublich klares, rauschfreies Signal. Die Vorverstärker verfügen zudem über eine Bias-Spannungsversorgung, was die Störungspegel zusätzlich niedrig hält. Ihr Signal ist glasklar.

Mit eingebautem APHEX® Ihr tadelloses Signal wird außerdem durch die legendären, patentierten Audio-Prozessoren, APHEX Aural Exciter™ und APHEX Big Bottom™, verbessert. Diese sind im Abschnitt zur Audioverarbeitung des RØDECaster Pro™ verbaut, und verleihen Ihrem Sound diesen reichen, warmen Klang, den man sonst nur in professionellen Studios findet. Der RØDECaster Pro™ bietet zudem mehrstufige Dynamiken, wie zum Beispiel Kompression, Begrenzung, De-Esser und Noise-Gate.

Diese Selbstbeschreibungen, zusammen mit den Videoclips, haben bei mir direkt den Gedanken getriggert: „oh - ein Gerät, das Auphonic gleich eingebaut hat. Interessanter Ansatz für alle, die wirklich einen sehr schlanken Workflow und wenig Werkzeuge suchen“. Natürlich steht das da nirgends, aber wenn man ein Gerät nur für Podcasting auf den Markt bringt und mit automatischer Pegeleinstellung wirbt das dann alles bietet, was man braucht - so ganz abwegig finde ich den Gedanken dann nicht, dass hier wirklich direkt sendefähiges Audio aus dem Gerät fällt.

Je näher man sich mit dem Gerät beschäftigt, desto mehr Fragezeichen tauchen aber auf. Und die werden weder durch ein (fehlendes) Manual noch durch die kurzen Videos aufgeklärt.
Meine Fragen an das CØDECaster Pro waren:

Wie läuft die Audio-Processingkette im Gerät genau ab? Was ist Pre-Fader, was Post-Fader, was kann man einstellen?
Was bewirken genau die APHEX Effekte?
Wie ist das Noisegate konfiguriert - ein hartes mit fester Threshhold, oder ein adaptives, weiches?
Welche Auswirkungen haben die Einstellungen „Low, Mid, High“ für die Stimme, welche „Soft, Normal, Loud“?
Was hat es mit der automatischen Pegeleinstellung auf sich?
Wie arbeitet der Kompressor?
Wie arbeitet der Limiter?
Gibt es Unterschiede zwischen dem Signal das per USB in den Rechner wandert und dem, was auf SD-Karte geschrieben werden kann?
Welche Ziellautstärke kann erreicht werden - die für Podcasts empfohlenen -16 LUFS, oder -18, oder etwas anderes - und wie stellt man das ein?
Bringen die Vorverstärker gegenüber günstigeren Geräten irgendwelche hörbaren Vorteile?
Welche Qualität wird bei einer Telefonverbindung über TRRS erziehlt, und welche über Bluetooth? Ist dies eine brauchbare Alternative zu StudioLink?

Wor allem aber die Grundfrage:
Wie sendefähig ist ein vernünftig aufgenommener Podcast out of the box bei guten Produktionsbedingungen (Raum, Mikros)?

Da keine dieser Fragen in irgendeinem Review den ich gelesen hätte (ca. 30) beantwortet oder auch nur gestellt wurde, habe ich mal etwas getestet und gemessen.

Aufbau und Verarbeitung

Grundsätzlich kommt das RØDECaster Pro dem Preis angemessen wertig daher. Die Fader und Regler fühlen sich gut an. Insbesondere die Lautstärke-Regler für die 4 Kopfhörerausgänge (eigentlich 5, eine undokumentierte (!) Miniklinke vorne gibt noch einmal Kopfhörer-Kanal 1 aus) sind mit einer guten Rasterung versehen. Das recht große Touch-Display erfüllt seinen Zweck, kann aber nicht mit aktuellen Smartphone-Displays mithalten. Etwas überrasch war ich von den Gummitastern für Soundjingles und einige andere Funktionen wie Solo und Mute. Insbesondere bei den Jinglebuttons vermisse ich einen klar definierten Druckpunkt, auch wenn man nach kurzer Eingewöhnung verlässlich die Sounds triggern kann. Die Konfigurierbarkeit der Farben ist nett, zwingend notwendig ist aber die Anpassung der Helligkeit: im Werkzustand sind die Elemente dermaßen hell strahlend, dass man glaubt es eher mit einem Kirmes-Utensil zu tun zu haben denn mit einem Profi-Gerät. Aber man kann die Helligkeit Dimmen, also alles gut.

Podcasting-Disco

Was mich nachhaltig verstört ist der generelle Formfaktor: mein erster Eindruck, und auch der zweite und dritte: oh, ist das groß. und alle Taster sind so groß. Und alle Fader. Das ist wie ein Handy für Senioren!
Zusammen mit der (ungedimmten) Blink-Disco wirkt das Gerät dadurch eher wie ein Spielzeug. Vor allem aber leidet die Mobilität massiv - ja, man kann es im Rucksack so eben mitnehmen, aber es ist um Größenordnungen von einem Zoom H6 entfernt. (wer jetzt ruft Ja aber dafür kann es so viel mehr - stay tuned).

Vergleich zum Zoom H6

Meiner festen Überzeugung nach würde RØDE besser fahren, wenn das Gerät um 1/3 kompakter gebaut wäre - vielleicht auch um die Hälfte. Vermutlich könnte man es ohne große Einschränkungen in der Handhabung sogar auf 1/3 schrumpfen - dann wäre es für mobile Szenarien wirklich interessant.

Ja es ist fein, dass die Elemente alle viel Platz haben - aber so ist das einfach zu viel.

Noisegate

Aufgabe eines Noisegate ist es, unerwünschte Geräusche wie Rauschen der Mikros, Lüfter im Rechner, Brummen von Kühlschränken etc. aus der Aufnahme zu filtern. Ein Spezialfall ist bei empfindlichen Kondensatormikrofonen das Rausfiltern von „Übersprechung“ - also dass die eigene Stimme nicht nur vom eigenen Mikro aufgenommen wird, sondern auch von den Mikrofonen der anderen Mitpodcastenden - nur eben deutlich leiser. Je nach Setup kann dies zu unerwünschtem Hall führen.
Noisegates sind im Musikbereich weit verbreitet, und funktionieren dort in der Regel nach einem „harten“ Prinzip: man gibt eine Lautstärke vor, ab der gefiltert werden soll (etwa: -40dB) und sobald am Mikrofon weniger/leiserer Klang anliegt, wird das Mikro komplett „stumm“ geschaltet.
Für Podcasting ist dieses Prozedere nur bedingt geeignet: gerade leiser gesprochene Passagen oder auch ein zustimmenden „Mmmm“ will man vielleicht gerade nicht ganz herausgefiltert haben, lauteres Atmen aber vielleicht schon.
Um dem zu begegnen gibt es verschiedene Lösungswege:

Ein Adaptives Noisegate: hier wird - teilweise mit Hilfe von Machine Learning - pro Mikrofon und SprecherIn „gelernt“, was vermutlich erhaltenswertes Signal ist, und was Störgeräusch. Je nach Situation wird dann gefiltert oder eben auch nicht. So funktioniert etwa das Noisegate in Auphonic.
Ein parametrisierbares, „weiches“ Noisegate: Man kann nicht nur die Lautstärke einstellen, ab der das Noisegate greifen soll, sondern auch, wie weit es dann absenkt (eben nicht: komplett abschneidet) und wie steil das Noisegate eingestellt wird. So ein Noisegate wird nach Gehör eingestellt und ist weniger empfindlich gegen Irrtümer, da eben immer noch ein Signal durchgelassen wird - nur eben abgeschwächt. Der Dynamics 2 Effekt in Ultraschall funktioniert so.

Wie ist das Noisegate im RØDECaster Pro gebaut? Leider ist dies ein „hartes“ Noisegate mit sehr wenigen Einstellungsmöglichkeiten. Mit einem Testaufbau habe ich leiser werdenden Rauschen aufgenommen und gemessen, ab welcher Schwelle das Noisegate greift: dies sind -50dB. Sprich alles, was leiser als diese Lautstärke ist, (in etwa leises Atmen) wird abgeschnitten. Es wird dabei relativ sanft aus- und eingeblendet, immerhin - so dass ein „Pumpen“ weniger stark auftritt.
Eine Besonderheit, die ich so noch nicht hatte: der Grenzwert, um eine eingeschaltetes Noisegate wieder abzuschalten, liegt nicht bei -50dB sondern bei -45dB. Es muss also wirklich etwas lauter werden, damit ein Signal wieder durchgelassen wird. Auch dies scheint mir eine „anti-Pumpen“ Maßnahme zu sein.
Leider kann man die Schwelle für das Noisegate nur indirekt manipulieren: pro Stimme kann man in den Settings angeben, ob die Voice Strength diese „Soft“, „Medium“ oder „Strong“ ist.

Diese Einstellung scheint nur einen einzigen Effekt zu haben: bei aktiviertem Noisegate den Grenzwert leicht anders zu setzen. Hier meine gemessenen Werte:

Soft: -55dB
Medium: -50dB (Standard)
Strong: -48dB

Hier ein längeres Klangbeispiel:

Bedeutet: wenn man den Eindruck hat, dass das Noisegate zu schnell anschlägt, sollte man auf „Soft“ wechseln und umgekehrt. In der Praxis fand ich das Noisegate brauchbar, aber es hinkt Größenordnungen hinter der Passgenauigkeit von Auphonic oder der Flexibilität des Dynamics 2 in Ultraschall hinterher. Per Firmware könnte (und sollte) hier nachgebessert werden.

FunFact am Rande: auch wenn das Noisegate komplett greift, wird immer noch ein klitzekleines bisschen Signal durchgelassen - hier stark vergrößert zu sehen, ab dem gelben Strich greift das Gate:

Die Restlautstärke beträgt noch ca -70dB - mit ist nicht ganz klar, warum hier nicht gleich auf „digital 0“ runtergefahren wird.

Limiter

Im PØDECaster Pro ist ein Limiter verbaut - unklar, ob in Hardware oder Software. Meine Vermutung wäre: letzteres. Dieser Limiter soll generell digitales Clipping vermeiden, also dass Ausschläge jenseits der Bitraten-Toleranz landen und Kurven von Peaks dann „plattgedrückt“ werden. So sieht eine übersteuerte Aufnahme mit digitalem Clipping aus:

Und im Zoom ist dann das Problem zu sehen:

Was vorher eine fließende Kurve war, schlägt nun oben und unten an und die jeweiligen Maximalwerte der Auflösung werden gesetzt - die Membranen können an dieser Stelle aber nicht mehr normal durchschwingen, es kommt zu hässlichen Verzerrungen.
Dem soll ein Limiter vorbeugen.

Das Problem des Limiter im RØDECAster Pro: zum einen kann man den Limiter weder abschalten, noch in irgendeiner Weise beeinflussen. Das wäre kein Problem, wenn er vernünftig gesetzt wäre. Aber: er ist zum anderen auf einen absurd konservativen Wert eingestellt, der eine Unmenge an Dynamik und nutzbarer Lautstärke sinnlos verschenkt. Wenn man versucht, eine maximal laute Aufnahme herzustellen, sieht danach die Kurve im RØDECaster Pro so aus:

Wir sehen: oben und unten gibt es jede Menge ungenutzen Raum, den der Limiter abschneidet. De facto wird hier fast die Hälfte der möglichen Dynamik verschenkt, hier gut zu sehen wenn man die Wellenform an der Unterkante anlegt (wie in der DAW Hindenburg als Standard-View):

Zum Vergleich: wir setzen im Ultraschall Dynamics 2 Effekt ebenfalls einen fest verbauten Limiter ein. Der hat einen großzügigen Puffer von 2dB. Ein entsprechendes Signal sieht dann so aus:

Zur Klarstellung: dieses Signal ist beim Abspielen signifikant lauter als das aus dem RØDECaster Pro (damit besser Verständlich etwa in der U-Bahn), hat zugleich aber deutlich mehr Dynamik (klingt natürlicher) und ist zu 100% verzerrungsfrei.

Die Situation wird noch dramatischer, wenn man sich die durch den Limiter begrenzte Wellenform des RØDECaster Pro genauer anschaut:

Hier wird es absurd: der Limiter kappt die Wellenform, obwohl noch jede Menge „Platz“ da wäre, aus der Kurve wird eine gerade Linie.
Der Limiter produziert also scheinbar das, was er eigentlich vermeiden soll: Digitales Clipping. Und das ohne jede Not. Vermutlich ist die Erklärung hierfür, dass der A/D-Wandler bereits an seine Grenze gebracht wurde - nach dem Garbage-IN-Garbage-Out Prinzip kann dann auch ein digitaler Limiter dahinter den Schaden nciht mehr beheben. Nur noch optisch vertuschen, das findet hier statt.

Nun gibt es in den Settings die Option, „Bypass Audio Processing“ für das Schreiben auf SD-Karte und über USB in ein Soundinterface:

Die Hoffnung wäre nun, dass man hiermit nicht nur Compressor etc. umgehen kann, sondern ebenfalls den Limiter. Ein erster Test scheint das zu bestätigen, mit aktiviertem Bypass erhält man etwa so eine Kurve:

Die ist zwar übersteuert und „schlägt oben an“, aber immerhin scheint hier wirklich kein Limiter am Werk zu sein.
Scheint.
Wenn man nämlich nun etwas am Gain dreht, so dass die Aufnahme generell lauter wird, erhält man - ohne Ändern der Settings! plötzlich bei gleichem Input diese Kurve:

Hier steigt mein Verständnis dann aus. Offensichtlich wird nun sehr wohl ein Limiter eingesetzt, die Kurve erreicht nicht mehr die Extreme - ist aber dennoch abgeflacht, man hat also digitales Clipping. Der Limiter scheint also in Abhängigkeit zum Gain- Wert eingestellt zu sein - warum auch immer.

Man muss es sagen: der Limiter im RØDECaster Pro ist eine komplette Fehlkonstruktion:

er ist zu konservativ (ca. 6dB Puffer nach meinen Messungen),
nicht einstellbar, und da in Abhängigkeit zum Gain auch nicht vorhersehbar, und
produziert in lauteren Passagen selbst Clipping bzw. versucht im A/D-Wandler entstandenes Clippung zu verstecken.

Hier muss RØDE dringend nachbessern.

Gain und Fader

Der Gain wird digital pro Kanal in den Settings eingestellt:

Grün hervorgehoben ist der Bereich, in dem laut gesprochene Passagen landen sollen. Mit einem Beyerdynamics DT297 Headset landet man dort mit einem Gain von ca. 26, das Signal ist dann auch gut und verzerrungsfrei. Aber erstaunlich leise:

Meine Messung für normal gesprochenen Text ergibt hier eine Lautheit von ca. -36 LUFS, was wirklich jenseits von Gut und Böse ist. Ich habe dann den Gain schrittweise erhöht - ab ca. 37 treten hörbare Verzerrungen schon bei mittellauter Sprache auf:

Hier die Sequenz zum Nachhören, ohne jeglichen weiteren Effekte (bis auf besagten Limiter):

Hier entsteht nun die Frage: Wenn man mit einem Gain von Maximal 30 und normaler Stimme nicht annähernd in die gewünschten Regionen von -16 LUFS kommt - was für Optionen bietet das RØDECaster Pro noch? Nun, zum ersten wären da die Fader, mit denen sich das Signal - unabhängig vom Gain - noch weiter verstärken lässt. Ferner ist ein Kompressor an Bord, der nicht nur Komprimiert (laute Passagen runter drückt), sondern auch das gesamte Signal danach anhebt.

Schauen (hören) wir uns zunächst die Fader an.

Der Unity Gain Punkt - also die Faderposition, in der weder Verstärkt, noch Abgeschwächt wird, ist von RØDE (Überraschung) - nicht dokumentiert. Er liegt nach meinen Messungen optisch ziemlich genau in der Mitte des Faderzuges, also zwischen dem 6. und 7. Markierungsstrich von unten:

Die unterste Position des Faders ist ein echtes -Unendlich, man erhält dann also wirklich ein „digital 0“ Signal. Schön. Nach oben hin gibt der Fader eine Verstärkung von maximal 12dB - je nachdem, ob und wie der Limiter greift (siehe oben).

Hier meine Messung des Kompressors: dieselbe Passage habe ich mit aktiviertem Kompressor einmal leise, einmal normallaut sowie einmal sehr laut eingesprochen und jeweils gegen das cleane Signal ohne Kompressor gemessen:

Das Ergebnis: leise und normal laut gesprochen wird eine Lautstärkenanhebung von ca. 6 LUFS erreicht. Beim laut gesprochenen greift der Limiter, hier werden nur noch 4 LUFS Anhebung erzielt.

Was wir hier auch festhalten können: bei normaler Sprechlautstärke, vernünftiger Aussteuerung und aktiviertem Kompressor erhält man kein Signal, das lauter ist als ca. -28 LUFS. das ist entschieden zu leise, wenn man als den für Podcasts wünschenswerten Pegel von -16 LUFS oder mindestens -18 LUFS erreichen will.

Durch Steigerung des Gain lässt sich etwas mehr Pegel erzielen (bis ca. -20 LUFS) aber dort besteht bereits ein Hang zur Verzerrung.

Das RØDECaster Pro ist ersichtlich nicht in der Lage, nur mit Bordmitteln einen sendefähig lauten Klang zu produzieren.

Zum Verständnis: das ist bei 99% aller anderen Soundinterfaces genau so - die werben aber auch nicht damit, alles an Bord zu haben.

Klangformung

RØDE verspricht mit den beiden APHEX-Effekte einen klareren, volleren Klang zu produzieren. Der Big Bottom Effekt hebt dabei die Bässe an - nach meinen Messungen im Bereich von 70Hz bis 180Hz, um etwa 4dB:

Inwiefern dieser Effekt nun wirksamer ist als ein gewöhnlicher EQ möge jede(r) selbst beurteilen. Der Exciter hingegen wirkt auf die Höhen:

Wie man sieht, wird der komplette Bereich von 3.000Hz bis 15.000Hz recht deutlich angehoben - um ca. 10dB. Angeblich sollen hier vor allem die „wohlklingenden“ Obertöne hinzugefügt werden - für mich sieht das eher wie ein sehr breit eingestellter Filter aus, aber auf diesen Gebieten kenne ich mich auch wirklich nicht aus.
Hier das Klangbeispiel zum eigene Meinung bilden:

Erwartbar ist durch den EQ nach dem APHEX lauter als clean: ca. 3 LUFS werden hinzugewonnen. Absolut liegt das Beispiel mit beiden Effekten jedoch bei leisen -33 LUFS (siehe oben).

Signalfluss

Aus dem bisher Verstandenen lässt sich meines Erachtens dieses Schaubild ableiten für den Signalfluss im RØDECaster Pro:

Zu sehen ist hier etwa, dass immer ein Limiter im Spiel ist. Ferner erkennt man, dass die ersten beiden Output Kanäle Stereo L/R abbilden - und erst danach die weiteren Kanäle folgen. Generell mag ich das: man hat so die Möglichkeit ein schon gut gemischtes Summensignal nehmen zu können, kann aber im Notfall auch auf die Einzelspuren zurückgreifen. Das würde ich mir auch bei anderen Interfaces wünschen.

Das -16 LUFS Problem und mögliche Lösungen

Wie oben ausgeführt, sind die direkt im RØDECaster Pro produzierten Soundfiles nicht sendefähig da entschieden zu leise. Was könnte hier verbessert werden? Ich würde folgende Maßnahmen empfehlen:

1. Den bestehenden Limiter konfigurierbar machen:

wie derzeit eingestellt (konservativ)
lauter Output (auf -1dB reduzieren)
ausschaltbar machen

2. Den bisherigen fertigen Output normalisieren.

Durch den Kompressor und Limiter entsteht schon eine ziemliche „Soundwurst“ - nur dass eben eine Menge Dynamik und Lautheit nicht genutzt wird. Dieses Signal hier ließe sich problemlos von -31 LUFS auf immerhin -20 LUFS verstärken - nur indem man die vorhandenen Reserven nutzt:

Wohlgemerkt ohne irgendwelchen Verzerrung etc. hinzuzufügen.

3. Einen fortschrittlichen Mechanismus verwenden

Deutlich besser klingende Ergebnisse würde man jedoch erzielen, wenn man gar nicht erst ca. 1/3 der aufgenommenen Daten vom Kompressor wegwirft um sie dann wieder „hinzuzuerfinden“ bei einer Normalisierung durch Interpolation.

Aktuelle Verfahren wie Auphonic oder der Dynamic 2 in Ultraschall funktionieren anders: laute Passagen bleiben laut, mittlere Passagen werden etwas angehoben, leise noch etwas mehr. Sehr leise Passagen (Rauschen) werden etwas abgesenkt.

Dieselbe Passage sieht nach einer entsprechenden Bearbeitung in Ultraschall etwa so aus:

Oben noch einmal das Original aus dem RØDECaster Pro. Zum Spaß habe ich auf der Ultraschall-Version noch einmal unseren EQ-Effekt angelegt, der im Kern ganz ähnliche Frequenzen anhebt wie die APHEX-Effekte:

Hier im Vergleich, damit man einmal die Unterschiede in der Lautstärke wirklich einschätzen kann:
Endergebnis des RØDECaster:

Vergleich nach Dynamics 2 von Ultraschall + EQ:

Das kann man dann mal in der U-Bahn vergleichend hören.
Diese Änderungen wären m.E. problemlos über ein Firmware-Update realisierbar - der DSP-Chip könnte mit Sicherheit entsprechend programmiert werden. Unser Dynamics 2 Code ist open source:

github.com

Ultraschall/ultraschall-portable/blob/master/Effects/dynamics/Ultraschall_Dynamics

desc:Ultraschall Dynamics (Ultraschall.fm)
//tags: graphical processing compressor expander gate
// Copyright (C) 2016 Cockos Inc
// License: LGPL - http://www.gnu.org/licenses/lgpl.html

// Dynamics Code derived from Cockos General Dynamcis
// Limiter Code from LOSERs "MGA JS Limiter"
// modified by fernsehmuell and rstockm (ultraschall.fm)
// added further options by Meo-Ada Mespotine

slider1:slider_detect=0<0,1,1{main,aux (use with caution! can result in loud signals!),feedback (caution too!)}>-Detector Input
slider2:0<-40,40,1>-Detector Gain (dB)
slider3:slider_rms=188<0,1000,1>-Detector RMS size (ms)
slider4:slider_pdc=100<0,1000,1>-Input lookahead (ms)
slider5:slider_attack=5<0,200,0.1>-Input Attack (ms)
slider6:slider_release=250<0,1000,1>-Input Release (ms)
slider10:slider_attack_out=0<0,200,0.1>-Gain Attack (ms)
slider11:slider_release_out=0<0,200,0.1>-Gain Release (ms)
slider12:0<-150,24,1>-Wet Mix (dB)
slider13:-150<-150,24,1>-Dry Mix (dB)

Diese Datei wurde abgeschnitten. Original zeigen

…den kann sich ja RØDE vielleicht mal ansehen.
Was ich nicht gelten lasse, ist das Argument „ja, ihr in der DAW habt leicht reden, das RØDECaster muss das ja alles in Echtzeit machen“.
Ja, zunächst einmal ist es richtig, dass Verfahren wie Dynamics 2 und natürlich auch Auphonic „in die Zukunft“ hören können, da das Audio schon fertig aufgenommen wurde - so lässt sich natürlich immer perfekt der nächste Wert einstellen, man wird nie von Dynamiksprüngen überrascht.
Aber.
Wir haben im Dynamics 2 Effekt ein Zeitfenster von 5 Sekunden, das wir „nach vorne“ analysieren - schon sehr üppig, auch mit 2 Sekunden erreicht man schon gute Ergebnisse. Auphonic ist da vermutlich noch weitsichtiger.
Es spricht aber rein gar nichts dagegen, dass das RØDECaster sich alle Zeit der Welt nimmt, zwischenpuffert, und dann ganz gemütlich das Ergebnis auf SD Karte schreibt? Niemand braucht Echtzeit auf der SD-Karte.
Und auch für die USB-Schnittstelle wäre dies denkbar - wenn ich es in der DAW haben will, dann ja eher clean um nach eigenem Geschmack editieren zu können und vielleicht zu routen. Das kann dann schnell sein - aber der prozessierte Mastermix kann gerne zwei Sekunden hinterher hängen. Schon jetzt sieht man, dass die eingebauten Effekte eine Latenz hinzufügen, in der DAW kommen also prozessierter Mastermix und die cleanen Einzelspuren zeitversetzt an:

Man muss noch einmal betonen: so ziemlich alle mir bekannten Sound-Interfaces verhalten sich ziemlich exakt genauso wie das RØDE was die Endlautstärke des Mix angeht. Mit dem Zoom H6 kann man auch keine sendefähige Lautstärke produzieren.

Meines Erachtens suggeriert aber die Werbung, und auch die Beschreibung des RØDECasters hier etwas anderes - eben dass man nicht noch nach der Aufnahme andere Tools anwerfen muss, sondern alles was man benötigt an Bord ist.

Das mag aber auch eine Fehlwahrnehmung meinerseits sein.

Speichern auf SD-Karte

Der Vollständigkeit halber: das Audio, dass in Form eines Multikanal-WAVs auf die SD-Karte gespeichert wird, ist exakt identisch zu dem, was man im Mehrkanal-Betrieb über USB in einer DAW erhält.
Man kann bei der SD-Variante nicht auswählen, welche Spuren mitgenommen werden: man erhält immer alle Spuren, auch wenn sie nicht genutzt wurden.

Etwas unschön, aber zu verschmerzen - hier verstehe ich die Strategie von RØDE, nicht zu viele Optionen anzubieten. Fehler entstehen schnell, so ist man immer auf der sicheren Seite und es macht in der DAW keine Mühe die leeren Spuren schnell loszuwerden.

Routing

Etwas sonderbar ist die Eigenart, dass sich das RØDECaster Pro mit zwei Geräten im Betriebssystem anmeldet. Auf dieser Seite kann man sich in PDFs ansehen, welche Auswirkungen dies auf die jeweiligen Settings in der DAW hat:

Schaut man hier beim MAC mal im Bereich REAPER (cool, dass sie das mit aufführen) so liest man Erstaunliches:

Mkay. Hier wird ein Weg vorgeschlagen - den die REAPER EntwicklerInnen selbst als „legacy, not recommendet“ beschreiben - nun ja. In der Praxis hat es bei mir soweit funktioniert, man erhält so einen Stereo-Rückkanal mit dem sich auch SKYPE N-1 Schaltungen realisieren lassen sollten. Wenn man dafür nicht lieber gleich die Hardware-Eingänge nutzt, siehe unten.

Externe Gäste einbinden

Ein unique selling point des RØDECaster Pro ist die Möglichkeit, externe GesprächspartnerInnen entweder über Bluetooth - mittels eines zusätzlichen Handys oder Tablets - oder mit einem TRRS-Anschlusskabel in das Pult zu integrieren. Hierbei wird intern gleich eine N-1 Schaltung mitgeliefert. nach wie vor: cool, endlich, danke.

Das Feature funktioniert auch wie beschrieben, an dieser Stelle aber zur eigenen Einordnung mal Klangbeispiele, welche Qualität man hier in etwa erwarten kann. Die Rahmenbedingungen waren:

die Remote-Spur wurde mit einem Superlux HMC660 Headset aufgenommen, das man wie hier beschrieben mit wenig Aufwand direkt an ein Smartphone anschließen kann und das dann ausgesprochen guten Klang liefert:

Die Verbindungen wurden dann über Facetime Audio per guter LTE-Verbindung hergestellt, was einen in etwa zu SKYPE vergleichbaren Sound liefert, vielleicht sogar etwas besser. Im Vergleich dazu ferner ein normales iPhone Telefonat, direkt in das iPhone 8 gesprochen. Ferner als Vergleich eine lokale Aufnahme mit dem HMC 660 so dass man den Originalklang ebenfalls beurteilen kann. Alle Lautstärken wurden normalisiert, so dass sie in etwa gleich laut klingen:

HMC660 Direktaufnahme:

HMC660 über TRRS Kabel via Facetime Audio

iPhone 8 über TRRS Kabel via Facetime Audio

iPhone 8 über Bluetooth via Facetime Audio

Hier die Frequenzverläufe übereinander gelegt:

Erkenntnisse:

nur die HMC660 Direktverbindung (Grün) hat nennenswerte Bassanteile
Die Bluetooth-Verbindung (Rot) ist erwartbar katastrophal aufgrund des verwendeten Profils. Alle Signale ab 4.000 Hz werden abgeschnitten - die sind aber für gut klingende Sprache extrem wichtig.
Die Aufnahmen direkt ins iPhone vs. Headset unterscheiden sich primär durch den Raumanteil (weniger beim Headset) und bieten beide einen sehr linearen Frequenzgang.
Facetime Audio klingt insgesamt nicht besonders eindrucksvoll auch bei guten Rahmenbedingungen - besser als nichts, aber Welten entfernt von StudioLink.

Empfehlungen:

Unbedingt ein TRRS-Kabel verwenden und Bluetooth - wenn auch vielleicht bequemer - unbedingt vermeiden.
Ein gutes Headset auf der Gegenseite hilft, aber die Möglichkeiten sind durch Facetime oder SKYPE stark begrenzt.

Im Ergebnis: etwas ernüchternd. Als Notlösung ok, aber wenn man eine regelmäßige Runde mit festem Personal hat ist StudioLink hier die um Welten bessere Lösung.

Sonstige Beobachtungen

Die Einspieler / Jingles funktionieren erwartbar gut und problemlos. Man kann hier von Hand faden, für Mikro 1 gibt es eine Ducking-Funktion (die ich noch nicht näher getestet habe).
Toll wäre es, wenn sich das RØDECaster Pro gleich noch mit als Midi-Device anmelden würde und bei jedem Sound auch gleich ein Midi-Signal gesetzt würde - unterschiedlich für jedes Pad - damit könnte man feine Kapitelmarken bauen. Aber das sind schon Luxuswünsche.

Immerhin kann man während einer Aufnahme (REC muss aktiv sein) manuell Marker setzen, die man dann etwa in REAPER/Ultraschall aus der WAV-Datei extrahieren kann. Das funktioniert natürlich nur, wenn auch eine WAV-Datei auf SD-Karte geschrieben wird.

Gut: man kann gleichzeitig auf SD-Karte aufzeichnen (als Backup) und parallel eine Aufnahme per USB in der DAW anfertigen. Dieses Feature fehlt etwa dem Zoom H6 schmerzhaft.

Zur „Güte“ der Vorverstärker im RØDECaster Pro wurde schon viel geschrieben. Tenor scheint hier zu sein: sie klingen rauscharm und gut, haben aber zu wenig Wumms um auch anspuchsvolle dynamische Mikros zu verstärken - hier wäre dann wieder etwa ein FetHead vonnöten:

Das habe ich nicht getestet. Ich habe zum A/B-Vergleich jedoch eine cleane Aufnahme mit dem Zoom H6 gemacht - hier ist bei einem DT297 Headset absolut kein Unterschied zu hören.

Zusammenfassung und Fazit

Schön, dass es mit dem RØDECaster Pro endlich ein dezidiertes Stück Hardware nur „für uns Podcastende“ gibt. Weniger schön, dass auch nach einigen wichtigen und guten Firmware-Updates noch immer das ein oder andere im Argen liegt. Unschön, dass die in der RØDE Werbung gemachten Versprechen nur zum Teil eingehalten werden.

Können EinsteigerInnen und Profis mit dem Gerät schnell und unkompliziert eine gut klingende Aufnahme hinbekommen? Eindeutig ja. Was man wirklich sagen muss: das Gerät setzt einen völlig neuen Maßstab in Sachen Bediehnbarkeit. Aufbau der Menüs, Verständlichkeit der Informationen - alles top und hoffentlich Vorbild für andere.

Ist diese dann direkt sendefähig als Podcast - sofern man nicht ohnehin Schneiden möchte? Eindeutig nein.

Wie man es dreht und wendet: -30 LUFS ist einfach viel zu leise. Dreht man lauter, riskiert man Verzerrungen und Clipping. Man benötigt also immer noch einen Durchgang durch Auphonic oder einen Effekt wie den Ultraschall Dynamics 2. Schon eine primitive Normalisierung würde hier helfen. Wie ausführlich erläutert, könnten entsprechgende Verbesserung relativ einfach mit einem Firmware-Update implementiert werden.

Die N-1 Schaltung für Smartphones ist ein echtes Alleinstellungsmerkmal. Die Bluetooth-Option scheidet klanglich aus. Über TRRS-Kabel wird es besser, aber die üblichen Telefonie-Programme reduzieren hier empfindlich die Qualität, etwa im Vergleich zu StudioLink.
Am interessantesten ist daher diese Option für Call-In Sendungen, bei denen man ständig wechselnde GesprächspartnerInnen hat die man wirklich nicht vorher mit besseren Lösungen versorgen kann.

Die Jingle-Pads sind praktisch, aber letztlich kann man diese Funktion auch verlgeichbar komfortabel über eine beliebige Jingle-App auf dem Smartphone ersetzen - mit weniger Sync-Aufwand.
Die Klangformungen des RØDECaster halte im im Kern für Marketinggewäsch. Meine Empfehlung wäre, das Audioprocessing abzuschalten - immerhin ist das möglich bis auf den Limiter - und dann die Bearbeitung in der DAW vorzunehmen.

Durch die Einschränkungen bei der Lautstärke und der Klangmöglichkeiten der N-1 Schaltung bleibt am Ende aber doch die Frage, ob sich das RØDECaster Pro wirklich von einem x-beliebigen Soundinterface absetzen kann. Sauber klingende 4-Kanäle bekommt man auch schon für 109 €:

Natürlich fehlt dann dort noch ein Kopfhörer-Splitter, der aber auch nichts kostet.
Meiner Meinung nach wäre RØDE ferner gut beraten, den Formfaktor drastisch zu redizieren - dann wäre das Gerät als all-in-one Lösung zumindest auf Hardware-Ebene schon sehr interessant. Auch an einem Zoom H6 muss man erst wieder einen Kopfhörer-Splitter dranbauen, das kann unterwegs schon nerven.

RØDE war in den letzten Monaten ausgesprochen lernfähig - vielleicht geht da ja noch was mit einer 2.0 Version.

Bis dahin: meines Erachtens nicht der große Wurf, schon gar kein Gamechanger (wie es damals das Zoom H6 durchaus war). Ein solides Gerät für Leute mit Platz auf dem Tisch, die es sich leisten können.

GNetzer · 1. Juli 2019 um 22:29

Wow, danke für die ausführliche Besprechung!

kieliscalling · 2. Juli 2019 um 06:11

Wow! Großartige Arbeit. Ich gehe nicht so gaaanz konform, dass man das Pult etwas kleiner bauen sollte, aber ich gebe Dir Recht, dass es da bestimmt Optimierungsbedarf gibt.
In Bezug auf die Verstärker und den Limiter muss ich sagen, dass das sogar eher ein Argument für mich ist, es nicht zu kaufen bzw. zu warten, ob irgendwann eine Mk.2 Version kommt.

bertofprey · 2. Juli 2019 um 07:31

Toller und kompetenter Bericht! Findet man in einer Welt von “Unboxing” Videos gar nicht mehr so leicht. Bestärkt mich definitiv darin, mir (jetzt noch) keines zuzulegen. Die Bedienbarkeit meines H6 ist bei einer Aufnahmesituation von 3 Leuten und mehr zwar nicht optimal und das Rode wäre da schon fein, aber die Bedienbarkeit allein rechtfertigt für mich nicht den Anschaffungspreis.

dirkprimbs · 2. Juli 2019 um 07:52

Hammerbeitrag, danke!
Bestätigt mich in meinem generellen “brauch ich nicht”-Gefühl…
Eigentlich sollte man diesen Beitrag ins Englische übersetzen und an den üblichen Stellen reposten. Allein schon um das Image der no-bullshit-Deutschen zu verstärken

timpritlove · 2. Juli 2019 um 08:55

Nun, meiner Meinung nach spricht da eine Menge dagegen und vor allem ist heutzutage ein Echtzeitprozessing keine Zumutung mehr. Ein ordentliches Signal kriegt man auch in Echtzeit hin, da braucht es keinen optmierten Lookahead. Das gehört imho ins Postprocessing.

Vor allem wäre eine Latenz auf USB eine absolute Katastrophe. Schon jetzt finde ich die Latenz von USB generell zu hoch und ich hoffe, dass die Interfaces alle möglichst bald auf USB-C und damit Thunderbolt gehen, damit das Thema Latenz ganz schnell vom Tisch kommt (mit Thunderbolt 3 und Sampling Raten >48 KHz kann man problemlos Roundtrips von <1ms erreichen, was ganz neue Anwendungen ermöglicht.

timpritlove · 2. Juli 2019 um 08:57

Aus Deinem Blockschaltbild werde ich noch nicht schlau. Könntest Du es mal erweitern, so dass alle Kanäle einzeln zu sehen sind, alle Elemente nur einmal vertreten sind (Limiter) und vor allem dass klar wird, wo auf SD und USB abgezweigt wird? That would be great.

Fred · 2. Juli 2019 um 09:18

Super Review. Vielen Dank für die detaillierte “Auseinandernahme”.

dirkprimbs · 2. Juli 2019 um 11:20

Ich glaube, Ralf hat das anders gemeint als Du es verstanden hast…
Manche Effekte basieren ja darauf, dass man zum Zeitpunkt der Analyse auch die kommenden Signale kennt. Er sagt im Prinzip nur, dass das Rode ja im Gerät genau so ein Processing machen könnte bevor es auf die Karte wegspeichert. Das hätte genau gar keine Auswirkung auf die Latenz an USB oder die Zeit des Signals durch die Schaltungen sondern eben nur auf Bearbeitung und Speicherung.

rstockm · 2. Juli 2019 um 12:05

Ich widerspreche hier in jedem Punkt:

Für adaptives Leveling ist es ziemlich entscheidend, wie groß der Lookahead ist. Ohne einen solchen erhält man sehr schnell ein unangenehmes „Pumpen“ im Klang weil ständig zu früh/spät Verstärkt oder Abgesenkt wird. Das hat auch nichts mit Zumutung zu tun, sondern mit Physik. Raum-Zeit-Kontinuum und so.
Wie ich in dieser Grafik zeige

gibt es schon jetzt einen deutlichen Versatz zwischen der prozessierten Summen-Spur und den einzelnen cleanen Spuren über USB. Die aber beide gleichzeitig über USB reinkommen. Da ist es völlig egal, ob dieser Versatz jetzt 2 Sekunden größer ist oder nicht, man nutzt die Spuren ohnehin nicht zusammen sondern wirft entweder die Summe weg oder die Einzelspuren.
3. Durch ein von mir gefordertes, erweitertes Processing auf der Stereo-Summe bleibt die geringe Latenz auf den Einzelspuren völlig unangetastet.Alle zeitritischen Dinge laufen da also dennoch - das Beste aus beiden Welten.
4. Ich verstehe das RØDECaster so, dass es für viele, viele Podcastende gerade gar kein Post-Processing mehr geben soll - weil das Gerät eben alles selber macht. Das ist mit dem jetzigen Aufbau aber nicht umsetzbar.

Wilhelm · 2. Juli 2019 um 15:41

Es wurde ja schon viel Lob ausgeschüttet und ich will mich anschließen.
Eine Frage habe ich noch, denn für den Schreibtisch würde ich mir solch ein Teil nicht kaufen, da gibt es praktischeres Zeug.

Wie sieht es denn aus Deiner Sicht mit mobilen Aufnahmen aus? Ich suche was robustes, das ich in eine Tasche werfe, an mache und möglichst verlustfrei Audio aufnehme. Danach ziehe ich die Daten dann als WAV auf den Rechner in Reaper und mache die Postproduktion.

Ist das ein Zugewinn für mobile Aufnahmen?

rstockm · 2. Juli 2019 um 17:03

Von den Funktionen her ja. Aber es ist halt: echt groß. Schau oben das Bild mit dem H6 zum Vergleich - das ist wirklich mobil. Und bietet nicht so entscheidend viel weniger.

Ranthoron · 2. Juli 2019 um 18:08

Hast du das mal an einen Linux-Rechner angeschlossen, wie es sich da anmeldet?

rstockm · 2. Juli 2019 um 18:14

Nein, habe kein Linux

rstockm · 2. Juli 2019 um 23:08

Schau mal hier drauf - vielleicht hilft das weiter:

Das was im USB-Multichannel landet ist genau dasselbe wie das, was im Multichannel WAV geschrieben wird.

Ranthoron · 3. Juli 2019 um 04:14

Dafür gibt es Live-CDs (bzw. Sticks)
Ich nutze das hier aktiv:

Ranthoron · 3. Juli 2019 um 04:17

Ich dachte eher daran, daß man ja auch vom Rechner aus Jingles aufspielen kann - da muß es ja auch einen Weg über USB geben…

timpritlove · 3. Juli 2019 um 07:20

Besser. Aber magst Du das Bild nicht komplett machen?

Wenn ich noch ein wenig herummeckern darf: mono und stereo sind hier immer eine Linie, da sollte L/R separat geführt werden und bei USB sollten noch die einzelnen Kanäle sichtbar werden. Außerdem fehlen dem Bild noch die ganzen Headphone-Ausgänge und die weiteren Eingänge (TRRS, Bluetooth). Die Buttons sind überhaupt noch nicht dabei und jeder Kanal hat ja noch diesen Mute und Solo Button.

Du darfst auch gerne Dein Bild sourcen, dann können wir alle dran herumzuppeln (was vielleicht aber nicht zielführend wäre)

rstockm · 3. Juli 2019 um 07:50

Nein, ich mach da jetzt nix mehr - es muss auch mal mit der Ultraschall-Release vorwärts gehen.
Hier kann sich gerne jemand austoben:

https://files.rstockm.de/index.php/s/tWfta6f5Wz8xrqD

Mespotine · 3. Juli 2019 um 12:36

Ich vermute mal, Comfort Noise und die Idee, die hinter Noise Shaping steht: https://de.wikipedia.org/wiki/Rauschformung
Sollte optional sein, aber ist meines Erachtens erstmal soweit verständlich warum.

Bei Musikprduktionen ist ne Art Richtlinie noch ordentlich Headroom zu lassen(6dB meist), der für den Mix und das Mastern gebraucht wird. Spontan würde ich vermuten, dass sie das auch auf Podcasts anwenden jedoch zu krass und teils unnötig.
Also evtl nen „das macht man so“-ohne das zu hinterfragen-Problem.

Den Limiter so hart zu setzen ist aber schon krass. Der sollte viel softer zuschlagen, bei weniger dB schon und immer stärker, je näher man ans Maximum kommt.

Was für ein Testsignal haste verwendet? Versuchs mal mit nem sauberen Sinuston, dann kannste sauberer sehen, ob die Obertöne verschwinden/sich seltsam verhalten bei höheren Gain. Wenn ja, findet audioprocessing statt oder irgendein krudes physikalische Phänomen, glaub aber Ersteres.
Müsste man vielleicht mal mit nem Spektrogramm genauer untersuchen.

Was mir noch in den Sinn kommt, dass ich es gut fände, wenn man optional zwei Möglichkeiten der Nachbearbeitung hätte, eine für den LiveMix den man raussendet und eine für die Aufnahme. So kann man das Verhältnis Sound vs Processingspeedlatenz beeinflussen, was man für live doch so niedrig wir möglich halten möchte, für die Aufnahme aber etwas mehr Zeit sich nehmen kann.

Cool wäre auch, wenn die Aphex-Effekte selbst programmierbar wären um da einfach selbst nachbessern zu können.

Die Größe des Gerätes wäre für mich ja irgendwie schon nen Pluspunkt, weil mich das Rumgefitzel bei soviel anderen Krams echt nervt.
Wenn es da verschiedene Ausbaustufen gäbe, groß(12 Inputkanäle), Mittel(6 Inputkanäle, kleinerer Formfaktor) und Mini(4 Inputkanäle und so klein wie möglich für transportabel) und wenn man das Ganze PostProcessing ausschalten könnte, wäre das echt nen Kandidat als mein nächstes Interface.