🎯 Studio Link - Roadmap 2025

Nach dem gestrigen Release möchte ich, wie angekündigt, ein wenig verraten, was noch auf meiner To-do-Liste steht und hoffentlich in den nächsten Monaten veröffentlicht werden kann.

„Magischer Double-Ender“ - Arbeitstitel

TL;DR

Ein intelligenterer Ansatz zur parallelen und verlustfreien Double-Ender Aufnahme mit folgenden Funktionen:

  • Automatische Synchronisation der Spuren
  • Netzwerkprobleme werden automatisch ausgeglichen
  • Hinterbandkontrolle: direkt in die finale Aufnahme reinhören (Latenz 5-10 Sekunden)
  • Fokus auf Audioqualität, später evtl. auch lokale Videoaufzeichnung

Damit Studio Link - Mix Rooms die Betaphase verlassen kann, fehlt u.a. noch ein sehr wichtiges Feature, der „Double-Ender”. Einige Maßnahmen greifen bereits jetzt, um schlechte Verbindungen besser zu optimieren. Aber bei einer Live-Verbindung spielt jedoch auch die Latenz eine wichtige Rolle und ohne diese zu erhöhen lassen sich nicht immer alle Probleme (z.B. Paketverluste etc.) direkt ausbügeln.

Darauf liegt aktuell der Fokus und die bessere Integration in das bestehende Ökosystem (Ultraschall etc.). Und natürlich hilft es auch das der Mix Room Server selbst eine gute Netzwerkanbindung schon hat. Aber das verhindert natürlich nicht das auf der Gegenseite oder irgendwo dazwischen weiterhin Probleme auftreten.

Aber ich möchte nicht nur einfach einen Double-Ender implementieren, sondern das ganze soll auch die Probleme die sich damit ergeben ebenfalls angehen.

Welche Probleme ergeben sich bei einer klassischen parallelen Aufnahme auf zwei oder mehreren Seiten?

1. Qualität ungewiss

Ich bezeichne das gerne auch als „Schrödingers Double-Ender“. Erst wenn man reinhört weiß man welche Qualität wirklich zu erwarten ist. Nicht selten liegen die Probleme die auch während der Aufnahme schon zu hören sind, gar nicht an der Internetverbindung sondern schon viel früher. z.B. falsche Samplerate, lokale Audio/Treiber Probleme, falsches Mikrofon etc. Das lässt sich häufig schwer auseinanderhalten und wenn dann die hoffnungsvoll erwartete bessere lokale Aufnahme ankommt und genauso mies klingt, ist der Frust groß.

Wäre es nicht schöner vorher zu ermitteln wo die Probleme liegen und wie sich die finale
Aufnahme wirklich anhören wird?

2. Synchronisation

Alle die schon mal versucht haben mehr als eine Remote Spur zu schneiden, wissen wie aufwendig das ganze werden kann.

3. Browser sind nicht gut darin Daten zu speichern

Es gibt zwar Workarounds und APIs, mit denen sich auch größere Datenmengen in Browsern speichern lassen, aber das Ganze stößt immer wieder auf Probleme. Je nach Browser und verfügbarem Speicherplatz kann dieser gerne mal unter 1 GB oder sogar noch geringer sein (z. B. auf mobilen Geräten). Somit entsteht eine weitere Fehlerquelle.

4. Geschwindigkeit/Handling

Es wäre schön wenn man direkt mit dem finalen Schnitt beginnen kann und nicht erst auf alle Backup-Aufnahmen warten muss.

Hinterbandkontrolle

Wenn also alles klappt, gehören diese Probleme mit dem magischen Double-Ender dann der Vergangenheit an :partying_face:.So lässt sich z.B. direkt während der Aufzeichnung in die finale Mehrspuraufnahme (mit ~5-10 Sekunden Latenz) hineinhören. Dadurch lässt sich direkt entscheiden ob die Probleme gravierend sind und analysiert werden sollten oder ob man beruhigt weitermachen kann. Quasi eine echte Hinterbandkontrolle.

Man kann also direkt selbst reinhören. Alternativ könnte auch ein Livestream angeboten werden, bei dem der Mix bereits repariert ist. Eine zweite Person oder das Publikum können dann direkt Feedback aus der Ferne geben.

Und wie funktioniert das dann?

Anders als beim klassischen Double-Ender wo die Aufnahme lokal erfolgt und die Übertragung im Nachgang oder Hintergrund stattfindet, werden direkt die defekten Audioteile (Paketverluste) noch einmal übertragen. Daher läuft im Hintergrund eine parallele Aufnahme mit 5-10 Sekunden Versatz die genug Zeit hat alle Netzwerkprobleme auszugleichen. Das wird nach meinen Tests auch schon sehr gut von Browsern nativ unterstützt.

Hat das Nachteile?

Neben den genannten Vorteilen und Problemen die das ganze löst, gibt es natürlich den Nachteil das es nur „eine“ Aufnahme Qualität gibt. Das ist bei Audio aber kein großes Problem da eh schon mit einer sehr guten Qualität (Opus 64kbit/s) für Sprache übertragen wird.

Ggf. werde ich für Video noch einmal eine lokale Aufnahmefunktion implementieren, da es hier aufgrund von Brandbreitenbeschränkungen (CPU, Codec etc.) eher zu sichtbaren Qualitätsunterschieden kommen kann. Im Moment liegt der Fokus hier aber eher auf Audio.


Ultraschall, Standalone und iOS/Android Apps

Aktuell sind die Mix Rooms ein Zwischenschritt um die Entwicklung voranzutreiben und auch für mich die Möglichkeit das Thema Video anzugehen. Der nächste große Schritt ist also beide Universen wieder zu vereinen. Und das ist kein kleiner Schritt, daher wird dieser Punkt auch noch etwas dauern.

Fediverse/Mastodon/ActivityPub

Auch hier möchte ich den Funktionsumfang deutlich erweitern. z.B. wäre es schön einem „Mix Room“ folgen zu können und Benachrichtungen zu bekommen (in beide Richtungen). Auch sollte das Login Feature um eine Art Authentifizierung erweitert werden.

Userinterface und mehrere Quellen

Neben neuen Funktionen, werde ich auch dem Userinterface noch einmal einen größeren Feinschliff verpassen. Ich denke hier lässt sich noch einiges optimieren und vor allem soll auch das Handling von mehreren Audio- und Videoquellen besser werden (z.B. parallel Kamera und Screensharing).

Podstock 2025

Da wir zum ersten Mal richtig viele Räume zur Verfügung haben, wird der Fokus von diesem Podstock stark auf Workshops liegen. Ich hoffe, dass ich vor Ort genug Zeit haben werde, um selbst Workshops anzubieten und dann auch schon einiges mehr zeigen kann.

U.a. fahren wir ja die Video Aufnahmen vom Podstock mit einer modifizierten Mix Room Version. An der Stelle wird es dann auch wieder einige Neuerungen und Verbesserungen geben.

Danke!

Ich habe noch viele weitere Ideen, deren Umsetzung ohne die bisherige finanzielle Unterstützung gar nicht möglich gewesen wäre. Daher möchte ich zum Schluss noch einmal Danke sagen! Über Feedback freue ich mich natürlich auch weiterhin.

Vielen Dank für die ausführliche Erklärung. Auch wenn ich ein halbwegs alter Hase bin, bin ich gar nicht so sicher ob ich das alles so richtig verstanden habe (und bisher ist Video für mich an der Stelle auch gar nicht so relevant, bei aufwändigen Produktionen ist man eher bei OBS unterwegs mit dem Rattenschwanz an Problemen, die man dort hat).
Das mit der Hinterband-Kontrolle ist sicherlich irgendwie ganz gut, aber ist während der Sendung (ich denke an mein Setup mit Ultraschall, selbst hosten und gleichzeitig die Technik kontrollieren müssen) eigentlich kaum möglich, vor allem mit so viel Versatz.

Da könnte man vielleicht mal umschalten, wenn jemand anders 2 Minuten redet und man nicht aktiv zuhören muss und sich einen kurzen Eindruck verschaffen, ob alles halbwegs in Ordnung ist – oder eben nur beim Sound Check aber dann nicht im Rest der Sendung. Ich bin halt Host und Mixer in Personalunion und das wird sicherlich vielen so gehen.

Der übliche Weg, den du auch beschrieben hast bei Riverside und Co. ist ja: ohne dass die User etwas drücken müssen (denn sie vergessen das oft, auch wenn man sie drauf hinweist, oder nach einem Verbindungs-Abbruch!!!) wird immer bei allen automatisch auch lokal aufgenommen und automatisch nach Abschluss der Sendung sofort hochgeladen. Das löst noch nicht das Synchronisations Problem, aber eine gute Spur zu haben, ist für mich alle Mal das Wichtigste.

Ich merke ja erst während der Sendung, wenn andere ihre Sound-Probleme haben aber automatischer Sync wäre natürlich zauberhaft.

Andere Probleme, die du vielleicht schon gelöst hast: StudioLink Stand Alone verlangt jedes Mal ein Einstellen der Soundkarte und so weiter, es gibt keine Preferences, die gespeichert werden. Gerade mit Anfängern oder einmaligen Gästen ein Dauerproblem, denn egal, was man gestern vielleicht in der Testrunde getestet und eingestellt hat, ist heute obsolet.

Außerdem: wenn Leute beim Host anrufen, klingelt es nicht. Man hat den ganzen Bildschirm voller Programme, man kriegt nie mit, wenn jemand rausgeflogen ist und wieder anruft, die müssen immer über irgendeinen Chat-Kanal sich bemerkbar machen. Es macht richtig viel Sinn, dass ein Telefon klingelt, wenn jemand anruft. :nerd_face:

Das wäre perspektivisch etwas, was für Ultraschall hilfreich wäre. Sprich, irgendwie herausbekommen, ob die Verbindung abgerissen ist und dann im Soundcheck von Ultraschall warnen, dass grad was schief läuft.
Da müssen wir mal überlegen, wie wir das stemmen können.

Ansonsten bin ich gespannt.

ja das probem des bemerkbar machen ist wirklich so ein problem wenn die verbinung unterbrochen ist ich bekomme das selten mit nur im internen chat sehe ich das aber wenn ein gast web ist macht der sich dann ander bemerkbar.

auch ist es blöd das die verbindung bei mir dann noch aktiv ist und es dann eine neue verbindung gibt wenn der rausgeflogende anruft es gibt aber dann keinen platz mehr so das ich zu erst die alte verbindung manuel beenden muss um dann den gast wider reinzuholen.

In einer der conf Dateien kann man einstellen dass Anrufe automatisch angenommen werden, so haben es vereinzelt Leute gelöst.

Guter Tipp, in meinem Fall: zu viele Leute haben diese Nummer, die Trolls würde ich mir sparen wollen. :stuck_out_tongue_winking_eye:

Ich bleibe dabei: ein Telefon sollte klingeln (alternativ eine verlässliche, nicht zu übersehende Notification werfen), wenn jemand anruft. Ist ja bei jeglicher anderer Software auch so.

Die Herausforderung ist dabei, dass es weder in der Aufnahme oder im Stream zu hören ist. Und das ist zumindest für Ultraschall gar nicht so trivial zu lösen. Aber mal schauen was sich da noch machen lässt. Wenn Browser Notifications erlaubt sind, sollte es auch schon eine Benachrichtigung geben.

Die sind während der Aufnahme stumm, weil man sowieso auf DND ist. Schwierig. Das ist wahrscheinlich der Nachteil, weil alles im Browser läuft statt als eigene App, die einen eigenen Tonkanal aufmachen könnte? Geht sowas nicht auch im Browser als zweite Entität/Thread/Popup/you name it?

Du könntest für StudioLink einen Browser verwenden, in dem sonst nichts läuft und den dann hier freigeben.


Oder time sensitive Benachrichtigungen erlauben, falls die von Studio Link solche sind.

Wenn das eine zuverlässige Double-Ender-Lösung wird, die auch mit Mobilgeräten funktioniert, wäre ich hellauf begeistert. Direkt reinhören zu können, ist auch super - allein, damit um herauszufinden, ob bspw. ein Knacksen an meinem oder am anderen Ende entsteht.

Ob das mit der Magie so klappt, kann ich nicht beurteilen, aber habe natürlich vollstes Vertrauen, dass das lösbar ist. Eine einfachere Lösung wäre aber vielleicht, dass Aufnahmen hochgeladen werden, bevor sie zu groß werden und dann einfach ein neues File angelegt wird. Vielleicht könnte sogar auch der/die Host einen Knopf bekommen, um das manuell auszulösen und dann kurz in die Aufnahme reinhören zu können.

Das klingt fantastisch, was du da alles entwickelst, @sreimers! Ich freue mich drauf, wie es weitergeht!

Neben der Tonqualität ist mein größtes Problem bei den Mix Rooms bisher ja, dass ich keine Einspieler abspielen kann. Das sorgt immer für einen Kaltstart, wenn man ohne Intro beginnen muss. Auch während einer Sendung würde ich für gewöhnlich gerne manchmal Jingles nutzen. Kennt jemand dafür schon einen Workaround? Einloggen per Zweitgerät und dort die Töne abspielen?

Ansonsten klingt es hier ja so, dass mittelfristig auch wieder die Verbindung zu Ultraschall ermöglicht wird, wo ich dann das übliche Soundboard nutzen kann. Ich bleibe gespannt!

andere Nummer einrichten und ansonsten gehen auch nur so viel Anrufe durch wie eingerichtete und „freie“ Studio-Link Spuren angelegt sind :man_shrugging:t2:

Ich mach doch nicht ständig neue IDs, die hab ich ja so aus einem Grund und alle kennen die, die sie kennen sollen. Dann muss man nichts mehr erklären. Man kennt das aus bekannten Zoom-Räumen, wo dann doch immer mal wieder jemand zur falschen Zeit reinstolpert.

Ja, das mit den Spuren ist gut, aber … es sollte einfach klingeln, finde ich. :slightly_smiling_face: Ich hätte schon gern die Kontrolle. Würde man beim Telefon ja auch nicht auf Auto-Accept stellen.

wieso ständig neue IDs? Mach einfach eine neue, die gibts du nur an deine Podcast Gäste/Co-Hosts raus, wer trollt kriegt aufs Maul*, ganz einfach. Und wie gesagt: wenn du nicht drölftausend offene Studio-Link Spuren hast, sondern nur so viele wie du Mit-Podcaster hast, kann auch keiner absichtlich oder versehentlich anrufen.

*Hast du so toxische Menschen in deiner Bubble die diese StudioLink ID haben? Zu denen würde ich den Kontakt abbrechen.