Nach dem gestrigen Release möchte ich, wie angekündigt, ein wenig verraten, was noch auf meiner To-do-Liste steht und hoffentlich in den nächsten Monaten veröffentlicht werden kann.
„Magischer Double-Ender“ - Arbeitstitel
TL;DR
Ein intelligenterer Ansatz zur parallelen und verlustfreien Double-Ender Aufnahme mit folgenden Funktionen:
- Automatische Synchronisation der Spuren
- Netzwerkprobleme werden automatisch ausgeglichen
- Hinterbandkontrolle: direkt in die finale Aufnahme reinhören (Latenz 5-10 Sekunden)
- Fokus auf Audioqualität, später evtl. auch lokale Videoaufzeichnung
Damit Studio Link - Mix Rooms die Betaphase verlassen kann, fehlt u.a. noch ein sehr wichtiges Feature, der „Double-Ender”. Einige Maßnahmen greifen bereits jetzt, um schlechte Verbindungen besser zu optimieren. Aber bei einer Live-Verbindung spielt jedoch auch die Latenz eine wichtige Rolle und ohne diese zu erhöhen lassen sich nicht immer alle Probleme (z.B. Paketverluste etc.) direkt ausbügeln.
Darauf liegt aktuell der Fokus und die bessere Integration in das bestehende Ökosystem (Ultraschall etc.). Und natürlich hilft es auch das der Mix Room Server selbst eine gute Netzwerkanbindung schon hat. Aber das verhindert natürlich nicht das auf der Gegenseite oder irgendwo dazwischen weiterhin Probleme auftreten.
Aber ich möchte nicht nur einfach einen Double-Ender implementieren, sondern das ganze soll auch die Probleme die sich damit ergeben ebenfalls angehen.
Welche Probleme ergeben sich bei einer klassischen parallelen Aufnahme auf zwei oder mehreren Seiten?
1. Qualität ungewiss
Ich bezeichne das gerne auch als „Schrödingers Double-Ender“. Erst wenn man reinhört weiß man welche Qualität wirklich zu erwarten ist. Nicht selten liegen die Probleme die auch während der Aufnahme schon zu hören sind, gar nicht an der Internetverbindung sondern schon viel früher. z.B. falsche Samplerate, lokale Audio/Treiber Probleme, falsches Mikrofon etc. Das lässt sich häufig schwer auseinanderhalten und wenn dann die hoffnungsvoll erwartete bessere lokale Aufnahme ankommt und genauso mies klingt, ist der Frust groß.
Wäre es nicht schöner vorher zu ermitteln wo die Probleme liegen und wie sich die finale
Aufnahme wirklich anhören wird?
2. Synchronisation
Alle die schon mal versucht haben mehr als eine Remote Spur zu schneiden, wissen wie aufwendig das ganze werden kann.
3. Browser sind nicht gut darin Daten zu speichern
Es gibt zwar Workarounds und APIs, mit denen sich auch größere Datenmengen in Browsern speichern lassen, aber das Ganze stößt immer wieder auf Probleme. Je nach Browser und verfügbarem Speicherplatz kann dieser gerne mal unter 1 GB oder sogar noch geringer sein (z. B. auf mobilen Geräten). Somit entsteht eine weitere Fehlerquelle.
4. Geschwindigkeit/Handling
Es wäre schön wenn man direkt mit dem finalen Schnitt beginnen kann und nicht erst auf alle Backup-Aufnahmen warten muss.
Hinterbandkontrolle
Wenn also alles klappt, gehören diese Probleme mit dem magischen Double-Ender dann der Vergangenheit an
.So lässt sich z.B. direkt während der Aufzeichnung in die finale Mehrspuraufnahme (mit ~5-10 Sekunden Latenz) hineinhören. Dadurch lässt sich direkt entscheiden ob die Probleme gravierend sind und analysiert werden sollten oder ob man beruhigt weitermachen kann. Quasi eine echte Hinterbandkontrolle.
Man kann also direkt selbst reinhören. Alternativ könnte auch ein Livestream angeboten werden, bei dem der Mix bereits repariert ist. Eine zweite Person oder das Publikum können dann direkt Feedback aus der Ferne geben.
Und wie funktioniert das dann?
Anders als beim klassischen Double-Ender wo die Aufnahme lokal erfolgt und die Übertragung im Nachgang oder Hintergrund stattfindet, werden direkt die defekten Audioteile (Paketverluste) noch einmal übertragen. Daher läuft im Hintergrund eine parallele Aufnahme mit 5-10 Sekunden Versatz die genug Zeit hat alle Netzwerkprobleme auszugleichen. Das wird nach meinen Tests auch schon sehr gut von Browsern nativ unterstützt.
Hat das Nachteile?
Neben den genannten Vorteilen und Problemen die das ganze löst, gibt es natürlich den Nachteil das es nur „eine“ Aufnahme Qualität gibt. Das ist bei Audio aber kein großes Problem da eh schon mit einer sehr guten Qualität (Opus 64kbit/s) für Sprache übertragen wird.
Ggf. werde ich für Video noch einmal eine lokale Aufnahmefunktion implementieren, da es hier aufgrund von Brandbreitenbeschränkungen (CPU, Codec etc.) eher zu sichtbaren Qualitätsunterschieden kommen kann. Im Moment liegt der Fokus hier aber eher auf Audio.
Ultraschall, Standalone und iOS/Android Apps
Aktuell sind die Mix Rooms ein Zwischenschritt um die Entwicklung voranzutreiben und auch für mich die Möglichkeit das Thema Video anzugehen. Der nächste große Schritt ist also beide Universen wieder zu vereinen. Und das ist kein kleiner Schritt, daher wird dieser Punkt auch noch etwas dauern.
Fediverse/Mastodon/ActivityPub
Auch hier möchte ich den Funktionsumfang deutlich erweitern. z.B. wäre es schön einem „Mix Room“ folgen zu können und Benachrichtungen zu bekommen (in beide Richtungen). Auch sollte das Login Feature um eine Art Authentifizierung erweitert werden.
Userinterface und mehrere Quellen
Neben neuen Funktionen, werde ich auch dem Userinterface noch einmal einen größeren Feinschliff verpassen. Ich denke hier lässt sich noch einiges optimieren und vor allem soll auch das Handling von mehreren Audio- und Videoquellen besser werden (z.B. parallel Kamera und Screensharing).
Podstock 2025
Da wir zum ersten Mal richtig viele Räume zur Verfügung haben, wird der Fokus von diesem Podstock stark auf Workshops liegen. Ich hoffe, dass ich vor Ort genug Zeit haben werde, um selbst Workshops anzubieten und dann auch schon einiges mehr zeigen kann.
U.a. fahren wir ja die Video Aufnahmen vom Podstock mit einer modifizierten Mix Room Version. An der Stelle wird es dann auch wieder einige Neuerungen und Verbesserungen geben.
Danke!
Ich habe noch viele weitere Ideen, deren Umsetzung ohne die bisherige finanzielle Unterstützung gar nicht möglich gewesen wäre. Daher möchte ich zum Schluss noch einmal Danke sagen! Über Feedback freue ich mich natürlich auch weiterhin.

