Füllwörter Entferner Tool - Suche Feedback

Hallo PodcasterInnen,

Ich habe ein Tool entwickelt, das Füllwörter und Stottern eliminiert.

https://cleanvoice.ai

Ich bin auf der Suche nach Leuten, die es testen können. (Vor allem mit Leuten, die in einem Dialekt sprechen: z.B. Bayerisch)

Die ersten 30 Minuten sind kostenlos, aber ich verschenke euch klarerweise mehr Guthaben fürs testen. Schreibt Ihr mir einfach und ich füge es euer Konto hinzu.

Bzgl Feedback, ich möchte wissen:

  • Hat cleanvoice Ihre Bearbeitungszeit verkürzt?
  • Welche Probleme sind Ihnen dabei aufgefallen?

Vielen Dank!

6 „Gefällt mir“

Moin. Ich höre die Arbeit des Tools schon seit einer Weile bei Podland und bin davon in der Regel einigermaßen beeindruckt. Jetzt habe ich es heute einmal selbst ausprobiert und hier sind die ersten Eindrücke:

  1. Es geht wahnsinnig schnell, in dem Tempo kann kein Mensch Audio sauber nachbearbeiten.
  2. Das kommt aber mit der Einschränkung, dass Cleanvoice manchmal mehr Schnitte setzt, als notwendig und dabei Wortbestandteile verloren gehen. Das fällt bei Podland schon auf und ich war gespannt, wie das in meinem Test laufen würde. Hier mal das Ergebnis: Zwei Takes aus meiner neuesten Episode immer erst das Original und dann das Cleanvoice-Ergebnis:

Der erste Take klappt super, da sind die ähs klar vom Rest getrennt, Cleanvoice hat hier leichtes Spiel. Bei Take zwei wird es knifflig: Leicht verstotterter Einstieg in den Satz und da ist auch noch ein äh mit drin. Der Mensch lässt sowas stehen, Cleanvoice nimmt es komplett weg und der Satzanfang wird unverständlich.

Und es wirkt etwas übereifrig, bei 0’38’’ hören wir, dass die erste Silbe von „erwähnen“ verschwunden ist und die zweite Silbe stark gekürzt wurde, bei 0’42’’ wird aus „geschenkt“ „schenkt“.

Das sind natürlich Kleinigkeiten, grundsätzlich bin ich ziemlich beeindruckt von dem Tool und ich denke, dass gerade Podcaster*innen, die sich mit dem Schnitt ihres Materials schwer tun (oder insgesamt keine Lust auf Audioschnitt haben) damit ein gutes Tool an die Hand bekommen. Für meine eigenen Produktionen würde ich wohl eher nicht darauf setzen. Dafür habe ich zu viel Spaß daran, selbst am Schnitt herumzufrickeln. :slight_smile: Was ich jetzt noch spaßhalber ausprobieren möchte, ist der Export der Schnittmarken bzw. deren Import in Reaper. So könnte ich „strittige“ Stellen mutmaßlich selbst korrigieren. Spannend ist dabei die Frage, wie sich das auf die Bearbeitungszeit auswirkt. Wie lange ich also ohne Cleanvoice bis zu einem zufriedenstellendem Ergebnis brauche vs. wie lange es dauert, den Cleanvoice-Schnitt punktuell zu korrigieren.

Zum Schluss noch ein kleiner Vergleich der Rohdaten: Das ungeschnittene File hatte eine Länge von knapp 20 min, hochgeladen habe ich meinen Schnitt mit einer Länge von 16 Minuten, aus dem ich Pausen, Versprecher, neu angefangene Sätze und einige ähms rausgeschnitten habe. Cleanvoice hat am Ende noch einmal knapp 90 Sekunden rausgeschnitten.

5 „Gefällt mir“

Wow! Danke für das Feedback!

Und es wirkt etwas übereifrig, bei 0’38’’ hören wir, dass die erste Silbe von „erwähnen“ verschwunden ist und die zweite Silbe stark gekürzt wurde, bei 0’42’’ wird aus „geschenkt“ „schenkt“.

Interessant, Ich werde mich mit dem Problem befassen. Sowas wie geschekt → schenkt sollte nicht passieren. Danke für die Audio Sample!

Was ich jetzt noch spaßhalber ausprobieren möchte, ist der Export der Schnittmarken bzw. deren Import in Reaper.

Nach der Bearbeitung kannst du entweder exportieren, wo die Bearbeitungen passiert sind, oder selbst bearbeiten und dir die Regionen markieren lassen (und selber entscheiden wie/was du schneidest)

Wenn Du möchtest, schicke ich Dir die beiden kompletten Files zum direkten Vergleich. Schreib mir gern eine DM, wo ich die abladen kann.

Ich weiß nur noch nicht, wie ich die CSV-Dateien in Reaper importieren kann. :thinking:

Du muss den Region/Marker Manager aufmachen.
View → Region/Marker Manager oder STRG+ALT+SHIFT+R

Dort rechts-click und dann import markers

Screenshot from 2021-08-27 14-59-29

Wenn du sehen willst, welche Bearbeitungen vorgenommen wurden, dann kannst du die Marker von Cleanvoice exportieren. Anhand der Marker kannst du herausfinden, wo die Bearbeitungen auf dem gereinigten Audiofile vorgenommen wurden. (Wird nicht gesagt was und wie viel, nur die Stelle)

Wenn du es selbst bearbeiten willst, kannst du stattdessen die Timestamps herunterladen.
Gleiche Prinzip, allerdings du musst die Raw-Audio im Reaper laden.

3 „Gefällt mir“

Ich wollte das den Sommer über gerne ausprobieren.

Weil ich ich bin, wollte ich es direkt mit 90 Minuten Mehrspurinterview ausprobieren. Die übliche Reaper Aufzeichnung, also 3 FLAC Dateien. Damit es spannend bleibt, war ich mobil unterwegs.

Upload über den Webbrowser. Hmm ja. Für große Dateien so lala. Oh. Nur WAV und MO3 geht. WAV ist mir zu groß, also MP3 Transcoden. Nach drei oder vier Upload versuchen hab ich es dann dran gegeben. Es gab immer eine nichtssagende Fehlermeldung. Hat der Upload nicht geklappt? Waren die Dateien zu groß? Stimmte sonst fast nicht? Keine ahnung.

Ich werde das bei Gelegenheit sicher noch mal ausprobieren, aber bisher hat es für mich gar nicht geklappt. Meine Vision wäre ein HTTP API. Und da Bastel ich mir ein Skript, dass vor dem Rohschnitt die Dateien aus Viper hoch lädt, und das Ergebnis wieder runterlädt.

Aber der mag ich nicht typisch sein.

Weil ich ich bin, wollte ich es direkt mit 90 Minuten Mehrspurinterview ausprobieren. Die übliche Reaper Aufzeichnung, also 3 FLAC Dateien. Damit es spannend bleibt, war ich mobil unterwegs.

In ca 1-2 Wochen sollte die FLAC support geben.

Nach drei oder vier Upload versuchen hab ich es dann dran gegeben. Es gab immer eine nichtssagende Fehlermeldung. Hat der Upload nicht geklappt? Waren die Dateien zu groß? Stimmte sonst fast nicht? Keine ahnung.

Echt Komisch, normalerweise gibt er eine Fehlermeldung. Hast du ein 90 min Datei hochgeladen? Dann wahrscheinlich ist das der Grund. Schreib mir ein PN mit deinem Konto Username, ich werde dir dann ein paar Stunden Guthaben auf dein Konto legen.

Ich werde das bei Gelegenheit sicher noch mal ausprobieren, aber bisher hat es für mich gar nicht geklappt. Meine Vision wäre ein HTTP API. Und da Bastel ich mir ein Skript, dass vor dem Rohschnitt die Dateien aus Viper hoch lädt, und das Ergebnis wieder runterlädt

API Support in ein paar Wochen, solle ich dich im Laufen halten?

3 „Gefällt mir“

Ich habe das heute mal ausprobiert und aus Reaper 2 Spuren einfach als mp3 exportiert.
Die aktuelle Aufnahme ist extrem „ehm“-Lastig. Mir graust schon ein paar Tagen vor dem Schnitt.
Die ersten 30 Minuten haben 130 „Filler-Sounds“. Das ist meist ein „ehm“.

Ich mag schon noch selbst bearbeiten, deshalb interessiere ich mich für die Timestamps.

Das erzeugte MP3 entspricht nicht so sehr meinem Geschmack, weil:

Ich finde, man hört die Schnitte: Bei einem uuuundeeehmmm ist das einfach nicht zu schneiden. Das wirkt einfach nicht. Und manchmal braucht es ein ehm und ähnliches, damit die Atmosphäre nicht verloren geht. Genauso wie Pausen etc.
Von 29 Minuten werden gut 2 Minuten bei dem Test heute entfernt.

Insgesamt ist mir das Ergebnis zu Aggressiv und gerade bei einem Interview wirkt das hinterher gehetzt.

Aber, die Timestamps in Ultraschall zu importieren ist großartig. Ich sehe sehr schnell, wo und was ist und kann ggf. eine die Region per Klick entfernen. Das geht sehr schön und schnell.
Allerdings scheinen die Regions nur das Problem und nicht den Schnitt zu markieren.
Pause Pause EHM Pause Pause wird dann einfach zu 4x Pause, wenn ich das so entferne. Ich würde mir wünschen, dass die Regions das schon mit reinrechnen.

Zeit sparen wird das definitiv und für Folgen wie die heute werde ich das sicher wieder verwenden. Das Abomodell passt leider nicht zu meiner Art der Nutzung. Wenn ich alle 2-3 Monate mal eine Folge damit bearbeite, lohnt das sonst nicht.
10 Stunden für 20 Euro wären sicherlich ok.
Was dringend fehlt: Import via FLAC.

Insgesamt ist cleanvoice und spannendes Tool. Damit lässt sich etwas anfangen und ich würde das sicher verwenden.

Das Zusammenspiel mit Ultraschall wirft aber noch Fragen auf. Vielleicht mögen @Mespotine oder @rstockm etwas helfen:
Mit den Regions komme ich nicht ganz klar:
image

Doppelklick startet aber die Aufnahme statt zu markieren. Cool wäre, wenn Doppelklick (und danach STRG+X) ginge, um die rauszuschneiden.
Ich konnte in den Actions aber nichts passendes finden, um das Verhalten zu ändern.
Noch cooler wäre es, wenn ich eine Region einfach deaktivieren könnte. Die wäre dann aus der Aufnahme raus, aber ich könnte die jederzeit wieder „sichtbar“ machen. Also kein Schnitt.
Ich schätze, das ist in Ultraschall möglich und dann würde ich tatsächlich so arbeiten:

  1. Regions importieren
  2. Alle Regions „muten“ also ausblenden
  3. Durchhören und wenn mir etwas auffällt, einfach die Region unmuten / einblenden und die Stelle somit unbearbeitet lassen

DAS würde meinen Workflow bei Folgen wie der von heute unfassbar beschleunigen. Aber ob und wie das geht… Keine Ahnung.

Spannendes tool - könnte meinen workflow sehr erleichtern.

habe es gerade mal probiert und reaper will die bearbeitete Datei nicht importieren - ich checke es mal mit den Marken - würde die Postproduktion schon verbessern wenn ich schon sehe wo ich schneiden muss.

bin gespannt

Danke @SebastianStix für dein Feedback!

Ich finde, man hört die Schnitte: Bei einem uuuundeeehmmm ist das einfach nicht zu schneiden. Das wirkt einfach nicht. Und manchmal braucht es ein ehm und ähnliches, damit die Atmosphäre nicht verloren geht. Genauso wie Pausen etc.

Leider solche Probleme kann ich derzeit nicht lösen.

Kann ich nachvollziehen. Werde ich mal schauen.

Was dringend fehlt: Import via FLAC.
@mdornseif
Ab heute, gibts FLAC support.

habe es gerade mal probiert und reaper will die bearbeitete Datei nicht importieren

@Georg kannst du mir die Datei mir senden (entweder PN oder support@cleanvoice.ai), ich kann dich mal dabei helfen mit dem Import.

1 „Gefällt mir“

@cleanvoice Könntet ihr nicht auch noch nen Samplitude EDL File als Export mit anbieten? Christian Alt hatte neulich bei uns im Meetup erwähnt, das man mit dieses Edit-Decision-Lists direkt die Schnitte in Reaper importieren kann, ohne das man sie nochmal von Hand aus den Regions ableiten muss.

Hallo Andi,
Ich bin mir nicht sicher, was der Unterschied zwischen Samplitude EDL und normales EDL ist, aber ich könnte auf jeden Fall EDL Support implementieren. Ich werde nächste Woche recherchieren, wie so ein File aussieht.

Das Skript hat der liebe Thomas Reintjes programmiert: https://github.com/tomtjes/DAW-converters
Ich arbeite viel mit Reaper, die EDLs, die von Trint kommen, sind aber nicht im Samplitude-Format, das Reaper lesen kann. Der EDL-to-Samplitude-Converter von Thomas löst das Problem. Könnte ich programmieren, würd ich daraus ein Skript für Reaper machen :smiley:

Ich hab das Tool mal mit einer meiner Folgen ausprobiert. Leider nimmt es mir nicht wirklich viel Arbeit ab. Füllwörter gebrauche ich kaum. Ich hatte gehofft, dass das Tool erkennt, wenn ich mich verspreche und einen Satz wiederhole und es dann einfach die letzte Variante nutzt, die fehlerfrei ist. Wenn das funktioniert, dann würde ich sofort zuschlagen.
Mir ist noch aufgefallen, dass immer noch Worte abgeschnitten werden. Bei mir konnten das Satzanfänge sein, wo einfach das erste Wort fehlte. Oder auch Endungen von Worten wurden teilweise wegeditiert.
Ich denke das Tool hat enorm viel Potenzial. In der jetzigen Form werde ich es aber erstmal nicht nutzen.

Also mir hat es sehr geholfen, ich verwende nicht die automatische Entfernung sondern füge die Marker in die Software ein und entferne es manuell. So kann ich dann manche Füllworte noch stehen lassen die sonst noch mehr kaputtgeschnitten hätten.

Was ich noch etwas vermisse, sind tiefe Einatmer, also wenn die Luft beim einatmen ein lauteres zischendes Geräusch erzeugt. Das wird nicht als „Mundgeräusch“ erkannt.
Mit einem Deesser ist das auch nicht immer sauber, so dass ich das häufig manuell diese „Fische“ platt mache oder ganz kille…
Wäre mega wenn es sowas auch noch erkennen könnte.