Descript - Audio wie Text bearbeiten

Der Gründer von Groupon hat ein Tool entwickelt, mit dem man Audiofiles transkribieren und dann durch Editieren des Textes schneiden kann.

6 „Gefällt mir“

Hat das schon jemand ausprobiert? 15 cent die minute ohne editing features, und subscription mit minutenpreis (7 ct) für editing features sind ganz schön happig zum ausprobieren und schneiden von podcasts. Und geht dann alles übers Internet auf einen privaten Server zur Analyse?

Ich mag die Idee allerdings, das würde die Produktion von einigen Sachen doch vereinfachen. Ich freue mich auf die Zeit, wo solche Features on Device funktionieren und nicht per subscription bezahlt werden müssen.

Es ist ein sehr spannender Ansatz, aber nicht so neu wie sie tun. Im Enterprise-Audio Bereich hab ich das schon ein paar mal gesehen.
Die Speech-To-Text Technologie kommt laut Webseite von Google, bei fast allen Anbietern, die ich kenne (z.B. getAudiograom) ist da eine Drittpartei (google, wit.ai, speechmatics,…) dahinter (die natürlich auch Geld haben will). So schnell wirst du das denke ich nicht als Standalone bekommen, da steckt doch ne Menge cloud computing und KI dahinter.
Bei einem Sprecher erwarte ich eine massive Effizienzsteigerung, die Frage ist, wie sich sowas bei 2 oder mehr Sprechern schlagen wird.

1 „Gefällt mir“

Hi. Ich hab am Beta-Test teilgenommen und war nur so mittelglücklich. Aber die jetzt gelaunchte Version habe ich noch nicht getestet. Kann sein, dass die jetzt smooth läuft und alles revolutioniert. Spannend finde ich vor allem, dass man textbasiert schneiden und diesen Rohschnitt dann nach Reaper exportieren kann. Das ist allerdings ein Premium-Feature.
http://help.descript.com/exporting/exporting-a-session

Wer einen Werbelink mit 100 Transkriptions-Freiminuten haben will, kann mir gerne eine DM schicken. Allerdings ist die Transkription bisher nur für englischsprachiges Material verfügbar.

1 „Gefällt mir“

Hier noch ein ganz interessanter Artikel, wie die BBC Speech-to-Text einsetzt.

3 „Gefällt mir“

Super spannend, danke!

Descript bietet jetzt nicht nur wie bisher das einfache Schneiden von Audio durch Löschen/Bewegen von Transkript-Text, sondern lässt sogar Editieren des Textes zu und erzeugt das passende Audio-Schnipsel dann per Machine Learning. Mehr Details: https://www.theverge.com/2019/9/18/20871613/descript-podcast-studio-launch-editor-overdub-ai-features-pricing-release-date

Ziemlich beeindruckend – aber so spannend ich es technologisch finde, so wenig reizvoll ist der Gedanke, dass das alles nur als Service verfügbar ist. (Kann man zwar letztlich auch von Auphonic sagen, aber da gibt’s zumindest auch die Offline-Variante und es fühlt sich einfach anders an, während Descript für mich wie jedes andere US-Startup wirkt, das jederzeit keine Lust oder kein Geld mehr haben könnte.)

Also quasi Text, den ich nie gesagt habe sondern nur geschrieben?

Gruselig und gleichzeitig auch spannend, gerade auch, ob Betonung und solche Sachen berücksichtigt werden.

So hab ich es auf jeden Fall verstanden, genau. Ich denke, dass das momentan nur für kleine Verbesserungen taugt – also wie im Beispiel-Screenshot, man hat 20 gesagt, obwohl 30 korrekt ist und bessert das kurz aus. Ich denke mal, dass selbst wenn sich das ein klein wenig komisch anhören sollte, die meisten Hörer das entweder gar nicht merken oder auf andere Gründe (kurze Audio-Glitches beim Abspielen/Hören sind ja normal) schieben.

1 „Gefällt mir“

Hmm…das hat Potenzial für eine Teenagersexbeichtefolge… @Malik

1 „Gefällt mir“

Kaum fünf Jahre später kann Descript auch schon mit deutschsprachigem Audio umgehen.

Ich habe in der Zwischenzeit bei englischsprachigen Projekten ganz gute Erfahrungen mit der Software gemacht. Sie eignet sich um O-Ton-Sammlungen oder einen Rohschnitt zu erstellen. Außerdem arbeite ich öfter mit Podcaster*innen, die keine Lust haben, eine DAW zu bedienen. Die können dann in Descript textbasiert schneiden und ich mache danach für sie den Feinschliff in Reaper.

Es soll Leute geben, die ihre Podcasts komplett in Descript produzieren (man kann darin auch Mehrspur-Aufnahmen machen), aber dafür ist es mir dann doch zu hakelig.

2 „Gefällt mir“

Hallo,
ich bin gerade (10.03.2022) auf dem Enterprise Podcast Summit und habe mir die Demo von Descript angeschaut und bin ziemlich überrascht was das Tool kann (und auch was nicht z.B. MIDI)

Das ist schon ziemlich gut geworden …

Die benutzen übrigens die rev.ai API für Speach to Text.

Grüße

Gero

1 „Gefällt mir“

Nachdem sie inzwischen seit ein paar Wochen auch Deutsch können hab ich das jetzt auch mal mit vier Aufnahmen getestet:

Also ist schon krass wie gut sie da Auphonic/Reaper/Cleanvoice/Transkription in eine doch echt einfach zu bedienende App bringen mit der eigentlich jeder in den Audio- (und Video)schnitt rein kommt. Viele Features gehen leider nur in Englisch (Custom Wörterbuch, ähm Erkennung, …) und auch die Sprach/Worterkennung in Deutsch braucht noch einiges an Trainingsdaten bis das so gut ist wie in Englisch. Da ist Trint in Deutsch aktuell schon wesentlich weiter, wobei beide Tools auch den Projekt-Export zu Reaper können.

Die $12 bzw. $15 pro Editor (die zusätzlichen Viewer kosten nichts extra) würde ich mir als Hobby Projekt nur leisten wenn man regelmäßig Produziert und sich den Editorzugang als Funktionsaccount mit mehreren Leuten teilt. Ist aber vielleicht auch nen Weg das der Schnitt bicht immer bei der gleichen Person hängen bleibt.

Wenn ich euch das mehr interessiert kann ich bei Bedarf gerne mal ne Edit Session aufzeichnen und als Video hochladen… gebt einfach Bescheid…

Ich teile regelmäßig Projekte mit Leuten, die einen kostenlosen Account haben. Ich lege also das Projekt an, starte die Transkription und teile es dann, damit sie drin rumschneiden können. Meine Login-Daten muss ich dafür nicht teilen.

Man sollte Unerfahrenen aber auf jeden Fall mitgeben, nicht zu viel zu schneiden. Descript verleitet dazu, Schnitte zu machen, die akustisch einfach nicht gehen. Ähs schneide ich auch lieber per Hand in Reaper raus, weil die Schnitte oft unsauber sind und es viel Zeit kostet, jeden Schnitt nochmal anzufassen.

Tipp, um viele unsaubere Descript-Schnitte zu polieren: In Reaper alles markieren > Item properties > Fade in und Fade out auf 0:00.010 setzen.

1 „Gefällt mir“

Tatsächlich hätten sie da ja auch ne Automatik dafür, aber eben nur für Englisch… die Schnitte bzw. Schnittvorschläge die Cleanvoice da macht, kann man dagegen eigentlich direkt 1:1 umsetzen… Ich rechne damit das sie das mit der Zeit (und mehr Trainingsdaten) auch hinbekommen werden…