Descript - Audio wie Text bearbeiten

GNetzer · 12. Dezember 2017 um 21:28

Der Gründer von Groupon hat ein Tool entwickelt, mit dem man Audiofiles transkribieren und dann durch Editieren des Textes schneiden kann.

Joram · 14. Dezember 2017 um 07:36

Hat das schon jemand ausprobiert? 15 cent die minute ohne editing features, und subscription mit minutenpreis (7 ct) für editing features sind ganz schön happig zum ausprobieren und schneiden von podcasts. Und geht dann alles übers Internet auf einen privaten Server zur Analyse?

Ich mag die Idee allerdings, das würde die Produktion von einigen Sachen doch vereinfachen. Ich freue mich auf die Zeit, wo solche Features on Device funktionieren und nicht per subscription bezahlt werden müssen.

bertofprey · 14. Dezember 2017 um 13:19

Es ist ein sehr spannender Ansatz, aber nicht so neu wie sie tun. Im Enterprise-Audio Bereich hab ich das schon ein paar mal gesehen.
Die Speech-To-Text Technologie kommt laut Webseite von Google, bei fast allen Anbietern, die ich kenne (z.B. getAudiograom) ist da eine Drittpartei (google, wit.ai, speechmatics,…) dahinter (die natürlich auch Geld haben will). So schnell wirst du das denke ich nicht als Standalone bekommen, da steckt doch ne Menge cloud computing und KI dahinter.
Bei einem Sprecher erwarte ich eine massive Effizienzsteigerung, die Frage ist, wie sich sowas bei 2 oder mehr Sprechern schlagen wird.

tomtjes · 14. Dezember 2017 um 16:51

Hi. Ich hab am Beta-Test teilgenommen und war nur so mittelglücklich. Aber die jetzt gelaunchte Version habe ich noch nicht getestet. Kann sein, dass die jetzt smooth läuft und alles revolutioniert. Spannend finde ich vor allem, dass man textbasiert schneiden und diesen Rohschnitt dann nach Reaper exportieren kann. Das ist allerdings ein Premium-Feature.
http://help.descript.com/exporting/exporting-a-session

Wer einen Werbelink mit 100 Transkriptions-Freiminuten haben will, kann mir gerne eine DM schicken. Allerdings ist die Transkription bisher nur für englischsprachiges Material verfügbar.

bertofprey · 15. Dezember 2017 um 08:01

Hier noch ein ganz interessanter Artikel, wie die BBC Speech-to-Text einsetzt.

GNetzer · 15. Dezember 2017 um 08:15

Super spannend, danke!

Manu · 18. September 2019 um 22:23

Descript bietet jetzt nicht nur wie bisher das einfache Schneiden von Audio durch Löschen/Bewegen von Transkript-Text, sondern lässt sogar Editieren des Textes zu und erzeugt das passende Audio-Schnipsel dann per Machine Learning. Mehr Details: https://www.theverge.com/2019/9/18/20871613/descript-podcast-studio-launch-editor-overdub-ai-features-pricing-release-date

Ziemlich beeindruckend – aber so spannend ich es technologisch finde, so wenig reizvoll ist der Gedanke, dass das alles nur als Service verfügbar ist. (Kann man zwar letztlich auch von Auphonic sagen, aber da gibt’s zumindest auch die Offline-Variante und es fühlt sich einfach anders an, während Descript für mich wie jedes andere US-Startup wirkt, das jederzeit keine Lust oder kein Geld mehr haben könnte.)

Mespotine · 19. September 2019 um 16:10

Also quasi Text, den ich nie gesagt habe sondern nur geschrieben?

Gruselig und gleichzeitig auch spannend, gerade auch, ob Betonung und solche Sachen berücksichtigt werden.

Manu · 19. September 2019 um 16:17

So hab ich es auf jeden Fall verstanden, genau. Ich denke, dass das momentan nur für kleine Verbesserungen taugt – also wie im Beispiel-Screenshot, man hat 20 gesagt, obwohl 30 korrekt ist und bessert das kurz aus. Ich denke mal, dass selbst wenn sich das ein klein wenig komisch anhören sollte, die meisten Hörer das entweder gar nicht merken oder auf andere Gründe (kurze Audio-Glitches beim Abspielen/Hören sind ja normal) schieben.

Mespotine · 19. September 2019 um 16:21

Hmm…das hat Potenzial für eine Teenagersexbeichtefolge… @Malik

tomtjes · 8. März 2022 um 17:02

Kaum fünf Jahre später kann Descript auch schon mit deutschsprachigem Audio umgehen.

Ich habe in der Zwischenzeit bei englischsprachigen Projekten ganz gute Erfahrungen mit der Software gemacht. Sie eignet sich um O-Ton-Sammlungen oder einen Rohschnitt zu erstellen. Außerdem arbeite ich öfter mit Podcaster*innen, die keine Lust haben, eine DAW zu bedienen. Die können dann in Descript textbasiert schneiden und ich mache danach für sie den Feinschliff in Reaper.

Es soll Leute geben, die ihre Podcasts komplett in Descript produzieren (man kann darin auch Mehrspur-Aufnahmen machen), aber dafür ist es mir dann doch zu hakelig.

Gero · 10. März 2022 um 18:21

Hallo,
ich bin gerade (10.03.2022) auf dem Enterprise Podcast Summit und habe mir die Demo von Descript angeschaut und bin ziemlich überrascht was das Tool kann (und auch was nicht z.B. MIDI)

Das ist schon ziemlich gut geworden …

Die benutzen übrigens die rev.ai API für Speach to Text.

Grüße

Gero

Andi · 17. April 2022 um 13:57

Nachdem sie inzwischen seit ein paar Wochen auch Deutsch können hab ich das jetzt auch mal mit vier Aufnahmen getestet:

Also ist schon krass wie gut sie da Auphonic/Reaper/Cleanvoice/Transkription in eine doch echt einfach zu bedienende App bringen mit der eigentlich jeder in den Audio- (und Video)schnitt rein kommt. Viele Features gehen leider nur in Englisch (Custom Wörterbuch, ähm Erkennung, …) und auch die Sprach/Worterkennung in Deutsch braucht noch einiges an Trainingsdaten bis das so gut ist wie in Englisch. Da ist Trint in Deutsch aktuell schon wesentlich weiter, wobei beide Tools auch den Projekt-Export zu Reaper können.

Die $12 bzw. $15 pro Editor (die zusätzlichen Viewer kosten nichts extra) würde ich mir als Hobby Projekt nur leisten wenn man regelmäßig Produziert und sich den Editorzugang als Funktionsaccount mit mehreren Leuten teilt. Ist aber vielleicht auch nen Weg das der Schnitt bicht immer bei der gleichen Person hängen bleibt.

Wenn ich euch das mehr interessiert kann ich bei Bedarf gerne mal ne Edit Session aufzeichnen und als Video hochladen… gebt einfach Bescheid…

tomtjes · 17. April 2022 um 15:23

Ich teile regelmäßig Projekte mit Leuten, die einen kostenlosen Account haben. Ich lege also das Projekt an, starte die Transkription und teile es dann, damit sie drin rumschneiden können. Meine Login-Daten muss ich dafür nicht teilen.

Man sollte Unerfahrenen aber auf jeden Fall mitgeben, nicht zu viel zu schneiden. Descript verleitet dazu, Schnitte zu machen, die akustisch einfach nicht gehen. Ähs schneide ich auch lieber per Hand in Reaper raus, weil die Schnitte oft unsauber sind und es viel Zeit kostet, jeden Schnitt nochmal anzufassen.

Tipp, um viele unsaubere Descript-Schnitte zu polieren: In Reaper alles markieren > Item properties > Fade in und Fade out auf 0:00.010 setzen.

Andi · 25. April 2022 um 13:09

Tatsächlich hätten sie da ja auch ne Automatik dafür, aber eben nur für Englisch… die Schnitte bzw. Schnittvorschläge die Cleanvoice da macht, kann man dagegen eigentlich direkt 1:1 umsetzen… Ich rechne damit das sie das mit der Zeit (und mehr Trainingsdaten) auch hinbekommen werden…

NiklasM · 5. März 2024 um 17:15

Um das Thema wieder aufzugreifen: Ich wär sehr interessiert an euren Workflows mit Descript. Ich hab mir das Tool in letzter Zeit angeschaut und ich finde es interessant, aber es erscheint mir nichts für „Profis“ zu sein, die schnell und effizient mit DAWs arbeiten und geschulte Ohren haben. Mir scheint es ein perfektes Tool für Menschen zu sein, die Podcasts machen wollen, aber keinen Audiohintergrund haben. Ich freue mich über eure Erfahrungsberichte mit dem Tool und wie ihr es gewinnbringend in euren Prozessen einsetzt.

NiklasM · 13. März 2024 um 11:25

Ich habe über Descript in meinem Newsletter Workflow Shortcuts geschrieben. Ich habe es selber ausprobiert und andere gefragt, die das schon in Produktionen nutzen. Außerdem habe ich versucht ein Fazit zu ziehen, für welche Anwendungsfälle und User das Tool sinnvoll sein könnte. Ich würde mich freuen, wenn ihr reinlest.

Außerdem gab es auf diese Newsletter Ausgabe eine große Resonanz auf LinkedIn und einige Leute haben unter einem Post von mir sich über Nutzung und Alternativen ausgetauscht, darauf möchte ich auch noch hinweisen.