Descript - Audio wie Text bearbeiten

Der Gründer von Groupon hat ein Tool entwickelt, mit dem man Audiofiles transkribieren und dann durch Editieren des Textes schneiden kann.

6 Like

Hat das schon jemand ausprobiert? 15 cent die minute ohne editing features, und subscription mit minutenpreis (7 ct) für editing features sind ganz schön happig zum ausprobieren und schneiden von podcasts. Und geht dann alles übers Internet auf einen privaten Server zur Analyse?

Ich mag die Idee allerdings, das würde die Produktion von einigen Sachen doch vereinfachen. Ich freue mich auf die Zeit, wo solche Features on Device funktionieren und nicht per subscription bezahlt werden müssen.

Es ist ein sehr spannender Ansatz, aber nicht so neu wie sie tun. Im Enterprise-Audio Bereich hab ich das schon ein paar mal gesehen.
Die Speech-To-Text Technologie kommt laut Webseite von Google, bei fast allen Anbietern, die ich kenne (z.B. getAudiograom) ist da eine Drittpartei (google, wit.ai, speechmatics,…) dahinter (die natürlich auch Geld haben will). So schnell wirst du das denke ich nicht als Standalone bekommen, da steckt doch ne Menge cloud computing und KI dahinter.
Bei einem Sprecher erwarte ich eine massive Effizienzsteigerung, die Frage ist, wie sich sowas bei 2 oder mehr Sprechern schlagen wird.

Hi. Ich hab am Beta-Test teilgenommen und war nur so mittelglücklich. Aber die jetzt gelaunchte Version habe ich noch nicht getestet. Kann sein, dass die jetzt smooth läuft und alles revolutioniert. Spannend finde ich vor allem, dass man textbasiert schneiden und diesen Rohschnitt dann nach Reaper exportieren kann. Das ist allerdings ein Premium-Feature.
http://help.descript.com/exporting/exporting-a-session

Wer einen Werbelink mit 100 Transkriptions-Freiminuten haben will, kann mir gerne eine DM schicken. Allerdings ist die Transkription bisher nur für englischsprachiges Material verfügbar.

1 Like

Hier noch ein ganz interessanter Artikel, wie die BBC Speech-to-Text einsetzt.

3 Like

Super spannend, danke!

Descript bietet jetzt nicht nur wie bisher das einfache Schneiden von Audio durch Löschen/Bewegen von Transkript-Text, sondern lässt sogar Editieren des Textes zu und erzeugt das passende Audio-Schnipsel dann per Machine Learning. Mehr Details: https://www.theverge.com/2019/9/18/20871613/descript-podcast-studio-launch-editor-overdub-ai-features-pricing-release-date

Ziemlich beeindruckend – aber so spannend ich es technologisch finde, so wenig reizvoll ist der Gedanke, dass das alles nur als Service verfügbar ist. (Kann man zwar letztlich auch von Auphonic sagen, aber da gibt’s zumindest auch die Offline-Variante und es fühlt sich einfach anders an, während Descript für mich wie jedes andere US-Startup wirkt, das jederzeit keine Lust oder kein Geld mehr haben könnte.)

Also quasi Text, den ich nie gesagt habe sondern nur geschrieben?

Gruselig und gleichzeitig auch spannend, gerade auch, ob Betonung und solche Sachen berücksichtigt werden.

So hab ich es auf jeden Fall verstanden, genau. Ich denke, dass das momentan nur für kleine Verbesserungen taugt – also wie im Beispiel-Screenshot, man hat 20 gesagt, obwohl 30 korrekt ist und bessert das kurz aus. Ich denke mal, dass selbst wenn sich das ein klein wenig komisch anhören sollte, die meisten Hörer das entweder gar nicht merken oder auf andere Gründe (kurze Audio-Glitches beim Abspielen/Hören sind ja normal) schieben.

1 Like

Hmm…das hat Potenzial für eine Teenagersexbeichtefolge… @lik