Automatische Audiotranskription

Hallo zusammen,

ich habe schon etwas im Forum und auf Google gestöbert. Ich nutze den Podlove Podcast Publisher und suche nach einem automatischen Transskriptionsservice.
Ich habe schon gelesen, dass Podigee etwas anbietet, aber das gibt es scheinbar nicht standalone, was uninteressant ist.

Ich habe bereits Trint ausprobiert und die Qualität war eher bescheiden. Happyscrib.co war OK soweit. Kennt jemand noch andere automatische Audiotransskriptionstools, das gut funktionieren?

Moin.

Auphonic hat drei entsprechende Services im Angebot, durch die Du Dein Audio laufen lassen kannst. Die Qualität ist eher so mittel, was die Beta-Transskripte im Sendegarten zeigen. Die haben dort seit Episode 80 keine Transskripte mehr eingebunden, keine Ahnung ob das an der Qualität oder an etwas anderem liegt.

1 Like

Hi,

ich habe damit recht lange rumexperiementiert.
Im Ergebnis hat mich kein Dienst überzeugt.

Podigee > Auphonic nutzt Google. Die Ergebnisse sind am besten, wenn man Multritrack-Upload nutzt.

Besser ist speechmatics, die man direkt via Auphonic nutzen kann. Das war fast brauchbar.
Eine 2-Stunden-Episode habe ich da mal durchgejagt. Wenn man die Fehler danach korrigiert, hockt man auch noch einige Stunden dran, das Ergebnis ist aber sauber.
Hauptproblem sind Satztrennung und ähnlich klingende Begriffe.

Für internen Gebrauch wäre das in Ordnung (wenn man schnell mal eine Stelle sucht). Dafür empfinde ich das als zu kostenintensiv.

Wenn Du das in den Player einbauen magst, kommst Du meiner Meinung nach nicht um einige Stunden Korrekturarbeit herum.

Noch eine Möglichkeit, die gänzlich kostenfrei geht, Qualitativ aber noch fürchterlichter ist: Wenn Du Deinen Podcast bei Youtube reinlädst, gibt es nach ein paar Stunden Untertitel, die man da auch raus bekommt.

Bei Headliner läuft das ähnlich wie bei Youtube: Ist auch mies. Ist auch kostenfrei. Bin nur gerade nicht sicher, ob das auf diese 10-Minuten-Schnipsel beschränkt ist oder auch bei ganzen Episoden geht …

Googles Erkennung ist ganz okay, wenn man ihm Hinweisworte gibt. Sehr erstaunt war ich über die Erkennung von Amazon (AWS). Die kostenlose Transkription mit wit.ai ist eher mies und taugt eher für große Suchen.

Neulich haben wir über die Leitung gesprochen, was an sich schon mal eine Herausforderung ist, aber man spricht ja auch viel unsauberer. Hier mal ein Transkript von Amazon, leider ohne Sprecherzuordnung: Berateraffäre Nr. 28. Und hier mal eine frühere Episode, die mit wit.ai transkribiert wurde: BA Interview mit Alexander Müller.

Mit Google teste ich demnächst mal etwas herum. Meine ersten Erfahrungen mit dem Google Transkript sind aber okay.

Egal, was die Tech-Konzerne versprechen, es gibt (noch) keine automatische Transkription, die ohne Nachbearbeitung prima Ergebnisse liefert. Man muss realistisch sein und entsprechend Zeit und Aufwand einplanen. Für Englisch zumindest bin ich sehr zufrieden mit http://sonix.ai, das auch erschwinglicher ist als Trint.

1 Like

Vielen Dank für die zahlreichen Hinweise. Ich werde es mal mit Auphonic und der AWS KI probieren. Das sieht ganz vielversprechend aus. Dürfte sich damit auch in den Podlove Kosmos einfinden über die Auphonic Integration. Mal sehen, ob man da auch die Transskripte dann automatisch zurück bekommt.

Berichte auf jeden Fall bitte dann auch mal von deinen Erfahrungen. Finde das Thema auch spannend.

Wenn Du mit Auphonic arbeitest geht das. Hier der passende Thread: