Spracherkennung für Podcasts

Interessante Sache …

Unsere Spracherkennung ist nun offen für alle!

Weitere Details dazu und Audio Search Beispiele mit dem Podigee Player sind hier:
https://auphonic.com/blog/2016/12/02/make-podcasts-searchable-speech-to-text/

5 „Gefällt mir“

Cool! Ich werde die Spracherkennung über wit.ai bei der nächsten Produktion mal ausprobieren.
Das wird direkt ein Härtefall: wir haben einen Belgier mit einem rheinlandpfälzischen Akzent als Gesprächsgast. :stuck_out_tongue_winking_eye:

Hat jemand von euch zufällig schon https://www.meetrum.io ausprobiert?

Ich bezweifle dass die eine eigene Spracherkennung entwickelt haben, verwenden wohl eher Google oder Speechmatics?

1 „Gefällt mir“

Der CTO von denen hat am Messestands behauptet das sie das selbst entwickelt haben, und das Firmen auch auf ihre eigene Infrastruktur deployen. Das B2B Geschäft läuft dann unter dem Namen http://multicast-media.com.

1 „Gefällt mir“

Falls das stimmt wäre es mal interessant zu probieren …

Hi @auphonic - falls nötig kann ich den Kontakt herstellen. Die Firma sitzt in Potsdam und ich kenne die beiden Gründer ganz gut.

1 „Gefällt mir“

Hab mal 5€ eingeworfen und den Test gemacht. Habe mir das fertige Transkript nicht super genau angeschaut, aber auf den ersten Blick wirkt es ganz brauchbar. Das Interface ist auch ganz nett, auch wenn es von der Bedienung noch ein wenig intuitiver sein könnte.
Was ich spannend finde ist, dass man Sprecher*innen anlegen und Beispiel-Audio zu den Personen hochladen kann. Danach versucht das Program den transkribierten Text automatisch den Personen zu zu ordnen.
Ich bin jetzt aber auch nicht bewandert, was die anderen Speech-to-Text SaaS Anbieter können und wie deren Preis-Leistung im Verhältnis ist.
Hier findet ihr noch die verwendete Folge
und das Transkript

1 „Gefällt mir“

Liebes Auphonic-Team,
danke für euren legendären Service.

Ich habe die ersten Folgen eines medizinischen Podcasts veröffentlicht und würde das Angebot gerne mit Transkriptionen verbessern.
Amazon bietet bei ihren Spracherkennungsdiensten eine Variante für medizinische Inhalte an.
Seht ihr eine Möglichkeit, diese medizinische Spracherkennung per Auphonic auch anzusteuern? Amazon tut sich ansonsten schrecklich schwer mit unseren Mediziner-Latein-griechisch-Denglisch.

Viele Grüße
Ingmar

Hallo!

Interessant, wusst noch nichts von Amazons medizinischer Spracherkennung…
Hast du das schon mal probiert?
Denn so weit ich sehe funktioniert das nur mit US Englisch oder?
https://docs.aws.amazon.com/transcribe/latest/dg/batch-med-transcription.html

LG

1 „Gefällt mir“

Ich habe bisher auch “nur” die US-Englische Variante gefunden.
Ich habe erst eine Folge auf englisch aufgezeichnet mit unzureichender Audioqualität und einer Mischung aus italienischem Englisch und (Kur-)Pfälzer Englisch die ich mir nicht als Test vorstellen kann.
Und mir fehlt ehrlicherweise das technische KnowHow mit AWS direkt zu interagieren.

1 „Gefällt mir“

Bei AWS (und afaik auch bei Google) kann man inzwischen ja auch ein Model mit seinen eigenen Daten trainieren… Hat das jemand von euch zufällig schon mal ausprobiert?

Bonus-Frage: Hat jemand schon nen Tool geschrieben oder gefunden mit der man zwei (oder mehr) VTT Dateien zum Vergleich in einer Tabelle nebeneinander legen kann, ohne das man das manuell in Excel & co. macht?

2 „Gefällt mir“

Bei wit.ai kannst du auch mit deinen eigene Daten trainieren. Das mache ich (fast) nach jeder Aufnahme und gefühlt wird die Erkennung besser.