Frage zu automatisch erzeugten Transkripten

Mal ne Frage an diejenigen unter Euch, die sich Transkripte mit Diensten da draußen erstellen lassen:

Gibt es Dienste, bei denen Ihr Transkripte mit Zeitmarken erstellen könnt?

Und gibt es die Möglichkeit für jedes einzelne Wort eine Zeitmarke mit erstellen zu lassen, so dass man weiß, wann exakt welches Wort gesprochen wurde?

Bei Google STT geht das beispielsweise:

2 „Gefällt mir“

Hallo,
meinst Du etwas anders als .vtt Dateien. Die spucken ja fast alle Dienste aus.

Kannst Du vielleicht nochmal erklären wie Du die Daten verwenden möchtest. Ich stehe gerade auf dem Schlauch.

Grüße

Gero

1 „Gefällt mir“

Ich möchte schauen, ob ich z. B. Chapter-Marken als Überschrift automatisch an die richtige Stelle im Transkript einfügen kann.
Die Zeitmarke hab ich ja in Ultraschall, aber ich muss dafür wissen, welchen Wort an der Stelle gesprochen wurde um zu wissen „Hier kommt der Name des Chapters rein“.
Und dazu bräuchte ich Zeitmarken für jedes einzelne Wort.

Wäre auch für andere Usecases hilfreich. Aber zu wissen, vor welches Wort ich die Kapitelmarke als Zwischenüberschrift einfügen kann ist da jetzt am Griffigsten als Beispiel. Hoffe ich zumindest.

Ah, OK ich habe verstanden.
Coole Idee!
Leider habe ich nicht viel dazu beizutragen im Augenblick.

Ich meine Descript hat eine eine manuelle Version davon gesehen zu haben. Da muss mann es aber noch per Hand angleichen.

Grüße

Gero

1 „Gefällt mir“

Wir erstellen die Transkripte für unsere Episoden mit Amazon Transcribe via Auphonic und bearbeiten / korrigieren sie dann mit dem Auphonic-eigenen Editor. Amazon Transcribe fügt jedem Wort einen Zeitstempel hinzu, die auch erhalten bleiben, wenn man das Transkript mit Bedacht darauf bearbeitet. So ist es uns möglich, ein interaktives Transkript anzubieten, das die aktuell gesprochenen Wörter highlightet. Hier ein Beispiel.

Auphonic fügt Kapitelmarken (z.B. aus einem Audition-Projekt oder den WAV-Dateien) automatisch als Überschriften ins Transkript ein.

Übrigens hat Happyscribe glaube ich eine ähnliche Scrolling-Funktion wie unser interaktives Transkript — ist aber sauteuer.

3 „Gefällt mir“

Ah, ok. Dann macht Auphonic da schon ne Menge möglich für das „Urtranskript“.

Danke Dir :slight_smile: