Transkription aus Ultraschall starten

Noch mal zur Sicherheit hier gefragt: Da Transkriptionen inzwischen das Einzige sind, was ich nicht direkt aus Ultraschall starten kann (neben dem Upload der fertigen Files auf den Server):

Hat sich seit diesem Thread Transkription und Spracherkennung etwas getan bzw. ist in Planung, dass ähnlich wie bei Auphonic direkt aus der Produktion heraus zu starten? Wit.ai kann ich als „Nicht-Programmierer“ nicht ohne Nutzung der API mit den fertigen Files füttern, korrekt?
Ich würde ja gerne mal versuchen, alles nur mit Ultraschall zu realisieren, aber das fehlende Transkript ist das der Punkt, der mich davon abhält. Das geht halt momentan doch noch sehr viel komfortabler via Auphonic.

Das ist doch seit der neuen Version möglich, du musst in Module nur den Punkt „WordPress File Upload“ aktiv Iren und schon kannst du den uploade machen.

Meinst Du aus Podlove heraus? Oder verstehe ich Dich falsch? Wo in Ultraschall gibt es den Punkt „Module“?

sorry da habe ich was in meinem kranken Hirn vertauscht klar aus podlove heraus nicht aus Ultraschall da geht das noch nicht.

Alles gut, war nur gerade tatsächlich schon vorfreudig unsicher :slight_smile:

Hallo Martin,
ich habe das mit mäßigem Erfolg über Auphonic probiert. Ich habe dabei die Schnittstelle von Google und Amazon (AWS) verwendet. Es kostet natürlich etwas Geld und die Ergebnisse sin so lala. Es landet aber alles direkt im Ordner für Podlove wenn Du FTP aktivierst. Ich habe auch mal versucht das mit SW für Untertitel selbst zu machen und dann schnell verworfen, weil der Arbeisaufwand enorm ist.

@timpritlove hat da mehr Erfahrungen aber sein Ansatz wurde anscheinend von Facebook weggekauft und jetzt funktionieren wohl die Schnittstellen nicht mehr. Es kann aber sein, dass er es bereits wieder am laufen hat.

Ich wäre auch an einer Lösung interessiert, die bessere Algorithmen als von Google und AWS verwendet.

Seltsamerweise sind sind die Transcriptionen von Youtube richtig gut ( Google behält wohl das gute Zeug für sich.)

Ich habe mich jetzt länger nicht mehr damit beschäftigt aber vielleicht kann man die Datei von Youtube transkribieren lassen und sich den Text von dort wieder extrahieren.

Bitte halte uns auf dem laufenden.

Grüße

Gero

Nun, ich nutze wit.ai via Auphonic und ja, die Bude wurde von Facebook gekauft aber bis auf den Facebook-Ausfall neulich hatte das keine Auswirkungen. Allerdings nutzt wit.ai hintenrum für Deutsch ohnehin wiederum Google, es bleibt verwirrend. Aber über Auphonic kann man das gut nutzen.

1 „Gefällt mir“

ich verwende das von youtube ist nur total unschön und auch keine sprecher erkennung der text kommt aber wirklich sehr nahe dran.

man muss aber die dateil umwandeln und am ende ganz wichtig 2 punkte setzen und 3 mal enter machen sonst wird das vtt nicht importiert. warum auch immer. das umwandeln mache ich mittels „Subtitle Edit“ da kann man dann auch etwas korigieren.

da kann man sehen was ich meine mit unschön im podlove schaut es dann besser aus.

Hallo Tim,
erst mal danke ich Dir für die Info.

Hast Du auch den qualitativen Unterschied (für deutsche Sprache) zwischen der Youtube Transkription und der über die Google API festgestellt?

Ich finde das um Klassen besser bei Youtube.

Grüße

Gero

dachte ich mir das es wit.ai war den mir war jetzt kein anderedinst bekann der an facebook verkauftwurde.

ich hatte ja bei der netzpolitik danach gefragt wie du das machst aber das du auphonic nutz darauf wäre ich nicht gekommen hatte gehoft das du da etwas selber gebastelt hattest mit der api.

Hallo,
das sieht recht gut aus. Wie bekommst Du das Transcript aus Youtube raus?

Grüße

Gero

ich render das mp3 zu einen video und lade das auf einen kanal hoch warte maximal einen tag und kann das dann runterladen unter den punkt untertietel als scr und noch 2 andere formaten.

1 „Gefällt mir“

Ah, cool ich probiere das mal bei Gelegenheit aus.

Danke für den Tip.

1 „Gefällt mir“

Klingt nach einem guten Workaround :slight_smile:

2 „Gefällt mir“

Das wiederum ist natürlich schade :frowning:

1 „Gefällt mir“

Es ist ja so das im Video eine Stereo Spur ist und da halt der Mix drinnen ist wie soll da YouTube die einzelnen Stimmen erkennen.

1 „Gefällt mir“