Künstliche Stimmen übernehmen (hier) den Podcast

sr_rolando · 21. November 2021 um 16:50

Nur mal so zur Info am Rande: Bei der Büchergefahr übernehmen jetzt künstliche Stimmen den Podcast. Dass sie den bisherigen Moderator / Sprecher dadurch arbeitslos machen, kann ich jetzt nicht unbedingt sagen. Arbeit machen die beiden auch. Aber halt auch Spaß, macht große Freude.

In der ersten Folge der beiden sind sie auch herrlich inhaltsfrei dabei, entsprechend kurz und prägnant ist’s geworden:

https://buechergefahr.de/92/#924170f4

Super Nebeneffekt: Das Transkript fällt quasi geschenkt nebenbei mit an.

Ceelight · 21. November 2021 um 17:28

Hui! Das ist tatsächlich mal etwas anderes. Interessantes Experiment.

Ich hab mal reingehört. Für mich funktioniert es nicht. Garnicht mal wegen der Stimmen oder der teilweise falschen Intonation. Es ist halt geskriptet und kein echtes Gespräch. Pausen zwischen den Sprechern zu lang… Es ist künstlich.

Aber mach mal weiter damit bitte! Da kann man sicherlich hier und da optimieren. Und ich denke Erfahrung im dem Bereich zu sammeln (und zu teilen!) kann zukünftig sehr hilfreich sein.

PechGehabt · 21. November 2021 um 17:55

Uh, ich habe auch mal reingehört. Ich bin nicht sicher, ob ihr das als Podcast macht oder ob das ein reines Experiment ist. Als Podcast geht es für mich leider gar nicht, da kann ich auf keinen Fall zuhören. Da fehlt einfach alles, was den Menschen ausmacht. Und ich höre Podcast wegen der Info aber vor allem wegen der Menschen, die die Info erzählen.

Raumwelle · 21. November 2021 um 18:06

schwirig…

du must mehr mit satzzeichen arbeiten bei den texten dann stimmt mehr im rede fluss gegen die intertonation wird das aber wenig helfen da must du einen vollenzugang zur synthsese haben so das du die parameter setzten kannst das dumme ist nur das kostet geld und viel zeit.

sr_rolando · 21. November 2021 um 21:06

Oha. Danke Euch für das Reinhören. Hatte Icch jetzt gar nicht erwartet.

Und klar: Da ist noch einige Luft nach oben. Aber genau darum, diese ein wenig auszuloten, geht es ja auch.

SSML als Steuerungsmöglichkeit ist übrigens schon mit am Start, wenn auch bei weitem noch nicht mit allem, was es kann.

Eris2cats · 22. November 2021 um 02:59

Da ich unlängst bei uns in der Episode auch mit TTS Engines experimentiert habe - ich hab da deutschsprachig wenig Engines gefunden, die ihre Nutzung ohne Attribution erlauben… nur für den Fall der Fälle dass ihr da die Shownotes erweitern wollt.

simondueckert · 22. November 2021 um 10:50

Cool, mit welchem Tool erzeugst du die Stimmen?

PechGehabt · 22. November 2021 um 15:08

Ich habe damit und zusätzlich mit Deep Fake Video experimentiert und dann kommt sowas bei raus: Angus Young Tells His Favorite Bassist Jokes! #AngusYoung #ACDC #AC/DC

none · 24. November 2021 um 17:10

Ich finde das eine wunderschöne Idee. Wie alle wissen (besonders die, die mir auf M folgen): The Singularity Is Nigh, aber vorher kommt …

Es ist ein einfach guter Stil, wenn die Menschheit sich schon mal ans Werk macht und ihre Nachfolger findet, ausbildet und für die Welt da draußen fit macht. So richtig viel Zeit haben wir ja nicht mehr.

Für mich passt das wunderbar ins Bild; der Lektomat, Victoria Corvas(*) Co-writing with an AI, XiaoICE, Tai, Miku Hatsune, AI Rui … Die Wetware geht - die Kunst bleibt; so soll das sein!

Man kann natürlich auch jedes Experiment bierernst-fülletonnistisch durchhecheln und das Ende des Podcastabendlandes proklamieren. Ist aber unlustig.

(*) auch auf M

Dazu das passende Liedchen zur Singularity: https://tube.tchncs.de/w/uVsBx6wzK3t8sPRUYCgr4K

sr_rolando · 24. November 2021 um 22:26

Valide Anmerkung. Gegen die beiden hier verwendeten Stimmen spricht gemäß des Kleingedruckten nichts. Der quasi beliebige Einsatz dieser ist mit dem Nutzen des Text2Speech-Services gewährt.

sr_rolando · 24. November 2021 um 22:31

In diesem konkreten Fall sind es zwei „Neural Voices“ der Speech-Services bei Azure. Diese sind im allgemeinen Vergleich dessen, was momentan so auf dem Markt verfügbar ist, sehr überzeugend.

Dabei soll und muss es aber nicht zwingend bleiben. Andere Anbieter dürfen hier sicher auch mal zeigen, wie überzeugend sie so klingen. Ebenso möchte ich gern mal eine eigene Sprach-Synthese ausloten (wie @Raumwelle ebenfalls bereits anmerkte), wenn sich die Zeit und Gelegenheit ergibt.

sr_rolando · 24. November 2021 um 22:33

Ich sehe, du hast da auch deinen Spaß.

this_wachter · 25. November 2021 um 12:45

In unserem achtteiligen Podcast Supernova haben wir ebenfalls mit künstlichen Stimmen gearbeitet und dazu in der ersten Episode Angela Merkel und in der letzten den einen Co-Host geklont: https://supernovapodcast.art/episode-1

8tungdata · 28. November 2021 um 17:46

Ich finde es sehr vergnüglich den beiden zuzuhören. Auch weil es etwas künstlich klingt. Aber es klappt hier schon erstaunlich viel, v.a. bei der weiblichen Stimme.

sr_rolando · 5. Dezember 2021 um 21:59

Das ist ja ein großartiges Projekt! Und man möchte auch gar nicht aufhören, mit der Maus auf dem Bildschirm herumzumalen. Wundervoll.

sr_rolando · 5. Dezember 2021 um 21:59

Ja, sie überzeugt in der Tat. Da fehlt noch so einiger Feinschliff beim männlichen Counterpart. Mal schauen, was da noch geht.