Erfahrungen mit Transkripten als Knowledge für GPTs

friiyo · 21. Februar 2024 um 21:24

Ich habe in den letzten Tagen festgestellt, dass sich Podcast-Transkripte erstaunlich einfach als Wissen in GPTs einbinden lassen. Ein paar Punkte, dann ein paar Fragen:

Ich habe die HTML-Transkripte, wie sie Auphonic (mit Whisper AI) erstellt, in ZIP-Dateien zusammengepackt. Das Laden der einzelnen Transkripte in den GPT war nicht besonders erfolgreich. Erfreulicherweise kann GPT aber gut mit ZIP-Dateien umgehen, die die HTML-Dateien beinhalten. Ich habe handliche Pakete geschnürt – jedes Transkript beinhaltet ca. 4 Stunden Podcast; ich habe eine Jahresproduktion von 20 Transkripten in eine ZIP verpackt.

Ich habe es zuerst mit den VTT-Dateien versucht. Aber da fehlten die Metadaten (Titel, Datum, Shownote-Text, Kapitel). GPT konnte den Kontext der Transkripte nicht besonders gut aus den Transkripten selbst herauslesen.

Dreh- und Angelpunkt scheint mir zu sein, in den Instructions sehr präzise zu sein, um GPT zu sagen, was die Nutzer wollen und wie über den Podcast Auskunft gegeben werden soll. Dass das Prompten eine eigene Kunst ist, ist ja mittlerweile klar. Aber hier muss man auf interessante Weise Meta-Prompten, damit die Antworten gut sind.

Hat damit schon jemand Erfahrung gesammelt?

heikopanjas · 22. Februar 2024 um 01:04

Kannst du ein oder zwei Beispiele für deine Prompts und die Antworten nennen? Zum Verständnis…

mati.podigee · 22. Februar 2024 um 11:11

Wow, hast du es mit ChatGPT von OpenAI gemacht? 20x4 Stunden das ist richtig viel Text, reicht der Kontext für so viel Input?

friiyo · 22. Februar 2024 um 12:40

Ja, es lassen sich ja neuerdings „GPTs“ kreieren. Diese GPTs bekommen dann ein „Knowledge“. Ab dann beginnt es mit den Instructions interessant zu werden. Man muss doch recht aufwendig und detailliert erklären, wie mit (späteren) Prompts umgegangen werden soll. Aber prinzipiell funktioniert es ganz gut, so inhaltliche Fragen an den Podcast stellen zu können.

Im ersten Versuch gestern habe ich vom Neue-Zwanziger-Podcast 20 Ausgaben pro ZIP verpackt. Auf die Frage, ob GPT es alles sehen könne, kamen keine Beschwerden und man konnte mit den inhaltlichen Fragen beginnen.

Ich hoffe, einige Podcasts probieren es mal aus. Scheint mir eine sehr lohnenswerte Sache zu sein, gerade für die ausufernden Podcasts.

friiyo · 22. Februar 2024 um 21:42

CleanShot 2024-02-22 at 22.40.31@2x