Ich habe in den letzten Tagen festgestellt, dass sich Podcast-Transkripte erstaunlich einfach als Wissen in GPTs einbinden lassen. Ein paar Punkte, dann ein paar Fragen:
Ich habe die HTML-Transkripte, wie sie Auphonic (mit Whisper AI) erstellt, in ZIP-Dateien zusammengepackt. Das Laden der einzelnen Transkripte in den GPT war nicht besonders erfolgreich. Erfreulicherweise kann GPT aber gut mit ZIP-Dateien umgehen, die die HTML-Dateien beinhalten. Ich habe handliche Pakete geschnürt – jedes Transkript beinhaltet ca. 4 Stunden Podcast; ich habe eine Jahresproduktion von 20 Transkripten in eine ZIP verpackt.
Ich habe es zuerst mit den VTT-Dateien versucht. Aber da fehlten die Metadaten (Titel, Datum, Shownote-Text, Kapitel). GPT konnte den Kontext der Transkripte nicht besonders gut aus den Transkripten selbst herauslesen.
Dreh- und Angelpunkt scheint mir zu sein, in den Instructions sehr präzise zu sein, um GPT zu sagen, was die Nutzer wollen und wie über den Podcast Auskunft gegeben werden soll. Dass das Prompten eine eigene Kunst ist, ist ja mittlerweile klar. Aber hier muss man auf interessante Weise Meta-Prompten, damit die Antworten gut sind.
Hat damit schon jemand Erfahrung gesammelt?