Podcast-Skill für Amazons Echo


#1

Nachdem inzwischen Amazon seine Bestellbeschränkung für den Amazon Echo und den Dot aufgehoben hat, zieht die Abhöreinricht… äh, der praktische Assistent in immer mehr Haushalte ein. Man kann schon nette Sachen mit ihm machen, Musik abspielen, Wetterbericht und Nachrichten abrufen, Licht an- und ausschalten, Star Trek-Witze erzählen lassen usw.
Leider gibt es aber immer noch keinen deutsche “Skill” für den Abruf von Podcasts, nur für die amerikanische Variante. Wer sich befähigt fühlt, so etwas selbst für seinen Podcast zu erstellen, findet hier eine Anleitung Podcast-Skill
(Ich würde ja gerne selbst einen Skill für mein “Geheimes Kabinett” programmieren, aber ich scheitere bereits an dieser Hürde). Aber vielleicht ist das was für Euch?


#2

Ich glaube @eazy hat da schon experimentiert…


#3

Ich nutze die Gelegenheit mal, um eine kleine Wasserstandsmeldung dazu abzugeben.

Ich habe Anfang Dezember einen Echo bekommen und praktisch am ersten Tag damit angefangen, einen Skill für fyyd zu bauen.

Die Dokumentation ist einerseits reichlich, andererseits nicht gut strukturiert. Aber es reichte, um innerhalb 24h die erste Antwort vom Gerät zu bekommen. “Alexa, spiele Freak Show” (ja, gut, Berliner Blase). Und was tat die Alexa? Freak-Show spielen. Yeah.

Nun bin ich ehrgeizig genug, möglichst viele der Features von fyyd auf diesen Skill zu werfen. Podcasts abspielen alleine ist langweilig, ich will auch mit Alexa kuratieren können und andere Dinge, die über das Abspielen hinaus gehen.

Das hat den Skill aufgeblasen und das Team, das die Skills zertifiziert (vergleichbar mit dem Prozess, in Apples Appstore zu kommen) meiner Meinung nach überfordert.

Es gibt im gesamten deutschen Skill-Store keinen privaten Skill (also ohne, dass Amazon zu mir kommt und mich bittet, was zu programmerien, siehe tunein), der auch nur annähernd so komplex ist, wie ich mir das für fyyd vorstelle. Damit habe ich eine 100%ige Wahrscheinlichkeit, an die bisher unbekannten Grenzen der Regeln dieses Prozesses zu stoßen. Kleines Beispiel gefällig?

Man kann mit dem Skill nach Stichwörtern suchen: “Alexa, spiele eine Episode über Abfall”. Zum Zeitpunkt der Zertifizierung war das an erster Stelle eine Folge der inzwischen eingestellten Wunderbaren Welt des Herrn Wahnhoff :slight_smile: Wer Alexa kennt, kennt auch die Alexa-App auf den Begleit-Geräten. Spielt man auf dem Echo was ab, kann man in einer App auf z.B. dem iPhone sehen, was da abgespielt wird. Diese Information gibt der Skill mit.

Nun gibt’s die Regel: Die Card (wie diese Info heißt), muss in der Sprache des jeweiligen Echos dargestellt werden. Der Tester hatte ein englisches Gerät. Er hat explizit nach dem Wort “Abfall” gesucht und bekommt eine deutschsprachige Antwort. Ratet mal… Skill abgelehnt. Durch alle Instanzen wurde das exerziert: abgelehnt, keine Chance. Selbst als ich vorbrachte, dass mir Amazon Music ja englische Titel anzeigt, wenn ich nach “Elton John” suche und das obwohl ich einen deutschen Echo habe brachte nichts. Kein Verständnis für die Materie.

Uff… es wird langatmig. Ich habe also wg. der Komplexität Probleme mit Amazon. Deshalb habe ich mich für folgendes entschieden: Es wird zwei Skills geben. Einen sehr, sehr einfachen. Reduziert auf das nötigste, um irgendwie einen Podcast zu hören. Kein Schnickes, keine fyyd-Features.

Und während dieser Skill die Weltherrschaft auf dem Echo-Podcast-Markt übernimmt, sehe ich zu, dass der Pro-Skill durch die Zertifizierung gerät. Ich war schon mal auf zwei Probleme runter (von zehn). Inzwischen sind’s wieder acht.

Ich rede zu viel. Wer möchte, kann gerne - auch ohne Zertifizierung für den Store - testen. Ich benötige dafür Deine Mailadresse bei Amazon, ich schalte Dich dann als Entwickler frei. Ich bitte allerdings darum, keinen Unsinn damit anzustellen. Wenn doch, komme ich bei Dir zu Hause vorbei.

Melde Dich per PM, dann kann ich Dich freischalten.

Ich gebe zurück ins Sendegate, schönen Abend noch.

Christan


#4

War ja eigentlich klar, dass auf den guten @eazy Verlass ist :grinning:


#5

Gibt es den gaaaanz einfachen Skill denn schon zum Installieren?


#6

Der ist leider noch nicht durch die Zertifizierung. Das dauert gerne mal länger, weil die schließlich was finden müssen, um den Skill abzulehnen :slight_smile:


#7

Hörer Hardy hat einen Skill für “methodisch inkorrekt” gebastelt: https://www.amazon.de/dp/B06X6K34P5/

Leider ist der Urheber wohl weder auf Twitter noch hier im Sendegate zu finden.


#8

Ich habe Hardy mal auf diesen Thread aufmerksam gemacht. Vielleicht mag er sich ja noch einbringen.


#9

Nicolas hatte mich schon mich schon auf den Thread aufmerksam gemacht und daraufhin hatte ich mich bei Sendegate angemeldet. Aber nicht unter nphardy - aber das ist jetzt auch gefixt :slight_smile: Mit @eazy hatte ich schon Kontakt.
Also jetzt hier nochmal öffentlich ein Hallo!


#10

sehr cooler nick :smiley:


#11

Hey, wenn Du die Anspielung wirklich verstanden hast, wärst Du der Erste und ich verneige mich in Bewunderung! Ansonsten gebe ich Dir natürlich Recht :smiley:


#12

naaaa, das habe ich sicher nicht exklusiv:


#13

Volltreffer! Sehr geil! Groooße Verneigung :smiley:


#14

Da wäre er denn:

Klappt soweit gut, das größte Probleme wird, wie erwartet, die Spracherkennung sein. Man sollte schon sehr deutlich sprechen und auch mal ein paar Versuche starten, damit auch ungewöhnliche Podcasttitel erkannt werden.

Das ist übrigens der “light”-Skill. Der kann nicht viel und ist im Grunde dazu da, einen Fuß in den Skillstore zu bekommen. Ich werde jetzt daran arbeiten, die Funktionen einzubauen, die man als angemeldeter Nutzer zur Verfügung hat.


#15

Vielen Dank für Deine Arbeit, leider habe ich das angesprochene Problem mit der Aussprache bei fast allen Podcast :slight_smile: Es ist schon lustig was dabei heraus kommt, wenn man den ein oder anderen Podcast sucht. Vielleicht ändert sich das in Zukunft, aber so kann ich den Skill so gut wie nicht nutzen, weil wenn ich 3-4 mal Alexa anbrülle und ich nicht den passenden Podcast höre macht das kein spaß. Der Skill von Methodisch Inkorekt geht super. Folgentitel werden ohne Probleme abgespielt. Ist da was anders programmiert ?


#16

Meinst Du den Skill von MI oder MI über meinen Skill?

Was hast Du denn Alexa ins Mikro gebrüllt? :wink: Dann könnte ich mir das ansehen.


#17

Ist der Skill eigentlich Open Source? Auf Github? Könnte da jemand (also z.B. ich) dran weiter arbeiten?


#18

Nein, der ist nicht quelloffen.

Der Skill an sich ist ja gar nicht das Problem, weshalb es momentan nicht weitergeht. Es ist der Reviewprozess von Amazon. Die lasten einem im Zweifel an, dass man einen deutschsprachigen Podcast abspielt, wenn ein Nutzer mit englischem Echo nach einem deutschen Podcast sucht. Alle Antworten und Medien müssen nämlich immer in der Sprache des jeweiligen Echos sein.

Und das ist nur ein schwachsinniger Punkt… Glaub mir, das willst Du Dir nicht antun, auch weil es alles php ist.

Aaaaber: Es gibt tonnenweise (naja, kiloweise…) Frameworks für Alexa da draußen für alle möglichen Sprachen. Die API von fyyd sollte aktuell ausreichen, um alles damit auch für einen Skill nutzen zu können. Schlag zu, ich bin Dir sicher dabei behilflich im Rahmen dessen, was mir möglich ist :slight_smile:


#19

Was interessiert mich nur mein Geschwätz von gestern?

Der Podcast-Skill ist ziemlich gescheitert, wie ich selbst finde. Das Thema habe ich zu groß angegangen und irgendwie klappt’s gut, oder auch nicht. Je nach Podcast, je nach Mensch geht das oder nicht.

Aber was interessiert mich der Quatsch von gestern? Nix. Von vorne eben.

Seit ein paar Monaten steht die API für fyyd in Version 0.2 herum und will ja auch genutzt werden. Das macht nicht nur @funkenstrahlen in Skoon oder @JeanetteMueller in der podcat, sondern jetzt auch ein Skill-Backend für Alexa.

Was ist das? Was tut das? Wo führt das alles nur hin?

Ihr erinnert Euch sicher daran, dass Einzelapps für Podcasts mal eine Weile in den Schlagzeilen waren. Der @Toby war da ganz vorne dabei.

Nun gibt es das auch für Alexa. Ich war anfangs kein Freund dieses Gedankens, aber nach ein paar Abenden habe ich meine Meinung geändert. Der Markt ist neu und ich glaube, es ist Platz für Experimente. Und für ein paar Podcasts, die aus dem üblichen Podcastangebot hervorstechen (und Einschlafen ist sowas, mMn), ist es durchaus sinnvoll, ein Einzelangebot zu starten.

Wie auch immer, kommen wir zur Technik dahinter.

Ich habe ein Skill-Backend gebaut, dass sich per API an fyyd bedient. Dieses Backend ist die Anbindung, die Alexa benötigt um gesteuert zu werden. Und die ist so gehalten, dass im Prinzip jeder Podcast, der bei fyyd.de gelistet ist damit ausgespielt werden kann.

Der Ablauf ist aktuell noch etwas holprig, aber Kern der Geschichte ist, dass sich die Podcastmenschen den Skill selbst bei Amazon anlegen und verwalten und von mir “nur” das Backend und die entsprechenden Steuerungsdaten kommen. Dafür gibt’s eine aktuell noch sehr unschöne Dokumentation, die soweit aber alles abdeckt.

Wie läuft’s nun wirklich ab?

  1. Podcast auf fyyd.de in Besitz nehmen (claim)
  2. Auf der Claim-Seite in den Einstellungen die Konfiguration für Alexa aufrufen
  3. Daten eintragen (soweit schon vorhanden)
  4. Doku lesen und abarbeiten
  5. Daten eintragen (jetzt vorhanden)
  6. Skill durchs Review bei Amazon jagen
  7. Skill haben :wink:

Das ist kilometerweit davon entfernt, komfortabel zu sein, aber es wird auch nicht besser werden, solange ich das nonprofit ohne Firma und Angestellte mache, denn den Skill nicht vom Podcastenden selbst eintragen zu lassen, sondern auch den Teil noch zu übernehmen ist etwas, das vor allem sehr viel Zeit frisst. Wäre ich arbeitslos, ich wüsste, womit ich demnächst versuchen würde, Geld zu verdienen…

Soweit so gut. Und jetzt?

Ich werde die gewonnenen Erfahrungen aus diesem Projekt in ein neues Projekt überführen: Ein Podcatcher für Alexa. Basis dafür wird je User eine Collection sein, in der die Podcasts dieses Podcatchers gesammelt werden. Diese wird der Skill dann mehr oder minder komfortabel anbieten und steuern können.

Es ist schon verdammt spannend zu entwickeln, wie das Prinzip “Podcatcher” auf Sprachsteuerung übertragen werden kann. Wo die Mängel sind, wo die Herausforderungen stecken. Allein zu diesem Thema könnte ich auf der Subscribe10 sicher drei Stunden am Stück reden :wink:

Die ganze Nummer ist im Moment noch etwas holprig, aber ich persönlich bin davon noch so begeistert wie vor einem Jahr. Und das sagt mir sehr deutlich: da ist was zu holen und wenn es nur ein gewaltiger Erkenntnisgewinn ist.

Danke für’s Lesen :slight_smile:

Edit: Ich vergaß zu erwähnen, dass gestern das erste Mal ein Skill auf Basis dieses Prozesses in den Skillstore geraten ist :slight_smile: Es ist - natürlich - der Einschlafen-Podcast: https://www.amazon.de/Christian-Bednarek-Einschlafen-Der-Podcast/dp/B07892DPKF/ Am ersten Tag gab’s hier schon 100 Installationen.

In nicht allzu ferner Zukunft wird ein weiterer, eher bekannter Podcast auch diesen Weg gehen, wenn nichts dazwischen kommt.

Ich habe auf Twitter schon dazu aufgerufen, sich für eine begrenzte Beta anzumelden. Ich kann noch ein paar (vll 3 oder 4) Podcasts auf den Weg schicken zu einem Skill, um die Doku und den Rest zu testen. Es sind schon ein paar Leute interessiert, entscheiden werde ich um Weihnachten herum. Das hat nichts mit Bevorzugung zu tun, aber es gibt jetzt schon mehr Bewerbungen als ich wuppen kann :slight_smile:


#20

Das ist absolut großartig!