Ungelistete Podcasts


#1

Eben höre ich die Frequenz, das Metaformat von viertausendhertz, wo in der aktuellen Folge die Zahlen meines Crawlers besprochen werden. Und da fällt die interessante Behauptung es gäbe ja wahrscheinlich eine riesige Dunkelziffer von Podcasts, die nicht in iTunes gelistet wären. Nun frage ich mich wie groß diese Dunkelziffer denn wohl wäre und wie man versuchen könnte die weiter zu konkretisieren?

Ganz allgemein weiß ich natürlich von ein paar etablierten “Inseln” in denen Audio produziert wird, das nicht in iTunes auftaucht. So haben sowohl Audible als auch Spotify ja ein paar exklusive Formate, die über keinen RSS Feed verfügen und damit exklusiv bleiben. Für meine Analyse hatte ich die aus zwei Gründen vernachlässigt:

  1. Es sind verhältnismäßig wenige Sendungen, ich schätze wir sprechen von einer niedrigen zweistelligen Zahl
  2. Ich bin der Meinung, dass ein RSS Feed schon notwendig ist um wirklich von Podcasts zu sprechen, aber darüber lässt sich natürlich auch vortrefflich streiten, in jedem Fall braucht es aber eine Abo-Möglichkeit bzw. Podcasts sind eine serielle Angelegenheit wodurch sie sich von einzelnen Downloads abgrenzen.

Hier also nun die Frage: Kennt ihr Podcasts die tatsächlich ausschließlich über die eigene Webseite verteilt werden, also nicht in iTunes zu finden sind aber sehr wohl über einen Abo-Mechanismus verfügen? (Meinetwegen muss das nicht mal RSS sein, ich nehme auch Maillinglisten oder Internetforen :slight_smile: )

Und als Folgefrage: Hat jemand eine Idee wie man diese “Dunkelziffer” versuchsweise quantifizieren könnte?


Daten aus dem Apple Podcasts Verzeichnis
#2

Ja, gibt’s, beispielsweise meinen http://radio.sf-fantasy.de/ Ich bin einfach noch nicht dazu gekommen, den Feed sauber auf Apple abzustimmen, mir ein Konto zu machen und einzubinden. (Ich sehe gerade: ich nähere mich dem 10jährigen - also gut, spätestens zum Jubiläum dann…)

Ich bin ja der Meinung: ohne RSS-Feed kein Podcast.
Sonst müsste man auch alle Mediatheken mit einbeziehen.
Und die Spotify Abo-Funktion ist ja auch nur ein Witz und funktioniert bestenfalls grottig, wenn überhaupt mal.
Andererseits hat YouTube RSS-Feeds für jeden Kanal. Das wäre dann ein VidCast - oder im entsprechenden Format dann auch ein Podcast.
Da braucht es dann wohl eine genauere Definition von “Podcast”…


#3

Auf die wir uns nie einigen werden :slight_smile:
Ich zähle im Zweifel gerne alles was irgendwie abonniert werden kann solange mir überhaupt nur jemand verraten kann wie man das jeweils quantifiziert/findet :slight_smile:


#4

die wundersame Rapwoche und viele andere flux formate sind nicht itunes gelistet, werden aber per feed ausgeliefert, der auf der website liegt.


#5

Naja da gibts eigentlich nichts auf Apple abzustimmen da die Metadaten die sie überprüfen ja zu einem Quasi Standard geworden sind und nichts dagegen spricht sich generell an diesen zu orientieren.


#6

@macsnider Fremd-selbstgestricktes CMS, selbstgestrickte Feeds - die muss man dann halt entsprechend nachstricken, wenn die (immer noch) zu rudimentär sind, um bei Apple gelistet werden sollen…


#7

Was ist denn mit dem cutoff, der mir 2016 beim Blick auf die Daten aufgefallen ist? Ist es immer noch so, dass bei den Podcasts das releaseDate einen bestimmtes Datum nicht unterschreitet? Dann wäre zu vermuten, dass etliche ältere Podcasts fehlen. In dem Fall könnte man mit den alten Daten abgleichen, um fehlende Einträge zu finden.


#8

Wo siehst du einen cutoff? Da sind sogar Podcasts von 2004 gelistet…


#9

Auch eine Möglichkeit Abgleich mit Soundcloud. Hier habe ich mal probeweise 18000 Feeds heruntergeladen:

Man kann wie im Beitrag beschrieben die user id durchiterieren. Geht nach ein bisschen rumprobieren bis 399999999, aber ich bezweifle das in diesem hohen Bereich sinnvolle Einträge sind. Sehr viele Feeds werden auch leer sein. Eine Schwierigkeit ist die natürlich die Podcasts daraus zu identifizieren, aber andererseits haben sie alle einen Feed. Damit sind es doch Podcasts, oder? :wink:


#10

Da muss ich erstmal die alten Daten wieder heraussuchen.


#11

Okay, von dieser damaligen Version deines Dumps:

habe ich die Liste mit 4328 deutschen Podcasts genommen. Dort gibt es den Eintrag “releaseDate” und keines davon ist älter als “2015-06-01”. Ich habe glaube ich nicht alle nachgeprüft, aber im Prinzip war das das Datum der letzten Podcastfolge, deswegen gab es auch Datumseinträge in der (damaligen) Zukunft. Die waren im feed fehldatiert.

Es geht also nicht darum, wann der Podcast mal gestartet ist, sondern wie alt seine letzte Folge war. Und auf der Basis schienen alle Podcasts deren update weiter als “2015-06-01” zurückliegt, entweder aus dem Verzeichnis entfernt oder jedenfalls nicht mehr angezeigt zu werden.


#12

Das ist ein Alter Dump. Folge dem Link oben bzw. Im Thread meinem aktualisierten dump von vor 3 Wochen. Da sind eindeutig reichlich ältere drin.


#13

Na, das beantwortet dann die Frage, ob der cutoff noch vorhanden ist. Aber ich kann auch nochmal selbst in die Daten schauen.


#14

Also zunächst ja kein cutoff mehr. Weißt du eigentlich, was damals der Grund dafür war?

Dann habe ich mal meinen Vorschlag von oben umgesetzt und geschaut, welche von den alten Itunes-IDs nicht in dem neuen Datensatz (genauer in “germanpodcasts.json”) enthalten sind. Das ergab eine Liste von 1353 IDs (von 4328).

Schaut man auf die Liste, sind natürlich einige Feeds verschwunden zum Beispiel:

id998951111 - feed: http://agcommunity.square7.ch/blog/feed/mp3/

Andere sind leer:

id999382575 - feed: http://feeds.feedburner.com/kennstewayne

Aber dann gibt es eine ganze Reihe mit funktionierendem Feed, die in dem neuen Datensatz nicht mehr enthalten sind. Beispiele:


#15

Ergänzung: Einige der Podcasts, die nicht im Datensatz sind, aber einen funktionierenden Feed haben, sind unter ihrer Itunes-ID noch immer verfügbar. Zum Beispiel:

Aber es gibt dann immer noch welche, die es nicht sind. (Bzw. wo sich die Itunes-Seite beschwert, ich hätte das Programm nicht installiert. Ich nehme an, das bedeutet sie sind nicht vorhanden.) Aus der oberen Liste ist das zum Beispiel Kunstjagd:

https://itunes.apple.com/de/podcast//id997404360

Zwei weitere:

https://itunes.apple.com/de/podcast//id1114597928 - feed: http://www.wortzummontag.de/podcast.xml

https://itunes.apple.com/de/podcast//id381549497 - feed: http://www.was-audio.de/podcast/gespraeche.rss


#16

Übrigens habe ich jetzt einen zentralen Platz für die Daten angelegt und einen neuen Thread angefangen um Auswertungen/Erkenntnisse zusammenzuführen:

Bitte hier entlang: