Daten aus dem iTunes Podcast Verzeichnis


#24

Hi Heiko,
erst mal vielen Dank für das Update und Deine klasse Arbeit/ Zeitinvest!

Mich würde neben den genannten Zahlen pro Kategorie aus 8/2017 auch noch einmal die Gesamtanzahl der gelisteten deutschen Podcasts interessieren. Nur so um ein Gefühl für den überall ausgerufenen “Podcast Boom” und das Momentum zu bekommen…

Wir haben ja weiter oben im Thread gesehen, dass es in 2/2016 rund 4000 Podcasts in deutscher Sprache gab (DACH hauptsächlich, schätze ich?).

Wie viele gibt es also nun 2 Jahre später?

Beste Grüße und im voraus schon einmal vielen Dank

Jens


#25

Einfach meinem Link oben folgen und das Skript laufen lassen :wink:
Alternativ weiß auch der @eazy ein wenig genauer wie viele zur Zeit gelistet sind…

//D


#26

Zahlen für deutsche Podcasts habe ich nicht, aber so wie es für mich aussieht, kommen weltweit pro Tag etwas weniger als 500 Podcasts dazu. Insgesamt habe ich ca. 390.000 Feeds gesammelt, von denen erfahrungsgemäß mehr als 80% live sind, wenn ich das nicht falsch vergessen habe. Ich gucke nicht jeden Tag nach, und ob mein Scanner immer richtig liegt, weiß ich auch nicht. Könnten auch alles Alternative Facts sein.


#27

Hey,
ja danke für den Tipp, das müsste ich mir mal genauer anschauen. Ich dachte vielleicht ist hier jemand dabei, der die Zahlen zufällig periodisch beobachtet…
Thnx
J


#28

Hi Heiko,
echt Wahnsinn, jeden Tag fast 500 neue…
Ich schau mir mal das Script an, vielleicht bin ich nicht zu doof um es ans laufen zu bringen und filtere dann mal nach deutschen podcasts.
Danke Dir
Jens


#29

Es war mal wieder Zeit…
Ich habe meinen Crawler neu geschrieben und die als Deutschsprachig identifizierbaren Podcasts aus dem Directory gefischt. Wer will kann in diesem Google
Spreadsheet
mit den Daten spielen oder hier das Excel File samt Pivot (2,7MB) herunterladen.
Für technisch versierte habe ich auch hier ein dekoratives JSON File (ZIP, 890kb)…

Wer selbst ran will oder wissen möchte wie mein Crawler funktioniert, der läd hier das Python Skript runter. Aber Achtung:

  1. Das Ding ist Quick & Dirty, erwartet keine besonders hohe Qualität
  1. Die iTunes API gibt nur sehr wenig Infos her weswegen ich außerdem jeden Feed abrufe. Wenn man das daheim nachmacht, dann zieht man nicht nur sehr viel Daten sondern sollte auch knapp eine Woche Zeit für den Crawl einplanen (ca. 750000 Feeds x ca. 1 Sekunde Zeitaufwand = 8,3 Tage)

Viel Spaß damit!

Quick Highlights:

  • Insgesamt sind in itunes 15265 Podcasts registriert deren Feeds im Language Tag als Sprache “de*” tragen also sich selbst als Deutsch identifizieren.
  • die verteilen sich auf 11060 unterschiedliche Podcaster (bzw. unterschiedliche Angaben bei “Autor”
  • Davon haben 7194 dieses Jahr noch kein Update gesehen. Sprich: knapp die Hälfte sind entweder verstorben oder pausieren.
  • Soundcloud hat mit 1585 Feeds immer noch einen ordentlichen Anteil.
  • anchor-feeds sind mit 655 auch ordentlich vertreten.
  • Lt. iTunes ist “Bildung” mit 1107 Podcasts die “vollste” Kategorie gefolgt von “Gesellschaft und Kultur” (1095) und “Musikfilme” (933, wtf?)
  • 2873 Podcasts stammen von 83 Podcastern mit mehr als 10 registrierten Sendungen. Keiner davon ist privat.

#30

Wow! Danke, danke, danke!


#31

nicht, dass ich mich zu früh freue, aber interpretiere ich deine XLSX-Datei richtig, dass die meisten Feeds eine podigee.io-Feed-URL haben?


#32

Da musst du selbst schauen. Ich habe einfach nur nach ein paar ausgewählten Stichworten gesucht und die aufgeführt. Es gibt keinen Anspruch auf Vollständigkeit bei der Tabelle die ich da rein kopiert habe…


#33

bin schon dabei :smiley:


#34

So, hier also die Ergebnisse meiner Analyse für Podigee:
Es gibt 1776 Feed-URLs mit “podigee” im Namen. Natürlich gibt es noch eine Dunkelziffer von Podcasts, die bei Podigee hosten, aber eine eigene Feed-Adresse haben. Die ist aber erfahrungsgemäß eher klein.
image

Während grad mal 52% der gelisteten Podcasts (8071 von 15265) in 2019 schon eine Folge rausgebracht haben, waren es für die mit einem Podigee-Feed 81% (1437 von 1776). Seit April waren es 58% (1043 von 1776). Macht auch irgendwie Sinn, da man ja bei Podigee nicht kostenlos hosten kann, dort also nur Feeds von noch aktiv betriebenen Podcasts liegen oder wo es den Leuten noch wichtig ist, dass sie online sind.
image

Seit Dirks letztem Crawling im Juli 2016 ist die Zahl der Podcasts mit Podigee-Feed um mehr als das 161-fache (von 11 auf 1776) gewachsen.


#35

Klasse, das ist echt spannend. Auch, weil viele noch Feedburner Feeds haben. Ich denke, das sind dann überwiegend “Old Farts”. Und der Post “hit’s me persönlich in da face” mit dem Tellerrand 309 Sept 2018.


#36

Ja, im Verzeichnis liegen ungefähr 50% “Leichen”


#37

Es gibt aber auch Podcasts, die eine fixe Anzahl von Episoden haben, und dann bewusst nie wieder neue Inhalte veröffentlichen (z.B erzählerische Formate). Es gibt sogar ein RSS-Attribut für diese Fälle:

<itunes:complete>

The podcast update status.

If you will never publish another episode to your show, use this tag.

Specifying the <itunes:complete> tag with a Yes value indicates that a podcast is complete and you will not post any more episodes in the future.

Specifying any value other than Yes has no effect.

Nutzt soweit ich weiß kein Mensch, sollten wir aber evtl. bei Podigee einbauen…


#38

Bei Podlove gibt es einen Haken dafür. #justsaying


#39

Ja, aber sind “Episodische Hörspiele auf RSS-Feed-Basis” mit “Complete” wirklich “Podcasts” im generischen Sinn? Das wäre auch mal zu diskutieren, gerade vor dem Hintergrund der aufkommenden Podbubble. Stichwort “Medienformate” und “Mediaformate” und “Vermarktung”.


#40

Stimmt natürlich. Allerdings bin ich mal so frech zu behaupten, dass eigentlich nur die aktiven und neuen Podcasts nennenswert HörerInnen finden. Da mag es Ausnahmen geben, aber ich selbst habe auch bisher keine Podcasts abonniert, die seit Monaten brachliegen und das liegt zum Teil eben daran, dass es genug spannende neue Inhalte gibt auf die ich aufmerksam werde…


#41

Sind das Podcasts? Ich würde sagen es sind welche, eben abgeschlossene. Nur weil die auf “complete” gesetzt sind heißt das ja nicht, dass es sich um Hörspiele handelt und selbst wenn würde das auch nichts ändern. Viel interessanter ist doch die Frage: Sind die relevant? Sprich: Ziehen solche Formate noch Hörerinnen an?

Das ist doch eine Frage, die zumindest teilweise von podigee beantwortbar sein müsste. Schließlich sehen die für über 1700 Podcasts die Zugriffsstatistiken.

@mati.podigee, @vanilla_chief - wäre es nicht allgemein interessant uns von diesen Statistiken mehr zu erzählen? Libsyn berichtet beispielsweise in ihrem Podcast “The Feed” einmal im Monat von ihren Statistiken. Wie viele Zugriffe finden im Mittel statt, Wie viele Zugriffe haben die Top Podcasts, woher kommen diese Zugriffe, welche Clients werden benutzt etc.

Ich fände toll das Equivalent dazu im Deutschen Markt zu bekommen…

//D


#42

Ja, das wäre eine tolle Sache. Da wir unsere Statistiken aktuell eh neu aufsetzen, könnten wir überlegen, wie wir bestimmte Daten anonym, Podcast-übergreifend auswerten können. Ich nehme das mal auf :slight_smile:


#43

fyi: Ich habe das Google Spreadsheet jetzt auch um die Anzahl Episoden und ein paar praktische Detailspalten ergänzt (z.B. gibt es jetzt eine Spalte in der ausschließlich die Domain steht)