Daten aus dem iTunes Podcast Verzeichnis

Der @eazy kann da vermutlich schöne Statistiken hervor zaubern, denn fyyd.de arbeitet immerhin mit dem crawl :wink:

1 „Gefällt mir“

Vielleicht noch ein paar Eckpunkte für die Podcastverzeichnisafficionados:

Surface Book i7 Core 2 HT 16GB RAM SSD, Windows 10 Pro x64, .NET 4.6.2 XML-DOM, MSSQL 2016 ENT, VSDL50/10, WiFi. Ein kompletter Scan der Datei dauert etwas über 5min (302s). Die Downloadmenge der Feeds beträgt 550MB.

Aktuelle Zahlen von heute Abend nach Kategorien (ungefähr):
Kunst: 30000
Wirtschaft: 22000
Komödien: 27000
Bildung: 20000
Spiele & Hobbys: 15000
Regierung & NGOs: 4000
Gesundheit: 12000
Familie & Kinder: 3000
Musik: 35000
Nachrichten & Politik: 13000
Religion & Spiritualität: 48000
Wissenschaft & Medizin: 4000
Gesellschaft & Kultur: 22000
Sport & Freizeit: 18000
TV & Film: 14000
Technologie: 10000

4 „Gefällt mir“

Hi Heiko,
erst mal vielen Dank für das Update und Deine klasse Arbeit/ Zeitinvest!

Mich würde neben den genannten Zahlen pro Kategorie aus 8/2017 auch noch einmal die Gesamtanzahl der gelisteten deutschen Podcasts interessieren. Nur so um ein Gefühl für den überall ausgerufenen “Podcast Boom” und das Momentum zu bekommen…

Wir haben ja weiter oben im Thread gesehen, dass es in 2/2016 rund 4000 Podcasts in deutscher Sprache gab (DACH hauptsächlich, schätze ich?).

Wie viele gibt es also nun 2 Jahre später?

Beste Grüße und im voraus schon einmal vielen Dank

Jens

Einfach meinem Link oben folgen und das Skript laufen lassen :wink:
Alternativ weiß auch der @eazy ein wenig genauer wie viele zur Zeit gelistet sind…

//D

Zahlen für deutsche Podcasts habe ich nicht, aber so wie es für mich aussieht, kommen weltweit pro Tag etwas weniger als 500 Podcasts dazu. Insgesamt habe ich ca. 390.000 Feeds gesammelt, von denen erfahrungsgemäß mehr als 80% live sind, wenn ich das nicht falsch vergessen habe. Ich gucke nicht jeden Tag nach, und ob mein Scanner immer richtig liegt, weiß ich auch nicht. Könnten auch alles Alternative Facts sein.

Hey,
ja danke für den Tipp, das müsste ich mir mal genauer anschauen. Ich dachte vielleicht ist hier jemand dabei, der die Zahlen zufällig periodisch beobachtet…
Thnx
J

Hi Heiko,
echt Wahnsinn, jeden Tag fast 500 neue…
Ich schau mir mal das Script an, vielleicht bin ich nicht zu doof um es ans laufen zu bringen und filtere dann mal nach deutschen podcasts.
Danke Dir
Jens

1 „Gefällt mir“

Es war mal wieder Zeit…
Ich habe meinen Crawler neu geschrieben und die als Deutschsprachig identifizierbaren Podcasts aus dem Directory gefischt. Wer will kann in diesem Google
Spreadsheet
mit den Daten spielen oder hier das Excel File samt Pivot (2,7MB) herunterladen.
Für technisch versierte habe ich auch hier ein dekoratives JSON File (ZIP, 890kb)…

Wer selbst ran will oder wissen möchte wie mein Crawler funktioniert, der läd hier das Python Skript runter. Aber Achtung:

  1. Das Ding ist Quick & Dirty, erwartet keine besonders hohe Qualität
  1. Die iTunes API gibt nur sehr wenig Infos her weswegen ich außerdem jeden Feed abrufe. Wenn man das daheim nachmacht, dann zieht man nicht nur sehr viel Daten sondern sollte auch knapp eine Woche Zeit für den Crawl einplanen (ca. 750000 Feeds x ca. 1 Sekunde Zeitaufwand = 8,3 Tage)

Viel Spaß damit!

Quick Highlights:

  • Insgesamt sind in itunes 15265 Podcasts registriert deren Feeds im Language Tag als Sprache “de*” tragen also sich selbst als Deutsch identifizieren.
  • die verteilen sich auf 11060 unterschiedliche Podcaster (bzw. unterschiedliche Angaben bei “Autor”
  • Davon haben 7194 dieses Jahr noch kein Update gesehen. Sprich: knapp die Hälfte sind entweder verstorben oder pausieren.
  • Soundcloud hat mit 1585 Feeds immer noch einen ordentlichen Anteil.
  • anchor-feeds sind mit 655 auch ordentlich vertreten.
  • Lt. iTunes ist “Bildung” mit 1107 Podcasts die “vollste” Kategorie gefolgt von “Gesellschaft und Kultur” (1095) und “Musikfilme” (933, wtf?)
  • 2873 Podcasts stammen von 83 Podcastern mit mehr als 10 registrierten Sendungen. Keiner davon ist privat.
10 „Gefällt mir“

Wow! Danke, danke, danke!

2 „Gefällt mir“

nicht, dass ich mich zu früh freue, aber interpretiere ich deine XLSX-Datei richtig, dass die meisten Feeds eine podigee.io-Feed-URL haben?

Da musst du selbst schauen. Ich habe einfach nur nach ein paar ausgewählten Stichworten gesucht und die aufgeführt. Es gibt keinen Anspruch auf Vollständigkeit bei der Tabelle die ich da rein kopiert habe…

bin schon dabei :smiley:

2 „Gefällt mir“

So, hier also die Ergebnisse meiner Analyse für Podigee:
Es gibt 1776 Feed-URLs mit “podigee” im Namen. Natürlich gibt es noch eine Dunkelziffer von Podcasts, die bei Podigee hosten, aber eine eigene Feed-Adresse haben. Die ist aber erfahrungsgemäß eher klein.
image

Während grad mal 52% der gelisteten Podcasts (8071 von 15265) in 2019 schon eine Folge rausgebracht haben, waren es für die mit einem Podigee-Feed 81% (1437 von 1776). Seit April waren es 58% (1043 von 1776). Macht auch irgendwie Sinn, da man ja bei Podigee nicht kostenlos hosten kann, dort also nur Feeds von noch aktiv betriebenen Podcasts liegen oder wo es den Leuten noch wichtig ist, dass sie online sind.
image

Seit Dirks letztem Crawling im Juli 2016 ist die Zahl der Podcasts mit Podigee-Feed um mehr als das 161-fache (von 11 auf 1776) gewachsen.

4 „Gefällt mir“

Klasse, das ist echt spannend. Auch, weil viele noch Feedburner Feeds haben. Ich denke, das sind dann überwiegend “Old Farts”. Und der Post “hit’s me persönlich in da face” mit dem Tellerrand 309 Sept 2018.

1 „Gefällt mir“

Ja, im Verzeichnis liegen ungefähr 50% “Leichen”

Es gibt aber auch Podcasts, die eine fixe Anzahl von Episoden haben, und dann bewusst nie wieder neue Inhalte veröffentlichen (z.B erzählerische Formate). Es gibt sogar ein RSS-Attribut für diese Fälle:

<itunes:complete>

The podcast update status.

If you will never publish another episode to your show, use this tag.

Specifying the <itunes:complete> tag with a Yes value indicates that a podcast is complete and you will not post any more episodes in the future.

Specifying any value other than Yes has no effect.

Nutzt soweit ich weiß kein Mensch, sollten wir aber evtl. bei Podigee einbauen…

3 „Gefällt mir“

Bei Podlove gibt es einen Haken dafür. #justsaying

3 „Gefällt mir“

Ja, aber sind “Episodische Hörspiele auf RSS-Feed-Basis” mit “Complete” wirklich “Podcasts” im generischen Sinn? Das wäre auch mal zu diskutieren, gerade vor dem Hintergrund der aufkommenden Podbubble. Stichwort “Medienformate” und “Mediaformate” und “Vermarktung”.

Stimmt natürlich. Allerdings bin ich mal so frech zu behaupten, dass eigentlich nur die aktiven und neuen Podcasts nennenswert HörerInnen finden. Da mag es Ausnahmen geben, aber ich selbst habe auch bisher keine Podcasts abonniert, die seit Monaten brachliegen und das liegt zum Teil eben daran, dass es genug spannende neue Inhalte gibt auf die ich aufmerksam werde…

1 „Gefällt mir“