Netzwerkstudie zur Podcasthörerschaft?

Sonntagssoziologe · 30. Mai 2015 um 20:57

Hallo,

ok, Studie ist etwas hoch gegriffen, aber ich hätte mal Lust, eine Netzwerkgrafik zu erstellen, die zeigt, welche Podcasts die Hörer gemeinsam hören, also ob Hörer von Wissenschaftspodcasts auch Laberpodcasts hören oder ob sich das mischt; ob Hörer thematisch auf Linie bleiben oder bunt durcheinander hören.

Dazu würde eine Onlineumfrage mit nur ein paar wenigen Fragen reichen., wie “Welche Podcasts hörst du noch?” usw.

Das Problem: für aussagekräftige Ergebnisse müssten wirklich quasi wenigstens Sendegatepodcaster mitmachen und in ihren Podcasts zur Beantwortung der Umfrage drängen. Es gäbe zwar auch dann noch Verzerrungen, da die Aufforderung eines etablierten Podcasters an seine Hörer wohl mehr wiegt als eines kleineren. Ich wäre dennoch auf das Ergebnis gespannt.

Haltet Ihr die Umsetzung für realisierbar?

timpritlove · 30. Mai 2015 um 22:31

Vielleicht solltest Du einfach mal auf die Datenbasis von http://podfilter.de zugreifen.

Sonntagssoziologe · 1. Juni 2015 um 22:20

Vielen Dank für den Hinweis.

Zunächst habe ich die Daten der Podcasterstudie 2014.

Ich hatte noch keine Zeit zum Auswerten, konnte aber mal auf die Schnelle eine Grafik herstellen.

Podcastthemen, die nahe beieinanderliegen, haben Hörer, die ähnliche Podcasts hören. Je größer ein Thema dargestellt ist, desto mehr Hörer hat es. Man sieht auf der linken Seite, dass es einen Hörerklumpen gibt, der nur auf Technik, Gesellschaft, Wissenschaft steht, also ein CRE-Prototyp. Interessant ist, dass sich diese Hörerschaft gar nicht sehr für Wirtschaftsthemen interessiert. Neben den CRE-Nerds scheint es eine Hörerschaft zu geben, die zwar ebenfalls technisch-politisch-wissenschaftlich interessiert ist sich darüber hinaus aber in zwei Interessensgruppen teilt: in die zweiteilt einmal in Popkulturmenschen, die Filme und Serien mögen und in die klassischen Kulturmenschen, die für Kultur und Musik schwärmen. Überraschend ist für mich die Position der Religion. Das Thema hätte ich näher der Kultur vermutet.

Um meine Einschätzung zu testen, müsste ich Rechenalgorithmen drüberjagen, welche die Hörer in Kategorien gruppieren. Dazu fehlt mir aber gerade die Rechnerkapazität, da rechnet mein Teil schonmal ne Stunde oder so dran

Als nächstes will ich mal schauen, ob sich die verschiedenen Themeninteressen mit verschiedenen Finanzierungsbereitschaften in Verbindung bringen lassen.

timpritlove · 1. Juni 2015 um 22:38

Interessante Auswertung. Das schreit ja gerade nach einer umfangreicheren Datenbasis. Vielleicht solltest Du mal mit @martinhering über eine (anonyme) Auswertung der Subscriber innerhalb von Instacast sprechen.

Sonntagssoziologe · 1. Juni 2015 um 22:45

Das mache ich glatt.

Hanno_Schwede · 3. Juni 2015 um 02:33

Nachdem ich nun beim @Nicolas nachgefragt hatte und wieder auf ein Projekt vom Modellansatzim Sendegate @Sebastian gestoßen bin, erinnert mich das Thema an dieses hier:

http://modellansatz.de/graphs/

stefanwienert · 3. Juni 2015 um 10:49

Entwickler von http://www.podfilter.de hier
Bei Interesse an den Daten koennen wir sicher ein Moeglichkeit finden. Bisher hatte ich noch nicht die Zeit gefunden eine ordentliche API zu bauen. Auch eine Visualisierung der Netzwerke finde ich spannend!

FYI:

Ich berechnet Aehnlichkeiten wie folgt:

1. Empfehlung

Mein Algorithmus ist einfach nur: Gib mir die zu mir 10 aehnlichsten Podcast-Listen (OPML-Dateien) und davon die Top-Podcasts die ich noch nicht abonniert habe (TopK Similarity)

###2. Aehnliche Podcasts zu Podcast X

statt topK nehm ich einfach alle Listen. D.h. was haben alle Podcast-Listen wo der entsprechende Podcast drin ist an Podcasts am haeufigsten gemeinsam (aus derselben Itunes Categorie).

Sonntagssoziologe · 3. Juni 2015 um 11:14

Was genau meinst du mit “ähnlichsten Podcastlisten”? Die Übereinstimmungen der Podcasttitel?

Deine Algorithmen sind Klasse für Podcastnutzer. Um einen Überblick über das Gesamtnetzwerk zu erhalten, würde ich vielleicht weitergehend auf einen Standard-Algorithmus der sozialen Netzwerkforschung zurückgreifen. z.B. den Fruchtermann-Reingold Algorithmus, der in der Software Pajek integriert ist. Der basiert auf einem physikalischen Federkraftmodell, bei dem zwischen allen Knotenpaaren eine abstoßende und zwischen benachbarten eine anziehende Kraft festgelegt wird. Daraus simuliert er Springfedern, die irgendwann zum Stillstand kommen und ähnlich vernetzte Knoten nahe beieinander positionieren. Der eignet sich für große Netze.

Als Basis dafür bräuchte man eine Tabelle in der jeder anonymisierten User-ID ein Podcasttitel zugeordnet ist. Idealerweise auch jedem Titel ein Thema, aber das muss nicht.

Sebastian · 3. Juni 2015 um 13:48

Es ist zwar schon etwas her, aber @rstockm hatte angeregt, dass man das ja auch gleich automatisieren kann.

Ich habe die Informationen aus den Podcast-Seiten von iTunes übernommen- hier sind bei jedem Podcast fünf weitere Podcasts angegeben, die Hörende dieses Podcasts auch hören. Und man kriegt auch gleich Bilder zu jedem Podcast.

Diese gerichteten Graphen lasse ich für alle Podcasts aus einer (recht zufälligen) Liste sammeln und dann bis in eine bestimmte Tiefe mit beispielsweise Neato von GraphViz automatisiert visualisieren.

Bezogen auf den Startpodcast werden die umliegenden Podcasts durch die bestehenden Kanten im Graph gruppiert und näher oder weiter von einander gestellt. Natürlich könnte man die maximale Kantenlänge vom Startpodcast vergrößern, oder mehrere Podcasts als Start-Knoten verwenden- das wurde aber ziemlich schnell unübersichtlich oder brauchte mehr Speicher als mein virtueller Server gerade hatte.

Aber auch so kann man ein paar interessante Schlüsse ziehen: Damals konnte man auch unter den Hörenden einen gewissen Wissenschafts-Podcast-Cluster erkennen- zumindest zwischen den Podcasts die vernetzend tätig sind, und gegenseitig auf interessante Themen hinweisen. (Ergo: Die Zuhörerschaft nimmt Empfehlungen sehr positiv auf!)

Noch stärker fiel der Geocaching-Cluster auf- hier gab es damals eine ganz eingeschworene Gemeinschaft, die sehr themenbezogen die Podcasts abonnieren.

Natürlich muss man diese Ergebnisse sehr mit Vorsicht betrachten- immerhin gibt es auf iTunes keine Zahlen, es geht nur um die Nutzer von iTunes, und es gibt auch immer nur höchstens fünf Kanten pro Knoten. Dafür gibt es diese Statistik ziemlich aktuell und für alle Podcasts, die auf iTunes gelistet sind.

Die Graphen waren für mich ein kleines Experiment, ich würde mich sehr freuen, wenn das jemand weiter verfolgt, oder einen umfassenderen Dienst dafür zur Verfügung stellt. Ich lasse das Skript gerade neu durchlaufen und werde heute abend eine aktualisierte Fassung (mit mehr Podcasts) online stellen.

Update: Auf http://modellansatz.de/graphs/ gibt es jetzt aktualisierte Graphen, und ich habe die Liste der Podcasts, für die die Graphen erzeugt wurden etwas vergrößert.

Sebastian · 4. Juni 2015 um 08:41

Es gibt unterschiedliche Cluster, teilweise orientieren sich die Hörer nach den teilnehmenden Personen, teilweise aber auch sehr stark thematisch. Ein paar Beispiele:

Fußball: http://modellansatz.de/graphs/collinas-erben.jpg

Coaching: http://modellansatz.de/graphs/gesund-fuehren-podcast.jpg

Geocaching: http://modellansatz.de/graphs/geocaching-podcast-aus-berlin.jpg

Referenzieren die Podcasts sich oft gegenseitig? Oder gibt es eine gemeinsame themenbezogene Plattform, die zur gemeinsamen Hörerschaft führen? Fallen euch weitere Zusammenhänge auf?

Zu den ganzen Fragen, wie sich unsere Szene darstellen und neue Hörerinnen und Hörer gewinnen kann, sind die Daten doch recht spannend.

Sonntagssoziologe · 4. Juni 2015 um 10:40

Respekt! http://modellansatz.de/graphs/ ist ja eine gigantische Fundgrube. Gibt es dazu einen schickbaren Datensatz? Das würde ich gern mal als Gesamtnetzwerk für eine Makroansicht aufbereiten.

Ich habe nach spontanem Herumklicken den Eindruck, dass Radiopodcasts vor allem mit anderen Radiopodcasts und Privatpodcasts mit anderen Privatpodcasts verknüpft sind. Dadurch bleiben Empfehlungen untereinander insgesamt ein Nullsummenspiel. Die Hörer werden nur anders verteilt, zugewonnen wird keiner. Neue Hörer ließen sich aber aus jenen Radioclustern gewinnen, in denen dann doch auch Privatpodcasts auftauchen. z.B. hier Wannhoffs Wissenschaft und die Sternengeschichten. Wenn beide mehr für die Podcastszene werben würden, erreichte das auch Hörer des öffentlich-rechtlichen. Ich bin z.B. genau so ins Podcasten reingerutscht, zuerst WDR5, BR2, SWR2, dann Wannhoffs Wissenschaft und schon war ich drin.

Podcaster, die als Brücken zwischen Radio- und Privatpodcast fungieren können, sollten eine regelmäßige Podcastrubrik einführen, in der sie aus der Szene berichten. Das hielte ich für ein angehbares Aquisekonzept.

Sebastian · 7. Juni 2015 um 21:26

Mit dem Skript auf der Seite lassen sich die Graphen und Daten schnell & automatisiert erzeugen- ich habe bei der Erstellung des Stands vom 3.6. aber vieles herausgeworfen, da uns die Netzwerke der englischen Podcasts aktuell ja nicht so sehr interessieren.

Mir ist nicht ganz klar, wie man das Gesamtnetzwerk sinnvoll visualisieren soll- die Anzahl nötiger Dimensionen erscheint mir zu hoch. Den Stand vom 3.6. habe ich in einem Archiv kurz zusammengefasst. In dem Archiv befinden sich drei Dateien:

kanten.txt: Pro Zeile zwei iTunes-IDs, Quelle und Ziel der Kante
bilder.zip: Bilder der Podcasts nach iTunes-ID
namen.txt: Pro Zeile eine iTunes-ID und der Anfang des Namens.

Ich bin gespannt, ob da jemand eine sinnvolle Darstellung des Gesamtnetzes erstellen kann.

Sonntagssoziologe · 8. Juni 2015 um 11:03

Mit einer Gesamtschau meine ich die Verknüpfung zwischen jeder einzelnen Hörer-ID und den von ihr abonnierten Podcasts. Das würde unter Berücksichtigung der Anzahl von Hörern zeigen, was es für Themen-Cluster gibt und welche Podcasts als Brücken zwischen den Clustern dienen können.

Sebastian · 13. Juni 2015 um 20:20

Das wäre echt interessant! Ich bin gespannt, was herauskommt.

stefanwienert · 14. Juni 2015 um 13:12

Ich habe gerade eine entsprechende Schnittstelle live geschaltet. Dazu braucht man allerdings einen API-Key von Podfilter (unten im Dashboard nach dem Einloggen).

Danach kannst du die Daten so abgreifen:

http://www.podfilter.de/api/v1/subscribers/flat_subscriptions.csv?api_key=…
.csv oder .json geht beides.

Sonntagssoziologe · 16. Juni 2015 um 11:03

Genau das ist es, perfekt, vielen Dank! Sobald ich Zeit habe, setze ich mich dran. Umzugsbedingt wahrscheinlich im Juli.

ohneQ · 11. August 2015 um 12:36

Interessant finde ich in meinem Fall, dass “Der will doch nur spielen!” (Comedyformat) durchaus Verbindungen mit Radiocomedy haben. Gerade große Podcasts (beispielsweise Wrint, Pietsmiet etc.) haben relativ wenige Verbindungen, während meiner recht viele hat.

Das kann einerseits an der Dauer liegen (Dwdns!: ca. 5 Minuten), andererseits scheint die Empfehlung zwischen Podcasts eher bei Kleineren statt zu finden.

Das wirkt auch logisch, da Kleinere weniger Input von Außen haben.

Das könnte bedeuten, dass wir Kleineren um die selben Personen buhlen und nach Wegen suchen sollten, mehr Hörer von außerhalb unserer Bubble zu bekommen.

Weiß jemand ob das ab und zu aktualisiert wird?
Mich würde das gerade für meinen zweiten Podcast interessieren, der ist allerdings noch nicht unter den 804 Podcasts gelistet, die auf der Seite sind und auch iTunes wirft noch keine Empfehlungen aus.

Sonntagssoziologe · 17. August 2015 um 11:00

Die Auswertung ist aufwändiger als ich dachte, da der Datenwust inhaltlich reduziert werden müsste. Ich kann daher nicht absehen, ob und wann ich dazu komme.

crossgolf_rebel · 17. August 2015 um 19:49

Ich habe da mal noch eine Frage, die Auswertung läuft doch über iTunes - werden damit nicht eine ganze Menge User von der Auswertung ausgeschlossen und befindet man sich da nicht in der Apple Bubble?
Ich bin Win und Android Nutzer und nutze iTunes überhaupt nicht und das machen sicher noch eine ganze Menge andere so.

Sonntagssoziologe · 17. August 2015 um 21:08

Völlig richtig. Solche Daten sollten nicht zur Erklärung der Welt herangezogen werden, sie spiegeln nur eine bestimmte Bubble wider. Bei sowas geht es mehr ums entdecken und Hypothesenformulieren. Anschlussuntersuchungen müssten folgen.