Kleine Podcaststatistik-Kunde

Es ist verständlich: Wer für ein Publikum Inhalte produziert möchte irgendwann gerne wissen wie groß dieses Publikum eigentlich ist, welche Aktivitäten ggf. zu einem Hörer:innenzuwachs führten oder auch welche Inhalte im eigenen Format zu den erfolgreicheren zählen.
Deswegen kommt die Frage nach den diversen Kennzahlen und Statistiken immer wieder auf und ich beobachte, dass besonders Neulinge manchmal Schwierigkeiten haben diverse Zahlen einzuordnen und zu verstehen.

Darum hier mal ein zusammenfassender Sendegate-Post zum Referenzieren. Ich habe keinen Anspruch auf Vollständigkeit aber die Grundlagen möchte ich hier trotzdem mal ordentlich zusammenfegen.

I - Woher kommen eigentlich welche Zahlen?

Das größte Problem beim Gespräch über Podcastzahlen ist erst einmal festzulegen wovon wir überhaupt sprechen. Ganz grob betrachtet kann man folgende Bereiche unterscheiden:

  • Informationen die auf Server-Seite anfallen

    • Downloads der RSS Feed-Datei: gibt grob Auskunft über die Anzahl Abonnenten, ist allerdings so ungenau dass diese Zahl kaum Beachtung findet
    • Episodendownloads: Die wichtigste Kennzahl weil die einzige die im offenen Internet mit hinreichender Genauigkeit gemessen werden kann. Sogenannte Streams sind nichts anderes als „häppchenweise Downloads“. Dadurch dass die sequentiell ablaufen kann man bei denen auf Serverseite sehen wann Streams abgebrochen werden weswegen auch viele Plattformen versessen drauf sind ihre Hörer:innen zum Streamen zu bewegen.
    • Refer: Beim Download vom Server werden ein paar Daten ausgetauscht die dazu genutzt werden können
      • zwischen verschiedenen Podcast-Clients zu unterscheiden
      • um Mobil- von Desktop zu trennen.
      • um Download-Locations zu ermitteln (die IP Adresse erlaubt meist die Lokalisierung des Requests)
      • um ein paar Details über die verwendete Plattform zu erfahren (Betriebssystem, ggf. Browser)
    • Was auf Serverseite nicht zu sehen sind „Listeners“. Immer wieder mal sieht man in diversen Statistiken die Behauptung man könne sehen was wirklich abgespielt/angehört wurde und das stimmt nicht. Bei Streams kann man zwar mit Recht annehmen, dass auch gehört wurde (aber von wie vielen? Spielt der Podcast am Autoradio hören vielleicht mehrere Leute zu? Spielt er auf einem Lautsprecher vielleicht auch gerade niemand?), aber wenn wir von der einzigen wirklich immer anfallenden Zahl ausgehen, den DOWNLOADS, dann versteckt sich dahinter ein automatischer Vorgang der nur manchmal auch mit dem Konsum zu tun hat.
      Als Beispiel: Ich höre hier je nach Situation über 5-6 verschiedene Endgeräte meine Podcasts. Die holen fast alle via Download irgendwann die Episoden abonnierter Podcasts ab was einem Download entspricht, aber manchmal trotzdem nicht mal in ein einziges „Listener“-Datum übergeht…
  • Informationen die auf Client-Seite anfallen

    Die Abspiel-App kann ihre Nutzer:innen natürlich umfassend beobachten und manche nutzen das um private Statistiken zu zeigen. So kann ich in meiner Lieblingsapp sehen wie viele Episoden ich schon gehört habe, wie viele Stunden ich skippe. Der Client kann sich merken wo ich pausiert habe oder welche Episoden ich mehrmals höre etc. Diese Daten sind sehr begehrte Informationen aber (noch) werden die längst nicht immer weitergegeben.

    Ich schreibe „(noch)“ weil es einen eindeutigen Trend dazu gibt die Hörer:innen in geschlossene App-Plattformen zu zwingen. Wer beispielsweise Spotify’s Hörer:innen erreichen will (das sind da dann übrigens immer Spotify’s-Hörer:innen, nicht Eure…) muss in Kauf nehmen dass Spotify selbst hosted und damit Zugriff auf die Server-Statistiken hat und gleichzeitig nur über den eigenen Spotify Client ausspielt wodurch sie das komplette Verhalten am Client überwachen können. Und weil wir uns als Nutzer bei Spotify mit Account registrieren können die dann auch präzise ermitteln wer was wie lange und wie oft hört… Der feuchte Traum der Content-Marketers…

    Apple geht einen anderen Weg. Die überwachen das Nutzer:innen-Verhalten auch, allerdings hosted Apple nicht notwendigerweise selbst und sie ermöglichen der unabhängigen Podcast-Client-Szene (noch) den freien Zugriff auf ihr Podcastverzeichnis. Das führt zu einer gewissen Schizophrenie. Wer Apple Podcast am Handy nutzt meldet Apple fast so viel Information wie Spotify. Daraus setzt Apple dann seine Podcaststatistiken zusammen. Wenn man aber wie ich einen anderen Podcastclient bevorzugt erfährt Apple eigentlich gar nichts mehr. Alle Serverzugriffe landen dann beim Hoster und alle Clientzugriffe bleiben bei der verwendeten Abspielsoftware…

    Wie kommt da Podlove ins Spiel?
    Ganz einfach - Podlove „lebt“ auf Serverseite und bemerkt Downloadrequests. Weil reine Downloadstatistiken auch eine Menge weißes Rauschen in Form von mehrfachen Requests und inkonsistenten Referrs etc. enthalten säubert Podlove die Daten ein wenig und bringt sie in eine sinnvolle Darstellung. Aber im Grunde zeigt einem Podlove ausschließlich was auf dem Server passiert auf dem der Podcast gehostet ist. Und wer aufmerksam mitgelesen hat weiß jetzt auch warum da keine Durchhörquoten oder Abbruchstatistiken oder auch nur „Listeners“ dabei sind… Die sieht man nämlich auf Serverseiten eben nicht. Außerdem kann einem Podlove nicht verraten wie die Situation bei Spotify aussieht. Denn Spotify ist ein „walled garden“. Sie laden Eure Folgen genau 1x für sich selbst runter, ändern dann das Dateiformat und liefern exklusiv über den eigenen Client aus. Wer wissen will was da an Daten anfällt muss im Spotify Backend nachschauen oder den Podcast bei einem Podcasthost unterbringen der ein Datenaustauschabkommen mit Spotify hat. (Podigee, Libsyn, Bluebrry…)

  • Statistiken zu Interaktion mit den Inhalten
    Wer so drauf ist wie ich will nicht nur Downloads sehen sondern möchte mit dem Publikum auch interagieren. Feedback, Erwähnungen online, Kommentare im Blog oder Sternewertungen sind da relevant. Dafür gibt es keinen Standard aber ein paar Dienstleister die ein paar Zahlen systematisch zusammenkehren aber auch hier wenig Gemeinsamkeiten haben. Ich persönlich achte auf Kommentare im Blog, Link-Clicks auf Social Media (kann man z.B. dann messen wenn man tracked Links oder Redirects verwendet um auf Episoden hinzuweisen) und Feedbacks die direkt an mich gerichtet werden (meine wichtigste „Metrik“). Das alles ist hochindividuell, abhängig von Thema, Format, persönlichen Social Media Praktiken und den Plattformen die man im Blick hat…

  • Marktbetrachtungen
    Es gibt verdammt wenig belastbare Marktzahlen und diejendigen die man findet sind meistens sehr einseitig. Kann man noch grob abschätzen wie viele Podcasts es gibt indem man Apple und Spotify durchsucht (Im Jahr 2021 gibt es ca. 35000 Deutsche Podcasts) wird es bei allem anderen schwierig. Podcastvermarkter haben eine chronische Überbetonung kommerzieller Formate, diverse Studien fragen zum Teil sehr inkonsistente Szenarien ab und selbst große etablierte Erfassungen wie die ARD/ZDF Onlinestudie hat einige methodisch zweifelhafte Perspektiven. Hinzu kommt, dass manche sogenannte Marktstudie bei näherer Betrachtung einfach nur ein übersetztes US-Medienpanel ist. Solche Betrachtungen sind dann spannend aber hierzulande ansichtlich einer dramatisch anderen Situation nur wenig aussagekräftig.

II - Benchmarks - Womit vergleichen? Was vergleichen?

Schaut man erst mal auf Zahlen fragt sich manche:r welche Zahlen denn nun „gut“ wären. Wir haben diese Diskussion hier im Sendegate immer wieder und im Grunde läuft es immer auf die gleichen Grundfragen hinaus:

  • Was ist mein Ziel?
    (Eine auf Massenmarketing basierende Einkommensquelle? Aktivierung einer bestimmten Zielgruppe? Auftragsgenerierung? Spaß haben?)
  • Wie „alt“ ist mein Podcast?
    Es ist ein Marathon, kein Sprint. Podcasts wachsen langsam und stetig wenn man dran bleibt.
  • Welches Thema? Wie viel „Konkurrenz“ gibt es in meiner Nische? Welche Länge/Frequenz?

Sprich: Die ganz großen Vergleichszahlen taugen nur sehr wenig. Ein monatlicher Podcast für Kamelzucht wird mit 100 regelmäßigen Abrufen ein Riesenerfolg sein, ein wöchentlicher Podcast über Computergames mit Gewinnerzielungsabsicht durch Affiliate Marketing ist vielleicht selbst mit 3000 noch nicht wo er sein will.

Trotzdem hier mal zur groben Orientierung… Der größte spezialisierte Podcasthoster der Welt ist LibSyn in den USA und die nennen in ihrem Podcast-Metaformat „The Feed“ regelmäßig ihre Serverstatistiken. Demnach haben (Stand 2021) alle Podcasts die sie sehen im Mittel etwa 140 Downloads 4 Wochen nach Veröffentlichung. Diese Zahlen schwanken in den letzten 3 Jahren immer +/- 20 je nach Monat sind aber wirklich erstaunlich stabil. In anderen Worten: Wenn eine neu veröffentlichte Episode nach 4 Wochen über 140 Downloads bei Podlove zeigt performt der Podcast besser als 50% aller anderen da draußen. Wer über 1000 DLs kommt ist übrigens schon besser als dreiviertel aller…

Sollte man sich damit vergleichen? NEIN!
Dein Podcast ist in einer eigenen Nische mit eigenen Dynamiken, wir sind in Deutschland in einem ca. 3.5% großen Markt verglichen mit der USA Podcastlandschaft und auch das macht einen massiven Unterschied… Wer wirklich benchmarken will muss das viel gezielter tun. Entweder befragt man gezielt Podcaster die ähnliche Inhalte produzieren und zieht dabei dann auch eine gehörige Portion „Bragging“ ab oder man hat das Glück zu einem der Formate vergleichbar zu sein die ihre Statistiken offenlegen. Siehe dazu auch weiter unten die verschiedenen Quellen hier im Sendegate in denen sich da zu stöbern lohnt…

III - Ein paar Überlegungen zur Datenethik

In Sachen Statistik wird so manches an Schlangenöl vertrieben und oft werden Zahlen verglichen die nicht zusammenpassen. Was ich jetzt noch gar nicht angesprochen habe ist die Gruppe an Dienstleistern die sich als Marketing-Middlemen anzubieten versuchen. Chartable, PodTrac, Podwatch und diverse andere Dienste bieten an sich als eine Art „Download-Proxy“ einrichten zu lassen und dadurch dann Zugriff auf Zahlen zu geben. Die Idee ist hier unter anderem auch das Aggregieren „benachbarter“ Requests etc. Das Problem mit diesen Diensten: Für die Hörer:innen ist es nicht sichtbar dass ihre Zugriffe hier zu Marketingzwecken abgehört werden und ich finde es ethisch höchst zweifelhaft wenn ich als Podcastproduzent die Datensicherheit meines Publikums meinem eigenen Wunsch nach detaillierten Statistiken unterordne.

Können wir bei Spotify vielleicht noch argumentieren dass Hörerinnen und Hörer ja schließlich bewusst in das Ökosystem kommen und den Bedingungen zustimmen ist das bei Download-Proxies wirklich sehr zweifelhaft.

Einer der marktführenden Podcastclients „Overcast“ hat daher inzwischen sichtbare Warnungen im Client um darauf hinzuweisen wenn Podcaster sich entschieden haben Downloadzugriffe durch Dritte tracken zu lassen.

Ich behaupte eigentlich braucht es keine anderen Statistiken als Downloadtrends über Zeit um zu wissen wie der eigene Podcast wächst oder schrumpft. Ich selbst achte auf die Downloads am 1. Tag (zeigt grob wer „sofort downloaden“ aktiviert hat) und dann die Downloads nach 4 Wochen (zeigt langfristiges Positiv/Negativ-Wachstum). Gehen die Zahlen hoch bin ich zufrieden, gehen sie runter achte ich darauf ob das einmalig oder trendend ist. Wenn letzteres frage ich meine Hörer:innen und Hörer und beachte deren Feedback…

Überhaupt: Wer für die Ausrichtung des eigenen Formats mehr wissen will als die Downloads sollte meiner Meinung nach zu Umfragen greifen oder Fokusgruppen organisieren bei denen Hörer:innen zustimmen „überwacht“ zu werden. Alles andere fühlt sich für mich problematisch an, ganz egal ob es eine immer öfter akzeptierte Praxis ist oder nicht.

IV - Wo weiterlesen? Interessante Artikel und Threads zum Thema im Sendegate (unvollständige Liste)

27 „Gefällt mir“

Top Artikel, danke Dir! Inhaltlich sehe ich es so wie Du.

3 „Gefällt mir“

Perfekt zusammengefasst, sauber!

2 „Gefällt mir“

Danke für die Zusammenfassung. Den Inhalt unterschreibe ich genau so. Danke!

2 „Gefällt mir“

Toll! Danke. Hier werde ich in Zukunft hin verlinken, wenn ich das nächste Mal Fragen beantworten muss, die ich selber nicht beantworten kann oder will.

2 „Gefällt mir“

Klasse Beitrag, Dirk. Dankeschön! :+1:

2 „Gefällt mir“

Super Zusammenfassung und Einordnung. Vielen Dank für Deine Mühe Dirk! :+1::100:

1 „Gefällt mir“

Super erklärt Dirk. Herzlichen Dank für Deine Mühe. :slight_smile:

1 „Gefällt mir“

Eine Verständnisfrage habe ich noch:
Wenn von Downloads die Rede ist, sind dann alle Downloads, also auch die von Bots, gemeint oder nur die, die Usern zuzuordnen sind?
Nachdem wir nun zu Let’s Cast gewechselt sind, stelle ich nämlich fest, dass Erstere etwa 10fach höher sind.

Danke,

Vera

1 „Gefällt mir“

Kurze Antwort: Ja, wenn ich von Downloads sprach dann meinte ich alle, auch Bots. Wie ich nämlich ausgeführt habe kann man eigentlich nur dann wirklich User unterscheiden wenn man gleichzeitig einer fortgeschrittenen „Überwachung“ zustimmt indem man einen Client nutzt der dir einen Nutzeraccount zuordnet und diese Info dann auch mit dem Server abgleicht. Spotify macht das so, Apple’s Podcast Client macht das auch.

Lange Antwort:
Ein wenig Graustufe…
Rein technisch sieht man einzelnen Downloads zwar nicht an ob sie von einem Bot kommen, aber manche Bots geben im Referrer an das sie ebensolche sind. Daraus generieren dann manche eigene Statistiken, also z.B. einen Überblick über die Clients. Sieht bei Podlove z.B. so aus:
image

Im Allgemeinen nimmt man (Podlove macht das eben z.B. so) hier alles raus was man zweifelsfrei als Bot identifiziert hat (weil es sich selbst so benennt).

Außerdem gibt es natürlich auch noch Wege Zugriffe zu gruppieren, etwa weil sie von bekannten Adressen kommen oder weil sie z.B. mehrfach in sehr kurzer Zeit aufschlagen etc. Es gibt also durchaus Wege die Zahl ein wenig aufzubereiten und alle Anbieter von Analytics machen das mehr oder weniger aufwändig.

Trotzdem noch mal ganz deutlich: Ohne Nutzerüberwachung keine Zuordnung zur Person. Will heißen: Im freuen Podcastuniversum siehst du nur „eine Episode wurde runtergeladen“. Du kannst dann evtl. bestimmte Downloads als „wahrscheinlich war das hier ein Crawler / Bot“ identifizieren, aber schon die Frage ob dieselbe Person mehrfach (z.B. mit verschiedenen Geräten) herunterlädt bleibt unbeantwortet.

//D

Danke für die Erläuterung, @dirkprimbs!

Bedeutet dies dann auch, dass die Downloadzahlen, die von erfolgreichen Podcasts gerne genannt werden oder auch als Grundlage für Anzeigenpreise dienen, ebenfalls diese größeren Zahlen inkl. Bots sind?

Ist das bei dir dauerhaft so? Ich weiß, dass es vor 1-2 Monaten Fälle gab, in denen bei Letscast gehosteten Podcasts stark gesteigerte Bot-Zugriffe verzeichnet wurden. Diese konnten identifiziert und korrigiert werden.

1 „Gefällt mir“

Hey zusammen,

@zazou103 Bei einem Podcast-Umzug ändert sich oft auch die RSS-Feed URL und darin enthalten dann auch die URLs zu den Audio-Dateien, diese werden hier vom CDN von LetsCast.fm ausgeliefert. Einige Plattformen/Portale („deren Bots“) laden daraufhin die Audio-Dateien neu herunter und werden, wenn richtig erkannt, auch als Bot markiert und im Statistik-Dashboard angezeigt. Momentan nutzen wir dafür unter anderem diese Liste: https://github.com/opawg/user-agents/blob/master/src/user-agents.json.

Es kann also nach Wechsel durchaus sein das erstmal vermehrt Bot-Downloads stattfinden, das normalisiert sich aber für gewöhnlich.

@christianeattig Die damaligen Zugriffe waren getarnt als „Download über iTunes“ (UserAgent: iTunes/12.9.5 (Macintosh; OS X 10.14.5) AppleWebKit/607.2.6.1.1 (dt:1)), entstanden aber alle aus der Microsoft® Azure Cloud.

Ein ausfiltern über die Adressen wird dazu im IAB-Standard empfohlen:

There are a number of scenarios where the raw requests include requests that should not be counted because they likely come from bots or from products that behave in ways that make them look like real downloads. IAB recommends that metrics providers filter potential bots and bogus requests.

The recommendation is to implementing data from external sources, such as lists of known datacenters/cloud IPs, or analysis of suspicious behaviour at the IP level.

Wir hatten das damals auch an Microsoft gemeldet, aber nur den Hinweis auf „Kunden in der Cloud“ erhalten. Innerhalb der Open Podcast Analytics Working Group hatte sich noch ein andere Podcast-Hoster (UK) dazu gemeldet, aber irgendwann war Ruhe :wink:

1 „Gefällt mir“

Da gibt es ein Missverständnis @knoxmic und @christianeattig
Das Zehnfache bezieht sich auf das Verhältnis von Downloads ohne Bots zu der Gesamtzahl mit Bots.
Ich denke nicht, dass die Zahl bei Let’s Cast generell höher ist.
Bisher hatte ich nur die Zahlen von Chartable und da sind die Bots auch nicht berücksichtigt, denke ich.

Naja, besonders die großen Formate hosten ihren Kram ja bei professionellen Dienstleistern wie etwa Podigee und die filtern den „Lärm“ so gut es geht raus.

1 „Gefällt mir“