Ich versuche gerade die Abrufstatistik einer älteren AstroGeo-Folge zu verstehen. Vielleicht habt ihr eine Idee dazu:
Es geht um die Folge Expandierende Erde: zu große Zahlen und zu kleine Schwerkraft vom 1. Mai 2025. Nach einem normalen Abrufpeak in den ersten Tagen und dem normalen Long Tail seither gab es seit gestern (6.8.25 08:00) einen neuen Peak von 3000 Abrufen.
Beim Reinzoomen sagt mir der Podlove Publisher, dass diese Abrufe über einen webplayer/unknown kommen (also nicht über die gewöhnlichen Wege der Webseite astrogeo.de). Gleichzeitig sehe ich bei den Clients vor allem Podcatcher-Apps. Schon das passt nicht zusammen. Die Podcatcher laden über den Feed.
Ich habe nun über Suchmaschinen gesucht, ob jemand die Folge irgendwo neu eingebettet hat. Die Referer-Statistik der Webseite zeigt auch keine auffällige Seite, die auf uns verweist.
Was gegen einen Crawler spricht: Man sieht einen Tagesrhythmus, mit einem Peak gestern vormittag, einem Abfallen über Nacht und einem neuen Anstieg heute.
Hat jemand eine Idee, was ich noch probieren könnte, diesen Peak zu erklären?
Interessant. Ich würde mal in der Datenbank die Download intents konkret anschauen. Welche Betriebssysteme und clients sind denn genau angegeben?
Apropos Crawler: z.B. Perplexity crawlt nicht nur um einen Index zu erstellen, sondern auch live wenn der Nutzer gerade Quellen sucht. Wenn die Robots.txt KI oder andere Robots ausschließt, dann probieren sie es einfach nochmal und geben sich diesmal als Safari auf MacOS aus. Das kam gerade bei der „Cloudflare-block-KI-Crawler“ Diskussion heraus.
Ich grase gerade durch die Datenbank. User Agents sind bunt gemischt (das zeigt ja auch das Backend). Unknown in der Statistik ist ein leeres Feld (null).
Wenn das ein Crawler ist, fragt sich halt, warum der nur eine Folge abgrast.
Eigentlich schon. Was dagegen spricht, sind die Userclients: 50% Apple Podcasts, Podcast Addict, Overcast, Antennapod. Das ist die normale Verteilung von einem Feedabruf. Ich verstehe nur nicht, wieso die nicht als Feed-Abruf gezählt werden.
Da kommt mir noch die “Podcast Episoden GUID” in den Sinn. Am Ende der Podlove-Folgenseite gibt es eine Funktion diese neu zu erstellen, was dazu führt, dass alle Clients die Datei neu herunterladen. Da die Folge schon alt ist, würden wahrscheinlich nicht alle aber einige Clients neu laden.
Schließe mich an. Ich hatte das auch, sogar nur extremer. Eine 4-5 Jahre alte Folge erhielt dann auf einmal an einem Tag 9000 Abrufe. Ich hab viel Zeit reingesteckt und konnte es nicht klären.