Podcasts bei Wikidata

Podcasts bei Wikidata

Ich habe mir vorgenommen, die Abbildung von Podcasts in Wikidata ein wenig zu verbessern.


Eine Vorbemerkung: Die Suche im Sendegate hat ergeben, dass das Thema gerade erst bei der Subscribe 7 besprochen wurde: #sub7-Doku: WikiData Insofern sollte ich kurz darauf eingehen, genauer auf diese These:

[quote=„nethad, post:2, topic:3221“]Dabei kamen wir zum Schluss, dass…

Wohl die Podcast-(Meta)daten nicht in Wikipedia selbst landen werden/sollen. Wikidata konzentriert sich auf „enzyklopädisches Wissen“, und da sind Podcasts leider oft nicht im Geltungsbereich. Das Schöne ist aber, dass sich die Daten wunderbar linken lassen, sodass Daten gar nicht in Wikidata selbst sein müssen.[/quote]

Ich weiß nicht, wie genau die erarbeitete These wiedergegeben ist, aber ich würde teilweise widersprechen. Zunächst, wenn ein Podcast nicht bei Wikipedia vorhanden ist, ist das noch kein Ausschlusskriterium für Wikidata. Das sollte man unterscheiden. Liegt auch an den Unterschieden zwischen den einzelnen Wikipedia-Projekten: In der englischen sind die Aufnahmekriterien allgemein entspannter, dementsprechend sind dort mehr Podcasts vorhanden (zugegeben könnte auch mit der Reichweite zu tun haben) und die bekommen dann soweit ich weiß automatisch einen Wikidata-Eintrag. Allerdings tatsächlich möchte ich auch kein Podcast-Verzeichnis importieren, was man sowieso automatisieren müsste. Ich würde also auch Relevanzkriterien anlegen, darauf gehe ich weiter unten ein.


Ich sehe zwei Hauptpunkte, die, sofern Interesse besteht, hier diskutiert werden könnten:

  1. Welche Struktur sollen die Einträge zu Podcasts bei Wikidata haben? Und da man sich am vorhandenen orientieren kann, vorallem welche Beschreibungselemente fehlen noch?

  2. Welche Suchanfragen könnte man auf Podcasts bei Wikidata anwenden? Offensichtlich besteht der Mehrwert einer Datenbank darin, dass man Zusammenhänge über das Eingetragene hinaus berechnen kann.

Und vielleicht gibt es auch Vorschläge für Podcasts, die für die Aufnahme in Wikidata geeignet sind. Mein Kriterium wäre hier sehr einfach: Die Podcasts sollten gut mit dem bestehenden Wissen in Wikidata vernetzbar sein. Das heißt im allgemeinen sie stehen im Zusammenhang mit Organisationen, Personen, vielleicht Ereignissen, die bereits in Wikidata abgebildet sind. Letztlich geht es jedenfalls mir darum, dass Suchanfragen an Wikidata auch die Podcastsphäre berühren können. Aber falls jemand von Wikidata hier mitliest: Das ist die Gelegenheit mir in die Hand zu fallen, bevor ihr mein Herz mit breiter Löschung brechen müsst. – Andererseits habe ich gerade gesehen, dass Leute jetzt schon einzelne Paper bei Wikidata einstellen, vielleicht fangt ihr einfach da an aufzuräumen. :wink:

1 „Gefällt mir“

So nach dem allgemeinen, um etwas vorzulegen habe ich mal zwei Podcasts eingetragen: Den BredowCast und die bekannteste Podcasterin Deutschlands:


Dabei bin ich auch direkt auf offene Fragen gestoßen: Wie genau kann man die Beziehung des BredowCast zum Hans-Bredow-Institut abbilden? Ist “die Kanzlerin direkt” eigentlich ein subtitle? Und ist Angela Merkel Moderator in ihrem eigenen Podcast? (Wobei ein anderer Wikidata-Nutzer letzteres offenbar mit ja beantwortet.)

Weiterer Ansatz: Ich will als nächstes mal prüfen, ob einige Podcasts bei Wikidata vielleicht fälschlich als radio program (Q1555508) eingeordnet wurden.

Ach ja, ich habe für das Thema zwischen “Community” und “Literatur” geschwankt. Ich nehme an, im Zweifelsfall kann es in eine passendere Kategorie verschoben werden.

So, nachdem einen Blick auf die constraint violations für das Podcast-Datenobjekt (Q20899) geworfen habe (für Wikidata gibt es automatische Überprüfungen der Datenintegrität und constraint violations gehören dazu), ist mir ein semantisches Grundübel aufgefallen. Bisher werden die in Wikidata befindlichen Podcasts als Instanz von eben diesem Objekt Q20899 geführt, um sie als Podcast zu klassifizieren. Allerdings meint dieses Objekt meinem Verständnis nach den Übertragungsweg und nicht die Publikationsform. Das sieht man zum Beispiel an den Oberklassen von “Podcast”:

podcast < digital media < electronic media < communication medium

bzw. Deutsch:
Podcast < Digitale Medien < elektronische Medien < Kommunikationsmittel

Wo ist das Problem? Nun viele der für Podcasts nützlichen Zuschreibungen etwa eine Originalsprache, Sprecher, Lizenz usw. gelten für ein Werk (oder eine Unterklasse davon) und eben nicht für einen Übertragungsweg. Zwar funktionieren sie trotzdem mit “Podcast” weil Wikidata solche Konflikte nicht unterbindet, aber für die korrekte Einbettung wäre es dennoch sinnvoll eine Lösung zu finden. Ich denke dazu sollte man ein neues Objekt wie “podcast program” analog etwa zu “radio program” einfügen.

Falls sich jemand mit Wikidata etwas besser auskennt, wäre ich an einem Austausch dazu interessiert. Ansonsten werde ich mal schauen, ob ich die Idee irgendwem bei Wikidata vorlegen kann.

Ich weiss nicht genau, ob das hier wirklich hingehört. Aber @timpritlove hatte 2014 auch schon mal über eine Verknüpfung zu Wikidata gesprochen. Vielleicht ist das ja interessant für Dich: https://re-publica.de/file/republica-2014-tim-pritlove-podlove-matrix

Danke. Die Podlove-Matrix-Idee kenne ich schon. Wenn ich mich recht entsinne, ging es da allerdings darum, das Datenbanksystem von Wikidata für eine eigene Datenbank zu verwenden. Insofern sehe ich aber durchaus einen Zusammenhang, denn die Erfahrungen mit Podcasts bei Wikidata lassen sich vielleicht für so ein Projekt übertragen.

Nach einigen Anpassungen am Wikidata-Datenbestand zu Podcasts sind hier nun zwei Queries, also Anfragen an die Datenbank. Der Query-Service benötigt Javascript. Dort einfach auf den Run-Button klicken. Wenn in der Auflistung nicht der Podcastname sondern Qxxx… steht, dann hat der Podcast kein englisches Label. Man kommt zum Datenbankobjekt, wenn man auf den Link in der ersten Spalte klickt.

Die erste Anfrage zeigt alle Podcastprogramme an:

http://tinyurl.com/jbbxnhz

Die zweite alle Radioprogramme, die auch als Audiopodcast ausgeliefert werden:

http://tinyurl.com/h5fsv6t

Sollten die Tinyurl-Links nicht funktionieren, stehen die Queries auch hier auf einer User-Subpage von mir: https://www.wikidata.org/wiki/User:Toaem/queries

Ergänzung:

Eine weitere Query zu Podcastnetzwerken:

http://tinyurl.com/gm2354f

Wer mit dem Query-Service noch nicht soviel anfangen konnte, dem kann ich eine einfache Einführung empfehlen, die als Vortrag bei der Gulaschprogrammiernacht dieses Jahr gehalten wurde. Gibt es hier als Video auch zum Download (ca. 25m):

Alternativ über Youtube: