Referent: @jensohlig
Session-Titel: Wikidata. Der Metadatenspeicher der Welt
Datum: 07.05.2016 / 18:15 Uhr
Raum: Synkope
Veranstaltung im SUBSCRIBE-Wiki: Link
Kurzbeschreibung:
Links:
- …
Referent: @jensohlig
Session-Titel: Wikidata. Der Metadatenspeicher der Welt
Datum: 07.05.2016 / 18:15 Uhr
Raum: Synkope
Veranstaltung im SUBSCRIBE-Wiki: Link
Kurzbeschreibung:
Links:
Die Notizen hier entstehen nachträglich, da ich mir während der Session selbst leider keine gemacht habe.
Die Slides von @johl: https://docs.google.com/presentation/d/1VF0ml3nWFRsYN-hwRgVfnXGi5w1iQ8CdJ3OKbEJsrVs/edit
Die Slides selbst sind ein kurzer Überblick über Wikidata und die technischen Rahmenbedingungen selbst. Ich kann dazu vor allem die CRE-Podcastfolge vom Dezember 2013 zu Wikidata empfehlen, bei der @johl selbst zu Gast war: http://cre.fm/cre205-wikidata
Daher möchte ich hier nicht auf die Details von Wikidata eingehen, nur kurz: Wikidata abstrahiert das Wissen der Wikipedia in eine Datenbank. Die wichtigen Begriffe dahinter sind Graphdatenbanken, Semantic Web, RDF. D.h. die Daten sind als Triple abgelegt.
Zur Session selbst: Nach der Einführung von @johl ging die Diskussion darum, warum Wikidata für Podcasts interessant sein kann.
Dabei kamen wir zum Schluss, dass…
Meine eigenen Gedanken:
Ich habe an der Subscribe selbst schon mal ein kleines Ruby-Skript geschrieben, das versucht, diese Verlinkungen halb-automatisch für eine Episode zu erstellen. Die APIs sind auf Seiten Wikidata vorhanden, allerdings gibt es ein grundlegendes Problem: Es ist äusserst schwierig (unmöglich?) zu erkennen, ob ein einzelnes Wort oder eine Wortgruppe verwendet werden soll für eine Verlinung.
Beispiel: Tesla Model 3
Wikidata: https://www.wikidata.org/wiki/Q23663332 (Tesla Model 3)
Reisst man diese Wortgruppe auseinander, hat man:
Tesla, Model, 3
3 Begriffe also, von der wahrscheinlich nur der erste sinnvoll ist.
Ich würde gerne einen Proof of Concept bauen, der:
Ausserdem wäre meiner Meinung nach zu diskutieren: Welche Daten können wir zu Podcasts und Episoden erfassen? Hier ist die Liste lang. Dinge, die mir schon einfallen:
Ich hoffe die Notizen und meine Gedanken dazu sind hilfreich. Über Feedback würde ich mich freuen.
Hi Thomas,
danke erstmal für die Zusammenfassung und den Beitrag. Was die Wortgruppen angeht:
Könntest du nicht grundsätzlich einfach die Potenzmenge der Menge aller Wörter im Text nehmen und danach suchen (ich gehe davon aus, dass die Suche ähnliche Ergebnisse unabhängig von der Reihenfolge ausgibt)?
Da es im anderen Thread eher ein Nebenaspekt sein sollte und nach Feedback gefragt wurde, zitiere ich mich mal selbst:
[quote=„toaem, post:1, topic:3485“][quote=„nethad, post:2, topic:3221“]Dabei kamen wir zum Schluss, dass…
Wohl die Podcast-(Meta)daten nicht in Wikipedia selbst landen werden/sollen. Wikidata konzentriert sich auf „enzyklopädisches Wissen“, und da sind Podcasts leider oft nicht im Geltungsbereich. Das Schöne ist aber, dass sich die Daten wunderbar linken lassen, sodass Daten gar nicht in Wikidata selbst sein müssen.[/quote]
Ich weiß nicht, wie genau die erarbeitete These wiedergegeben ist, aber ich würde teilweise widersprechen. Zunächst, wenn ein Podcast nicht bei Wikipedia vorhanden ist, ist das noch kein Ausschlusskriterium für Wikidata. Das sollte man unterscheiden. Liegt auch an den Unterschieden zwischen den einzelnen Wikipedia-Projekten: In der englischen sind die Aufnahmekriterien allgemein entspannter, dementsprechend sind dort mehr Podcasts vorhanden (zugegeben könnte auch mit der Reichweite zu tun haben) und die bekommen dann soweit ich weiß automatisch einen Wikidata-Eintrag. […][/quote]
Wie ich danach ausführe, würde ich Wikidata allerdings auch nicht als ein Podcastverzeichnis-Ersatz verstehen, aber ich denke es gibt durchaus einige Podcasts, die dort sein sollten (und viele sind es ja auch schon).