Wir freuen uns, dass der DigAMus auch Gegenstand von Forschungsarbeiten wird. Wir regen dazu unbedingt an und wer sich mit dem Gedanken trägt, die hier gesammelten Projekte zum Gegenstand von Bachelor-, Master- oder Doktorarbeiten zu machen, kann sich gerne mit uns in Verbindung setzen. Wir helfen gerne, wenn wir können. Und umarmen all diejenigen, die zum Wissenstransfer beitragen möchten! Wer möchte, kann sich mit den Ergebnissen auch gerne zum Wohle aller hier präsentieren.
Masterarbeit zum Wissensgraphen
Ein Wikidata Wissensgraph zu digitalen Museumsangeboten befindet sich im Aufbau, gespeist aus den Einreichungen für den DigAMus-Award. Marta Koscielniak ist Masterandin in MALIS – “Library and Information Science” an der TH Köln und ihre Abschlussarbeit zielt darauf ab, diese neue Wissenssammlung hinsichtlich ihrer Nutzbarkeit zu untersuchen und Verbesserungs- sowie Erweiterungsmöglichkeiten aufzuzeigen.
MA-Arbeit: „Der Wikidata Knowledge Graph des DigAMus Awards zu digitalen Museumsprojekten und seine Nutzbarkeit als neue Wissensquelle„
Marta Koscielniak ist Masterandin im Studiengang MALIS (Master of Library and Information Science) an der TH Köln.
Henriette Mühlmann hat Marta Koscielniak zu ihrer laufenden Abschlussarbeit interviewt:
Worum geht es in deiner Forschung zum DigAMus-Wissensgraphen?
Meine Perspektive ist die der Informationswissenschaften. Dadurch lege ich den Fokus auf die Infrastruktur. Das heißt, ich frage mich, in welcher Form diese neue Wissensquelle etwas bietet. DigAMus sammelt Metadaten zu digitalen Museums Angeboten. Das sind Daten, die andere Daten beschreiben und sie auffindbar machen.
Es geht mir in meiner Forschungsarbeit auch darum, die Verbindung von DigAMus und Wikidata in einem größeren Zusammenhang zu verstehen. Wie verhält sich dieses Projekt zu der grundlegenden Idee des Semantic Web, zu Knowledge-Graph-Systemen im Allgemeinen sowie zu LODLAM, das heißt zum Bereich strukturierter gemeinfreier Daten bei Gedächtnisinstitutionen (Linked Open Data for Libraries, Archives, Museums (LAM).
Ich habe mir die Beschaffenheit des bestehenden Datenmodells, das dem Knowledge Graph von DigAMus zugrunde liegt, angeschaut und versucht, die Datenqualität anhand der allgemeinen Empfehlungen für Forschungsdaten zu bewerten. Forschungsdaten im Internet sollten gemäß der sogenannten FAIR-Prinzipien auffindbar (Findable), zugänglich (Accessible), übergreifend anwendbar (Interoperable) und wiederverwendbar (Reusable) sein. Meine Arbeit untersucht auch Nutzungsaspekte, gibt konkrete Verbesserungs- und Erweiterungsmöglichkeiten.
Weitere Ressource dazu:
Kailus, Angela (2023): Handreichung für ein FAIRes Management kulturwissenschaftlicher Forschungsdaten (NFDI4Culture Guidelines), Version 1.0.1. https://doi.org/10.5281/ZENODO.7716941
Was ist die Idee des Semantic Web?
Die Idee des Semantic Web wurde von Tim Berners-Lee, Gründer und Vorstand des WWW-Konsortiums, schon Ende der 1990er Jahre aufgebracht. Er hat den immensen Wert erkannt, der daraus resultiert, wenn sowohl Internetressourcen als auch ihre Beziehungen untereinander mit Bedeutung versehen werden. Gerade für Online-Daten ist es entscheidend, dass Informationen und Metadaten von Maschinen interpretiert und verarbeitet werden können. Das war im damaligen Internet noch wenig gegeben.
Welche Maschinen lesen im Internet Daten und wofür?
Die meisten der an Wikidata gerichteten Abfragen stammen nicht von individuellen Personen, sondern von unzähligen Apps, Bots oder auch digitalen Assistenten wie Siri oder Alexa. Von der Wikimedia Foundation gibt es sogar eine Anleitung dazu, wie man selbst eine einfache Web App bauen kann, die auf Wikidata zugreift. Der Nutzung eines Universal Knowledge Graph sind keine Grenzen gesetzt.
Was ist das Besondere am Ordnungssystem von Wikidata?
Charakteristisch ist die grundlegende Struktur von Subjekt-Prädikat-Objekt-Beziehungen. Die kleinste Einheit im Wissensnetz ist eine Aussage. Dadurch lässt sich ein Knowledge Graph bereits mit wenigen Aussagen (Statements) beginnen und später sehr stark ausbauen.
Eine Wissensbasis wie Wikidata legt den Fokus auf die Beziehungen, was je nach Anwendung Vorteile bietet. Wenn für eine Fragestellung die Beziehungen interessant sind, sind andere Systeme weniger gut geeignet, um Ergebnisse herauszuholen.
Die Eingabeseite für Projektvorschläge für den DigAMus-Award enthält einige Wikidata-Kategorien, die wenig geläufig sind. Wie kann ich sicher sein, die richtigen Kategorien zuzuordnen?
Natürlich könnte man Erläuterungen ergänzen, doch sinnvoll wäre dies nicht. Das Eingabeformular wäre völlig überladen und zu kompliziert. Allerdings ist es auch gar nicht so schlimm, wenn nicht alle Angaben zutreffen. Ohnehin ist die Auswahl ja auf zwei Kategorien begrenzt, obwohl manche Projekte vielen Klassen angehören. Diese Angaben können später von der Wikidata-Community oder vom DigAMus-Team ergänzt oder korrigiert werden. Eine Zuordnung ist also immer veränderlich und ergibt sich aus der Zusammenarbeit Vieler. Die Gemeinschaft ist das Korrektiv. Am Ende sollten die Klassifizierungen natürlich alle stimmen.
Für die eingesandten Projekte des DigAMus-Award wurde in Wikidata eigens die neue Klasse „digital museum project“ erstellt. Deine Forschungsarbeit kritisiert diese Kategorie. Warum?
Weil sie eine Ambiguität beinhaltet. Es ist nicht klar, was damit gemeint ist – geht es um ein Produkt oder um ein Projekt, aus dem ein Angebot entstanden ist? Aus der Perspektive von DigAMus meint „project“ stets ein konkretes Produkt, nämlich die von der Jury bewerteten Apps, Podcasts, Online-Ausstellungen usw. Deren Entstehungsprozess wird ja nicht bewertet.
Das ist in Wikidata anders, da werden „digital projects” im Allgemeinen als menschliche Handlungen definiert und gelten somit als Prozesse. Hier liegt also ein Widerspruch zwischen dem Begriffsverständnis des DigAMus-Award und der Klassifizierung in Wikidata.
Neben den Museumsprojekten umfasst DigAMus auch Angebote von Gedenkstätten, Bibliotheken, Archiven oder Kooperationsprojekte.
Genau! Grundsätzlich ist die neue Klasse schon wichtig, denn sie macht den DigAMus-Wissensgraphen besser anschlussfähig. Die Benennung ließe sich aber überdenken. Eventuell ist die Wikidata-Kategorie der Vermittlungsmedien „communication media“ für DigAMus sinnvoll, statt „project“. https://www.wikidata.org/wiki/Q340169; „GLAM digital communication media” – aber die Entscheidungen und Diskussion zu solchen Kategorien und Klassifikationen muss eben immer auch in einer Community gefunden werden.
Digitalprojekte sind ohnehin enorm aufwändig. Warum sollten Museen nun zusätzlich auch noch Metadaten für Wikidata erarbeiten?
Der DigAMus-Award sieht das ein bisschen als Übung und kollektive Praxis für alle, die sich in einer datengestützten Welt bewegen. Grundsätzlich dient es Allen, strukturierte Metadaten in einem freien Wissensspeicher festzuhalten. Ein spezifischer Vorteil ist, dass die Daten in Wikidata in strukturierter Form vorliegen und unendliche weitere Verknüpfungen ermöglichen. Unterschiedlichste Institutionen, Firmen oder Privatpersonen können neue Verbindungen erstellen, sofern die Daten auffindbar, zugänglich, anwendungsfähig und wiederverwendbar sind, also den FAIR-Prinzipien entsprechen. In Wikidata Items können außerdem Persistente Identifier, wie z. B. DOI verlinkt werden, das unterstützt die Eindeutigkeit und Auffindbarkeit von digitalen Angeboten.
DigAMus bildet gewissermaßen den Angelpunkt, der die Informationen aus den verstreuten „Datensilos“ herausholt, bündelt und für verschiedene Nutzungsmöglichkeiten öffnet. Dafür genügt zu Beginn schon eine minimale Beschreibung mit wenigen Angaben. Diese kann weiter wachsen. Im Übrigen müssen die Museen das ja gar nicht allein leisten. Sobald ein Eintrag in Wikidata steht, können Andere neue Beziehungen anlegen, neue Verknüpfungen erstellen.
Schön ist ja auch, dass der Einreicheprozess schon so gestaltet wurde, dass die Wikidata Items direkt mit angelegt werden können. Je mehr Metadaten eingegeben werden, desto besser. DiGAMus macht es den Museen hier wirklich leicht, Teil des Wissensgrahen zu werden. Nach der Einreichung werden die Einträge bereinigt und teilautomatisiert in Wikidata übertragen.
Welchen Nutzen habe ich als Privatperson?
Das hängt natürlich von den eigenen Interessen ab. Was möchte ich wissen über digitale kulturelle Angebote? Nehmen wir als Beispiel an, ich plane einen Familienurlaub und wüsste gern, welche Virtual-Reality-Angebote für Kinder es in Museen dieser Region gibt. Oder ich möchte ein KI-Projekt entwickeln und frage mich, welche Ansätze es schon gibt – dann finde ich idealerweise über die Daten und Metadaten Informationen im Wissensgraphen. Wenn die entsprechenden Informationen in Wikidata vorliegen, kann ich zukünftig noch einfacher mein Smartphone fragen.