Dies ist der erste in einer kurzen Serie von Blogeinträgen, in denen ich einige Design-Entscheidungen für Wikidata erkläre. Dies sind persönliche Meinungen, aber sie haben einen großen Einfluss auf Features oder Non-Features von Wikidata. Diese sollen hier erklärt werden.

By Tomascastelazo (Own work)
CC-BY-SA-3.0,
via Wikimedia Commons
Eines der Features – andere Menschen nennen es Bug – ist, dass man jedes Objekt als Wert einer Eigenschaft festlegen kann. Viele davon ergeben keinen Sinn: Wenn man einen Artikel zu Paris hat und dann sagt, dass das zugehörige Land Ziegenkäse ist, ergibt nicht wirklich Sinn. Wäre es nicht toll, wenn Wikidata wüsste, welche Werte für ein Land sinnvoll sind und dir erlauben würde, nur diese auszuwählen anstatt alle möglichen anderen Werte zuzulassen? Wäre es nicht toll, wenn die Community entscheidet, dass eine Eigenschaft wie das vielgenutzte P107 auf die sechs Werte eingeschränkt wird, für die die Community sich entschieden hat?
Ich stimme dem absolut nicht zu.
Ein weiteres Feature – andere nennen es Bug – von Wikidata ist, dass du jede Eigenschaft für jedes Objekt verwenden kannst. Wenn du die Hauptstadt von Julius Caesar angeben willst, kannst du das tun. Wäre es nicht toll, wenn Wikidata wüsste, welche Eigenschaften für ein bestimmtes Objekt sinnvoll sind und dich dann nicht nur auf diese beschränkt, sondern sogar auflistet, welche Eigenschaften noch keine Werte haben? Wäre es nicht toll, wenn die Community Vorlagen mit allen Eigenschaften anlegen könnte, die für eine Person, für eine Stadt oder für ein Land angegeben werden müssen – und nichts anderes erlaubt wäre?
Ich stimme dem absolut nicht zu.
Ich bin der Meinung, dass schlauere Vorschläge großartig wären. Einige davon könnten relativ trivial zu implementieren sein: Zähle die Häufigkeit der Werte für eine bestimmte Eigenschaft und mache basierend darauf Vorschläge. Und was ist mit Vorschlägen für Eigenschaften? Es wird viel in diesem Bereich geforscht, im Prinzip so etwas wie “Objekte mit diesen Eigenschaften haben auch jene Eigenschaften”. Du hast das vielleicht schon auf einigen Shoppingseiten gesehen.
Ich bin absolut für bessere Vorschläge. Ich bin jedoch gegen harte Einschränkungen. Es gibt hier viel zu viel Raum für Drama und Edit-wars. Hat jedes Land eine Hauptstadt? Was ist überhaupt ein Land? Was sollen die möglichen Werte für die Eigenschaft Geschlecht sein? Was sind die richtigen Eigenschaften für Presidenten?
Nicht alles, was das System nutzt, um die Nutzeroberfläche und Hauptfunktionalität zu bauen – Bezeichnungen und Beschreibungen zum Beispiel, oder die Links zu Wikipedia-Seiten – kann Belege haben. Es gibt Dinge, die das System einfach “glaubt”. Wenn du aber die Aussage hinzufügst, dass Kosovo ein Land ist, dann kannst du einen Beleg hinzufügen. Andere könnten behaupten, dass Kosovo ein Teil von Serbien ist. Du kannst auch dafür einen Beleg angeben. Aber sobald du willst, dass die Nutzeroberfläsche diese Information verwendet – zum Beispiel, wenn eine Eigenschaft auf Länder beschränkt ist, – muss das System entscheiden, ob Kosovo ein unabhängiges Land ist oder nicht. Das lässt keinen Raum für die Art von Wissensvielfalt, für die Wikidata gebaut ist.
Ich sehe die Gefahr, dass ein Teil von Wikidata im Bau einer Ontologie stecken bleiben könnte. Ich glaube, dass diese Übungen fundamental nicht lösbar sein können, und daher sollte es nicht Wikidatas Aufgabe sein, diese zu lösen. Wikidata sollte meiner Meinung nach auf einer weniger abstrakten Ebene arbeiten: Lasst uns die Autoren von Aerosmiths “I Don’t Want to Miss a Thing” angeben und nicht diskutieren, ob Urheberschaft auf ein Lied angewandt werden kann oder nicht. Lasst uns den Stammbaum der britischen Monarchen erstellen und nicht diskutieren, ob offizielle Posten nur von Personen begleitet werden können. Bist du sicher, dass kein Esel je römischer Senator war? Kannst du entscheiden, ob ein Drink einen Erfinder haben sollte?
Für Menschen und Bots bietet Wikidata einen einzigartigen Ort für Kollaboration. Noch viel mehr als Wikipedia, die schon ein erstaunliches Beispiel für eine solche Umgebung ist. In Wikipedia haben wir Bots, die nach veralteten Belegen auf Webseiten suchen, nach korrekter Interpunktion und so weiter. In Wikidata können wir Bots schreiben, die schauen, ob ein Lehrer tatsächlich vor dem Tod seiner Schüler lebte. Ob alle römischen Senatoren vor dem 6. Jahrhundert gelebt haben. Ob die Summe aller Bewohner der Städte eines Landes kleiner ist als die Anzahl der Bewohner des ganzen Landes. Und die Bots, die dies prüfen, müssen einen Weg finden, ihre Ergebnisse an Menschen zu melden, die dann prüfen können, ob sie echte Inkonsistenzen entdeckt haben – entweder in der realen Welt oder in Wikidata – oder nicht.
Die Welt ist komplex. Wikidatas Ziel ist es, strukturiertes Wissen über diese komplexe Welt zu sammeln. Die Wurzeln von Wikidata, wie der Name schon sagt, sind Wikis – und Wikis bedeuten Freiheit. Basierend auf diesem Erbe ist es weder das Ziel von Wikidata Einschränkungen für bestimmte Typen von Eigenschaften zu implementieren, noch Einschränkungen für mögliche Eigenschaften von Objekten festzulegen.
(Ich habe die langweiligen technischen Details übersprungen, warum es schwierig zu implementieren wäre und welche möglichen Probleme durch die Implementierung dieser Features auftreten könnten. Es gibt ernstzunehmende Probleme dabei, aber ich wollte bei den konzeptionellen Gründen bleiben.)