Im deutschen Wikisource ist die Diskussion aufgekommen, wie man Seiten dauerhaft und eindeutig referenzieren kann, zum Beispiel bei Zitaten.
Die Antwort die man zur Zeit drauf erhält sind dauerhafte URLs des Stils:
http://de.wikipedia.org/w/index.php?title=Uniform_Resource_Name&oldid=22366097
wobei auch eine Angabe wie
http://de.wikipedia.org/w/index.php?oldid=22366097
ausreichend ist, um zur entsprechenden Version zu gelangen, dies bedeutet das die Seite auch bei einer Umbenennung des Artikel allein durch seine OLDID erreichbar ist. Nun das OLDID ein unglücklicher Name ist, wenn man auf eine aktuelle Version eines Artikels verlinkt ist eine ganz andere Geschichte.
Nun die Zitierung einer Version ist dauerhaft gewährleistet. Diskussion abgeschlossen? Leider nicht ganz.
Sollte doch einmal, der, zugegebene unwahrscheinliche, Fall eintreten, das aus irgendeinem Grund ein Projekt umbenannt werden, oder sich der erste Teil der URL ändert ist der Text nicht mehr erreichbar. Da Wissenschaftler jedoch sehr langfristig denken. Aus diesem Grund wurden andere Systeme wie die URN oder auch die DOIs entwickelt.
Bei diesen Systemen wird jedem Dokument ein Name zugeordnet. Dieser Name verweist nicht direkt auf den Ort des Dokuments, sondern verweist auf eine Datenbank (der Resolver) in der gespeichert ist wo das Dokument liegt. Sollte sich jemals der Ort (die URL) des Dokuments ändern wird nur der Eintrag in der Datenbank verändert, nicht aber der Name des Dokuments, dieser bleibt dauerhaft gleich.
Wie lässt sich dies System nun für die Wikimedia Projekte wie die Wikipedia verwenden? Wie schon gesagt es gibt mehrere Systeme die so funktionieren, diese können völlig unabhängig voneinander genutzt werden, so dass ich das Ganze nur an einem Beispiel, der URN, deutlich machen möchte.
URNs sind das System für das sich international die Nationalbibliotheken für ihre digitalen Dokumente entschieden haben. Diese haben innerhalb der URN einen eigenen Namensraum, der nbn heißt.
Eine URN hast Beispielsweise das folgende Format:
urn:nbn:de:gbv:089-3321752945
Dabei ist das Ganze hierarchisch aufgebaut:
NBN: Nationalbibliotheken
DE: Deutschland
GBV: Namensraum des Gemeinsamen Bibliothksverbundes
089-3321752945 Nummer des Dokuments
Zu dem Dokument gelang man über einen Resolver z.B. den der Deutschen Nationalbibliothek. Ebenfalls gibt es ein Plugin für Firefox und den Internetexplorer mit dem man dann die URN direkt in die Adresszeile des Browsers eingeben kann.
Ideal wäre es wenn Wikimedia über einen eigenen Namensraum verfügen könnte. Diesen könnte man dann Beispielsweise folgendermaßen gestalten:
URN: wie oben
WM: Namensraum von Wikimedia
DE: Sprachkennnung
WP: Projekt oder Unternamensraum
123456 Zahl die der momentanen OLDID entspricht
So könnten diese Zahlen ganz einfach aus den bisherigen Informationen des Dokuments erzeugt werden. Umgekehrt ließe sich so auch recht einfach ein Resolver aufsetzen. Da sich der erste Teil ganz einfach in eine URL umwandeln ließe und der zweite Teil einfach hinten angehangen wird. Zumindest so lange an der bisherigen Struktur nichts geändert wird.
Nun kann man sich sicher streiten ob man zuerst die Projektkennung oder erst die Sprachkennung verwendet. Ich würde die Sprachkennung vorziehen, da so die einzelnen Chapter leichter zusätzliche Unternamensräume für eigene Dokumente und eigene Projekte einrichten könnten, aber letztendlich wäre dies auch egal.
Um das ganze nun wirklich dauerhaft abzusichern wäre sozusagen als Krönung es sicher möglich mit den verschiedenen Nationalbibliothken Verträge abzuschließen, dass sollte irgendwann mal etwas schief gehen (wovon natürlich keiner Ausgeht) diese das Resolving übernehmen und den letzten verfügbaren Dump verfügbar machen würden. Dies wäre selbstverständlich mehr ein symbolischer Akt für die Wissenschaft um auch dem letzten noch die Ängste zu nehmen, dass das Dokument irgendwann nicht mehr zugänglich wäre.
So wäre es möglich unabhängig davon was die Zukunft bringt eine ganz bestimmte Vision eines Wikipedia-, Wikisource-, Wikibooks-, …. Dokuments zu referenzieren.
Notwendig für diesen Schritt wäre es einen eigenen URN Namensraum zu beantragen, dis ist sehr aufwendig aber es gibt auch andere Persistent Identifier bei denen so etwas vielleicht etwas schneller geht. Ich selber bin gespannt, wann es so etwas für die Wikimedia Projekte gibt.
Jetzt interessiert mich die Meinung der Leser, was meint ihr? Sind URNs sinvoll? Oder lieber ein anderes System von Persistent Identifier (man kann durchaus auch mehrere Systeme unterstützen)? Oder sehe ich das ganz falsch und Persistent URLs reichen doch?