Bibliothek 2.0 und mehr …

24. Oktober 2006

Wikimedia Projekte: Uniform Recource Names (URNs) vs Persistent URL

Filed under: Wikipedia — patrickd @ 12:30

Im deutschen Wikisource ist die Diskussion aufgekommen, wie man Seiten dauerhaft und eindeutig referenzieren kann, zum Beispiel bei Zitaten.
Die Antwort die man zur Zeit drauf erhält sind dauerhafte URLs des Stils:

http://de.wikipedia.org/w/index.php?title=Uniform_Resource_Name&oldid=22366097

wobei auch eine Angabe wie

http://de.wikipedia.org/w/index.php?oldid=22366097

ausreichend ist, um zur entsprechenden Version zu gelangen, dies bedeutet das die Seite auch bei einer Umbenennung des Artikel allein durch seine OLDID erreichbar ist. Nun das OLDID ein unglücklicher Name ist, wenn man auf eine aktuelle Version eines Artikels verlinkt ist eine ganz andere Geschichte.

Nun die Zitierung einer Version ist dauerhaft gewährleistet. Diskussion abgeschlossen? Leider nicht ganz.

Sollte doch einmal, der, zugegebene unwahrscheinliche, Fall eintreten, das aus irgendeinem Grund ein Projekt umbenannt werden, oder sich der erste Teil der URL ändert ist der Text nicht mehr erreichbar. Da Wissenschaftler jedoch sehr langfristig denken. Aus diesem Grund wurden andere Systeme wie die URN oder auch die DOIs entwickelt.

Bei diesen Systemen wird jedem Dokument ein Name zugeordnet. Dieser Name verweist nicht direkt auf den Ort des Dokuments, sondern verweist auf eine Datenbank (der Resolver) in der gespeichert ist wo das Dokument liegt. Sollte sich jemals der Ort (die URL) des Dokuments ändern wird nur der Eintrag in der Datenbank verändert, nicht aber der Name des Dokuments, dieser bleibt dauerhaft gleich.

Wie lässt sich dies System nun für die Wikimedia Projekte wie die Wikipedia verwenden? Wie schon gesagt es gibt mehrere Systeme die so funktionieren, diese können völlig unabhängig voneinander genutzt werden, so dass ich das Ganze nur an einem Beispiel, der URN, deutlich machen möchte.

URNs sind das System für das sich international die Nationalbibliotheken für ihre digitalen Dokumente entschieden haben. Diese haben innerhalb der URN einen eigenen Namensraum, der nbn heißt.

Eine URN hast Beispielsweise das folgende Format:

urn:nbn:de:gbv:089-3321752945

Dabei ist das Ganze hierarchisch aufgebaut:
NBN: Nationalbibliotheken
DE: Deutschland
GBV: Namensraum des Gemeinsamen Bibliothksverbundes
089-3321752945 Nummer des Dokuments

Zu dem Dokument gelang man über einen Resolver z.B. den der Deutschen Nationalbibliothek. Ebenfalls gibt es ein Plugin für Firefox und den Internetexplorer mit dem man dann die URN direkt in die Adresszeile des Browsers eingeben kann.
Ideal wäre es wenn Wikimedia über einen eigenen Namensraum verfügen könnte. Diesen könnte man dann Beispielsweise folgendermaßen gestalten:
URN: wie oben
WM: Namensraum von Wikimedia
DE: Sprachkennnung
WP: Projekt oder Unternamensraum
123456 Zahl die der momentanen OLDID entspricht

So könnten diese Zahlen ganz einfach aus den bisherigen Informationen des Dokuments erzeugt werden. Umgekehrt ließe sich so auch recht einfach ein Resolver aufsetzen. Da sich der erste Teil ganz einfach in eine URL umwandeln ließe und der zweite Teil einfach hinten angehangen wird. Zumindest so lange an der bisherigen Struktur nichts geändert wird.

Nun kann man sich sicher streiten ob man zuerst die Projektkennung oder erst die Sprachkennung verwendet. Ich würde die Sprachkennung vorziehen, da so die einzelnen Chapter leichter zusätzliche Unternamensräume für eigene Dokumente und eigene Projekte einrichten könnten, aber letztendlich wäre dies auch egal.

Um das ganze nun wirklich dauerhaft abzusichern wäre sozusagen als Krönung es sicher möglich mit den verschiedenen Nationalbibliothken Verträge abzuschließen, dass sollte irgendwann mal etwas schief gehen (wovon natürlich keiner Ausgeht) diese das Resolving übernehmen und den letzten verfügbaren Dump verfügbar machen würden. Dies wäre selbstverständlich mehr ein symbolischer Akt für die Wissenschaft um auch dem letzten noch die Ängste zu nehmen, dass das Dokument irgendwann nicht mehr zugänglich wäre.

So wäre es möglich unabhängig davon was die Zukunft bringt eine ganz bestimmte Vision eines Wikipedia-, Wikisource-, Wikibooks-, …. Dokuments zu referenzieren.

Notwendig für diesen Schritt wäre es einen eigenen URN Namensraum zu beantragen, dis ist sehr aufwendig aber es gibt auch andere Persistent Identifier bei denen so etwas vielleicht etwas schneller geht. Ich selber bin gespannt, wann es so etwas für die Wikimedia Projekte gibt.

Jetzt interessiert mich die Meinung der Leser, was meint ihr? Sind URNs sinvoll? Oder lieber ein anderes System von Persistent Identifier (man kann durchaus auch mehrere Systeme unterstützen)? Oder sehe ich das ganz falsch und Persistent URLs reichen doch?

2 Kommentare »

  1. Wie hier beschrieben können Wikipedia-Seiten mit einheitlichen Identifiern auch für das Semantic Web verwendet werden – allerdings gehen die Meinungen auseinander, welche Arten von Identifiern verwendet werden sollen, und ob eine ID gleichzeitig für eine Webseite und den Gegenstand, den die Seite beschreibt, stehen kann. Siehe dazu dieses Paper.

    Kommentar von Jakob — 25. Oktober 2006 @ 10:35

  2. Hallo,

    kurz vorweg: Es ist gar nicht so aufwändig, einen eigenen URN-Namensraum zu bekommen. Muss man nur standardkonform formulieren.

    Auch haben sich nicht alle Nationalbibliotheken für urn:nbn entschieden, sondern es ist erstmal Platz für sie in diesem Namensraum.

    Über Alternativen könnte man auch nachgrübeln. Das kommerzielle Modell des DOI passt vielleicht nicht so recht zur Wikipedia. Vielleicht schon eher das Handle-System, obwohl das mittlerweile auch ein wenig (aber viel weniger als DOI) Geld kostet. Die Identifier könnten dann z.B. via Handle’s Resolver, aber auch dx.doi.org und crossref.org aufgelöst werden.

    Interessant ist auch das Konzept der Archival Resource Keys (ARKs) von J. Kunze, CDL.

    In wenigen Tagen sollte auch ein Übersichtsbericht zum Thema mitsamt Handlungsempfehlungen von einem Kollegen und meiner wenigkeit elektronisch frei verfügbar sein. Ich poste dann hier mal den Link…

    Kommentar von Hans-Werner — 26. Oktober 2006 @ 17:34


RSS feed for comments on this post. TrackBack URI

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

Bloggen auf WordPress.com.

%d Bloggern gefällt das: