Zum Hauptinhalt springen
TU Graz/ TU Graz/ Services/ Bibliothek der TU Graz/

Offen, auffindbar, vernetzt: Persistente Identifikatoren in der Forschung

Von Maja Bartl | 14.11.2025

Persistente Identifikatoren spielen eine immer größere Rolle bei wissenschaftlichen Publikationsprozessen. In diesem Artikel wird dem Was?, Wer? und Wozu? auf den Grund gegangen.

Dieser Artikel ist mit Unterstützung von Miguel Rey Mazon zustande gekommen. Er ist Forschungsassistent und Teil des RDM-Team in Bibliothek und Archiv der TU Graz.

Was sind Persistente Identifikatoren?

Persistente Identifikatoren (PIDs) sind definiert als universelle, eindeutige und dauerhafte Zeichenketten, die zur Identifizierung von physischen und digitalen Objekten (Publikationen, Datensätze, Forschungsinstrumente etc.) als auch von Konzepten (Personen, Orte, Zeitspannen, Events etc.) im Web verwendet werden können. Die Zeichenketten erscheinen in Form einer URI (Uniform Resource Identifier) und weisen auf die Metadaten der beschriebenen Entität (in manchen Fällen mit digitalem Objekt), die eine sinnvolle Nachnutzung ermöglichen. Metadaten sind Daten über Daten und erschließen ein Objekt (wie zum Beispiel eine digitale Publikation) auf deskriptiver, administrativer und technischer Ebene.

Im Unterschied zu herkömmlichen URLs, die nur auf einen Ort im Web mit dem entsprechenden Inhalt weisen, identifizieren PIDs den Inhalt selbst. Dies kann entweder ein reiner Metadatensatz sein, oder ein digitales Objekt in Verbindung mit Metadaten. Wenn der Inhalt – sei es ein Forschungsdatensatz oder eine digitale Publikation – nun an einen anderen Ort verschoben wird, kann er durch die persistente Identifizierung immer noch gefunden werden. Im Falle einer Ortsveränderung werden die Metadaten zum Objekt aktualisiert, der Identifikator bleibt jedoch derselbe. Diese dynamische Funktionalität verhindert das „Brechen“ von Links und trägt so zur langfristigen Auffindbarkeit von Daten im Internet bei.

PIDs werden durch die Entwicklungen der letzten Jahre hin zu einer offenen Forschungslandschaft immer wichtiger. Sie unterstützen aktiv die FAIR Prinzipien (Findable, Accessible, Interoperable, Reusable), die mehrere Richtlinien zur besseren Nachnutzbarkeit von (Forschungs-)Daten spezifizieren.

 

Die PID-Landschaft – kurz umrissen

Eine persistente Auffindbarkeit und Nachnutzbarkeit klingt erst einmal vielversprechend, muss aber im gleichen Atemzug wieder relativiert werden. Kein System hält für immer und auch PIDs können brechen, wenn auch seltener als URLs. Um die Beständigkeit der Daten zu gewährleisten, muss viel Arbeit in die Wartung und das Management der einzelnen Systeme gesteckt werden. Die Idee einer persistenten Referenzierung von physischen Objekten wurde schon vor dem „digital turn“ durch Standards wie die ISBN-Nummer oder auch diverse Identifikatoren für biologische Proben praktiziert, doch in diesem Zusammenhang geht es um die Umsetzung des Konzeptes mittels digitaler Technologien.

Die PID-Landschaft weist viele verschiedene Standards auf. Dazu zählen intradisziplinäre, wie zum Beispiel CETAF (Consortium of European Taxonomic Facilities) in der Biologie, als auch interdisziplinäre Standards (z.B. DOI, URN), die über diverse Fachgebiete und Entitäten hinaus angewandt werden. Dazu kommen Identifikatoren, die sich nur auf eine einzige Entität wie Personen oder Organisationen beziehen (z.B. ORCID, ROR). Die Wahl eines PID-Schemas für Objekte in Forschungsprozessen ist abhängig von Größe und Mitteln der anwendenden Institution, sowie von nationalen Bedingungen.

Im Forschungsbereich haben sich auf europäischer Ebene die Standards ORCID (Open Researcher and Contributor ID) für Personen, DOI (Digital Object Identifier) oder URN (Uniform Resource Name) für Publikationen und Datensätze sowie ROR (Research Organisation Registry) für Organisationen durchgesetzt. Die finale Version des Identifikators für Forschungsprojekte RAiD (Research Activity Identifier) ist 2025 veröffentlicht worden und wird noch in Richtung Systemkompatibilität weiterentwickelt. Auch die GND (Gemeinsame Normdatei) wird in manchen Fällen zur Referenzierung von Personen, Institutionen und Publikationen verwendet. Die Dominanz von DOIs bei wissenschaftlichen Publikationen hat sich in den letzten Jahren aus der Verlagslandschaft heraus entwickelt.

Jeder PID ist an ein bestimmtes Schema gebunden, das den Aufbau des Identifikators vorgibt. DOIs sind zum Beispiel Teil des Handle-Systems, während ORCID sich aus dem Schema der ISNI (International Standard Name Identifier) entwickelt hat.

Beispiel DOI: Der Administrations- und Managementprozess bei PIDs ist sehr vielschichtig. Sogenannte „Authorities“ sind für Stabilität und Persistenz der Systeme zuständig (z.B. DONA Foundation), doch die Vergabe und Resolution der PIDs wird oft von „Service Providern“ wie DataCite oder CrossRef übernommen.

Die TU Wien Bibliothek bietet als DataCite-Mitglied seit 2020 den DOI Service Austria an. Als lokale Vergabestelle unterstützt sie österreichische Universitäten, Forschungseinrichtungen und sonstige Non-Profit-Organisationen dabei, DOIs zu registrieren und zu nutzen. Auch für ORCID hat sich 2019 an der TU Wien ein Konsortium gebildet. Sein Ziel ist die flächendeckende Etablierung des Standards in Österreich. Die TU Graz ist Mitglied im ORCID-Konsortium und nimmt die nationalen Serviceleistungen zur Registrierung von DOIs in Anspruch. Die DOIs im institutionellen Repositorium werden also über eine DataCite-Schnittstelle vergeben.

 

Welchen Nutzen haben PIDs für die Forschung?

Die dauerhafte Identifizierung von mit Forschungsprozessen verknüpften Ressourcen für ein nachhaltiges und transparentes Forschungsmanagement ist notwendig, um Konformität mit der Open-Science-Strategie zu erreichen. Der wahre Wert von PIDs liegt jedoch in ihrer Fähigkeit, den Forschungsprozess mit all seinen Entitäten nachvollziehbar zu gestalten und deren Entwicklungen nachverfolgen zu können. PIDs wie DOIs können an diverse Entitäten im gesamten Forschungszyklus, wie zum Beispiel Publikationen, Forschungsdaten, Software und Messinstrumente, vergeben werden, was eine Verlinkung untereinander als auch mit Forschenden und Organisationen möglich macht.

Vermeidung von Ambiguitäten

Die Verwendung von PIDs und Metadaten führt zu einer eindeutigen Identifizierung von Objekten und der Vermeidung von Verwechslungen und falschen Zuordnungen. Namensgleichheiten unter Forschenden stellen kein Problem mehr dar, da die Metadaten auf den wissenschaftlichen Hintergrund und die organisatorische Zugehörigkeit verweisen. Auch Namensänderungen durch eine Heirat können so adäquat dargestellt werden.

Finden und Zitieren

PIDs erleichtern die Auffindbarkeit von und den Zugriff zu Daten im Forschungsprozess und steigern damit die Sichtbarkeit. Zusätzlich ermöglichen sie durch die Verbindung mit basalen Metadaten die Zitierbarkeit der einzelnen Entitäten. Die Metadaten können von anderen Plattformen (BASE, OpenAIRE etc.) wiederverwendet werden und erleichtern auch den Import von Publikationen in Literaturverwaltungsprogramme.

Unser institutionelles Forschungsinformationssystem PURE hat beispielsweise eine ORCID-Schnittstelle integriert, die es den Forschenden an der TU Graz ermöglicht, dort gespeicherte Publikationen ohne Mehraufwand in das FIS zu importieren.

FAIRes Forschungsdatenmanagement

Die Umsetzung der FAIR Prinzipien wird auf europäischer Ebene durch Projekte wie EOSC (European Open Science Cloud) vorangetrieben. Damit ändern sich auch die Voraussetzungen für Projektanträge und Datenmanagementpläne (DMPs). In vielen Fällen wird mittlerweile die Angabe einer Forschenden-ID (z.B. ORCID) und die Vergabe von PIDs an den Forschungsoutput (z.B. DOIs) verlangt.

Ein weiterer Schritt auf diesem Weg ist die Verlinkung mehrerer PIDs im Sinne von Linked Open Data, um Beziehungen zwischen den einzelnen Entitäten sichtbar zu machen. Damit kann der gesamte Forschungsworkflow vom Projekt (RAiD) über die Forschenden (ORCID) an einer Institution (ROR) bis hin zu Publikationen und Forschungsdaten (DOI) eindeutig dargestellt werden.

 

Kritikpunkte

Obwohl die technischen Voraussetzungen für die Implementation von PIDs bereits vorhanden sind und sie von vielen Institutionen angewandt werden, gibt es Nachteile, die ihre flächendeckende Verwendung (noch) verhindern.

In einigen Fällen (z.B. ORCID) kann man PIDs kostenlos registrieren. Bei PIDs für digitale Objekte wie Publikationen sieht die Situation jedoch etwas anders aus. Das Feld ist dominiert von proprietären Anbietern, die das „minten“ der Identifikatoren sowie Systemerhaltung und -management übernehmen. Um zum Beispiel DOIs an digitale Objekte vergeben zu können, muss man Mitglied bei DataCite oder CrossRef sein und einen jährlichen Mitgliedsbeitrag sowie eine Pauschale pro vergebenem DOI bezahlen. Für kleinere Institutionen sind derartige Kosten oft nicht zu stemmen. Zur Unterstützung österreichischer Institutionen ist die TU Wien Mitglied im Verein DataCite und ermöglicht als lokale Vergabestelle eine manuelle als auch automatisierte Registrierung auf nationaler Ebene sowie technische Unterstützung.

Es gibt auch nicht-proprietäre Formate für digitale Objekte (z.B. ARK), die anfänglich mit weniger Kosten verbunden sind. Dabei muss man aber mit einem erheblichen Mehraufwand bei Management, Hosting, Verwaltung und Weitergabe rechnen. Dieser Do-it-yourself-Charakter, der ein gewisses technisches Know-How voraussetzt, hat wahrscheinlich die Verbreitung dieses Standards gehemmt. Er wird unter anderem vermehrt von Kulturerbeinstitutionen in Frankreich und Brasilien verwendet.

 

Fazit und Ausblick

PIDs unterstützen nicht nur die gute wissenschaftliche Praxis, sondern erleichtern auch die Verwaltung des eigenen wissenschaftlichen Outputs und der damit zusammenhängenden Entitäten und Arbeitsschritte. Die Integration von wissenschaftlichen Informationen in die verschiedensten Systemumgebungen wird durch die Funktionalitäten von Linked (Open) Data unterstützt. Zusätzlich leisten sie einen entscheidenden Beitrag zur FAIRen Gestaltung der Forschungslandschaft.

Die PID-Landschaft und ihre Schlüsselspieler sowie vereinzelte „Recommendations“ von individuellen Institutionen zur Verwendung von PIDs in der Forschung sind bereits „in situ“, doch die flächendeckende Anwendung für alle Entitäten im Forschungsprozess ist noch nicht erfolgt. Kleinere Institutionen scheitern oft an den Kosten und einzelne PIDs für Entitäten innerhalb eines Forschungsworkflows sind noch im Aufbau begriffen (z.B. RAiD, Identifikator für Software). In Forschungsrepositorien sowie bei der Identifikation von Publikationen und Personen ist die Verwendung von PIDs jedoch bereits Standard. Projekte wie PID4NFDI in Deutschland arbeiten momentan an der Weiterentwicklung von nationalen und internationalen Infrastrukturen. Auch Metadatenstandards werden teilweise aktualisiert, um den neuen Ansprüchen bezüglich einer passenden Einbindung von PIDs zu entsprechen (z.B. Europeana Data Model) In den nächsten Jahren werden sich vermutlich weitere Best-Practice-Beispiele für den Umgang mit PIDs entwickeln.

 

Weiterführende Informationen

Maja Bartl ist Bibliothekarin an der TU Graz. Sie unterstützt Forschende und Studierende bei forschungsrelevanten Themen und Fragen zum institutionellen Forschungsinformationssystem PURE.
Beitrag teilen auf
Zur Blog Startseite