layout | title |
---|---|
default |
Post_1071 |
Hier werden allgemeine Grundsätze der konzeptionellen Umsetzung der Grundlagen in unserer Leipzig Ontology beschrieben.
Über URIs (Unique Resource Identifier) werden Ressourcen identifiziert, über die RDF-Tripel (also letztlich Sätze) in der Wissensbasis gesammelt werden. In jedem RDF-Tripel sind die ersten beiden Einträge (Subjekt und Prädikat) unbedingt URIs, der dritte (Objekt) ein Literal (String) oder ebenfalls eine URI. Während URIs für Subjekte und Objekte (also Knoten im entsprechenden RDF-Graphen) im Normalfall Objektinstanz-Bezeichner sind und damit eine realweltliche Entsprechung haben, sind URIs für Prädikate Begriffs-Bezeichner und gehören zum Modell.URIs dienen zwar dazu, Informationen in maschinenlesbarer Form vorzuhalten, es ist aber eine gute Regel, sprechende Namen als Bezeichner zu vergeben. Jeder Bezeichner soll deshalb die Gestalt leipzig-data.de/Data/<Präfix>/EinfacherBezeichner haben, wobei EinfacherBezeichner den regulären Ausdruck [-A-Za-z0-9.] matcht und CamelCase-Notation sowie '' (minor variation) und '.' (major variation) als Trennzeichen die Lesbarkeit weiter verbessern. Für verschiedene Typen von Objektinstanzen gibt es feinere Namensgebungsregeln.
- Dazu werden Umlaute und andere Sonderzeichen nach fixID-Regeln in reine ASCII-Strings transformiert.
- Es gibt Pakete mit Einträgen zu Subjekten, die zur selben Klasse gehören. Der Paketname ist dabei typischerweise ein Wort im Plural, der Namensraumpräfix der damit organisierten Instanzen dasselbe Wort im Singular.
- Also etwa leipzig-data.de/Data/Orte/ für das Paket und leipzig-data.de/Data/Ort/ als Namenspräfix für Instanzen von ld:Ort, die in Orte.ttl aufgelistet sind.
- Es gibt Pakete, in denen Informationen aus einer Quelle zusammengefasst sind. Hier steht typischerweise die Frage einer weiteren Datenintegration in die Gesamtsammlung im Vordergrund - die Daten sind zunächst im RDF-Format erfasst, die weitere (auch schrittweise) Integration in Leipzig Data ist zu diskutieren.