Metadaten-Format

Aus OpenBib Wiki
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Allgemeines

Grundlage für die interne Verarbeitung ist ein allgemeines Zwischenformat, in das Daten aus beliebigen Erfassungssystemen zunächst umgewandelt und intern vereinheitlicht werden. Auf diesen so vereinheitlichten Daten können dann - losgelöst vom jeweiligen Erfassungssystem - gemeinsame weitere Verarbeitungsschritte erfolgen - wie z.B eine automatische Kataloganreicherung.

Die folgenden Informationen beziehen sich auf das aktuelle JSON-basierte Metadaten-Format, wie es in OpenBib ab der Version 3 Verwendung findet. Bis dahin wurde ein textzeilenorientiertes Metadaten-Format eingesetzt, bei dem u.a. die Feldnummern der Normdaten (Personen, Körperschaften, Notationen, Schlagworte) noch nicht an MAB2 angeglichen waren und sich Subfelder/Indikatoren nicht strukturiert verarbeiten liessen.

Aufbau

Das Metadaten-Format ist sehr einfach aufgebaut. Pro Textzeile ist ein Datensatz in JSON kodiert.

Jeder Datensatz besitzt zwingend einen Key id mit seiner permanenten alphanumerischen Identifikationsnummer, die jedoch kein / beinhalten darf. Die einzelnen Felder (mit ihren Inhalten) sind unter dem Key fields zusammengefasst.

Die (einzelnen oder multiplen) Inhalte einzelner Felder sind wiederum unter dem Key ihrer Feldnummer als Array abgelegt .Die Feldnummern entsprechenden i.a. dem MAB2 Standard. Jeder einzelne Inhaltseintrag hat dabei eine festgelegte Form.

Für einfache Inhalte ist diese:

{"content":"Professional computing series","subfield":"","mult":"3"}

Dabei steht der eigentliche Inhalt in content. In subfield kann zusätzlich ein Teilfeld-Identifier (in MAB2 Indikator) abgelegt werden, z.B. g für geographisch. In mult werden Ordnungsinformationen der einzelnen Inhalte eines gegebenen Feldes hinterlegt, damit Reihenfolgen jenseits der impliziten Abfolge im Array z.B. in Datenbanken abgebildet werden können.

Alternativ haben Verknüpfungen in andere Normdaten die Form:

{"supplement":"","id":"242","subfield":"","mult":"1"}

Dabei wird mit id die Identifikationsnummer in der anderen Normdatenart gekennzeichnet. In subfield kann wieder zusätzlich ein Teilfeld-Identifier abgelegt werden. In supplement werden zusätzliche Informationen wie [Hrsg. ] oder [Illustr.] zum verknüpften Normdateneintrag angegeben, die z.B. kennzeichnen, wie eine Person im Kontext des aktuellen Mediums gewirkt hat - also z.B. als Herausgeber. Diese Information ist Teil des Mediums und nicht Teil des Normdateneintrags. Ordnungsinformationen werdern wieder mit mult abgebildet.

Als Kodierung der Daten wird UTF8 verwendet.

Standard-Dateinamen

Standard-Dateinamen für die verschiedenen Normdaten-Arten sind:

Titeldaten meta.title.gz
Personendaten meta.person.gz
Körperschaftsdaten meta.corporatebody.gz
Systematik-/Notationsdaten meta.classification.gz
Schlagwortdaten meta.subject.gz
Exemplardaten meta.holding.gz

Titel

Beispiel

{"fields":{"0412":[{"content":"Addison-Wesley","subfield":"","mult":"001"}],"0403":[{"content":"1st ed.","subfield":"","mult":"001"}],\\
 "0451":[{"content":"Professional computing series","subfield":"","mult":"003"}],"0009":[{"content":"DB","subfield":"","mult":"001"}],\\
 "0331":[{"content":"Tcl and the Tk toolkit","subfield":"","mult":"001"}],"0540":[{"content":"0-201-63337-X","subfield":"","mult":"001"}],\\
 "0027":[{"content":"V","subfield":"","mult":1}],"0003":[{"content":"03.01.2005","subfield":"","mult":1}],\\
 "0010":[{"content":"14","subfield":"","mult":"001"}],"0011":[{"content":"14","subfield":"","mult":"001"}],\\
 "0100":[{"supplement":"","id":"242","subfield":"","mult":"001"}],"0710":[{"supplement":"","id":"70","subfield":"","mult":"001"},\\
         {"supplement":"","id":"32","subfield":"","mult":"002"}],"0016":[{"content":"Home, sweet home","subfield":"","mult":"001"}],\\
 "0002":[{"content":"03.01.2005","subfield":"","mult":1}],"0425":[{"content":"1994","subfield":"","mult":"001"}],\\
 "0359":[{"content":"John K. Ousterhout","subfield":"","mult":"001"}],"0433":[{"content":"XX, 458 S. : graph. \\
          Darst.","subfield":"","mult":"001"}],"0410":[{"content":"Reading, Mass.","subfield":"","mult":"001"}]},"id":"14"}

Verwendete Felder

0002
Aufnahmedatum
0003
Änderungsdatum
0004
ID der Überordnung
0005
Inventarnummer (in mex vorhanden)
0009
Herkunft
0010
Fremdnummer
0011
Lokale ID
0014
Signatur (in mex vorhanden)
0015
Sprache
0016
Standort (in mex vorhanden)
0026
NE/R
0027
Art des Werkes (V oder Leer = Verfasser, S=Sachtitelwerk, U=Urheberwerk)
0028
Bandkennzeichen (Leer = Stuecktitel, B = Band, G = Gesamtwerk/Ueberordnung)
0035
ErschLand
0036
Erscheinungsform
0038
Veröffentlichungsart
0042
Publikationsstatus
0089
Bandangabe
0100
Verfasser
0101
Person
0103
Gefeierte Person
0150
HBZ Personen-ID
0200
Urheber
0201
Körperschaft
0300
Sammlungsvermerk
0304
EST
0310
AST
0331
HST
0333
Zu erg. Urheber/HST Urheber
0334
Material
0335
Zusatz zum HST
0341
PSTVorlage
0359
Vorl. Verfasser/Koerperschaft
0360
Vorl. Unterreihe
0361
Vorlage beigef. Werk
0365
Gemeins. Angaben
0370
WST
0403
Auflage
0405
Erscheinungsverlauf
0407
Massstab
0410
Verlagsort
0412
Verlag
0413
Drucker
0424
ErschJahr/Ansetzung
0425
ErschJahr
0433
Kollation
0434
Ill_Angabe
0434
Sonst. Angaben
0435
Format
0437
Begleitmat.
0451
GesTit Vorl
0453
Id des GT
0454
Ansetzungsform GT
0501
Fussnoten
0503
Uebers. HST
0504
PST Fussnote
0505
WST Fussnote
0507
Ang. HST
0508
Quelle
0509
Verfasser Fussnote
0510
Ausgabe Fussnote
0511
Erschverm. Fussnote
0512
Koll. Fussnote
0513
Impress. Aend.
0515
Ergänzt. GesamtTitel
0516
Sprache
0517
Angaben zum Inhalt
0519
HSSVermerk
0522
Teilungsvermerk
0523
Erscheinungsweise
0525
Herkunft Fussnote
0527
Parallel Ausg.
0529
Titbeilage
0530
Bezugswerk
0531
FrühAusgabe
0532
FrühTit
0533
SpätAusgabe
0534
Titelkonk.
0535
Anz. Ex.
0536
Vorr. Erschtermin
0540
ISBN
0543
ISSN
0553
ArtikelNr. als 13-stellige ISBN
0572
ZDB-ID
0590
HSTQuelle
0591
Verfasser Quelle
0594
ErschOrt Quelle
0595
ErschJahr Quelle
0600
Bemerkung
0619
Jahr Vorlage
0646
Filmbesitz
0652
EDV Material
0655
EDV Adress
0662
EDVurl
0700
Notation
0710
Schlagwort
0715
Unbekannt
0750
Abstract
0800
Art/Inhalt Medienart
0802
Medien-Zustand
0902
Schlagwort
0905
RSWK-ID
0907
Schlagwort
0910
RSWK-ID
0912
Schlagwort
0915
RSWK-ID
0917
Schlagwort
0920
RSWK-ID
0922
Schlagwort
0925
RSWK-ID
0927
Schlagwort
0930
RSWK-ID
0932
Schlagwort
0935
RSWK-ID
0937
Schlagwort
0940
RSWK-ID
0942
Schlagwort
0947
Schlagwort
0955
RSWK-ID
1000
Titel beginnend mit 1000
1014
Unbekannt
1025
Lokale ZDB-ID
1026
ZDB Jason-ID
1042
ZDB Prio
1299
ZDB Mikro
1527
ID der Parallelausgabe
1529
Fortlaufende Beilage Titel?
1530
ID des Bezugswerkes
1531
ID der frueheren Ausgabe
1532
ID fruehrer Hinweis
1533
ID Titelkonkordanz
1534
ID spaeterer Hinweis ?
1600
Hinweis auf Pseudo-Orte (Zweigstellen, Lesesaaltheke etc.)
1664
Provenienz
1671
Verbreitungsort
1672
Hochschulort (z.B. Paris)
1673
Veranstaltungsort (TODO)
1674
Veranstaltungsjahr (TODO)
1675
ID des Hochschulortes
1676
ID des Veranstaltungsortes
1677
ID des Erscheinungsortes
1679
Jahr Orginal
1710
MESH-Ketten
1751
Nicht mehr existent
1800
Nebeneintragung 1. Person
1802
Nebeneintragung 2. Körperschaft
1804
Nebeneintragung 1. EST
1805
Nebeneintragung 1. Titelansetzung
1806
Nebeneintragung 1. Titel in Mischform
1814
Nicht mehr existent
1836
Nicht mehr existent
1848
Nicht mehr existent
1850
Nebeneintragung 1. Person ID
1852
Nebeneintragung 1. Körperschaft ID
1978
Nicht mehr existent
2000
Urheber HBZ
2001
HBZ-ID der Sonstig beteiligten Körperschaft
2010
RSWK HBZ
2011
RSWK HBZ
2012
RSWK HBZ
2013
RSWK HBZ
2014
RSWK HBZ
2015
RSWK HBZ
2016
RSWK HBZ
2017
RSWK HBZ
2018
RSWK HBZ
2019
RSWK HBZ
2651
URL lokal
2655
URL lokal
2662
USB EDVurl
2663
USB URLInfo
3000
Erwerbung Intern
3002
ZDB TitelID alt
3003
ZDB lokaleID alt
3004
Kommentar MAB2
3005
IntNotEx
3006
IntNotLok (z.B. retro)
3007
Unbekannt (Standort?)
3750
Nicht mehr existent
4200
Wikipedia-Artikelname deutsch (Anreicherung)
4201
Wikipedia-Artikelname englisch (Anreicherung)
4202
Wikipedia-Artikelname französisch (Anreicherung)
4210
Rechte-Information (Copyright)
4211
Preis
4212
Währung
4220
Nutzername (z.B. aus Bibsonomy)
4230
Standort-ID / (Pseudo)ISIL
4700
Sammlung bzw. Sammlungsschwerpunkt
4711
Unbekannt
4712
Markierung Econbiz (wi, so, wiso)
4715
Markierung EDZ
4717
Markierung Fachbibliothek Versicherungswissenschaft
4720
Testdaten Inhaltsverzeichnis-Scans
4725
Temporaeres Schlagwort
5050
BibKey
5051
BibKey Basis-String
5055
WorkKey Basis-String

Besonderheiten in den Titeldaten

Im Falle von der Kategorie 451 werden (derzeit noch) die mult-Werte für die Kodierung der multiplen Gesamttitel verwendet und es kommt ein Modulo dazu.

451.001-004: Erster  Gesamttitel mit Teilfeldern
451.005-009: Zweiter Gesamttitel mit Teilfeldern (MAB2: 461)

Es ist geplant die Feldnummern an MAB2 anzugleichen und entsprechende Teilfeld-Werte hinzuzufügen.

Exemplare

Beispiel

{"fields":{"0004":[{"content":"1","subfield":"","mult":1}],"0014":[{"content":"AB 123","subfield":"","mult":1}]},"id":14}

Verwendete Felder

0004
ID der zugehörigen Titelaufnahme
0005
Inventarnummer
0010
Mediennummer
0014
Signatur
0016
Standort
1204
Bestandsangaben (in Zusammenfassung postitiv + negativ)

Personen

Beispiel

{"fields":{"0002":[{"content":"03.01.2005","subfield":"","mult":1}],"0800":[{"content":"Ousterhout, John K.","subfield":"","mult":1}],\\
 "0003":[{"content":"03.01.2005","subfield":"","mult":1}]},"id":"242"}

Verwendete Felder

0002
Aufnahmedatum
0003
Änderungsdatum
0800
Ansetzung
0830
Verweisung

Körperschaften

Beispiel

{"fields":{"0002":[{"content":"03.01.2005","subfield":"","mult":1}],"0800":[{"content":"Electronic Frontier Foundation","subfield":"","mult":1}],\\
 "0003":[{"content":"03.01.2005","subfield":"","mult":1}]},"id":"8"}

Verwendete Felder

0002
Aufnahmedatum
0003
Änderungsdatum
0800
Ansetzung
0810
Verweisung
0812
 ?
0881
Abkürzung der Ansetzung
0850
Früherer/Späterer Name

Systematik/Klassifikation

Beispiel

{"fields":{"0002":[{"content":"03.01.2005","subfield":"","mult":1}],"0800":[{"content":"LA 2","subfield":"","mult":1}],\\
 "0003":[{"content":"03.01.2005","subfield":"","mult":1}]},"id":"1"}

Verwendete Felder

0002
Aufnahmedatum
0003
Änderungsdatum
0800
Ansetzung
0801
Benennung
0810
Vermerk
0830
Stichworte
0840
Verweisform

Schlagworte

Beispiel

{"fields":{"0002":[{"content":"03.01.2005","subfield":"","mult":1}],"0800":[{"content":"Tcl","subfield":"","mult":"001"}],\\
 "0003":[{"content":"03.01.2005","subfield":"","mult":1}]},"id":"32"}

Verwendete Felder

0002
Aufnahmedatum
0003
Änderungsdatum
0800
Ansetzung
0805
Definition
0806
Bemerkungen
0807
Quelle
0810
Korrespondierende Klassifikation
0830
Verweisung
0850
Übergeordnet
0860
Assoziiert
0870
Früher
0880
Später

Bibliotheksinformationen

Verwendete Kategorien

0010
Institutsname
0020
Straße
0030
Gebäude
0040
Interaktiver Lageplan der Universität
0050
Gemeinsame Bibliothek
0060
Telefon
0070
Fax
0080
E-Mail
0090
Internet
0100
Auskunft / Bibliothekar(in)
0110
Öffnungszeiten
0120
Bestand Monos
0130
Bestand Zeitschriften
0140
Anzahl laufender Zeitschriften
0150
Bestand CD's / Digitale Medien
0160
Sonstige Bestandsangaben
0170
Besondere Sammelgebiete
0180
Art der Bibliothek
0190
Neuerwerbungslisten
0200
Kopierer / Technische Ausstattung
0210
DV-Ausstattung
0220
Art des Systems
0230
Online-Katalogisierung seit Erscheinungsjahr
0235
Online-Katalogisierung seit Erwerbungsjahr
0240
Mitarbeit am KUG
0250
Sigel in ZDB
0260
Art der Vernetzung
1000
Geo-Koordinaten


MARC21

Um eine bessere Kompatibilität der Daten der Daten und eine Nachnutzbarkeit externer Software zu gewährleisten, wird derzeit evaluiert, ob das Metadaten-Format auf MARC21 geändert werden soll. Voraussetzung dazu ist, dass sich die Meriten des MAB2-Formats (getrennte Normdaten, Hierarchien) auch in das MARC21 retten lassen.

Für verschiedene Informationsarten gibt es auch in MARC21 entsprechende Formate:

Weitere Informationen zu MARC21

Besondere Spezifika

Getrennte Normdaten

In MARC21 gibt es auch die Möglichkeit z.B. Personendaten getrennt zu beschreiben und zu verlinken:

Hierarchien

In MARC21 können Hierarchien (siehe http://www.allegro-c.de/formate/kap101.htm Hierarchie und Verknüpfung) über das Feld 773 im Teilfeld w abgebildet werden. Dort wird dann die ID des übergeordneten Satzes eingetragen.

Meine Werkzeuge
Namensräume
Varianten
Aktionen
Navigation
Werkzeuge