Über diesen Webservice

Konzept und Hintergründe von correspSearch

Mit correspSearch können Sie Verzeichnisse verschiedener digitaler und gedruckter Briefeditionen nach Absender, Empfänger, Schreibort und -datum durchsuchen. Dafür stehen eine Website und eine technische Schnittstelle zur Verfügung. Der Webservice aggregiert und wertet TEI-XML-Dateien im „Correspondence Metadata Interchange“-Format aus.

Der Webservice correspSearch wird nach folgenden Prinzipien betrieben und weiter entwickelt:

  • Nachweissystem: Der Webservice dient lediglich als ein Such- und Nachweissystem, das den Nutzerinnen und Nutzer bei Ihrer Recherche hilft und sie zu den eigenständigen Publikationen weiterleitet.
  • Wissenschaftliche Datenbasis: Ausgewertet werden Briefverzeichnisse von Editionen oder Repositorien, die anhand wissenschaftlicher Kriterien erarbeitet wurden.
  • Konzeptionelle Offenheit: Es gibt keinen zeitlichen oder räumlichen Sammlungsschwerpunkt, damit auch neuartige Forschungsfragen beantwortet werden können.
  • Open Access: Der Webservice aggregiert frei lizenzierte Daten und bietet seine Daten ebenfalls unter einer freien Lizenz zur Nachnutzung an.
  • Freie Schnittstellen: correspSearch bietet offene und dokumentierte technische Schnittstellen, damit die Daten unkompliziert von anderen Projekten abgefragt und verwendet werden können.
  • Offene Standards: Datenaustausch und Datenverarbeitung des Webservices basieren auf offenen Standardformaten und -technologien.

Forschungshintergrund

Briefe zählen zu den wertvollsten Quellen historischer Forschung. Zum einen wird in ihnen eine Vielzahl von unterschiedlichen Themen, Ereignissen, Personen etc. angesprochen und kommentiert. Zum anderen bildet die briefliche Kommunikation Beziehungsnetze zwischen Personen ab.

Aus editorischen und arbeitsökonomischen Gründen werden historische Korrespondenzen aber überwiegend nur ausschnittsweise ediert: entweder im Hinblick auf eine Person oder sogar nur auf einen einzigen Briefwechsel zwischen zwei Briefpartnern. Um die oben genannten Fragen zu erforschen, sind daher aufwändige Recherchen über mehrere Briefeditionen hinweg notwendig. Diese Problematik ist auch der Forschung seit längerem bekannt. So fordert u.a. auch Wolfgang Bunzel im Bezug auf die Erforschung der Romantik:

„die Schaffung einer dezentralen, möglichst offenen, auf [...] html/xml-Grundlage basierenden und mit TEI-Minimalstandards operierenden digitalen Plattform, die nach vielen Richtungen hin erweiterbar ist und es den bereits bestehenden Portalen und Homepages erlaubt, sich mit denkbar geringem Zusatzaufwand daran zu beteiligen. Nötig ist dafür keine Superstruktur, welche die – ohnehin nicht exakt bezifferbare – Gesamtheit aller Briefe der Romantik überwölbt, sondern vielmehr ein intelligentes Verknüpfungssystem, das vorhandene Dokumente in Konnex zueinander bringt. Mit dem Aufbau eines solchen Nexus gehen natürlich Recherchemöglichkeiten einher, die von der Personen- über die Datums- und Orts- bis hin zur gezielten Stichwortsuche (und dies natürlich in beliebiger Kombination der Suchparameter) reichen.”

Wolfgang Bunzel: Briefnetzwerke der Romantik. Theorie – Praxis – Edition. In: Anne Bohnenkamp und Elke Richter (Hg.): Brief-Edition im digitalen Zeitalter (=Beihefte zu editio Bd. 34) Berlin/Boston 2013. S. 109-131, hier S. 117.

Der Webservice „correspSearch” geht einen ersten Schritt in diese Richtung, indem er aus verteilten Editionen und Repositorien die Briefmetadaten aggregiert und über offene Schnittstellen, auf TEI-XML-Grundlage sowie unter einer freien Lizenz zentral zur Verfügung stellt. So können schnell Verzeichnisse verschiedener digitaler und gedruckter Briefeditionen nach Absender, Empfänger, Schreibort und -datum durchsucht werden.

Die Grafik veranschaulicht die Funktionsweise von correspSearch.

Digitale Briefverzeichnisse

Grundlage des Webservices correspSearch sind im Correspondence Metadata Interchange (CMI) Format online bereitgestellte digitale Briefverzeichnisse.

Das CMI-Format basiert wesentlich auf der Erweiterung „correspDesc“ (Correspondence Description) für die Richtlinien der Text Encoding Initiative. Das Element correspDesc wurde von der TEI Correspondence SIG entwickelt, um die Korrespondenz-spezifischen Metadaten von Briefen, Postkarten etc. in TEI-basierten Editionen notieren zu können. Die Erweiterung „correspDesc“ wurde im April 2015 mit der Version 2.8 der TEI P5 offiziell bereitgestellt.

Das CMI-Format wurde ebenfalls im Rahmen der TEI Correspondence SIG entwickelt und soll durch eine Reduzierung auf die wesentlichen Elemente der Korrespondenz – also Absender, Empfänger, Datums- und Ortsangaben eines jeden Briefes – sowie deren restriktivere Handhabung einen standardisierten Abgleich von Korrespondenz-Metadaten ermöglichen. Neben der standardisierten TEI-XML-Kodierung wird dies insbesondere durch die Verwendung von Normdateien ermöglicht. Absender, Empfänger, Schreib- und Empfangsorte werden durch Normidentifikationsnummern (wie z.B. die GND-Nummer der Deutschen Nationalbibliothek) über Projektgrenzen hinaus eindeutig identifizierbar und damit verknüpfbar gemacht. Schließlich wird im CMI-Format der einzelne Brief referenziert: bei gedruckten Editionen mittels der Briefnummer und der bibliografischen Angabe, bei digitalen Editionen zusätzlich mittels der URL.

Mehr Informationen zum CMI-Format

Erfasste Daten

Die Datengrundlage dieses Dienstes bilden die digitalen Briefverzeichnisse von wissenschaftlich erarbeiteten Editionen und Repositorien. Dabei sind vom Webdienst zeitlich und räumlich keine Begrenzungen vorgesehen. Welche Briefverzeichnisse der Webservice genau enthält, kann der Datenübersicht entnommen werden.

Der Datenbestand soll laufend erweitert werden. Jede gedruckte oder digitale Briefedition kann ihr Briefverzeichnis im CMI-Format beim Webdienst correspSearch registrieren lassen.

Mehr Informationen zum Mitmachen

Zu beachten ist, dass Briefeditionen immer nur jeweils den Briefwechsel einer Person bzw. zweier Briefpartner komplett abbilden. Die Korresponenz aller weiteren Briefpartner wird nur insoweit erfasst, als dass der Briefpartner in einem Briefwechsel mit der zentralen Persönlichkeit der jeweiligen Edition steht. Der Dienst gibt nur die edierten Briefe eines Briefwechsel wieder und das u.U. auch unvollständig, da noch nicht alle theoretisch erhältlichen Briefverzeichnisse aufgenommen wurden bzw. die jeweilige Edition auch noch gar nicht abgeschlossen ist. Nicht edierte Briefe aus Archiven werden vom Webdienst bisher nicht erschlossen.

Funktionen des Webservices

Der Webservice correspSearch macht die digitalen Briefverzeichnisse zentral recherchierbar. Die Verzeichnisse werden dabei jeweils vom Anbieter unter einer freien Lizenz online vorgehalten und vom Webservice in periodischen Abständen neu eingelesen. Jedes Verzeichnis muss also lediglich mit seiner URL im Webservice registriert werden und wird dann automatisch ausgewertet.

Beim Einlesen der Verzeichnisse wird für jede Norm-ID eines Korrespondenten bei der Virtual International Authority File (VIAF) nach den gängigsten Norm-IDs gefragt, so dass unterschiedliche Normdatensysteme aufeinander abgebildet werden. Derzeit unterstützt der Webservice GND, VIAF sowie die Normdatensystem der Bibliothèque nationale de France (BNF), der Library of Congress (LC) und der National Diet Library (NDL) in Japan. Für die Ortsnamen wird die geographische Datenbank GeoNames verwendet.

Die aggregierten Briefverzeichnisse kann man nach verschiedenen Kriterien (u.a. Korrespondenten, Schreiborte, Datum, Edition etc.) durchsuchen bzw. filtern. Dabei können die Korrespondenzpartner und -orte auf ihre entsprechende Rolle im Kommunikationsprozess eingeschränkt werden.

Als Ergebnis werden die Korrespondenz-Metadaten der einzelnen Briefe mitsamt bibliografischer Angaben angezeigt. Briefe aus digitalen Editionen werden zusätzlich direkt verlinkt.

Neben der Website stehen außerdem mehrere technische Schnittstellen zur Verfügung, durch die der Webservice automatisiert abgefragt werden kann. Das Ergebnis wird dann u.a. im CMI-Format ausgegeben und kann von anderen Programmen weiterbenutzt und -verarbeitet werden.

Mehr Informationen zur Schnittstelle

Verwendete Technologien

Die Softwarearchitektur des Webservices ist (ab Version 2) modularisiert und besteht aus folgenden Komponenten:

  • csHarvester: Harvesting und Validierung der CMIF-Dateien (eXistdb-App)
  • csIngest: Ingest der CMIF-Dateien in den Elasticsearch-Index, Anlegen von Einträgen in diversen Autocompletes (Personen, Orte etc.), Anreichern mit weiteren Daten aus Normdateien (Python)
  • csSearch: Frontend der Suche inkl. Karten-basierter Suche (vue.js)
  • csWeb: Website (außer Suche) (eXistdb-App)
  • csAPI: API (eXistdb-App)
  • CMIF Creator: Tool zum browserbasierten, einfachen Erstellen von CMIF-Dateien (vue.js)
  • csLink: Javascript-Widget zur Einbindung in digitale Editionen

Folgende Webservices und Schnittstellen werden für die Suche, den Suchindex oder den CMIF Creator verwendet:

Anbieter dieses Webservices

Der Webservice correspSearch wird seit April 2014 von der TELOTA-Arbeitsgruppe an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) entwickelt und bereitgestellt – in Kooperation mit der TEI Correspondence SIG und weiteren Wissenschaftlern.

Die BBAW ist mit 25 Akademienvorhaben und einer Vielzahl von Drittmittelprojekten die größte außeruniversitäre Forschungseinrichtung mit geisteswissenschaftlichem Profil in der Region Berlin-Brandenburg. Seit über 15 Jahren unterhält die BBAW zudem mehrere Forschungsvorhaben im Bereich der digitalen Geisteswissenschaften, so z.B. (neben der TELOTA-Arbeitsgruppe) das Digitale Wörterbuch der deutschen Sprache oder das Deutsche Textarchiv.

Die Initiative zu diesem Webdienst entstand im Februar 2014 im Workshop „Briefeditionen um 1800: Schnittstellen finden und vernetzen“, der von Anne Baillot (Nachwuchsgruppe „Berliner Intellektuelle“ an der HU Berlin) und Markus Schnöpf (TELOTA, BBAW) organisiert worden war.