KORVIS als Beispiel für ein semantisches Informationssystem

    11. Januar 2005 von Jochen Schwarze

    Das Kommunale Rats- und Verwaltungs-Informationssystem KORVIS für Gemeinderat und Verwaltungsführungskräfte der Landeshauptstadt Stuttgart stellt einen zentralen Zugang zu bisher auf einer Vielzahl von Systemen verteilten Daten in Form eines integrierten Informationsportals bereit. Kernaspekte des Portals sind eine Topic Map des Gesamtdatenbestands, die einheitliche Navigation, eine übergreifende Suche und die semantische Vernetzung innerhalb des Informationsbestands. Das Gesamtsystem KORVIS unterstützt die systematische und effiziente Recherche und das Erkennen von Zusammenhängen im Informationsbestand.

    Einleitung

    Das Kommunale Rats- und Verwaltungs-Informationssystem KORVIS [1] ist ein Informationsportal für Führungskräfte der Landeshauptstadt Stuttgart, also Mitglieder des Gemeinderats und Fraktionsgeschäftsstellen, Bezirksbeiräte, Bereich Oberbürgermeister und Bürgermeister sowie Amtsleiter. Diese benötigen zur Steuerung und Entscheidungsfindung unter anderem die Unterlagen der Gemeinderatsarbeit, Information zu Mitarbeiterinnen und Mitarbeitern, Organisationsstrukturen, Rechtsgrundlagen, statistische Information, Geodaten, Information aus dem Intranet sowie redaktionelle Informationen. Diese Daten sind bisher auf einer Vielzahl von Systemen verteilt, die sich in Zugänglichkeit, Benutzungsschnittstelle und Technik stark unterscheiden. KORVIS stellt einen zentralen Zugang zu diesen Daten in Form eines integrierten Informationsportals bereit. Das Portal bietet eine einheitliche Navigation, eine übergreifende Suche und stellt die semantische Vernetzung innerhalb des Informationsbestands her. Hiermit geht es über den verbreiteten Portal-Ansatz, der verschiedene isolierte Subsysteme wie Kacheln aneinanderreiht, wesentlich hinaus. Das System unterstützt den Benutzer bei der systematischen und effizienten Recherche und dem Erkennen von Zusammenhängen im Gesamtbestand.

    Das KORVIS-Portal

    Die wesentlichen Elemente des Portals aus Sicht der Benutzerinnen und Benutzer sind folgende:

    1. Über eine zentrale, an der Oberfläche bewusst einfach gehaltene Suchfunktion kann der Benutzer den gesamten Informationsbestand durchsuchen. Zu finden sind die Indexdaten und die Dokumente aller angeschlossenen Subsysteme im Volltext. Die Ergebnisse werden übergreifend gerankt und einheitlich dargestellt. Der Benutzer erhält dynamisch eingeblendete Vorschläge zur weiteren Eingrenzung sowie passende Thesaurus-Begriffe. Auf die verbreitete Expertensuche mit komplizierten Suchmasken wird bewusst verzichtet.
    2. Man kann das gewünschte Dokument über die Suchergebnisliste direkt im Subsystem aufrufen. Dort stehen alle Möglichkeiten des Subsystems, beispielsweise das Auslösen von Workflow-Schritten, unmittelbar wie gewohnt zur Verfügung.
    3. Die Dokumentanzeige wird ergänzt durch einen als Kontextleiste bezeichneten Bereich mit Information zum aktuellen Dokument. Dieser Bereich liefert weitere Daten und Verknüpfungen zu anderen Dokumenten des Gesamtbestands, welche ein Subsystem jeweils einzeln nicht liefern kann. Die Kontextleiste begleitet den Benutzer bei der Navigation im Informationsbestand, ähnlich wie der kleine Bildschirm des Navigationssystems eine Autofahrt begleitet: dieses zeigt zur Orientierung eine Karte als schematische Darstellung der aktuellen Umgebung mit den nächsten Tankstellen und Parkhäusern - die KORVIS-Kontextleiste zeigt zur Orientierung die schematische Umgebung der Topic Map mit den nächsten Dokumenten und Metadaten.

    Für den Benutzerkreis der Landeshauptstadt Stuttgart ist die Portaloberfläche in Lotus Notes integriert, das die Basis für viele städtische Anwendungen bildet. Hier greifen Elemente für Lotus Notes als Rich Client eines Domino-Servers mit Elementen für den Webbrowser als Thin Client eines Java-Applikationsservers nahtlos ineinander, gewissermaßen als Mixed Client.

    Systemkonzept

    Eines der zentralen Bestandteile des Systemkonzepts ist eine Topic Map, die im Wesentlichen logische Verknüpfungen und wichtige Metadaten zu allen Informationseinheiten aus den angeschlossenen Subsystemen enthält. Diese Subsysteme werden durch das neue Portal nicht ersetzt; vielmehr erfüllt die Topic Map die Funktion eines semantischen Index" über den gesamten Informationsbestand, der direkt in einzelne Informationseinheiten der Subsysteme verweist. Schnittstellenmodule oder Topic Map-Konnektoren liefern dabei die Indexdaten aus den Subsystemen in Form von Topic Map-Modulen. Diese Module werden zu einer Gesamt-Topic Map vereinigt. Bis auf wenige Ausnahmen findet keine redaktionelle Pflege der Topic Map statt, zum einen wegen des großen Datenumfangs, zum anderen, weil die Informationsbestände der Subsysteme "leben" und in regelmäßigen Abständen vollautomatisch abgeglichen werden.

    Warum Topic Maps?

    Topic Maps wurden als Basistechnologie aus verschiedenen Gründen gewählt. Die wichtigsten ergeben sich direkt aus den Grundeigenschaften von Topic Maps [2, 3, 4]:

    1. Mit Topic Maps lassen sich beliebige Verknüpfungen zwischen Dokumenten (Associations) und beliebige Metadaten von Dokumenten (Occurrences) beschreiben. Bei Erweiterungen an diesen Daten sind keine strukturellen Änderungen in relationalen Datenbankschemata oder programmatischen Zugriffsschichten notwendig. Dies erleichtert die Realisierung und die kontinuierliche Verbesserung des Systems erheblich.
    2. Topic Maps können Verknüpfungen zwischen Dokumenten und Metadaten von Dokumenten außerhalb dieser Dokumente beschreiben. Dies ist aus verschiedenen Gründen wichtig. Zum einen technisch, denn ein Eingriff in mehrere hunderttausend Dokumente und Datensätze in zahlreichen Subsystemen ist nicht erwünscht. Zum anderen rechtlich, denn eine einmal unterschriebene und archivierte Beschlussvorlage darf nachträglich nicht mehr geändert werden. Drittens konzeptionell, denn eine Topic Map ist eine Art "Wissens-Quintessenz" des zugrunde liegenden Informationsbestands, und diese bleibt langfristig stabil, wenn man sie vom Dokumenten-Workflow, von technischen Veränderungen in den Subsystemen und vom Alterungsprozess der Dokumente entkoppelt.
    3. Mehrere dezentral erstellte Topic Maps lassen sich mit definierter Logik zu einer Gesamtmenge vereinigen (Merging). Dies ist wichtig, weil verschiedene Subsysteme zur selben Informationseinheit unterschiedliche Metadaten und Verknüpfungsvorschläge liefern können. Zu einem Straßennamen beispielsweise findet man unter anderem Kartenmaterial des Stadtmessungsamts und Bauprojekte des Hochbauamts. Die Zusammenführung solcher bisher isolierter Daten erzeugt einen deutlichen Synergie-Effekt.

    Diese Eigenschaften haben ihre Tragfähigkeit beim Einsatz im Gesamtsystem bereits erwiesen.

    Architektur und Technik

    Die umfangreiche Topic Map ist auf Serverseite in einer relationalen Datenbank mit optimierter Zugriffs-Schicht abgelegt. Ein Java-Applikationsserver dient als Integrationsplattform für die Laufzeitumgebung. Die browserbasierte Portaloberfläche wird über HTML und JSP modelliert.

    Automatisch gesteuerte Konnektor-Module liefern Topic Maps im XTM-Format [5]. Diese Module sind mit den Subsystemen über verschiedene Protokolle verbunden, unter anderem XML, SOAP/Web Services und CORBA/IIOP. Teile der Topic Map werden gemeinsam mit dem Volltext der Dokumente aus den Subsystemen über eine Suchmaschine vorindiziert, um zur Laufzeit eine effiziente Abfrage zu ermöglichen.

    Zum Einsatz kommen verstärkt Open Source-Komponenten, unter anderem Linux-basierte Server, Jakarta Tomcat als Java-Applikatonsserver und verschiedene Bibliotheken für die Suchmaschine (Jakarta Lucene [6]) und zur Topic Map-Integration (TM4J [7]).

    Über die Realisierung der Kernarchitektur hinaus sind verschiedene technische Aspekte der Systemintegration gelöst. Hierzu gehören zum Beispiel die durchgängige Benutzer-Anmeldung (Single Sign-On), beginnend bei Windows über den Notes Client und Domino Server bis zum Java-Applikationsserver. Weiterhin müssen zwischen den Topic Map-Daten und dem Berechtigungsmodell der Subsysteme konsistente Zugriffsrechte gesichert sein. Und nicht zuletzt schreibt die Stadtverwaltung für externe Links den Mozilla-Webbrowser vor, so dass der nahtlose Übergang zwischen dem Lotus Notes Client, dem intern benutzen Microsoft Internet Explorer und einem externen Browser hergestellt sein muss.

    Diese Gesamtarchitektur kann flexibel erweitert auf andere Anwendungsfälle übertragen werden.

    Fazit

    Die bislang gewonnen praktischen Erfahrungen mit der Implementierung zeigen, dass die Erwartungen an den gewählten technisch-konzeptionellen Ansatz erfüllt wurden. Eine Topic Map mit ca. einer halben Million Objekten wird ständig aktuell gehalten. Die technische Komplexität im Hintergrund lässt sich mit einer einfachen, auch für weniger computerversierte Benutzerinnen und Benutzer geeigneten Oberfläche darstellen.

    Mehrere konsolidierende Tätigkeiten unterstützen das Projekt, unter anderem die Schaffung eines stadtweiten Namens- und Adressbuchs sowie die Aufbereitung verschiedener städtischer Thesauren.

    Im Vergleich zu Wissensmanagement-Projekten in der Privatwirtschaft fiel im vorliegenden Projekt besonders die große fachliche Breite und Tiefe an Themen und Domänen auf, mit denen die Entscheidungsträger in der täglichen Arbeit konfrontiert sind. Dies zeigt sich beispielweise in den umfangreichen Thesauren und einer Vielzahl unterschiedlicher Dokument- und Verknüpfungstypen.

    Perspektivisch könnten weitere Datenbestände in das System integriert werden, auch tabellarische und numerische Daten, z.B. aus SAP. Durch ein systematisches Qualitätsmanagement und redaktionelle Prozesse lässt sich das semantische Netz weiter verdichten. Potenzial besteht auch in einer denkbaren Kooperation mit anderen Kommunen zur Schaffung einer Ontologie der öffentlichen Verwaltung.

    Links und Quellenangaben

    [1] Projekt KORVIS, Landeshauptstadt Stuttgart: www.stuttgart.de/sde/content.php
    [2] Wikipedia-Artikel zu Topic Maps: de.wikipedia.org/wiki/Topic_Maps
    [3] Einführung in Topic Maps in englischer Sprache: www.ontopia.net/topicmaps/materials/tao.html
    [4] Jochen Schwarze. Erfolgreiches Informationsmanagement mit XML. 2001: www.doculine.com/news/2001/0901/xml.shtml
    [5] XML Topic Maps (XTM): www.topicmaps.org
    [6] Jakarta Lucene: jakarta.apache.org/lucene
    [7] Topic Maps for Java (TM4J): www.tm4j.org

    Kontakt

    jochen.schwarze@cit.de
    www.jochen-schwarze.de
    www.cit.de
    Ansprechpartner bei der Landeshauptstadt Stuttgart für das Projekt KORVIS:
    Iris Frank, iris.frank@stuttgart.de
    Peter Lippert, peter.lippert@stuttgart.de

Kommentare

Das Kommentarsystem ist zurzeit deaktiviert.