integis.ch > Dokumentation

Quelle: FAN-Agenda ?/04, www.fan-info.ch
 

Dokumentation und Modellierung von Geodaten

Prof. S.F. Keller
Dozent für Informationssysteme
Hochschule für Technik Rapperswil HSR (FHO)

Warum Daten dokumentieren?

Raumrelevante Entscheidungen sollen auf nachvollziehbaren und aktuellen Grundlagen beruhen. Erfahrungen aus der Amtlichen Vermessung haben gezeigt, dass ein grosses Verbesserungspotential darin liegt, wenn sich alle am Prozess beteiligten Fachleute untereinander gut verständigen (vgl. Bericht 17, www.swisstopo.ch). Dies gilt gleichermassen für die Aktualisierung von Plänen und Karten, wie auch für die Weiterverarbeitung der Daten in einem Geoinformationssystem (GIS). Ganz besonders gilt dies für die Vergabe von Arbeiten der öffentlichen Hand an Unternehmer oder an andere Dienststellen. In allen diesen Fällen geht es um die Verständigung über Daten. Daten ohne Beschreibung sind wertlos; Informationsflüsse, wie auch Geschäftsabläufe, sind Chefsache!

Was ist eine Datenbeschreibung?

Gefragt ist also eine verständliche Dokumentation der Daten, eine Datenbeschreibung. Im Folgenden wollen wir erläutern, was das ist und wie man dazu kommt. Eine präzise und hinreichende Datenbeschreibung umfasst typischerweise folgende vier EDV-Dokumenten-Kategorien (vgl. www.integis.ch > Dokumente):

  1. Merkmalskatalog (Prosa)
  2. Datenmodell als Diagramm (UML)
  3. Datenmodell in textueller Sprache (INTERLIS)
  4. Weitere Dokumente, u.a. zur Kartendarstellung (Prosa; INTERLIS)

Der Merkmalskatalog (1) beschreibt die Inhalte und gibt evtl. Hinweise zur Datenerfassung. Man stelle sich ein „technisches Prosa“ vor, in dem z.B. zuerst beschrieben wird, was genau im Projekt-Zusammenhang als Konzept (Entitätsmenge, Klasse) gilt: Was gilt als Zonengrenze? Wie ist ein Obstgarten definiert? Das Datenmodell als grafisches Diagramm (2) gibt eine Übersicht über die Konzepte. In der Informatik hat man sich hier auf die Unified Modeling Language (UML) geeinigt, welches für diesen Zweck das so genannte „Klassendiagramm“ anbietet (Konzept = Klasse). Dieses ist aber noch (bewusst) zuwenig präzise: Es fehlen genormte Datentypen und die Möglichkeit, die Datenbeschreibung selber zu prüfen und maschinell nutzen zu können. Dafür wurde INTERLIS (3) entwickelt. Die Daten beschrieben in INTERLIS (= „INTERLIS-Modell“; „INTERLIS-Datei“) bezeichnen wir als Datenmodell oder Datenschema im engeren Sinne: Damit erst werden die Datenstrukturen, die Beziehungen untereinander sowie deren Konsistenzbedingungen präzise und vollständig dokumentiert.

Zusätzliche Dokumente (4) beschreiben schliesslich, wie aus den ‚grafiklosen’ Geodaten, Kartengrafiken erzeugt werden (sog. Darstellungsbeschreibung). Zu dieser vierten Kategorie zählen wir weitere Dokumente, wie z.B. Empfehlungen für die Erstdatenerfassung oder Datenübernahme, (kantonale) Datenmodell-Erweiterungen oder die Definition ergänzender, einfacher Datenabgabeformate. Alle diese Dokumente bauen auf dem Datenmodell auf und beziehen sich explizit auf dieses. Dazu kommen die „üblichen“ IT-Regelungen, wie u.a. Übertragungsmedien (inkl. Kompressionsverfahren), Sicherheitsaspekte und Verantwortlichkeiten.

Eigenschaften und Nutzen

Die Abfolge der Dokumenten-Kategorien entspricht in etwa auch der zeitlichen Abfolge, nach der sie erstellt werden. Sie sind das Resultat eines gemeinsamen Abstraktions- und Einigungsprozesses. Man nennt diese Tätigkeit auch ‚modellieren’. Eine Datenbeschreibung enthält die modellierten Konzepte der realen Welt. Jedes der Dokumente deckt einen besonderen Aspekt ab.

Die Sprache zur Beschreibung des Datenmodells im engeren Sinne (Dokument 3, INTERLIS) hat einige interessante Eigenschaften: Es handelt sich um eine textuelle Notation, deren Ausdrucksstärke kompatibel ist zu Industriestandards wie UML und zu internationalen Normen wie ISO 19100. Ein mit dieser formalisierten und normierten Sprache beschriebenes Datenmodell kann mit Werkzeugen automatisch weiterverarbeitet werden, z.B. zur Erzeugung von einheitlich aussehenden und immer aktuellen Dokumentationen. Namentlich ist es mittels genauen Regeln möglich, ein Dateiformat festzulegen, sobald ein Datenmodell vorhanden ist. Dieses Dateiformat wird für den informationsverlustfreien, systemneutralen Datentransfer benötigt und dient auch zu Archivierungszwecken.

Die Beschreibungssprache zusammen mit den so genannten Abbildungs- und Codierungsregeln sind in der INTERLIS-Spezifikation, der Schweizer Norm SN 612031 festgehalten (www.interlis.ch). Dank diesen Regeln erübrigen sich viele Diskussionen: z.B. wie ein Sachverhalt interpretiert (Stufe Datenmodell) oder wie ein Attribut „codiert“ werden soll (Stufe Format). Die notwendigsten Werkzeuge sind heute verfügbar, wie z.B. Prüfprogramme, Konverter und Editoren, was die Anwendung dieser Sprache vereinfacht. Mit dem normierten Format ist das Automatisierungspotential von INTERLIS aber noch lange nicht ausgeschöpft: Wünschbar sind noch Regelungen und Werkzeuge um z.B. weitere Standardformate zu erzeugen, Grafiksymbole zu verwalten oder Webdienste zu konfigurieren.

Organisatorisches

Eine solchermassen einheitlich dokumentierte Datenbeschreibung ist die Voraussetzung für die Abgabe homogener Daten. Dabei wird technisch weder eine dezentrale noch eine zentrale Lösung vorweggenommen. Das INTERLIS-Format schreibt nicht vor, wie die Daten im System intern zu verwalten sind, noch verlangt es von den Datenproduzenten oder den Datennutzern ein identisches System.

Die Auftraggeber - meist die öffentliche Hand - sind diejenigen, welche von diesen Regelungen am meisten profitieren. Sie können die notwendigen Investitionen der Auftragsnehmer in Schnittstellensoftware schützen helfen, indem sie für den konsequenten Einsatz dieser Normen sorgen, z.B. in Ausschreibungen, Systemevaluationen und Geoservices.

Vorgehen

Für eine fachgerechte Datenbeschreibung ist es meist sinnvoll, dass eine (kleine) Arbeitsgruppe gebildet wird. Das dort vereinte Know-how soll u.a. folgende drei Aspekte abdecken:

Bei a) sind vor allem Kenntnisse über die Verwendung, Bedeutung der Daten sowie über deren Herkunft und Entstehung gemeint. Es liegt auf der Hand, dass ein möglichst klar definierter Projektauftrag (b) die Arbeit erleichtert; hier ist die Projektleitung gefordert. Was mit sachgerechten Modellierungs-Kenntnissen (c) angesprochen ist, sollte aus diesen Erläuterungen hervorgehen. Mitgemeint sind damit insbesondere Know-how in der Geodaten- und Systemdokumentation sowie der Anforderungs- und System-Spezifikation. Diese Aspekte werden oft unterschätzt oder gar vernachlässigt. Davon betroffen sind nicht nur Projekte zur Karten- oder Plan-Aktualisierung und zur Geodaten-Erfassung sondern auch solche zur Migration und Systemevaluation. Aus Erfahrung bekommt man diese am besten „in den Griff“, wenn ausgewiesene Informatiker beigezogen werden.

Wie in der Informatik üblich, beginnt die erste Phase (Analyse) mit dem Zusammentragen der evtl. vorhandenen Dokumente (Ist-Zustand) und dem Definieren der Anforderungen (Soll-Zustand). Der Merkmalskatalog ist eine der ersten Dokumente, die erarbeitet werden. Eine gut verständliche Begriffsbildung ist dabei sehr wichtig. Anschliessend wird das UML-Klassendiagramm erstellt. Evtl. werden bereits bestehende Datenmodelle berücksichtigt, insbesondere auch übergeordnete (z.B. Basismodelle vom Bund). Dabei muss beachtet werden, dass diese auf konzeptioneller Stufe, d.h. technologie-neutral konzipiert werden. Auf dieser Stufe gibt es keine unnötigen „Schlüsselmerkmale“ und Werte sind mit verständlichen Bezeichnungen versehen - kryptische Zahlencodes kommen hier kaum vor.

Mit dem Merkmalskatalog und dem UML-Klassendiagramm ist ein Informatikspezialist im Stande, das Datenmodell in INTERLIS-Sprache zu entwerfen, welches von nun das „führende Dokument“ wird (evtl. mit Werkzeugen verwaltet). Die Erfahrung hat gezeigt, dass auch diejenigen, denen diese Sprache und Vorgehensweise neu ist, innert kurzer Zeit mitdiskutieren können. Die weiteren Dokumente folgen anschliessend: Oft müssen noch Fragen zur Prüfung, Abnahme, Unterhalt (Nachführung, Aktualisierung), Historie und Archivierung der Daten geklärt werden.

Aufwand und Erfahrungen

Bleibt die Frage nach dem Aufwand und den Erfahrungen: Der Aufwand für das Projekt und die Datendokumentation hängt hauptsächlich von drei Kriterien ab: Erstens Komplexität und Umfang der Materie, zweitens die Organisationsart (gibt es Pilotprojekte?) und drittens die Anzahl der am Projekt Beteiligten. Je mehr Beteiligte direkt oder indirekt involviert sind, desto grösser ist auch der Aufwand. Eine Kosten-Nutzen-Analyse lässt sich in etwa mit der Frage vergleichen, ob man ein Mehrzweckgebäude mit oder ohne oder Architekt und Baustatiker bauen will. Damit ist zugleich auch etwas über die Risiken ausgesagt. Generell lässt sich feststellen, dass sich eine Professionalisierung von IT-Projekten auf jeden Fall lohnt. Vielleicht sind damit nicht immer kurzfristige finanzielle Einsparungen möglich, sicher aber ein ‚nachhaltigerer’ Umgang mit der Technik.

***