Hussels, UlrichKnetsch, GerlindeLehmann, Angela2019-09-202019-09-202005https://dl.gi.de/handle/20.500.12116/27780Ein grundsätzliches Problem von Umweltdatenbanken ist die Ersterfassung bzw. Übernahme von Daten aus bestehenden Datensammlungen. Die Ersterfassung von größeren Datenbeständen ist generell sehr aufwändig und bei der Datenübernahme aus bestehenden Datensammlungen besteht das Problem darin, dass diese Daten bereits unter bestimmten Prämissen gesammelt wurden, die in der Regel nicht explizit dokumentiert sind. Dadurch sind selbst Daten gleicher Struktur oft nicht miteinander vergleichbar. Daher ist es immer wichtig, das gesamte hinter einer Datensammlung stehende Modell zu kennen, um die Daten richtig erfassen bzw. interpretieren zu können. Um also geeignete Schnittstellen für eine Datenerfassung oder eine Datenübernahme herzustellen, sollte zunächst ein fachliches, d. h. problemund anwenderorientiertes Datenmodell formuliert werden. Aus diesem sollten dann die Schnittstelle bzw. eine Menge von zusammengehörigen Teil-Schnittstellen abgeleitet werden. Die Schnittstellenformate und die Modellbeschreibung sollten sowohl vom Menschen als auch von der Maschine zu interpretieren sein. Als Grundlage für die technische Realisierung solcher Schnittstellen bietet sich XML an. Konkret geht es darum, umweltbezogene Unternehmensdaten von diesen zu erfassen, ggf. über mehrere (administrative) Stationen, in denen diese Daten geprüft werden können, weiter zu leiten und schließlich in einer gemeinsamen Datenbank zusammenzufassen (ETL-Vorgang). Manche Unternehmen sind in der Lage zu diesem Zweck vorhandene Datenbanken ’anzuzapfen’, andere müssen die Daten erst erheben oder es gibt eine Mischung von Beidem. In jedem Fall unterscheidet sich die Interpretation dessen, was erfasst werden soll, von Unternehmen zu Unternehmen. Dies ist insbesondere dann der Fall, wenn es sich um unterschiedliche Branchen handelt. Ist der Zweck der Datensammlung bekannt, hilft dies schon weiter. Besser ist es, wenn schon bei der Erfassung deutlich wird, in welchem Zusammenhang die Daten schließlich abgelegt und ausgewertet werden sollen. Idealer Weise enthält das Datenmodell folglich alle für die Interpretation und den Vergleich der Daten notwendigen Informationen. Für Messwerte sind dies z. B. sämtliche Randbedingungen, die im Zusammenhang mit dem Gesamtmodell bei den abgefragten Quellen variieren können und nicht nur solche Randbedingungen, die für die Daten liefernde Stelle für relevant gehalten werden.AGXIS – Ein Konzept für eine generische SchnittstellenbeschreibungText/Conference Paper