wir sind Teil des Teams am Smart Mobility Institute der Hochschule Bremerhaven, und wir arbeiten derzeit an dem Forschungsprojekt “Green Delivery Analytics” (GDA), das darauf abzielt, eine CO2-neutrale Last-Mile-Logistik für die 80 größten deutschen Städte zu entwickeln. Dazu setzen wir auf einen datenbasierten Ansatz, der unterschiedliche Zustellsysteme (Mikro-Hubs, E-Transporter, Lastenfahrräder) analysiert und kombiniert.
Wir stehen jedoch aktuell vor einer großen Herausforderung: Der Umgang mit heterogenen Datensätzen, insbesondere OpenStreetMap (OSM) und amtlichen Daten im AAA-Anwendungsschema. Die Datenformate, Keys, Tags und Features unterscheiden sich erheblich, was den Datenmapping-Prozess komplex und fehleranfällig macht. Aktuell planen wir, diese Daten miteinander vergleichen zu können und gegebenenfalls sogar eine Verknüpfung der Daten zu ermöglichen. Dies wäre insbesondere für die Fahrrad-Infrastruktur sinnvoll, da hier die OSM-Community den besten Datenbestand bereithält.
Daher interessieren wir uns aktuell für Erfahrungen, Tipps und bewährte Praktiken von euch:
Habt ihr Erfahrungen beim Datenmappen und Zusammenführen von
OSM-Daten mit amtlichen Daten?
Welche Tools oder Ansätze haben sich bei der Harmonisierung dieser Datenformate bewährt?
Gibt es bekannte Workflows oder Tools, die speziell für den Umgang mit den unterschiedlichen Keys und Tags von OSM und den Features der amtlichen Daten entwickelt wurden?
Unser Projekt legt einen Fokus auf Austausch und Öffentlichkeitsarbeit, daher sind wir sehr an einem Dialog interessiert. Falls jemand Interesse hat, uns näher zu unterstützen oder detailliert über unsere Herausforderungen zu diskutieren, freuen wir uns sehr!
Vielen Dank im Voraus für eure Hilfe und euren Input!
Beste Grüße,
Richard Schulte und Mattes Leibenath
Smart Mobility Institute, Hochschule Bremerhaven
PS: Falls dieses Topic nicht sinnvoll getagged ist oder in ähnlicher Form bereits geführt wurde, freuen wir uns auf einen Hinweis! Wir finden uns hier gerade noch etwas zurecht
Ich hab’ mit amtlichen Daten noch nie zu tun gehabt, kann deswegen dazu nichts sagen.
Aber aus meiner Erfahrung mit OSM-Daten würde ich behaupten, dass man durch den komplexen Datenmapping-Prozess (ich würde übrigens eher “Daten zusammenführen” oder sowas sagen, weil “Mappen” in OSM-Kreisen meist das Erfassen der Daten meint) durch muss. Je nachdem, was ihr dabei genau vor habt, gibt es sicherlich das eine oder andere Tool, dass dabei hilfreich sein kann. Ich glaube aber, dafür müsste man mehr Details wissen.
Warum wollt ihr überhaupt inhomogene Daten zusammenführen (wenn ihr das mit ‘Daten-Mapping’ meint)? Wäre nicht erstmal ein Vergleich der Ergebnisse, die ihr mit jedem Datenset erzeugt, viel sinnvoller?
Die Jungs und Mädels dort editieren direkt an Radverkehrsanlagen, die in OSM erfasst sind…
Von den AAA-Daten (AFIS-ATKIS-AFIS) wären eh nur das dritte A nutzbar:
ATKIS
…und auch hier sollte man peinlich genau schauen, was in Frage käme. Für mich haben ATKIS und OSM völlig unterschiedliche Ansätze, die nicht ohne weiteres übertragbar sind.
Aus dem zweiten A wären höchstens die aus den Gemarkungsgrenzen abgeleiteten Ortsteil/Gemeinde/sonstige Verwaltungsgrenzen nutzbar, wenn diese nicht generalisiert sind.
Beim ersten A sehe ich keinen direkten Anwendungsfall.
Deshalb ein paar Anmerkungen, damit keine falschen Vorstellungen aufkommen:
OSM ist eine von Freiwilligen durchgeführte Sammlung von Geodaten (keine Datenbank im IT-Sinn), bei der es über manche Schlüsselzuordnungen großenteils Übereinstimmung gibt, bei anderen gibt es lebhafte Debatten, oft ohne Resultat, und im Prinzip kann jeder neue Schlüssel und Werte einführen (any tag you like).
Das macht ein Matching (um das Wort Mapping zu vermeiden) mit anderen Schemata gelinde formuliert sehr schwierig.
Ich habe für meine Bachelorarbeit OSM, Google Maps und amtliche Daten übereinander gelegt um die Datenqualität in Bezug auf Betretungs- und Befahrungsverbote zu analysieren.
Der einzige Weg den ich gesehen habe das fehlerfrei zu machen war alles manuell abzuzeichnen (wobei die Nutzung der Linien aus OSM auch gegangen wäre, aber keine Zeitgewinn gebracht hätte). Als Datenformat habe ich einfache Linien-Features mit einer Attributtabelle verwendet. Ich habe in QGIS ein Formular erstellt und darüber die für mich relevanten Features aus den einzelnen Quellen in den Datensatz eingetragen. Das waren 760 km in 2900 Segmenten mit 30 Attributen. Für einen Stadtteil also eine mögliche Methode, für ganz Berlin eher nicht.
Wir haben bereits festgestellt, dass die amtlichen Daten aus ATKIS und die Daten, die in OSM gepflegt sind, sich stark unterscheiden. Teilweise existieren Äquivalente in dem jeweils anderen Modell nicht. Das erklärt dann auch die zweite Frage.
Ein Vergleich der Nutzbarkeit ist so ohne weiteres nicht wirklich möglich, da die amtlichen Daten alleine einige geplante Ergebnisse gar nicht erzeugen können
Für unsere aktuellen Themen ist das richtig, in Zukunft werden wir uns auch Gedanken über Vorhersagemodelle der Nachfrage machen, dafür könnte auch ALFIS noch interessant werden.
Diese Schwierigkeit ist uns durchaus bewusst. Wir sind ja intern auch noch am Diskutieren, ob die Nutzung von OSM-Daten in unserem Fall sinnvoll ist.
Genau deshalb interessieren wir uns auch für jegliche Informationen dazu, über welche Schlüssel möglicherweise Einigkeit herrscht und welche für automatisierte Anwendung quasi nicht verwendbar sind.
Ich verwende dafür Taginfo oder die Version, die nur die Werte für Deutschland auswertet. Bei Keys und Values, die dort häufig angezeigt werden, kann man einigermaßen sicher davon ausgehen, dass hierbei eine weitgehende Einigkeit herrscht (gelegentlich gibt es auch Werte, die schlicht nur sehr selten vorkommen - Geysiere gibt es in Deutschland halt nicht all zu viele - da muss man ein bisschen den eigenen Kopf benutzen).
In den Tabellen sind oft auch Links zum Wiki; auf den Seiten dort kann man auch ganz gut einen Einblick bekommen, z.B. den Status im Kasten rechts. Oft ist auf den Wikiseiten auch aufgeführt, ob es da derzeit Uneinigkeit bei der Verwendung gibt. Im Zweifelsfall könnt ihr hier auch einfach fragen, ob dieser oder jener Tag einheitlich benutzt wird.
Ein anderes Problem, das ich bei der Nutzung von OSM-Daten immer wieder habe, ist, dass man Dinge oft auf unterschiedliche Arten mappen kann, beispielsweise kann ein Gehweg separat angelegt werden oder an eine Straße drangetaggt. In letzterem Falle kann man das mit sidewalk=left, sidewalk=both, sidewalk:left=yes oder (seltener anzutreffen) sidewalk:both=yes mappen. Ich kann nicht ausschließen, dass es auch noch weitere Möglichkeiten gibt. Das verkompliziert das Auswerten ziemlich.
Und im AAA-Modell ist das genaue Gegenteil der Fall: Nur Dinge für die es expliziten konsens gibt sind freigegeben, was in der Vergangenheit zu einigen Notlösungen geführt hat**.
Grundsätzlich würde ich in Städten auf OSM setzen und auf dem Land auf ATKIS. OSM ist zwar deutlich detailierter und zumindest in Sädten auch aktueller. Aber der Ländliche bereich ist oft stark veraltet oder was Gebäude im besonderen angeht immernoch nicht vollständig erfasst; auch in Deutschland. In beiden Welten gibt es Objekte die seit 10 Jahren nicht mehr angefasst wurden, aber durch die ATKIS-Turnusaktualisierung hat alle drei Jahre ein Mensch drauf geschaut und entschieden, dass alles noch passt. Diese Garantie kann OSM nicht geben, da sind die Sachen wirklich seit 10 Jahren nicht mehr mit dem Luftbild oder vor Ort abgeglichen worden.
**Hier zwei Beispiele
Summary
Es war lange Zeit nicht möglich Landwirtschaftliche Betiebsflächen (Bauernhöfe ohne Wohngebäude) als solche zu erfassen. Diese Flächen wurden notgedrungen als Industrie- und Gewerbeflächen erfasst.
Ein Anderes Beispiel sind Knicks für die ein Erdwall und eine Hecke als eigenständige Objekte übereinander erfasst wurden. Mittlerweile kann man am Erdwall einfach noch “Knick” als zusätzliches Atribut dranhängen.
Von der Turnunsaktualisierung sind auch nicht alle Objektarten gleichermaßen betroffen. Waldwege und Pfade haben da z.b eine äußerst niedrige Priorität.
Gebäude sind nicht Teil von ATKIS sonder von ALKIS. Hier kommt es zum Teil zu Verzögerungen im Eintragungsprozess, weil das ganze mit dem Kataster gekoppelt ist und ggf. dort wegen offener Bauverfahren nicht eingetragen werden kann. Auch Schwarzbauten finden eher selten den Weg in ALKIS