Moin,
TL/DR;
Die Deutsche Bahn bietet mit ihren Haltestellendaten eine Quelle von eindeutig identifizierbaren Bahnhöfen zur Personenbeförderung. Vorschlag OSM mit diesen Daten als Import anzureichern, Lizenz ist für OSM geeignet nehme ich an (ist explizit für OSM Import vorgesehen)
Die lange Version:
ich habe mir die Datenprobleme etwas genauer angesehen und habe die uic_ref entdeckt, die einen internationalen Identifier darstellt für Bahnhöfe, analog etwa dem IATA Code bei Flughäfen.
Der Auricher Bahnhof hat keine uic_ref gepflegt, also könnte man daraus schließen, man bräuchte nur alle Bahnhöfe zu ermitteln mit “uic_ref”. Dem ist aber nicht so: overpass turbo
Scheinbar die komplette Linie zwischen Hamburg-Harburg und Cuxhaven hat keinen uic_ref, wird aber vom RE 5 der DB selbst bedient. Viele Haltestellen und Bahnhöfe haben die uic_ref korrekt gepflegt. Andere Linien, etwa die Verbindung Bremerhaven ↔ Bremervörde wird von privaten Unternehmen bedient, die im Haltestellen-CSV der DB auch eine uic_ref haben, in OSM also lediglich fehlen.
Das heißt, die Idee wäre, man könnte den uic_ref tatsächlich nutzen, um mit dem entstehenden Datenbild ein Netz von Regional- und Fernbahnhöfen zur Personenbeförderung ableiten zu können. Mit dem sowieso in OSM vorgesehenen uic_ref sind vermutlich auch noch andere Use Cases abbildbar, die Kollegen von openrailwaymap wissen dazu bestimmt mehr.
Nun haben wir 2 Datentöpfe:
- Einmal OSM, mit einer vollständigen Liste aller Bahnhöfe und Haltestellen
- Das CSV der DB, das eine Untermenge aller jener ist, die sich zum Zeitpunkt der CSV Erstellung in Betrieb befanden.
Ich könnte also einen Batch Import bzw. “Merge” programmieren, vorausgesetzt dass …
- die Lizenz des CSV geklärt ist → Die Daten wurden explizit für OSM (mit-) veröffentlicht: https://data.deutschebahn.com/dataset/data-haltestellen.html#
Dieser Datensatz wird bereitgestellt unter der Lizenz Creative Commons Attribution 4.0 International (CC BY 4.0). Wenn die Daten der Deutschen Bahn (DB) Bestandteil des OpenStreetMap-Datenbankwerkes werden, genügt eine Nennung der Deutschen Bahn AG in der Liste der Beitragenden. Eine Nennung der DB bei jeder Verwendung der Daten auch durch Lizenznehmer des oben genannten Datenbankwerks ist dann nicht mehr erforderlich. Eine indirekte Nennung (Verweis auf Herausgeber des Datenbankwerks, der wiederum auf die DB verweist) genügt.
- wir gesichert wissen, dass die Haltestellendaten der DB aus dem CSV nur Haltestellen zur Personenbeförderung darstellen,
- einen aktuellen Datensatz von der DB bekommen, der jüngste ist von 2020
- den Datensatz als Batch Prozess gegen alle gepflegten OSM Bahnhöfe und Haltestellen laufen lassen und fehlende
uic_ref vervollständigen.
Ein “Merge” Script Ansatz, um einen Match & Merge Algorithmus zu bauen, könnte so aussehen:
- Für jeden Datensatz im CSV der DB: Nimm Lat/Lon und finde zugehörigen OSM Bahnhof oder Haltestelle
- Setze
uic_ref, name, operator und Verkehrstyp (Regio, Fern, etc.)
- Done
Den 2. Step könnte man erstmal vorsichtig gestalten, so dass man zunächst nur Tags hinzufügt, die noch nicht existieren, jedoch keine bestehenden überschreibt usw.
Klingt das sinnig oder wurde das schon versucht, oder was würde dagegen sprechen? Für mich sieht es jedenfalls nicht so aus, als wenn die Datensätze der Deutschen Bahn jemals importiert wurden.
Das einzige was ich noch bemerkenswert finde ist, dass bspw. Hemmoor durchaus mal die uic_ref lt. DB CSV hatte und auch damit angelegt worden ist, aber in Revision 9 entfernt wurde (wie auch bei anderen Haltestellen auf dieser Linie)
VG,
Stefano