für ein Studienprojekt im Geomatik Master befasse ich mich mit dem “Clubsterben” und möchten die Anzahl und Verteilung von Nachtclubs 2020 und 2026 miteinander vergleichen. Hierbei ist aufgefallen, dass einige Nachtclubs als Punkte erfasst wurden, andere als Flächen. Teilweise sind sie so doppelt erfasst. Hat dies einen besonderen Grund?
Grundsätzlich: Sofern die Fläche bekannt ist, kann eine Einrichtung immer als Fläche eingetragen werden. Das hat nichts damit zu tun, ob die Einrichtung ein Gebäude alleine benutzt. Aber es wird oft so gemacht, wie Du schreibst.
Es ist auch sinnvoll Gebäude-Daten und POI-Daten nicht in einem Objekt zu mischen. Besser ist es die Daten getrennt zu erfassen.
Eine doppelte Erfassung findet man auch manchmal, das ist dann ein Fehler.
Das verstehe ich nicht. Wenn ich Flächen bearbeitet, bekomme ich vom System natürlich eine Vielzahl von möglichen Informationen - die ich eintragen kann - gewiss automatisch angeboten. Soweit richtig!
Bearbeite ich hingegen Punkte und erhalte diese Informationen nicht! automatisch angeboten, kann ich sie immer noch händisch eintragen mit der Auswahl “Feld hinzufügen” oder komplett manuell. Die Standard Tags sind ja bekannt bei Bedarf.
Dazu möchte ich noch kommentieren, dass OSM nicht unbedingt vollständig ist und Änderungen wie Neueröffnungen oder Schließungen mit mal längerer, mal kürzerer Verzögerung erfasst werden.
Wenn ein Club 2021 in OSM eingetragen wurde, könnte das bedeuten, dass er 2021 eröffnet wurde, oder auch dass er 2020 schon bestand und erst 2021 erfasst wurde.
Wenn ein Club 2026 in OSM vorhanden ist, könnte es sein, dass er dauerhaft geschlossen ist und nur noch niemand die Änderung in OSM vollzogen hat.
Manche Clubs schließen „schleichend“. Erst finden keine Veranstaltungen mehr statt. Auf der Website steht „wir machen Pause“. Ein Jahr später ist die Tür verrammelt und alles voll mit Graffiti, aber der Name steht noch auf dem Schild. Das ist ja für den OSM-Mapper von außen schwer zu beurteilen, ab wann man ein Objekt als geschlossen oder nicht mehr existent markiert.
Diese Arten von Daten-Fehlern wirst Du behandeln oder zumindest in Deiner Arbeit benennen müssen.
Ganz richtig. Ein 2026 eingetragenes Objekt kann bereits seit 50 Jahren bestehen. Ein Hinweis, wann ein Nachtclub eröffnet wurde, kann der Tag start_date sein. Der wird aber nur sehr selten verwendet.
wenn man die Eingänge bei der Fläche dazutaggt ist das auch möglich, dann ist es allerdings explizit, während man bei einem node nie weiß ob den jemand gutmeinend in Nähe des Eingangs getaggt hat oder auch nicht
Allerdings setzen manche Mapper den Node in Eingangsnähe, andere in die geometrische Mitte, wieder andere an den gedanklichen “Mittelpunkt” (Hauptraum o.ä.), und noch andere schieben die beiden POI eines Gebäudes relativ willkürlich so weit auseinander, dass sich die Icons im Rendering nicht überlappen. Und da nirgendwo maschinenlesbar festgehalten wird, welches Kriterium bei diesem konkreten Node angewendet wurde, ist dieser vermeintliche Vorteil eines Punktes nicht zuverlässig nutzbar. Im Gegensatz zu z.B. einem explizit getaggten entrance=*-Node in einem Flächenumriss.
Hallo Isabelle,
einen schönen Username hast du dir hier gewählt weißesbesser provoziert natürlich, dass man es auf die Probe stellt
Doppelerfassung wurde ja bereits als Fehler benannt und ist dadurch von besonderem Interesse.
Ich habe dazu für die Club-Hauptstadt Berlin mal folgende Untersuchung vorgenommen:
Diese schreiben wir in die Datei ‘nightclubs.csv’ [1]
Mit dem folgenden (zugegebenermaßen etwas kryptischen Unix-Kommando) können wir darin Dubletten ermitteln: cat nightclubs.csv | awk -F§ '{print $1}'| sort | uniq -c | sort -rn |awk '$1 > 1 {print}'
Es werden damit alle Zeilen zuerst auf den Namen reduziert, diese dann (lexikalisch) sortiert, mit uniq -c werden Duplikate gezählt, selbige nach Anzahl (reverse) sortiert und zum Schuss alle Fälle mit einer Anzahl >1 ausgegeben. Das Ergebnis sieht dann so aus:
3
2 Kater Blau
2 Beat-Fabrik
Wir haben also drei Fälle von Clubs ohne Namen und zwei Dubletten, die wir uns mit je einem grep-Kommando näher betrachten können:
Mit dieser Overpass-Turbo-Abfrage können wir die Ergebnisse näher betrachten. Besonders interessiert uns der Kater Blau und wir können erkennen, dass der zugehörige node auch als entrance=main getaggt ist, wärend der way noch den tag building = yes trägt.
Und da hast du deinen “besonderen Grund” für die Doppelerfassung beim blauen Kater. Der way ist das Gebäude und der node ist der Haupteingang zum Gelände des Clubs. Die Tagging-Experten hier können dir nun gleich erklären, wie man den “Fehler” korrigieren kann und wie es OSM-regelkonform auszusehen hätte[2] Im schlimmsten Fall kann es dir passieren, dass zur Lösung eine Site-Relation in Stellung[3] gebracht wird .
Sortierte Version der ''nightclubs.csv
1820§node
808§node
Abgedreht Klub§node
://about blank§node
Abstrakt§way
ACUD§node
ÆDEN§way
al2 eventlocation berlin§node
Alte Kantine§node
American Western Saloon§node
AM to PM§node
Arena Club§node
ASeven Club§node
Astra Kulturhaus§way
Auster-Club§node
Ava Club§node
Badehaus§way
Ballhaus Berlin§node
Ballhaus Spandau§node
Beate Uwe§node
Beat-Fabrik§way
Beat-Fabrik§way
Berghain Kantine§way
Berghain§node
Bergwerk§node
Berndhain§node
b-flat§node
Bi Nuu§node
BlackWhite Danceclub§node
Brickhouse Berlin§node
BRICKS Club§node
Brotfabrik§way
Bulbul Berlin§node
Butze (Kultur Klub Schulzendorf)§node
Cake Club§node
Calabash§node
Cassiopeia§way
Clärchens Ballhaus§node
Club Charlotte§node
Club R8§node
Connection§node
Cosmic Kaspar§node
Crazy Friesack§node
Der Weiße Hase§node
Die Busche§node
Duncker§way
Else§node
Entenkeller 2.0§node
Falscher Fisch§node
Festsaal Kreuzberg§way
Fiese Remise§way
Fitzroy§node
Flow Bar§node
FluxBau§node
Fränkis Tanzbar§node
Frivole Bar moechtegern§node
Geheimclub (Annika von Trier)§node
Glashaus§node
Golden Gate§way
Gretchen§way
Gutenberg 100§node
Hafenbar§node
Hamlet§way
Hangar 49§way
Havanna§node
Heideglühen§node
Hole⁴⁴§node
Humboldthain Club§node
Huxleys Neue Welt§node
Insomnia§node
Internet Explorer§node
IQ Studentenkeller§node
“Jugendschiff ““ReMiLi”””§way
Junction-Bar§node
K133 Night Lounge§node
Kater Blau§node
Kater Blau§way
KISS Lounge§node
Kit Kat Club§node
Klubhaus Philipp§node
Konzulát§node
Kreuzwerk§node
KTV Bar§node
KW Eventcenter§node
LARK§way
Lexia 833§way
Lido§node
Lokschuppen§way
Maaya§way
Matrix§node
Maxxim Club§node
M-BIA§node
Melancholie 2§node
Metrom Lounge§node
Metropol§way
MiSalsa§node
Mokka Mitte Bar§node
MONOM§node
MS Hoppetosse§way
Musikbrauerei§node
Nachspiel - Afterhour @KitKat Club Berlin§node
Nachtclub§node
name§@type
Narva Lounge§node
NBI Club§node
New West Club§node
Nightclub Zeusus§way
§node
§node
NVA - Club§node
OC23§way
Ohm§node
Orchidea§node
OST§node
OXI Garten§way
Panke§way
Parkclub§way
Parkdeck by Clärchen’s§node
Pirates Club§node
Pirschheide§node
Postbahnhof§node
Prägewerk§way
Pride Warehouse§way
Prince Charles§node
Privatclub§node
Pro Pool & Dance Hall§way
Puro Sky Lounge Berlin§node
Pussy Cat§node
RAW 99§node
Reset§node
Revier Südost§node
Ritter Butzke§node
Roadrunners Rock & Motor Club§way
Roter Salon§node
Sage§node
Silverwings§node
Sin City Tabledance§node
Sisyphos§way
Slaughterhouse§node
SO36§node
Soda Club§node
Spartacus§way
spindler & klatt§node
Stella Berlin§node
Tabula Rasa§node
Tabu§node
The Door§node
The Hub§node
Top Disco Berlin§node
Tresor Berlin§node
Trompete§node
Vagabund Club§node
Velvet Monkey§node
Venus§node
Villa Rosa§node
Vitrin§node
Void§node
§way
Weekend Club§node
Werk9§way
Wild at Heart§node
yaam§way
Zur Klappe§node
Zur Wilden Renate§node
PS. Die Identifikation via Namen ist natürlich eine etwas grobe Heuristik, aber sie funktioniert hier schon ganz gut.
siehe 'Sortierte Version der '‘nightclubs.csv"’ am Ende ↩︎
apropos: in Berlin wundern mich immer diese “Fußwege”, aus der Entfernung sieht das wie ein service aus, auch wenn da vielleicht derzeit nicht oder kaum gefahren wird: Way: 293387144 | OpenStreetMap
man müsste wohl schräg über den Gehweg fahren bzw. aus der anderen Zufahrt abbiegen, es steht da ein Poller der aussieht als wäre er öffenbar.
Ich hatte mir die Umgebung nicht wirklich angeschaut, aber jetzt, da du mich aufmerksam gemachst hast, wundere ich mich über die Sauna “Schnurrbad”, ein way mit
name = Schnurrbad
leisure = sauna
und vollständiger Adresse, aber ohne building tag.
Deren facebook-Seite sieht allerdings seit März 2024 verwaist aus.