Hallo zusammen,
Mir ist aufgefallen, dass Filialen von großen Ketten naturgemäß bundesweit unterschiedlich gemappt werden. Für große Ketten sollte eine Vereinheitlichung weitgehend machbar sein. Ich habe mir das ganze mal an einem Beispiel angesehen und mir überlegt, wie man davon ausgehend entsprechende Verbesserungsprozesse implementieren könnte.
Konkret: ich habe bei mir ums Eck mehrere Läden gemappt, wo ich mir zur Inspiration angesehen habe, wie das andere gemacht haben. Bei Zeemann, Dänischem Bettenlager, Futterhaus, Rossmann findet man da extrem unterschiedliche Werte für “amenity”. Besonders deutlich ist mir das aber aufgefallen bei KFC. Wurde das als “Kentucky Fried Chicken” ohne “alt_name=KFC” gemappt, findet man den Laden mit der Suche nach “KFC” nicht und umgekehrt. Ich habe mich daher mal in die Overpass API eingelesen und eine Suche mit einer boundary box über ganz Deutschland laufen lassen und die Ergebnisse rausgeworfen, die sicher kein KFC sind (“Kentucky-Straße”, “KFC Bootshaus”, “KFC-Sportplatz” u.ä.). Von der Zahl her kommt man dann noch auf 182, was dem Wikipedia-Artikel nach eine sehr gute Abdeckung ergibt (yay, OSM-Qualität!). Die Namen variieren aber durchaus, hier mal als Beispiel:
Name Häufigkeit
KFC 106
Kentucky Fried Chicken 57
KFC (Kentucky Fried Chicken) 4
KFC Kentucky Fried Chicken 4
Drive-In KFC 2
Kentucky Fried Chicken (KFC) 1
Kentucky-Fried-Chicken 1
KFC - Kentucky Fried Chicken 1
KFC (im Bau) 1
KFC Amel 1
KFC Morschwiller 1
KFC Stuhr 1
KFC-Drive 1
SBB & Kentucky Fried Chicken 1
Dazu kommen noch ein paar Variationen mit anderen Keys:
Key und Value Häufigkeit
3
2
1
1
1
10
Die getaggte amenity variiert zum Teil auch:
Amenity Häufigkeit
fast_food 151
parking 20
restaurant 9
biergarten 2
bar 1
Bar könnte ein false positive sein, parking bezieht sich auf den Parkplatz (sollte der mit “Name=KFC” getaggt sein?!). Biergarten müsste man überprüfen - ich vermute damit ist die Außenbestuhlung gemeint (womit der Tag falsch wäre…). Restaurant dürfte fast sicher falsch sein und sollte auf fast_food geändert werden.
Auch was die Cuisine angeht ist man sich nicht einig (ich hab da noch nie gegessen, aber sollte nicht jeder Laden die gleiche Karte haben?):
Cuisine Häufigkeit
chicken 69
burger 19
american 4
Chicken_und_Burger 1
fast_food 1
sandwich 1
Okay, soweit die Fakten - was möchte ich also jetzt tun?
Kurzfristig
Ich schlage eine Umbenennung vor - entweder benennen wir “Kentucky Fried Chicken”, “KFC (Kentucky Fried Chicken)”, “KFC Kentucky Fried Chicken”, “Kentucky Fried Chicken (KFC)”, “Kentucky-Fried-Chicken” und “KFC - Kentucky Fried Chicken” in “name=KFC” um und setzen ein “alt_name=Kentucky Fried Chicken” dazu oder benennen alle KFC’s um in “name=Kentucky Fried Chicken” mit “short_name=KFC”. Ersteres würde ich bevorzugen, da das üblicherweise der Name am Eingang ist.
Die drei KFC’s mit Stadtnamen im Name-Tag würde ich ebenfalls davon befreien und mit “alt_name=Kentucky Fried Chicken” beehren wollen.
Dann sollten wir “amenity=restaurant” in “amenity=fast_food” ändern und uns die Punkte Bar und Biergarten angucken auf Plausibilität.
Bei der Cuisine bin ich mangels Kenntnis für Vorschläge offen.
Sollte dieser Kurzfrist-Vorschlag Zustimmung finden bin ich für Hilfe in der Umsetzung sehr dankbar.
Mittelfristig
Sollte der Pilot KFC klappen, dann würde ich diese Plausibilitäts-/Konsistenz-Prüfung gerne ausweiten auf andere Ketten. Seien es Supermärkte (Rewe, Netto, Lidl, …), Banken (Commerzbank, Deutsche Bank, …), andere Fast Food-Ketten, Möbelmärkte, Drogerien, … etc. Je nachdem wie groß die Masse ist und ob ich es schaffe mir da entsprechende Tools zu basteln würde ich gerne alles überprüfen, das mehr als 50 Filialen in Deutschland hat.
Langfristig
Meine Idealvorstellung ist, dass unsere Ergebnisse in den Checks von z.B. JOSM oder Osmose enthalten sind, etwa in der Art “oh, du taggst ein “name=Kentucky Fried Chicken” mit “amenity=restaurant”. Bist du sicher, dass “name=KFC”, “amenity=fast_food” und “alt_name=Kentucky Fried Chicken” nicht die bessere Variante wäre?”. Auf diese Weise könnte man nach einmaliger Bereinigung des Wildwuchses (kurzfrist-Variante) weitgehend sicher stellen, dass eben jener nicht in Kürze wieder besteht.
Ich bin gespannt auf eure Meinungen.