Wall·E: Automatische Korrektur allgemeiner Tagging-Tippfehler?

Gerade getan. Metaphone findet in der Tat weniger totalen Unfug als Soundex, aber die sinnvollen Zuordnungen stehen größtenteils bereits auf der Liste. Insbesondere der Austausch von Vokalen ändert auch den Metaphone-Code häufig überhaupt nicht.
War in jedem Fall interessant, sich einmal mit diesen Algorithmen zu befassen. Eventuell behalte ich Metaphone auch im Programm drin, ein paar Kandidaten hat er ja doch noch geliefert. Hier nochmal einige weitere Ergänzungen für den Regelsatz; die meisten wurden zwar mit den anderen Methoden auch schon gefunden, ich habe sie aber im großen Haufen übersehen.

amnety (1)
         --> amenity (1180611)
baoat (4)
         --> boat (21156)
cliub (1)
         --> club (392)
cuiseine (1)
         --> cuisine (53559)
intermittend (7)
         --> intermittent (1417)
operater (1)
         --> operator (308297)
propsoed (1)
         --> proposed (5113)
tactilie_paving (8)
         --> tactile_paving (15116)
trycktape (2)
         --> tracktype (1551734)
whitwater (1)
         --> whitewater (756)
tinnel (1)
         --> tunnel (125528)

Zur allgemeinen Unterhaltung auch noch einige ausgewählte Kuriositäten aus dem Hause Metaphone:

bascule (1)
         --> bicycle (683084)
bit (30)
         --> boat (21156)
casino (1)
         --> cuisine (53559)
cats (2)
         --> goods (4507)
coins (2)
         --> genus (7045)
died (3)
         --> TODO (1964)
         --> todo (1212)
diet (5)
         --> TODO (1964)
         --> todo (1212)
highres (3)
         --> horse (67616)
litter (2)
         --> ladder (439)
lotterie (1)
         --> ladder (439)
police (9)
         --> place (119095)

Sieht doch gut aus. Hätte nicht gedacht, dass so ein Ansatz wirklich was bringt (letztendlich sind ja auch die gefundenen wohl eher Tippfehler als von Leuten produziert, die soz. geschrieben haben, was sie sprechen). Die Kuriositäten find ich garnicht mal so kurios, mal abgesehen von den todos hört sich das bei mir, wenn ich (gezielt) ein wenig ‘schlabberig’ spreche, schon sehr ähnlich an. Nachdem ich Soundex schon kannte (und für reichlich unbrauchbar halte), bin ich doch erstaunt, dass es da doch auch Algorithmen gibt, die halbwegs vernünftig sind. Wenn auch in dem Fall nur für die englische Sprache, aber das reicht hier ja.

Ich habe gerade einen größeren Testlauf mit dem gesamten obigen Regelsatz durchgeführt, im Gegenzug auf einem deutlich kleineren Gebiet (Saarland) als später vorgesehen.
Das ganze ist auf dem dev-Klon der API mit zuvor dorthin kopierten OSM-Originaldaten erfolgt (d.h. im Unterschied zu Simulationen wird das Hochladen nicht ausgespart, sondern erfolgt bloß zu einem anderen Server; dieser Test ist also völlig äquivalent zu einem Test gegen die echte API).
Dies ist der Änderungssatz: http://api06.dev.openstreetmap.org/browse/changeset/32240
Log:

osm-mechedit-fix-misspell run Mon Oct 14 15:39:56 2013
created changeset #32240, http://www.openstreetmap.org/browse/changeset/32240
editing node 4295798690: http://www.openstreetmap.org/browse/node/4295798690
	replacing misspelt tag key "addr.city" -> "addr:city"
editing node 4295798691: http://www.openstreetmap.org/browse/node/4295798691
	replacing misspelt tag key "add:city" -> "addr:city"
editing way 4295042659: http://www.openstreetmap.org/browse/way/4295042659
	replacing misspelt tag key "Source" -> "source"
editing way 4295042660: http://www.openstreetmap.org/browse/way/4295042660
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042661: http://www.openstreetmap.org/browse/way/4295042661
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042662: http://www.openstreetmap.org/browse/way/4295042662
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042663: http://www.openstreetmap.org/browse/way/4295042663
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042664: http://www.openstreetmap.org/browse/way/4295042664
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042665: http://www.openstreetmap.org/browse/way/4295042665
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042666: http://www.openstreetmap.org/browse/way/4295042666
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042667: http://www.openstreetmap.org/browse/way/4295042667
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042668: http://www.openstreetmap.org/browse/way/4295042668
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042669: http://www.openstreetmap.org/browse/way/4295042669
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042670: http://www.openstreetmap.org/browse/way/4295042670
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042671: http://www.openstreetmap.org/browse/way/4295042671
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042672: http://www.openstreetmap.org/browse/way/4295042672
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042673: http://www.openstreetmap.org/browse/way/4295042673
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042674: http://www.openstreetmap.org/browse/way/4295042674
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042675: http://www.openstreetmap.org/browse/way/4295042675
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042676: http://www.openstreetmap.org/browse/way/4295042676
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042677: http://www.openstreetmap.org/browse/way/4295042677
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042678: http://www.openstreetmap.org/browse/way/4295042678
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042679: http://www.openstreetmap.org/browse/way/4295042679
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042680: http://www.openstreetmap.org/browse/way/4295042680
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042681: http://www.openstreetmap.org/browse/way/4295042681
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042682: http://www.openstreetmap.org/browse/way/4295042682
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042683: http://www.openstreetmap.org/browse/way/4295042683
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042684: http://www.openstreetmap.org/browse/way/4295042684
	removing misspelt tag key "buidling:use" (tag "building:use" present with identical value)
editing way 4295042685: http://www.openstreetmap.org/browse/way/4295042685
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042686: http://www.openstreetmap.org/browse/way/4295042686
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042687: http://www.openstreetmap.org/browse/way/4295042687
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042688: http://www.openstreetmap.org/browse/way/4295042688
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042689: http://www.openstreetmap.org/browse/way/4295042689
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042690: http://www.openstreetmap.org/browse/way/4295042690
	replacing misspelt tag key "buidling:use" -> "building:use"
editing way 4295042691: http://www.openstreetmap.org/browse/way/4295042691
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042692: http://www.openstreetmap.org/browse/way/4295042692
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042693: http://www.openstreetmap.org/browse/way/4295042693
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042694: http://www.openstreetmap.org/browse/way/4295042694
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042695: http://www.openstreetmap.org/browse/way/4295042695
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042696: http://www.openstreetmap.org/browse/way/4295042696
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042697: http://www.openstreetmap.org/browse/way/4295042697
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042698: http://www.openstreetmap.org/browse/way/4295042698
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042699: http://www.openstreetmap.org/browse/way/4295042699
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042700: http://www.openstreetmap.org/browse/way/4295042700
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042701: http://www.openstreetmap.org/browse/way/4295042701
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042702: http://www.openstreetmap.org/browse/way/4295042702
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042703: http://www.openstreetmap.org/browse/way/4295042703
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042704: http://www.openstreetmap.org/browse/way/4295042704
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042705: http://www.openstreetmap.org/browse/way/4295042705
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042706: http://www.openstreetmap.org/browse/way/4295042706
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042707: http://www.openstreetmap.org/browse/way/4295042707
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042708: http://www.openstreetmap.org/browse/way/4295042708
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042709: http://www.openstreetmap.org/browse/way/4295042709
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042710: http://www.openstreetmap.org/browse/way/4295042710
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042711: http://www.openstreetmap.org/browse/way/4295042711
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042712: http://www.openstreetmap.org/browse/way/4295042712
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042713: http://www.openstreetmap.org/browse/way/4295042713
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042714: http://www.openstreetmap.org/browse/way/4295042714
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042715: http://www.openstreetmap.org/browse/way/4295042715
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042716: http://www.openstreetmap.org/browse/way/4295042716
	removing misspelt tag key "adddr:city" (tag "addr:city" present with identical value)
editing way 4295042717: http://www.openstreetmap.org/browse/way/4295042717
	replacing misspelt tag key "adddr:city" -> "addr:city"
editing way 4295042718: http://www.openstreetmap.org/browse/way/4295042718
	replacing misspelt tag key "MTB:scale" -> "mtb:scale"
editing way 4295042719: http://www.openstreetmap.org/browse/way/4295042719
	replacing misspelt tag key "MTB:scale" -> "mtb:scale"
editing way 4295042720: http://www.openstreetmap.org/browse/way/4295042720
	replacing misspelt tag key "MTB:scale" -> "mtb:scale"
total number of objects modified: 64

Erste reale Bearbeitungen würde ich mal für nächste Woche ansetzen, falls sich bis dahin nicht doch noch Widerspruch regt.

+1
Oder man nimmt den hgb-value als Referenz hinzu. Bei destination deutet es auf “hgv” hin, bei #ff00ff oder so könnte es vielleicht “rgb” sein. Die values “yes” & “no” sind natürlich ein schlechter Indikator.

Das erscheint mir ein bisschen wackelig (und aufwendig) für einen Bot-Lauf.
Das würde ich allerhöchstens für eine spätere Verfeinerung in Betracht ziehen (so denn dieser Fall im unbearbeiteten Rest häufig genug auftritt).

Der Aufwand für die letzten Prozent an Fehlern dürfte wie so oft exponentiell ansteigen.

Sieht gut aus.
Interessant finde ich, dass du Taggs mit falsch geschriebenenem Schlüssel entfernst, wenn die richtige Schreibweise bereits mit dem gleichen Wert existiert.

Von meiner Seite also ein klares GO!

Edbert (EvanE)

Neues für den Regelsatz (bisher übersehen, erst durch Metaphone aufgetaucht oder schlicht ganz neu im Datenbestand):

abondened (1)
         --> abandoned (3071)
attraktion (1)
         --> attraction (1420)
attrection (13)
         --> attraction (1420)
cemetry (4)
         --> cemetery (675)

chnage:lanes (1)
         --> change:lanes (2541)
communication:mobile_phones (5)
         --> communication:mobile_phone (928)
contact:mobil (1)
         --> contact:mobile (193)
couisin (3)
         --> cuisine (53725)

crossing:ref (1)
         --> crossing_ref (13739)
drive-through (1)
         --> drive_through (703)
est_hight (3)
         --> est_height (379)

fecne_type (1)
         --> fence_type (5433)
fence_typ (1)
         --> fence_type (5433)
fench_type (1)
         --> fence_type (5433)
footway=right (2)
         --> footway:right (475)

oeprator (1)
         --> operator (309730)
opeartor (1)
         --> operator (309730)
payment:credit_card (3)
         --> payment:credit_cards (2605)
payment:debit_card (1)
         --> payment:debit_cards (2009)
payment:mastercar (1)
         --> payment:mastercard (362)

playgroung (1)
         --> playground (2385)
tactile_pafing (2)
         --> tactile_paving (15252)
traffic_signals:sounds (2)
         --> traffic_signals:sound (1378)
whelchair (1)
         --> wheelchair (304396)

Mit “abandoned” habe ich auch so meine Schwierigkeiten.
Ich muss die genaue Schreibweise oft nachsehen.

Ansonsten sind das typische Problemfälle mit Trennzeichen, Einzahl/Mehrzahl, fehlenden Buchstaben oder Buchstabendreher.
Von meiner Seite aus gibt es keine Einwände, das wie aufgelistet in die Regeln zu übernehmen.

Edbert (EvanE)

Hallo,

um nochmals auf meinen Vorschlag von Post #5 zu kommen, das Komma, das fälschlicherweise als Dezimaltenner in der Datenbank steht, per Bot (Wall·E) zu korrigieren (z.B. per Regular Expression: “0 bis 5 Ziffern, ‘,’, 1 bis 12 Ziffern, beliebige Zeichen (z.B. Einheit - meist ‘m’ für Meter)”, denn es gibt auch Vorkmmen wie z.B. “,95”) habe ich bei Taginfo die Häufigkeit dieses (Tipp-)Fehlers nachgesehen (am Beispiel von width=*):

2.5: 27 511 mal ok (als 7. Eintrag)
2,5: 11 092 mal fehlerhaft (als 13. Eintrag) (28,7 % bei diesem Wert)

1.5: 22 036 mal ok
1,5: 5 395 mal fehlerhaft (19,7 %)

0.5: 18 480 mal ok
0,5: 6 292 mal fehlerhaft (25,4 %)

Die allermeisten der mit Komma geschriebenen Werte befinden sich in Deutschland - deshalb finde ich Wall·E hier den idealen Bot, diese Tippfehler zu korrigieren, denn die etwa 11000 falschen Einträge des Wertes 2,5 möchte ich nicht von Hand korrigieren - das wird dann vermutlich auf einen Revert von Frederik hinauslaufen (wie beim Thema Hauseingänge geschehen: building=entrance → entrance=yes).

Bei height=* kommen die ersten Werte mit Komma erst ab etwa Eintrag 300 der Taginfo mit Häufigkeiten in den 70-ern vor.

Franz

Hallo Franz

Vorab: In diesem Thread reden wir über die Korrektur von Schlüsseln.
Das ist also eigentlich der falsche Platz für die Korrekur von Werten.
Wir/du sollten dafür besser einen eigenen Thread starten.

Generell ist diese Sache sicher eines der größeren Probleme bei den Werten, wie deine Zahlen eindrücklich belegen.
Warum das in Deutschland so viel häufiger als in anderen Ländern passiert ist leicht erklärt:
Im Ziffernblock ist bei deutscher Tastatur-Belegung das Komma als Dezimaltrenner kodiert und nicht der Punkt, wie bei den meisten anderen Belegungen.

Du könntest das durchaus einmalig (oder auch auf Dauer) selber machen, wenn du es vorab ankündigst, diskutierst (mindestens Forum und talk-de), dokumentierst und ausgiebig testest. Dann hättest du wohl kaum etwas von Frederik oder einem anderen Mitglied der Data Working Group (DWG) zu befürchten. Die Regeln für automatisierte Edits sind für so etwas Umfangreiches eben zu beachten.

Ich denke, dass die Zeit dafür durchaus reif ist, da in der nächsten stabilen JOSM Version (endlich!) ein Test auf numerische Werte eingebaut sein wird. Damit wird sich die Situation wahrscheinlich auch ohne Bot (wenn auch langsam) bessern.

Edbert (EvanE)

Entschulding vorab: einige Aussagen überschneiden sich inhaltlich mit denen von EvanE, der mir eine Viertelstunde zuvorgekommen ist. Ich verzichte darauf, das Posting à la “wie Edbert oben schon schrieb” umzudekorieren.

Sorry - ich hatte das Posting zwar gelesen, aber nicht beantwortet und zugegebenermaßen auch schon wieder vergessen. Die Idee halte ich durchaus für sinnvoll, dennoch muß ich dafür in die unbestimmte Zukunft verweisen. Wie schon mehrfach gesagt, kümmere ich mich zunächst nur um Schlüssel und möchte mit Werten erst anfangen, wenn der Regelsatz für die Schlüssel einigermaßen steht. Wie lange das dauert, vermag ich nicht vorherzusagen - Wochen, vielleicht auch Monate.
Bei den Werten hatte ich bisher eigentlich nur an Korrekturen nach ähnlichem Schema wie bei den Schlüsseln gedacht, aber in Abhängigkeit vom Tagschlüssel kann man durchaus über spezielle Korrekturen numerischer Werte (Trennzeichen, Standard-Einheiten) nachdenken. Aber wie gesagt, nicht in nächster Zeit; es sei denn, jemand anders erbarmt sich.

Die hohe Prävalenz in DE ist durchaus plausibel: erstens ist hier einfach das Komma als Dezimaltrenner üblich; zweitens ist hierzulande die Basiserfassung weitgehend abgeschlossen, sodaß man sich eben mit solchen Details befassen kann. Wo kaum die wichtigsten Straßen vorhanden sind und Tags wie maxheight gar nicht existieren, besteht auch keine Gelegenheit, sie falsch zu schreiben.
Ich glaube allerdings, daß width=2,5->2.5 mit dem damaligen Umtaggen der Eingänge (und vielen vergleichbaren Aktionen auf kleinerer Skala) nicht zu vergleichen ist. Mit Diskussion hier und/oder auf talk-de wäre das durchaus auch “manuell” (also nicht per Regex etc., sondern wirklich nur einen bestimmten Wert ersetzen, und im nächsten Changeset den nächsten) machbar, da es wirklich um einen eindeutigen Fehler geht. Etliche Mapper nehmen vergleichbare Bearbeitungen auch ohne jede Konsultation vor, und solange alles gut geht, sagt auch die DWG selten etwas. Aber die schiere Zahl von 11000 Objekten nur für einen einzigen Wert schreckt einen verantwortungsvollen Mapper natürlich schon ab, und das zurecht.

Zwei erste Durchgänge auf dem echten Datenbestand:
http://www.openstreetmap.org/browse/changeset/18467617 (Regierungsbezirk Münster, 52 Objekte)
http://www.openstreetmap.org/browse/changeset/18467728 (Regierungsbezirk Köln, 51 Objekte)
Von dem ersten fehlt leider das Log. (Eigentlich sollte der erst noch ohne Hochladen laufen, wegen einer falsch gesetzten Option wurde dann aber doch direkt in die Datenbank geschrieben. Als ich das gemerkt habe, hatte ich schon den Buffer mit dem Log geschlossen.) Am besten lassen sich die Bearbeitungen noch nachvollziehen, indem man in JOSM “Adresse öffnen” mit http://www.openstreetmap.org/api/0.6/changeset/18467617/download füttert. Anschließend “Daten aktualisieren”, Suche nach user:Wall·E und Objekthistorie aufrufen (möglichst nicht gleich für alle 52).
Hier wurden in erster Linie add:, addr;, addr:ountry, addr:sity und ähnliche Tags ersetzt oder entfernt (v.a. in Detmold, Marl, Münster und Wuppertal).

Das Log des zweiten Änderungssatzes folgt (und ist auch in dem bekannten Wall·E-Log enthalten). Häufigste Tags: landu, NOTE, Name, Ref, roof:color, building:color, castle_typ.

osm-mechedit-fix-misspell run Mon Oct 21 12:05:16 2013 (Emacs running in batch mode on nightshade.toolserver.org)
created changeset #18467728, http://www.openstreetmap.org/browse/changeset/18467728
editing node 1668928390: http://www.openstreetmap.org/browse/node/1668928390
	replacing misspelt tag key "landu" -> "landuse"
editing way 32300556: http://www.openstreetmap.org/browse/way/32300556
	replacing misspelt tag key "NOTE" -> "note"
editing way 37906197: http://www.openstreetmap.org/browse/way/37906197
	replacing misspelt tag key "Name" -> "name"
editing way 38281538: http://www.openstreetmap.org/browse/way/38281538
	replacing misspelt tag key "NOTE" -> "note"
editing way 39209898: http://www.openstreetmap.org/browse/way/39209898
	replacing misspelt tag key "Name" -> "name"
editing way 39209900: http://www.openstreetmap.org/browse/way/39209900
	replacing misspelt tag key "Name" -> "name"
editing way 50905297: http://www.openstreetmap.org/browse/way/50905297
	replacing misspelt tag key "Ref" -> "ref"
editing way 95816081: http://www.openstreetmap.org/browse/way/95816081
	replacing misspelt tag key "roof:color" -> "roof:colour"
editing way 95816087: http://www.openstreetmap.org/browse/way/95816087
	replacing misspelt tag key "roof:color" -> "roof:colour"
editing way 105000636: http://www.openstreetmap.org/browse/way/105000636
	replacing misspelt tag key "Name" -> "name"
editing way 106480373: http://www.openstreetmap.org/browse/way/106480373
	replacing misspelt tag key "building:color" -> "building:colour"
	replacing misspelt tag key "roof:color" -> "roof:colour"
editing way 119231732: http://www.openstreetmap.org/browse/way/119231732
	replacing misspelt tag key "Name" -> "name"
editing way 119849051: http://www.openstreetmap.org/browse/way/119849051
	replacing misspelt tag key "roof:color" -> "roof:colour"
editing way 146986002: http://www.openstreetmap.org/browse/way/146986002
	removing misspelt tag key "building:color" (tag "building:colour" present with identical value)
editing way 146986045: http://www.openstreetmap.org/browse/way/146986045
	removing misspelt tag key "building:color" (tag "building:colour" present with identical value)
editing way 147329387: http://www.openstreetmap.org/browse/way/147329387
	replacing misspelt tag key "building:color" -> "building:colour"
editing way 147329388: http://www.openstreetmap.org/browse/way/147329388
	replacing misspelt tag key "building:color" -> "building:colour"
editing way 147329392: http://www.openstreetmap.org/browse/way/147329392
	replacing misspelt tag key "building:color" -> "building:colour"
editing way 147334135: http://www.openstreetmap.org/browse/way/147334135
	replacing misspelt tag key "addr.country" -> "addr:country"
editing way 160956311: http://www.openstreetmap.org/browse/way/160956311
	replacing misspelt tag key "Name" -> "name"
editing way 160956314: http://www.openstreetmap.org/browse/way/160956314
	replacing misspelt tag key "Name" -> "name"
editing way 168868456: http://www.openstreetmap.org/browse/way/168868456
	replacing misspelt tag key "Name" -> "name"
editing way 168868457: http://www.openstreetmap.org/browse/way/168868457
	replacing misspelt tag key "Name" -> "name"
editing way 173569233: http://www.openstreetmap.org/browse/way/173569233
	replacing misspelt tag key "Ref" -> "ref"
editing way 176783457: http://www.openstreetmap.org/browse/way/176783457
	replacing misspelt tag key "Name" -> "name"
editing way 198923912: http://www.openstreetmap.org/browse/way/198923912
	replacing misspelt tag key "Name" -> "name"
editing way 206371196: http://www.openstreetmap.org/browse/way/206371196
	replacing misspelt tag key "roof:color" -> "roof:colour"
editing way 206421980: http://www.openstreetmap.org/browse/way/206421980
	replacing misspelt tag key "roof:color" -> "roof:colour"
editing way 208097195: http://www.openstreetmap.org/browse/way/208097195
	replacing misspelt tag key "roof:color" -> "roof:colour"
editing way 217209481: http://www.openstreetmap.org/browse/way/217209481
	removing misspelt tag key "building:color" (tag "building:colour" present with identical value)
editing way 217209483: http://www.openstreetmap.org/browse/way/217209483
	removing misspelt tag key "building:color" (tag "building:colour" present with identical value)
editing way 217994356: http://www.openstreetmap.org/browse/way/217994356
	removing misspelt tag key "landu" (tag "landuse" present with identical value)
editing way 220141860: http://www.openstreetmap.org/browse/way/220141860
	removing misspelt tag key "Name" (tag "name" present with identical value)
editing way 220141874: http://www.openstreetmap.org/browse/way/220141874
	replacing misspelt tag key "Name" -> "name"
editing way 220141878: http://www.openstreetmap.org/browse/way/220141878
	replacing misspelt tag key "Name" -> "name"
editing way 220141880: http://www.openstreetmap.org/browse/way/220141880
	replacing misspelt tag key "Name" -> "name"
editing way 220141881: http://www.openstreetmap.org/browse/way/220141881
	replacing misspelt tag key "Name" -> "name"
editing way 223459322: http://www.openstreetmap.org/browse/way/223459322
	removing misspelt tag key "building:color" (tag "building:colour" present with identical value)
editing way 223459323: http://www.openstreetmap.org/browse/way/223459323
	replacing misspelt tag key "building:color" -> "building:colour"
editing way 224029176: http://www.openstreetmap.org/browse/way/224029176
	replacing misspelt tag key "soruce" -> "source"
editing way 224962046: http://www.openstreetmap.org/browse/way/224962046
	replacing misspelt tag key "websi" -> "website"
editing way 227342330: http://www.openstreetmap.org/browse/way/227342330
	replacing misspelt tag key "building:color" -> "building:colour"
editing way 227802940: http://www.openstreetmap.org/browse/way/227802940
	replacing misspelt tag key "Ref" -> "ref"
editing way 230424612: http://www.openstreetmap.org/browse/way/230424612
	replacing misspelt tag key "castle_typ" -> "castle_type"
editing way 230424619: http://www.openstreetmap.org/browse/way/230424619
	replacing misspelt tag key "castle_typ" -> "castle_type"
editing way 230424626: http://www.openstreetmap.org/browse/way/230424626
	replacing misspelt tag key "castle_typ" -> "castle_type"
editing way 230424628: http://www.openstreetmap.org/browse/way/230424628
	replacing misspelt tag key "castle_typ" -> "castle_type"
editing way 230424630: http://www.openstreetmap.org/browse/way/230424630
	replacing misspelt tag key "castle_typ" -> "castle_type"
editing way 237262848: http://www.openstreetmap.org/browse/way/237262848
	replacing misspelt tag key "barreier" -> "barrier"
editing way 239076802: http://www.openstreetmap.org/browse/way/239076802
	replacing misspelt tag key "Name" -> "name"
editing way 239988840: http://www.openstreetmap.org/browse/way/239988840
	replacing misspelt tag key "NOTE" -> "note"
total number of objects modified: 51

Soweit ich sehen kann, hat es keine Probleme gegeben. Wenn nicht doch noch welche auftauchen - bitte mal durchsehen! -, geht es in den nächsten Tagen portionsweise mit dem Rest der Republik weiter. Ich werde allerdings nicht jedes Mal ein neues Posting hier aufmachen. Die Änderungssätze finden sich hier und das Protokoll sollte nun dort angehängt werden.

Übersicht über die Änderungssätze:
Regierungsbezirk Münster (21.10.)
Regierungsbezirk Köln (21.10.)

Weitere per Nachtrag (Edit):
Saarland (21.10.)
Nach Deaktivierung von building:color und roof:color (siehe weiterer Diskussionsverlauf):
Rheinland-Pfalz (22.10.)
Regierungsbezirk Düsseldorf (22.10.)
Niedersachsen (22.10.)
Hessen (23.10.)
Regierunsgbezirk Detmold (23.10.)
Baden-Württemberg (24.10.)
Schleswig-Holstein (24.10.)
Regierungsbezirk Arnsberg (25.10.)
Mecklenburg-Vorpommern (25.10.)
Bayern (27.10.)
Brandenburg inklusive Berlin (27.10.)
Sachsen (28.10.)
Sachsen-Anhalt (28.10.)
Thüringen (28.10.)

DE (Rest) (29.10.)

Einspruch!
Das Tagg note=* gehört ebenso wie fixme=* zu den sogenannten Annotations (zu deutsch Anmerkungen), haben also (anders als name, landuse, addr:*, …) keinen Einfluss auf die Bedeutung eines Objektes.

Nun gibt es mittlerweile häufig den Fall, das Objekte mehr als 10/15/20 Taggs (Eigenschaften) besitzen (Adresse, 3D-Infos, …). Dabei gehen note=* oder fixme=* (beides Notizen an andere Mapper) leicht in der Menge der anderen Taggs unter. Von daher schreiben manche Mapper note und/oder fixme in Großbuchstaben, damit diese in der Tagg-Liste möglichst weit oben stehen und auf diese Weise nicht übersehen werden.

Daher finde ich, dass die Groß-/Kleinschreibung bei NOTE=* und FIXME=* nicht korrigiert werden sollte.
(Andere Probleme sind mir nicht aufgefallen.)

Heute in Großschreibung
EDBERT (EVANE)

Ich habe NOTE für die Zukunft rausgenommen. Was ist mit Note?

PS/Edit. FIXME1, FIXME2, FXIME, FixMe und Fixme werden nicht angerührt. Eine Ersetzung von FIXME zu fixme wird vom Suchprogramm erst gar nicht vorgeschlagen, da FIXME häufiger ist. Die exotischen Schlüssel COMMENT, INFO und STATUS bleiben ebenfalls stehen.

Wenn ich so etwas (in der Regel bei FIXME) mache, dann bin ich konsequent und schreibe alles groß (ist aufälliger).
Unabhängig davon würde ich dazu neigen, alle Varianten von Groß-/Kleinschreibung unverändert zu lassen.

(wieder mit ‘richtiger’ Schreibweise)
Edbert (EvanE)

Ich bin der Meinung, dass sich Wall-E zunächst auf seine eigentliche neue Aufgabe, die Korrektur von Tagging-Tippfehlern (siehe Überschrift), konzentrieren sollte.
Die Angleichung von Varianten unterschiedlichen Geschmackes würde ich erst machen, wenn ein Konsens vorzuliegen scheint.
Generelle Kennzeichnung von Annotationen (keine Objekteigenschaft) per alles Großbuchstaben fände ich z.B. sinnvoll. Wenn Note korrigieren, dann in diesem Sinne zu NOTE.

Ich habe “Note” nun auch herausgenommen.
Bei Tippfehlern vs. Geschmacksvarianten bin ich nicht sicher, ob wir da evtl. eine unterschiedliche Definition vor Augen haben. Bei FIXME und NOTE (sowie weiteren Varianten) sehe ich sein, daß das häufig Absicht ist. Wegen der geringen Häufigkeit war mir das bei NOTE zunächst nicht in den Sinn gekommen; es gibt ja schließlich auch LAYER und NOEXIT, die kaum absichtlich gesetzt worden sein dürften, sondern etwa durch Caps Lock. FIXME habe ich im Übrigen selbst früher benutzt (und zwar aus der von Edbert skizzierten Überlegung).

Die aktuelle Fassung des Regelsatzes ist inzwischen im Volltext im Wiki dokumentiert.

Ich gehe davon aus, daß alle Elemente des Regelsatzes (nach Streichung von NOTE und Note) tatsächlich Fehler (Vertipper, Sprachfehler, Germanismen, außerdem AmE/BrE) sind und keine Geschmacksvarianten. Wenn Du welche siehst, streiche ich die gerne raus.

Einzige mögliche Ausnahme, und damit kommen wir zu einem anderen Thema, das ich ohnehin noch ansprechen wollte, sind die color/colour-Tags. In der Datenbank sind building:color und roof:color ungefähr im Verhältnis 1:10 zu building:colour und roof:colour vertreten. Allein in Berlin beträfe die Korrektur etwa 2700 Objekte. Im Grunde sind wir da schon im Bereich des Umtaggens, wovon ich mich ja eigentlich fernhalten möchte - die color-Variante könnte ja durchaus Absicht sein. Andererseits ist die Definition auf den 3D-Wikiseiten eindeutig, und die zugrundeliegende Regel, sich nach der britischen Rechtschreibung zu richten, ist uralt und auch akzeptiert. Von daher bin ich trotz Bauchschmerzen geneigt, building:color und roof:color im Regelsatz zu belassen - aber die Größenordnung sollte uns bewußt sein.

Ich glaube nicht, dass (in Deutschland zumindest) eine nennenswerte Anzahl von Mappern absichtlich color verwendet. Es ist halt so, dass man meist eher dem amerikanisch-englischen zugeneigt ist, das aber halt in OSM aus historischen Gründen unüblich ist. Persönlich fände ich ja amerikanisches Englisch sinnvoller - aber wenn wir hier ausnahmsweise schonmal einen Standard haben, sollte man den nicht aufweichen. Also: Ja, gerade color->colour halte ich für sinnvoll und notwendig, auch wenn es natürlich hier kein Tippfehler im eigentlich Sinne ist (zumindest in den meisten Fällen wohl nicht).

Selbst wenn jemand absichtlich color geschrieben hat, ist der Informationsgehalt der gleiche wie bei colour. Ein Umtaggen würde ich nur ablehnen, wenn mir irgend jemand eine unterschiedliche Bedeutung der beiden Schreibweisen plausibel machen könnte.
Geschmacksfrage ist es mE nicht, da die Regeln (AE vs. BE) eigentlich eindeutig sind (sofern es in OSM überhaupt Regeln gibt ;)).

Das ist soweit ohne Auffälligkeit.
Das hat man alles so oder so ähnlich schon mal selber beim Mappen gesehen.

Ich denke, da die Regeln sowohl allgemein (BE-Schreibweise) als auch bei Simple 3D Buildings eindeutig ist, kann und soll man das als Tippfehler betrachten. Weiter muss man davon ausgehen, dass vielen der Unterschied AmE / BE gerade bei dem Wort colour nicht geläufig ist. Und das ist letztlich ja auch eine Art von Schreibfehler.

Die reine Menge ist natürlich ein Problem. Gegebenenfalls eine Bremse einbauen (100-200 Treffer?), falls das in einem Gebiet (größere Städte) häufig vorkommt und dann in mehreren Läufen ändern.

Eventuell mag es sinnvoll sein, die DWG bzw. deren deutsch Mitglieder vorab darüber zu informieren, dass in den Stadtstaaten dieses Problem gehäuft auftritt und um Rat bitten, ob es a) Einwände gibt und b) ob man besondere Maßnahmen ergreifen soll.
Da du alles sauber diskutiert, dokumentiert und getestet hast, erwarte ich für Deutschland jedoch keine Probleme.
Wenn das irgendwann mal auf mehr als Deutschland ausgedehnt werden soll, dann muss man sowieso mit einem breiteren Kreis neu diskutieren.

Edbert (EvanE)