Gehirnstürmung: Automatische Korrektur von Adressfehlern

Das Problem ist, dass es eigentlich kein Mapper auf Basis der vorhandenen Daten richtig machen kann, denn die in OSM unbenannte Straße nach dem einen Eckhaus zu benennen, würde man bei dieser Ähnlichkeit zum Namen der nächsten Straße wohl eher nicht machen. Man müßte also Glück haben, dass sich ein lokaler Mapper der Sache annimmt und vor Ort erkundet. Da hat dann aber ein Schreibtisch-Mapper, der die Sache falsch korrigiert, leider beste Chancen schneller zu sein.

Einerseits verbessern die QA-Tools erheblich die Datenqualität, aber andererseits induzieren sie auch zusätzliche Fehler.
Für einen Bot gilt prinzipiell das gleiche.

Sinnvoll wäre es, die Aufgaben so auf Bot und QA-Tools so zu verteilen, dass wir die Verbesserung der Datenqualität maximieren und dabei die induzierten Fehler minimieren. Mit dem Ansatz, ein Bot muss unfehlbar sein, können wir dies jedoch nicht erreichen. Natürlich muss man alles tun, was angemessen machbar ist, damit der Bot so zuverlässig wie irgend möglich arbeitet.

Der Bot sollte erkennen, wo er schon mal mitgewirkt hat, damit er Fehler nicht bei jedem Durchlauf wieder neu macht. Für den Fall, dass der Bot korrigiert wird von einem Mapper.

Auch wenn ich den Namen in der Straße für zuverlässiger halte, da dieser gerendert wird und somit Fehler leichter auffallen, hatte ich für diesen Fall noch keine hinreichende Sicherheit angenommen und somit noch keine automatische Ersetzung vorgeschlagen.
Erst wenn zusätzliche Anhaltspunkte dafür hinzukommen, dass der Name der Straße richtig ist, sollte die Ersetzung automatisch erfolgen.

Bei der Korrektur der STra0ennamen ist dieses Feature bereits realisiert, vgl. auch Doku: http://wiki.openstreetmap.org/wiki/User:Oli-Wan/Wall-E#Ausnahmen.2C_Opt-out . Bei allen weiteren Korrekturprozessen werde ich eine gleichartige Sperrliste einbauen.

Stumpfsinnig müssen die Fehler nicht unbedingt sein, aber bei der Korrektur muß ein Irrtum nahezu ausgeschlossen sein. Im Fall der Abweichungen zwischen name und addr:street traue ich mir das nicht zu.

Einen habe ich noch: Vertauschung von Tags (etwa addr:postcode <-> addr:city) erkennen und korrigieren. Ist auch nicht ganz einfach, kommt aber häufig genug vor, daß es einen Versuch wert wäre.

Da ich bei den ganzen Threads den Überblick verloren habe, hoffe ich, dass ich diesmal den richtigen treffe.

Nur eine Idee: Kann man addr:housenumber vereinheitlichen. Ich meine die, wo Buchstaben und Zahlen vorkommen, also 1a, 2b, 3d etc. Ich sehe in meinem Bereich keine einheitliche Schreibweise, bin aber auch nicht sicher, ob es eine solche gibt. Ich finde
1A
1a
1 A
1 a
Bestimmt gibt es auch Bindestriche oder dergleichen.
Ist das nicht doof für den Auswerter?

Und wenn wir schon bei Hausnummern sind. Lt. Wiki sind Auflistungen mit Komma getrennt. Habe aber auch schon Semikolon, Schrägstrich und Leerzeichen gesehen. Also zB.
addr:housenumber = 1/2
Wie sieht es da mit einer Vereinheitlichung aus?

Gruß S-Man

Nahmd,

Die ganze Vielfalt der Leib-Nitze kann man hier erleben. :slight_smile:

Gruß Wolf

.oO( und jetzt schnell in Deckung )

Das ist keine Aufzählung, es gibt wirklich solche Nummern. Sprich: Nummer eins von zwei. Entstand einmal durch Erbteilung von Hofstellen.

Baßtölpel

Aha, wieder was gelernt :slight_smile: Aber bei uns gibts das tatsächlich nur als Aufzählung, sogar direkt so an ein Haus geschrieben. Sind halt 2 Adressen im Haus.

Aufzählungen, egal ob 37/38 oder 37-41 existieren als Hausnummer. So etwas sollte also kein Bot anfassen. Ein Navi sollte jedoch möglichst sinnvolle Vorschläge anbieten.
Die eben erwähnte Aufteilung existiert auch in Kombinationen, ich habe selbst irgendwas in der Art 5 3/7 a gemappt. Ich kann den Ort leider nicht näher als irgendwo in Oberbayern eingrenzen, denn die Hausnummern von Einzelhöfen nehme ich auf meinen Radtouren gelegentlich nebenbei mit auf.

Baßtölpel

Verrückt, was es nicht alles gibt.

Gut bleibt noch die Frage nach Vereinheitlichung von 1a, 1 a, 1A und 1 A…

vielleicht hilft die DIN :wink:http://www.druckeselbst.de/briefbogen/din5008.php

Nahmd,

In Köln (im “belgischen Viertel”) läuft eine Postleitzahlengrenze quer durch eine Hausnummer. Also “5a” hat eine andere Postleitzahl als “5b” (kann auch 5 und 5a gewesen sein).

Auch mit so etwas muss man bei der Bestimmung passender Korrekturen rechnen :-/

Gruß Wolf

Eine solche Vereinheitlichung darf gerne jeder Auswerter nach seinen eigenen Vorstellungen in seinem lokalen Datenbestand vornehmen, aber als Bot-Operation in OSM kommt sie für mich nicht in Frage. Es ist nicht objektiv entscheidbar, welche der genannten Schreibweisen richtig ist, oder daß überhaupt eine davon falsch ist.

Eher nicht. Die DIN ist Wunschdenken. In der Realität werden die Hausnummer ohne Rücksicht auf die DIN von den Gemeinden vergeben. Was die machen ist meiner Erfahrung nach uneinheitlich. Noch uneinheitlicher ist das, was die Hauseigentümer an ihr Haus schrauben (häufigster Fehler: Zusammenfassung mehrerer Nummern mit “-”). Zudem sind viele Hausnummern vor Einführung der DIN vergeben worden.
(Bei uns ist “1a” die übliche Schreibweise - auch weil die Hausnummernschilder eher quadratisch sind ;-))

Auch wenn die Gemeinde eine Hausnummer “1A” oder “1a” vergeben hat, so wäre diese nach der DIN als “1 A” bzw. “1 a” zu schreiben. Man könnte also für die Tags definieren, dass die Schreibweise nach dieser DIN zu verwenden ist. Dies ist allerdings wohl nur sinnvoll, wenn sich DIN und entsprechende ISO-Norm nicht widersprechen und müßte zunächst abgestimmt werden.
Dann könnte man eine teilweise Vereinheitlichung zu “1 A” und “1 a” durchführen.

@ slhh
genau, es geht nicht um “a” oder “A” sondern lediglich um das blank nach der Ziffer.
Das ist in DE durch DIN geregelt. So hat es auch in Anschriftenfeldern auf Briefen zu erscheinen.
In vielen Ländern kann man sich an dieser Stelle künstlerisch betätigen :wink: … aber in DE ist es mMn eindeutig.

Augsburg wäre ein Kanditat. Dort werden nebeneinanderliegende Hausnummern mit “7 1/2” zwischengeschaltet und Hinterhofgebäude mit “7a” bezeichnet. Der Hinterhof von “7 1/2” hat dann “7 1/2a”.

@ slhh:
Die Vergabe einer Hausnummer ist ein Verwaltungsakt - und die Nummer ist dann nur so richtig, wie sie vergeben wird. Andererseits ist die Nummer nur so brauchbar, wie sie am Haus steht (ich kenne da auch Abweichungen von der amtlichen Nummer) :wink:

Ein Auswerteprogramm dürfte kein Problem haben, die Leerzeichen in Hausnummern oder die Groß- und Kleinschreibung zu ignorieren (bzw. zu ergänzen). Demnach wäre die automatisierte Umtaggerei aus meiner Sicht überflüssig und eher fehleranfällig.

PS: Ich gehe davon aus, dass Du -wie die meisten- deine Telefonnummer trotzdem nicht nach der DIN 5008 schreibst :wink: