Nominatim und seine Tücken

Hallo zusammen

Ich versuche seid längerem die Nominatim (http://nominatim.openstreetmap.org) Suche zu verstehen und wie es in der Lage ist Ortschaften und Punkte einzuschätzen und stosse schon seid langem schon auf etwas was mir gar nicht gefällt in meiner Gemeinde.

Und zwar vergeichen wir mal 4 Suchen:

Kemleten: http://nominatim.openstreetmap.org/details.php?place_id=109562985
Ottikon: http://nominatim.openstreetmap.org/details.php?place_id=109567831
Illnau: http://nominatim.openstreetmap.org/details.php?place_id=109540281
Effretikon: http://nominatim.openstreetmap.org/details.php?place_id=109562982

Die Suchen sind hier der Ortschaftsgrösse nach sortiert. (klein bis gross)

Bei allen vier wird jedoch viel zu viel als Fläche dargestellt.

Wie kann ich die Umkreisung der Ortschaften auf die Realen Dimensionen runter bringen? Also so, dass wirklich nur die Teile in die Suche mit aufgenommen werden, die auch wirklich zu diesem Bereich dazu gehören?

Ich vermute jetzt mal, dass das eigentliche Problem hier bei der Postleitzahl liegt, da fast alle Ortschaften in meiner Gegend die selbe Postleitzahl wie Effretikon haben, da die Poststellen alle aufgelöst wurden. Was ich dann jedoch nicht ganz verstehe ist wieso sich dann die Grenzen bis nach Kyburg und noch weiter nach Osten erstrecken, obwohl da im nord Osten längst eine andere Postleitzahl herrscht.

Oder aber es hat etwas mit dem 3 Kilometer umkreis zu tun in dem alles als zugehörig angesehen wird.

In Ermangelung anderer Quellen verwendet Nominatim einen sehr einfachen Ansatz:

  • Man nehme den Ortsmittelpunkt, wie er durch einen place=…
    Knoten angegeben ist.
  • Anhand des Wertes von place=… wird ein Standardradius verwendet.

Das führt dann gelegentlich zu falschen Zuordnungen.
Postleitzahlen werden, soweit ich weis, bei der Nominatim-Suche
nicht berücksichtigt.

Edbert (EvanE)

Das blöde ist ja, dass eigentlich genug Quellen für alle drei Ortschaften vorhanden wären.

Hier steht:

Heisst das nun, dass ich bei jeder Strasse eigentlich ein is_in Tag machen könnte, um zu verhindern, dass für die selbe Strasse noch andere nahe gelegene Ortschaften in die Parentliste rein kommen ?
Ich glaube ich habe noch nie ein is_in Tag bei einer Strasse gesehen bis heute. Muss mich korrigieren: gibts öfters in Europa als man denkt: http://tagwatch.stoecker.eu/Europe/En/tagstats_is_in__.html

Das scheint ene Möglichkeit zu sein.

In Dortmund wird vielfach an den Straßen ein is_in=Dortmund… verwendet.
Wenn dann noch an einer Adresse ein addr:street=… angegeben ist wird
die Verbindung wohl genutzt.

Edit:
Die Datenbasis von Nominatim wird nicht täglich aktualisiert.
Es kann also ein paar Tage bis Wochen dauern, bis Änderungen
sich in der Nominatim-Suche auswirken.

Edbert (EvanE)

Eine andere Möglichkeit ist den place Tag nicht auf einen Node zu setzen sondern auf die residential Area. Dann weiß Nominatim genau wie weit das place reicht.

Also is_in würde ich nicht mehr verwenden. Es ist ungenau und kontrovers.

“addr:*” ist präziser und wird schon millionenfach auch mit “addr:street” verwendet Tagstat:


Most popular tag / tag combinations 
   tag 1             tag 2              uses 
addr:housenumber   addr:street        5,825,030 
addr:city          addr:street        4,527,990 
addr:city          addr:housenumber   4,488,205 
addr:country       addr:housnumber    4,260,336

Also während meiner 10 Monaten in diesem Forum kann ich mich an
keine Diskussion über is_in erinnern.

Ebenso kann ich mich an keine Diskussion in der Malingliste talk-de
in den letzten Monaten erinnern.

is_in (an einer Straße) und addr:street (als teil einer Adresse)
schliessen sich nicht aus. Ganz im Gegenteil finde ich, dass sie
sich sehr gut ergänzen.

Die Tatsache, dass ein User vor kurzem (April 2010) im Wiki einträgt,
dass dieses Tag umstritten ist, bedeutet nicht zwangsläufig, dass dies
den Tatsachen entspricht. Das ist erst einmal nur die individuelle
Meinung dieses Users. (im besagten Zeitraum keine Diskussion auf
der deutschen Mailingliste oder im deutschen Forum)

Wie auch immer. Solange Nominatim die Information des is-in Taggs
auswertet, ist dieses Tagg nützlich.

Noch ein Punkt:
Die Anzahl eingetragener Adressen nimmt erfreulicherweise zu.
Allerdings wird das selbst in gut erfassten Gegenden wie Dortmund
immer nur in kleinen Teilen verwendet. In anderen Gegenden mit
weniger guten Luftbildern, sind nicht einmal die Gebäude, geschweige
denn die Adressen flächendeckend erfasst.

Edbert (EvanE)

Ich denke ich werde eine Kombination aus beidem machen. Ich werde die Landuse=Residential Zonen und auch die Highway=Residential Strassen mit is_in versehen.

Das Place Tag auf die Landuse=Residential Zone zu legen ist ein wenig kritisch bei mir. Ich habe nicht eine Grosse Zone, ich habe ganz viele kleine gemacht die sich mit den Strassen nicht schneiden und ich habe auch Gebäude ausserhalb des Dorfes, die nicht direkt an die restlichen landuse=residential Zonen angrenzen und durch landuse=farm abgetrennt sind, aber trotzdem zum Dorf gehören.

Die Frage ist nun, wie definiere ich eine Grenze um das Dorf herum ohne den Punkt zu verschieben an dem die Ortschaft angeschrieben ist?

Ich habe das hier zum Thema gefunden: http://wiki.openstreetmap.org/wiki/FAQ#What_makes_a_road_belong_to_a_city.3F

Welches würdet ihr empfehlen ? Und wie falls es das mit dem boundary ist: wie bekomme ich es hin, dass ich den Ortsnamen immer noch dort habe wo er jetzt ist ?

ls_in ist eigentlich absolut und stammt aus den Angangstagen von OSM.
In Afrika ist das immer noch nützlich weil keine Grenzen existieren aber in Deutschland ist es eigentlich über.

Die Strukturen werden heute durch die Grenzen abgebildet. Anstatt alle Straßen mit is_in vollzupflastern sollte man lieber die Grenze einzeichnen.

Das place Tag als Node dient dann immer noch zur Anzeige des Namens falls der Mittelpunkt der Grenze als Ort für den Namen nicht passend ist.
Bei kleineren Dörfern kann man auch der residential Area das place Tag geben wenn die residential Area das ganze Dorf umschließt aber meistens reicht dort der Place Node.

Den Status der Gemeindegrenzen kann man hier sehen http://svenanders.openstreetmap.de/ags/Deutschland/
Durch den manuelle PLZ Import bekommen wir zur Zeit relativ viele neue dazu. Ich hoffe da helfen auch weiterhin viele mit.

Wenn ich mir ansehe, wieviele Gemeindegrenzen selbst in Deutschland
es auch heute noch nicht gibt, kann ich deine Einschätzung noch lange
nicht teilen.

Straßen sind einfach, da man sie mit dem GPS erfassen kann und sie
existieren in DE weitgehend flächendeckend im OSM-Datenbestand.
Gemeindegrenzen hingegen sind schwierig, da z.b. die Landesvermessungs-
ämter die ungern kostenfrei und offen rausrücken.

Postleitzahlgebiete sind nach den Bedürfnissen der Post AG gegliedert.
Das kann mal mit Gemeindegrenzen übereinstimmen, muss es aber nicht.

In Rheinland-Pfalz fehlt nach obiger Quelle etwas mehr als die Hälfte der
Gemeindegrenzen.

Edbert (EvanE)