Bei den Testdaten wurde meines Wissens das Google Geocoding genutzt. Aber aus den genannten lizenzrechtlichen Gründen und dem Qualitätsaspekt wird sicherlich die auch erwähnte manuelle Prüfung und Bearbeitung durch einen Menschen notwendig sein.
In einem ersten Lauf ca. 1.000 Einträge - evtl. dann noch einmal ca. 30 - 40.000 POIs.
Noch eine Frage:
Ein Forumsteilnehmer hat auch die Firma NavAds positiv erwähnt - ist deren Vorgehensweise gut dokumentiert?
Sorry, aber eine Prüfung macht aus illegalen Daten keine legalen. Es geht einfach nicht, dass ihr diese Koordinaten verwendet. Im Extremfall kann uns Google verklagen, diese Daten wieder zu entfernen - und das würde bestimmt auch noch was kosten.
Es gibt die Möglichkeit, den OSM-basierenden Geocoder Nominatim zu verwenden, wobei so viele Queries sicher an die Schmerzgrenze (Usage Policy) von Nominatim kommen.
Der hatte auch nur so perfekt geklappt, weil NavAds eine Firma aus dem OpenSource-Umfeld beauftragt hatte und die hatten dann wiederum einen wirklichen OSM-Experten beauftragt. Dieser bemerkte erst lange nach Projektende, für wen er wirklich gearbeitet hatte.
Der “Senior Social Geo Specialist” von NavAds ist auf dem Niveau eines unterdurchschnittlichen OSM-Anfängers.
Aus eigener Erfahrung kann ich sagen das die Google Koordinaten häufig um dutzende und mehr Meter neben den eigentlichen liegen.
Die können “eigentlich” nur als grober Anhaltspunkt gewertet werden, nach dem Motto “da ungefähr ist was”…
Nur um Unklarheiten zu vermeiden, auch automatisch mit Nominatim georeferenzierte Daten müssen unbedingt manuell geprüft werden, bevor sie zu OSM hochgeladen werden. Sonst passiert nämlich folgendes:
Nominatim-Anfrage nach einer bestimmten Hausnummer für einen POI wird gestellt
OSM hat in der Straße keine Hausnummern, Nominatim gibt einfach einen Punkt in der Mitte der Straße zurück
POI mit dieser Adresse wird hochgeladen, dadurch entsteht fälschlicherweise der Eindruck, die Hausnummer befinde sich tatsächlich an diesem Punkt in der Mitte der Straße
künftige Nominatim-Suchen nach dieser Adresse finden genau den Punkt in der Mitte der Straße…
alternativ auch mit “2. OSM hat hier nur eine Hausnummerninterpolation”, auch hier würde ein blindes Hochladen eine Genauigkeit vorgaukeln, die nicht existiert.
Gemeint ist wohl das man aus den keywords (zB. “Gutachten;Schätzungen;Oldtimer-Bewertungen;Unfallgutachten;KFZ-Bewertung;Laservermessung;Motorradrahmenvermessung;KFZ-Sachverständiger”) das passende OSM Tag generiert, und was man macht wenn es keinen Tag für “KFZ-Sachverständiger” in OSM gibt.
Fall A: Nominatim kennt die Adresse nicht, dann kommt bestenfalls irgendwas in der Nähe raus, was euch aber nicht weiter hilft.
Fall B: Es kennt die Adresse, dann ist die Wahrscheinlichkeit aber groß, dass der POI in OpenStreetMap bereits erfasst ist. Ihr müsstet also manuell (!) abgleichen, ob es zu ergänzende Daten gibt.
Fazit: Egal wie man es dreht und wendet, letztendlich läuft es darauf hinaus, dass jeder POI einzeln per Hand eingetragen werden muss (und das ohne die Berücksichtigung eurer Koordinaten).
Gerne sind bei Google übrigens auch mal die Straßen verdreht, die Hauskoordinaten wurden nämlich damals nicht mit dem BKG-Datensatz gekauft, sondern sind noch auf der alten TeleAtlas-Basis. Die Koordinaten sind daher teilweise auch mal schön parallel zur Straße interpoliert, obwohl die Gebäude teilweise Vorgärten usw. haben
Lustigerweise aktualisierte Google die Hauskoordinaten nicht mehr. Ich habe noch Datensätze aus 2007-2009 hier, die Koordinaten sind heute nahezu identisch