Vorschläge für einen universelles Import Tool

Hi, ich möchte einen Importer für fremde Daten zu OSM schreiben. Keine Angst, damit werden Importe nicht zum 0815 Job den Einsteiger machen sollten. Mein Anliegen ist eine Modulare Plattform bereitzustellen um Datenspenden effektiv umwandeln zukönnen. Bevor ich hier aber mehr berichte möchte ich erst einmal wissen was ihr euch so wünschen würdet.

Ein Importer, welcher für vorhande Addressen POI einpfügt wäre Klasse.

z.:B man hat eine Liste mit Bäckerläden mit Addressen und diese kan man dann automatisch an die richtigen Stellen setzen.

Das Format, in welchem die Adressen vorliegen, sollte frei wählbar sein und man mit Platzhaltern angeben kann, wo welche Information zu finden ist.

Des weiteren sollte überprüft werden, ob das Objekt schon vorhanden ist in einem gewissen Umkreis um das importierte Objekt, bzw. ob es teilweise vorhanden ist. Bspw. wenn das Haus schon eingetragen ist, sollte das Tag für die Arztpraxis auch an dem Haus landen und nicht als Node irgendwo.

Das größte Problem, was ich sehe wird die Entscheidung, welche Daten nun genauer sind. Hier müsste man dann den Nutzer entscheiden lassen. Also wenn das Objekt schon vorhanden ist, muss der Nutzer manuell entscheiden, welches in der Datenbank bleiben soll.

Dann fang schon mal an, Hausnummern einzutragen.
Ohne die Hausnummern ist es schwierig, die POIs an die richtige Stelle zu setzen.

Edbert (EvanE)

Hier in Rostock sind haben wir zu ~50% die Hausnummern schon. Auch ein Zuordnen zu Straßen und Eintragen bei OpenStreetBugs wäre ja bereits hilfreich. Ansonsten ein Export der nicht gefundenen Adressen an Google um zumindest eine grobe Orientierung zu haben für die anderen Mapper.

Wo du OSB gerade ansprichst. Es wäre der Qualität der Daten zuliebe sicher sinnvoll, alle Importe auch zu OSB hinzuzufügen.

Georeferenzierte GeoTiff die automatisch daraus OSM Daten machen. Automatische erkennung von Straßen, Wege, Breite der Straße, Gebäudeumrisse, Grünanlagen, Wälder.

Import von normalen Fotos um daraus automatisch OSM Daten zu machen. Mustererkennung von Straßen und Gebäude anhand bestehender OSM Daten mit automatischem Import zur automatischen Klassifizierung von Wegen anhand des Fotos, Automatische Erkennung von Hausnummern an den Fotos die korrekt automatisch den OSM Daten zugeordnet und Importiert werden.

Automatischer Webcrawler welcher den Google Katalog nach Webseiten abgrast und vollautomatisch daraus eine POI Datenbank anhand der gefundenen Adressen mit Haunummer generiert.

Ich denke damit wärst schon mal einige Jahre beschäftigt :smiley:

Das wäre was feines und halte ich durchaus für machbar… wäre doch was schickes für ne diplomarbeit…

Die Hausnummern die nicht richtig erkannt werden von der OCR wandern dann als Captcha für die Openstreetmap Login Anmeldung :smiley:

Das mit der OCR ist für mein JOSM video mapping Plugin als letzte Ausbaustufe geplant.

Den Google Index abgrasen ist IMHO illegal. Was aber gehen würde ist eine bessere Zusammenarbeit mit offenen Suchmaschienen wie ebend www.yacy.net nur kommen die gerade leider selber nicht aus dem Knick.

Das mit Mustererkennung würde ich persönlich erstmal raus lassen, weil ich mich eher auf Datenmigration beschränken würde, muss das aber erst noch mal in Ruhe durchdenken.

Viele Webseiten haben geografische Informationen in ihren META tags.
http://en.wikipedia.org/wiki/Geotagging

Wenn man diese Informationen automatisiert abfragen und als OSM Daten abspeichert (vielleicht in einer eigenen Datenbank) hätte man gleich einen äusserst interessanten Layer.

Hmm an GeoRSS habe ich schon oft gedacht es aber noch nie live irgendwo in-the-wild gesehen bzw. noch keinen Reader der das dann auch darstellt/filtert. Wäre ja ideal um aus globalen Feeds nur die lokal interessanten Sachen zu filtern…

hi, Mutiger

ich schlage mich auch gerade mit dem Import von POIs rum und bin fast fertig (auch mit den Nerven).

Das Hauptproblem, das mich am meisten beschäftigt hat, war die Tatsache, dass ca 5% der externen Daten bereits in OSM drin sind, allerdings mit leicht unterschiedlichen Koordinaten. Die im Feld gemessenen Koordinaten können ja nie exakt mit denen einer externen Quelle übereinstimmen.

Ich hoffe, dass mein Ansatz einigermassen richtig ist (Suche in der Nähe des Zielpunktes nach Nodes mit fast gleichen Eigenschaften und füge diese “Doppelgänger” NICHT automatisch ein). Hat schon was mit Fuzzi-Logik zu tun (kein Spass - sowas gibt es wirklich). Man braucht “nur” zu definieren, was “nah” ist und was “ähnliche Eigenschaften” sind und dann hats man :wink:

Noch ein wenig String-Handling im XSL-Prozessor und dann jag ich die Punkte rüber

wambacher

Hehe Fuzzy klingt gut :smiley: aber das Problem ist ja ebend, dass jeder sich so seine Skripte schreibt und da wäre ein Tool, in das man dann auch KnowHow stecken kann echt gut.

Das wollte ich ja garnicht sagen. Solange nix da ist strickt die Oma eben selber. Ich wollte nur auf die Problematik bereits vorhandener Daten hinweisen.

Wenn dieses kleine Problem nicht gewesen wäre, hätte ich erheblich weniger Arbeit gehabt. Und hätte ich vorher an diese Sache gedacht, wäre es noch einfacher gewesen (Theorie: Punkte nehmen, Koordinaten umrechnen, nach xml konvertieren und rüber damit - Praxis: alles auseinanderreissen und von vorne anfangen …)

gruss

wambacher

p.s. muss noch zwei kleine Fuzzies füttern :wink:

Ja ist vollkommen richtig, da stellt sich für mich auch die Frage nach dem effektiven (weil punktweisen) Zugriff auf die API. Naja mal klein anfangen und dann werden sich bestimmt schon Lösungen aufzeigen. Auch ein Modus zum halbautomatischen einpflegen/abgleichen wäre ja nicht schlecht.