Photon - ein neuer Geocoder für OSM-Daten

Auf dem Gebiet der Geocoder (Adress-Angabe → Koordinaten) scheint es etwas neues zu geben:

http://wiki.openstreetmap.org/wiki/Photon

übersetzt:
Photon ist ein Open-Source Geocoder (“Namens- und Adress-Suche”) für OpenStreetMap Daten. Er basiert auf Apache Solr - einer effizienten und hoch skalierbaren Such-Platform
Photon wird von der deutschen Firma Komoot entwickelt, und bietet einen mehrsprachigen (derzeit Englisch und Deutsch) “Search-as-you-Type” Geocoder.

Eine Demo-Installation findet sich online unter http://www.komoot.de

Diese quasi-Echtzeitsuche finde ich phänomenal!!!

Auf der entsprechenden Seite von github.com findet man schon einige Hinweise, wie eine Installation funktioniert.

Fragen:

Wer findet Schwächen, Fehler, fehlende Daten?

Wie werden die Rohdaten erzeugt?
(Anscheinend benötigt man einen Datenbestand im Nominatim-Format)

Was benötigt man, um diese Suchmaschine auf eigenen Webseiten zu integrieren?

Wer bekommt es zum Laufen?

name:* etc. wird anscheinend noch nicht berücksichtigt, ansonsten schon mal sehr schick.

Optisch und technisch sehr gut! Gefällt mir viel besser als nominatim, mag aber auch allein daran liegen, dass photon eher web2.0 entspricht.

Auffälligkeiten:

  • Prioritäten in der Vorschlagsliste stimmen nicht immer (Beispiel: “Dorfstraße, Osterrönfeld”, Topergebnis bleibt eine Seebener Dorfstraße in Salzwedel, die auch das Topergebnis ist wenn man nur “Dorfstraße” eingibt. Nur wenn man dann noch die PLZ dazu angibt, wird der Vorschlag aus der Liste verworfen)
  • Vorschläge entfallen, wenn die Hausnummer nicht in OSM erfasst ist (Beispiel: “Fährstraße, Osterrönfeld” oder “Fährstraße 30, Osterrönfeld” liefert gute Ergebnisse, wohingegen “Fährstraße 3, Osterrönfeld” (eine Hausnummer die fehlt), als Topergebnis einen Elektrofachhändler angibt sowie dutzende Straßen in anderen Städten die den selben Namen mit der Hausnummer 3 haben)

Es wäre vielleicht wichtig das Kleingedruckte zu lesen. Der OP weisst zwar kurz drauf hin, aber Photon is beleibe kein Ersatz für Nominatim sondern eine Fulltextsuche -auf- Nominatim Daten, also wenn man so will schlicht eine Erweiterung. Sprich es hat niemend seinen Zauberstab benutzt und magisch all die Probleme mit den unterliegenden Daten behoben die Nominatim versucht zu lösen.

Simon

Naja ob man ein Programm mit eigenen Algorithmen auf bestimmte Datenformate (Nominatim-Format) und eigener GUI als Erweiterung bezeichnen will, kann man sich sicherlich streiten.

Mal eine ganz andere Frage - auch wenn ich mich kaum mit dem Nominatim-Datenformat auskenne - : Könnte man nicht ein Bayessches Netz erzeugen & trainieren, um so gute Suchergebnisse für Geoanfragen zu bekommen?

Eine unscharfe Suche fehlt mir am meisten in den OSM-Suchen. Man weiss doch nie, wie man “Bert(h)ol(d|t)-Brecht-Straße” schreiben soll, und wenn man das weiss, stehts in OSM anders drin… Eine Vorschlagsliste mit Korrekturen wäre was feines.

Zum Training müsste man dem Netz sagen, wie zufrieden man mit dem gerade erhaltenen Ergebnis war, damit es das lernt…

Grüße, Max

Nominatim verarbeitet überhaupt erst die Namen und anderes OSM-Zugemüse zu etwas, das sinnvoll für das Geocoding verwendet und durchsucht werden kann, sprich 99% des Aufwandes (vom Synchronizieren mit den Diffs gar nicht zu reden). Ich würde doch empfehlen lonvias Vortrag dazu von der FOSSGIS oder SOTM 2013 mal anzuschauen.

Das eignet sich doch Crowdsourcing perfekt, um genügend Trainingsdaten einzuspeisen, oder?

oder man schaut einfach, was der Nutzer letztendlich angeklickt hat :slight_smile:

Ja genau, das wären dann ja quasi die Trainingsdaten. Frage ist nur, ob man auch den Nutzer die Möglichkeit geben sollte ein total unpassendes Ergebnis als solches zu deklarieren. Ich habe nicht wirklich viel Erfahrung mit Bayesschen oder Neuronalen Netzen, aber es ist ein sehr spannendes Thema. Gerade die Vorstellung, dass ein Schwarm an Nutzern ein Netz trainiert klingt toll :smiley: Jetzt brauchen wir nur noch jemand der das Ganze als technisch zu aufwändig erklärt :wink: