Unicode im Ortsnamen 'Pfυllendorf'?

die ist ja immer noch erst in Version 2501. Zur Landmasserelation könnte man auch mal wieder diskutieren, hier neuer Thread.

Nö, da hab ich echt keinen Bock drauf,

Der Typ war zu krank drauf… vergleiche: https://www.openstreetmap.org/changeset/144525353


Wir werden trotzdem noch viel Spaß hier gemeinsam haben, möglicherweise nur nicht mehr unter diesem Account - Ein Olaf lässt sich nicht kleinkriegen!


Der Kommentar sagt alles… Man sollte weiterhin die Augen stets offen halten und auf der Hut sein,

Sven

2 Likes

Im Overpass findet man mit…

nwr["name"~"[ΑαΒβΕΖΗΙΚΜΝνΟοΡρΤΥυΧ]"]({{bbox}});

…Namen, welche mindestens eins der Zeichen in der eckigen Klammer enthalten.
Momentan stehen im Beispiel nur die Griechischen Buchstaben, die eine gewisse Verwechslungsgefahr haben. Leider gibt es für fast jedes Ascii-Zeichen teils mehrere gleich aussehende Zeichen (“Homoglyphen”) in Unicode (siehe auch Unicode-Spoofing). Die Liste müsste also sehr lang werden.

Mit Overpass gefunden:

Da ist ein Eta statt H drin, aber nicht vom üblichen Verdächtigen.

Osmose findet sowas auch:
https://osmose.openstreetmap.fr/de/issues/open?country=germany_nordrhein_westfalen_arnsberg&item=5070&source=&class=50701&username=&bbox=

6 Likes

Könne es einfacher sein, in Gebieten ohne sprachliche Besonderheiten wie Mehrsprachigkeit sollte es auch reichen, alles zu suchen, was keine Zeichen des deutschen Alphabets und Leerzeichen enthält?

Bei der Eröffnung des Threads hatte ich noch weitere Fragen im Hinterkopf:

  • Wie häufig kommt das Problem “unzulässige Zeichen in Bezeichnern” vor?
  • Wie kann man unzulässige Zeichen automatisch erkennen?
  • Ist es zielführend ein entsprechendes Programm zu entwickeln?

‘Grobe’ Ideen für ein entsprechendes QS-Programm:

  • Open-Source (GitHub)
  • plattformunabhängig (Go)
  • Konfiguration via Datei (YAML)
    • Node, Way, Relation
    • Tags (name, name:de, …)
    • ungültige Zeichen
    • gültige Zeichen
  • Eingabe: PBF-Datei, …
  • Ausgabe: Text-Datei, CSV-Datei, …

Wenn ‘allgemeines’ Interesse an einem solchen Programm besteht, könnten wir die genauen Anforderungen hier zunächst diskutieren.

Es ist sinnfrei schon wieder ein neues QS Program zu schreiben, einfach entsprechende Erweiterungen für Osmose und OSMCha erstellen.

So deckt man sowohl die zeitnahe Entdeckung von irgendwelchem Vandalismus wie auch die Behebung von unabsichtlichen Verschreiber ab.

Alternativ kann man auch andersrum suchen:

nwr
  ["name"]["name"!~"^[a-zA-Z0-9 äöüÄÖÜß,.:'´`/&<=>()°+-]+$"]
  ({{bbox}});
out center;

Sind trotzdem immer noch zahlreiche Falsch-Positive.

3 Likes

Kann man im basemap.de-Viewer (Achtung: Nicht zur Datenübernahme freigegeben) irgendwie Fehler melden?

Pfullendorf - Robinienweg wird dort als Rubinienweg geführt.

Die Basemap erthält ihre Daten auch nur von anderen Stellen. Du müsstest herausfinden, wer der Datenlieferant ist, z.B. die Stadt/Gemeinde, und dort den Fehler melden. Evtl. können die dir aber helfen, den richtigen Ansprechpartner zu finden: KONTAKT - basemap.de.

Die Anführungszeichen sind manchmal auch nicht so sinnvoll, z.B. hier:

Wenn man nur “place” betrachtet sollten die meisten der Sonderzeichen die du durchgehen lassen willst, nicht vorkommen bzw. falsch sein. Die falschen Positiven die ich sehe sind glaube ich vorwiegend auf Leerzeichen und Anführungsstriche zurückzuführen.

Update: damit habe ich kaum noch (falsche) Treffer, und m.E. sind “Anführungszeichen” in Namen meistens falsch, insbesondere, wenn der komplette Name nochmal in Anführungszeichen steht.

[out:json][timeout:225];
// gather results
nwr
  ["place"]["name"]["name"!~"^[a-zA-Z\ \- 0-9äöüÄÖÜß,()]"]
  ({{bbox}});
// print results
out geom;

sowas hier finde ich auch ziemlich verdächtig, unabhängig von den Anführungszeichen: Node: ‪„Möhren werden orange.“‬ (‪7636798707‬) | OpenStreetMap

1 Like

Wofür steht das nwr in der Abfrage? Danke!

node, way, relation

3 Likes

Ich finde den Osmose-Link von @Ökkel super und denke, dass es kein anderes Tool braucht. Da sind anscheinend die “normalen” Zeichen für die verschiedenen Sprachen hinterlegt, und dann wird nach Abweichungen gesucht. Elegant und sehr praktisch.

1 Like

Habs über das Kontaktformular gemeldet.

In Pfullendorf ist mir aufgefallen, daß dort sehr Waldwege vermutlich inkorrekt getaggt sind:

access=forestry
highway=track
motorcar=forestry
motorcycle=forestry
surface=gravel
tracktype=grade2

Vielleicht kann sich dem ja ein Ortskundiger mal annehmen.

Fraglich sind die Wege in Lila:

Antwort von basemap ist gekommen: Sie sind nicht in der Lage festzustellen ob der Name Rubinienweg korrekt ist. :wink:

1 Like