Vorschlag für autom. Edit: Schreibweise Straßennamen

Das schon länger versprochene Logfile habe ich nun erst einmal hier abgelegt:
http://osmac.bplaced.net/wall-e/wall-e-log.txt
(Die Bearbeitungen der ersten paar Tage sind nicht enthalten, da gab es noch kein Logging.)

Ich werde es nicht nach jedem Lauf aktualisieren, sondern unregelmäßig alle paar Tage.

Mir sind der Weg 188886967 (Leerzeichen vor dem Straßennamen) und Weg 186531527 (KurzeStraße, fehlendes Blank) aufgefallen. Den ersten Fall könnte man sofort mit behandeln, der zweite Fall wäre was für eine Warnmeldung.

Mit freundlichen Grüßen Georg V.

Danke für den Hinweis, der zweite Fall wird ab sofort im Log vermerkt:

	warning: name tag "VerdächtigeStraße" of way #123 still looks suspicious
	warning: name tag "Verdächtige straße" of way #123 still looks suspicious

Im Moment wird nur bei “Straße” mitten im Wort und “straße” am Wortanfang gewarnt, aber das ist natürlich auf weitere “interessante” Fälle erweiterbar.

Leerzeichen am Anfang/Ende könnte man in der Tat gleich mit entsorgen. Andererseits habe ich bei solchen Nebenkorrekturen Skrupel: das Forum hat sein Placet zu den beschriebenen Korrekturen gegeben, aber keinen Freibrief für beliebige Korrekturen erteilt. Wenn irgendwann die Leerzeichen-Beseitigung auch als eigenständige Korrektur genehmigt ist, hätte ich weniger Bedenken, sie auch in die Korrektur von “Strassen & friends” zu integrieren.

Diskutieren sollte man sowas natürlich erst, auch wenn ich keinen Grund für Bedenken bezüglich einer Leerzeichenentfernung sehe, wenn man sich auf Anfang und Ende beschränkt.

Für den Fall der deutschen Straßennamen können wir dies wohl gleich hier als Erweiterung dikutieren. Da halte ich nicht nur diese Leerzeichenentfernung, sondern auch die Reduktion von doppelten (oder mehrfachen) Leerzeichen innerhalb des Namens zu einem einzelnen für sinnvoll.

Gibt es da eventuell noch technische Schwierigkeiten? Ich meine irgendwo gelesen zu haben, dass derartige Leerzeichen teilweise von der Software (eventuell API?) unterdrückt werden. Findet dein Bot derartige Namen?

Das entsorgen derartiger Leerzeichen halte ich für eine sehr wichtige Bot-Aufgabe, da Menschen diese Fehler vermutlich nur selten erkennen würden.

Leerzeichen am Anfang oder Ende sollten mindestens als Warnung ausgegeben werden.
Was noch gelegentlich vorkommt, sind Nummern hinter dem Straßennamen. Das ist zwar meist wohlgemeint aber in der Regel falsch. Solche Straßennamen sollten daher auch eine Warnung erzeugen.

Noch einige allgemeine Bemerkungen zu deiner Liste:

  • Vor/nach jedem Changeset sollte zur besseren Lesbarkeit eine Leerzeile stehen.
  • Die Changesets sollten auch mit Link angegeben werden.
  • Die Datei / der Text sollte utf-8 wie in OSM sein.
    Es scheint aber Westlich (Windows-1252, ISO-8859-1/-15) zu sein.
  • Die Angabe einer Bounding-Box für das Changeset wäre nützlich.
    In Zukunft kann man vielleicht 1x1° Kacheln (oder so) für die Changesets
    als maximalen Bereich setzen. So könnte man gezielt seine eigene Umgebung
    kontrollieren.

Mir ist noch die Schillerstraße 23 in Kevelaer wegen der Hausnummer aufgefallen. Die Straße stammt von einem Neuling und ist mit nichts verbunden. Vielleicht kann sich ein Mapper aus der Region dieser Sache annehmen. Nichts was man automatisiert korrigieren könnte oder sollte (über das str. → straße hinaus).

Edbert (EvanE)

Falls dies hier Konsens ist, habe ich kein Problem damit, diese Funktion einzubauen. Bloß wollte ich nicht einfach Korrekturen vornehmen, die hier nie angesprochen wurden, auch wenn sie noch so trivial erscheinen mögen. Bis auf weiteres gibt es eine Warnung im Log.

Nein, die API läßt so ziemlich alles durch, inklusive Steuerzeichen. Lediglich JOSM warnt in einigen Fällen, u.a. Leerzeichen am Anfang oder Ende.

Kann ich zwar einbauen, aber bezüglich der Anteile legitimer bzw. fehlerhafter Verwendung bin ich mir nicht so sicher. Es kommt doch häufiger vor, daß Straßen tatsächlich durchnumeriert werden: etwa 2. Ausfallstraße, 2. Bauackerweg, 2. Berieselungsweg, 2. Dünenaufgang, aber auch mit nachgestellter Zahl, wie bei den diversen “Abgängen” hier (wobei man im letzteren Fall über den Namen streiten mag, aber es handelt sich nicht um den typischen Fall des nach Hausnummern “benannten” Stichwegs).
Wenn man jetzt für alles, was im weitesten Sinne merkwürdig aussieht, eine Warnung einbaut, geht das an der eigentlichen Zielsetzung des Werkzeugs vorbei. Und dabei werden sowieso nur die Wege erfaßt, die vorher schon im “Strassen etc.”-Filter hängengeblieben sind. Da wäre es vielleicht sinnvoller, einmal systematisch sämtliche Straßennamen in DE nach Auffälligkeiten zu durchwühlen und dann Mappern aus Fleisch und Blut zur Kontrolle vorzulegen.

Leerzeile und Link sollten zukünftig geschrieben werden. Mit der Kodierung hakt es noch ein wenig, aber das kriege ich auch noch hin.
Die Aufteilung in Kacheln ist für den Regelbetrieb in der Tat überlegenswert, wenngleich ich sie größer als 1°x^1° wählen würde (z.B. Nordost, Südost, Südwest, Nordwest; oder den Bot gleich auf Bundesländer ansetzen). Im Moment sind mir die flächenmäßig großen Änderungssätze aber ganz recht, da sie mehr auffallen und so auch Mapper, die das Forum nicht verfolgen, auf den Bot aufmerksam werden. Mehr Augen vergrößern die Chance, Probleme zu entdecken. Außerdem soll keiner behaupten können, der Bot sei heimlich in Betrieb gegangen :wink:

Sofern sich die Änderungen der Leerzeichen ausschließlich auf Straßennamen bezieht, die dein Bot sowieso prüft, habe ich keine Bedenken, die automatisch mit zu entsorgen.

Für den allgemeinen Fall (Leerzeichen vor/hinter name, operator usw.) sollte das ein eigener Bot(lauf) sein. Und dessen Regeln sollten wir dann noch einmal getrennt diskutieren.

Bezog sich nur auf Straßennamen, die du sowieso prüfst. Weg ##, Abgang ## usw. sollten also gar nicht enthalten sein. Eine allgemeine Prüfung würde wie bei den Leerzeichen eine eigene Analyse mit eigenen Regeln erfordern.

Eine Prüfung der Straßennamen in der BRD nach mehreren Kriterien mit entsprechender Warnliste wäre natürlich auch nicht schlecht. Das muss aber nicht unbedingt von dir kommen.

Die Größe der Unterteilung hängt natürlich auch von der Menge der gefundenen Fehlern ab. Bei mehr als 10 000 in der BRD wäre 1x1° wahrscheinlich sinnvoll bei ca. 1000 Fehlern in der BRD scheint mir eine Unterteilung nach Bundesländern gut geeignet. Bei Werten dazwischen (z.B. > 3000), könnte man noch die Regierungsbezirke (NRW, Hessen, BaWü, …?) dazunehmen.

Aber wie immer, du kannst am ehesten einschätzen, wie Aufwand und Nutzen sinnvoll austariert werden und wie groß sinnvolle Schwellwerte sind. Kleinere Gebiete sind natürlich für die Kontrolle durch regionale Mapper günstiger.

Apropos heimlich: Hast du deinen Bot schon auf den betreffenden Mailing-Listen angekündigt?

Edbert (EvanE)

Ja, nur um diese geht es: überzählige Leerzeichen (sowie Tabs und sonstige [[:blank:]]) am Anfang oder Ende des name-Tags einer Straße, wenn der Straßenname ohnehin einer Korrektur nach den übrigen Regeln unterzogen wird. Ich werde mal die weiteren Wortmeldungen abwarten, aber bei Bedarf ist diese Erweiterung ganz schnell zu integrieren.

Richtig, aber diese Beispiele waren in meiner Straßennamen-Sammlung gerade leichter zu finden :wink: Dir geht es vermutlich um die Fälle, wo ein Stichweg “zu den Häusern Ameisenstraße 12-14” als name=“Ameisenstraße 12-14” bezeichnet ist. Bevor man aber Mapper mit einem Hinweis dazu einlädt, diese zu verändern, sollte man m.E. klären, ob sie wirklich als Fehler angesehen werden sollten. Schließlich steht dieser “Name” ja oft genug genau so auf einem Straßenschild. (keep right! beispielsweise hat sich in letzter Zeit mit seiner Deutung “falscher” Tags, der dann einige Mapper nur allzu willig gefolgt sind, nicht immer beliebt gemacht.)

Henning (aighes) war so freundlich, auch talk-de einzuweihen.

Echte Namen mit Nummer an Ende gibt es schon einige, wie z.B. im Bereich von Hamburg-Sülldorf und Hamburg-Rissen viele Namen wie “Feldweg 77”. Dabei handelt es nicht nur um highway=track sondern z.B. auch um highway=unclassified.

Da diese Namen aber nur einen prozentual kleinen Anteil ausmachen, würde ich schon einen hohen Anteil fehlerhafter Verwendung erwarten, da das Potential an Stichwegen sehr groß ist, die man fehlerhaft mit Hausnummer benennen könnte.

Wenn man derartig falsch benannte Stichwege finden will, könnte folgender Ansatz helfen:

  • Beschränkung auf highway= service, track, path, footway
  • Nur Wege auswählen, die mit einer Straße verbunden sind, die den gleichen Namen ohne Hausnummer trägt.

Wenn man diese Wege gefunden hat, wäre die nächste Frage, was wir damit machen (egal ob automatisch oder manuell). In gewisser Weise ist die enthaltene Information ja schon sinnvoll, nur wohl nicht im Name-Tag.

Da stimme ich zu. Wenn es dem irgendwo möglich wäre, zu erkennen, dass das Restrisiko einer falschen Ersetzung in einem Falle erhöht ist, so wäre eine Warnung sinnvoll. Ansonsten eher nicht. Wenn jemand das Protokoll ansieht, dürften aber ohnehin einige Fehler auffallen. Nur viele von diesen kann man ohne Ortskenntnis nicht bearbeiten. Daher wäre es hilfreich, wenn man bei jeder Straße gleich einen Link hat, um einen OSB Eintrag an der passenden Stelle zu generieren. Man müsste wohl nur einen Weg finden, um zu verhindern, dass dies von mehreren Mappern wiederholt wird, ohne zu erkennen, dass dies schon jemand vorher gemacht hat.

Dies ist nun auch behoben. Emacs schreibt auf meinem Notebook unter Windoof in der Tat standardmäßig in iso-latin-1-dos. Für den Log-Buffer wird nun buffer-file-coding-system zu utf-8-unix gesetzt, sodaß dieser “ordentlich” kodiert wird. (Aktuelles Log: http://osmac.bplaced.net/wall-e/wall-e-log.txt )

Da der Probebetrieb bislang erfreulich reibungslos verlaufen ist, habe ich die Schlagzahl moderat erhöht: Jeder Änderungssatz enthält jetzt 20 Objekte.

Ja Danke.
Umlaute/ß funktionieren jetzt.
Auch die Leerzeilen und Links bei den Changesets sind jetzt vorhanden.

Schöne Weihnachten
Edbert (EvanE)

So, ich habe mir noch einmal den Verlauf der Diskussion seit dem Erweiterungsvorschlag aus #74 komplett durchgelesen. Ich reduziere den Vorschlag auf die Punkte, bei denen ich keinen grundsätzlichen Widerspruch gesehen habe bzw. die oben als eindeutig/sicher korrigierbar eingeschätzt wurden; ich ergänze ferner die Entfernung von Leerzeichen am Anfang oder Ende des name-Tags. Die übrigen Punkte, insbesondere fehlende und vertauschte Zeichen, vertage ich erst einmal. Diese können wir später wieder aufgreifen, ggf. auch gestützt auf Erfahrungen mit der ebenfalls geplanten Korrektur von addr:*-Tags.

Dieser Erweiterungsvorschlag ersetzt jenen aus #74. In den folgenden Fällen gehe ich von einer falschen Schreibweise von “Straße” (bzw. “-straße”) aus und möchte den jeweiligen Ausdruck entsprechend ersetzen. Wie gehabt geht es ausschließlich um das name-Tag von Wegen mit highway=… in DE (strikt).

  • asynchron betätigte Umschalttaste: STraße, sTraße als isoliertes Wort → Straße

  • ß (kleines Eszet) durch falschen Buchstaben ersetzt (nur die explizit genannten Fälle), jeweils für Straße und -straße gleichermaßen
    [list=*]

  • Stra0e (eine Taste daneben gehauen)

  • Stra9e (zwei Tasten daneben gehauen)

  • Stra-e (falsches Tastaturlayout)

  • Straβe (kleines beta)

  • Straẞe (Versal-ß, großes Eszet)

  • Stra?e (in diesem Forum nicht verwendbarer “replacement character” EF BF BD in UTF-8)

[/*] [*]Leerzeichen am Anfang oder Ende des name-Tags: entfernen, falls ohnehin eine Bearbeitung nach einer der sonstigen Regeln vorgenommen wird[/*] [/list]

In der Praxis hätten die geplanten Erweiterungen momentan folgende Auswirkungen (Edit: ein Programmierfehler verhinderte zunächst die Anwendung der STraße-Regel):

osm-mechedit-fix-strasse run Tue Dec 25 01:04:24 2012
editing way #23447224, http://www.openstreetmap.org/browse/way/23447224
	name tag modified: "Nemmersdorfer STraße" -> "Nemmersdorfer Straße"
	(simulation run; no upload to the database is performed)
editing way #23583482, http://www.openstreetmap.org/browse/way/23583482
	name tag modified: "Ruthenberger STraße" -> "Ruthenberger Straße"
	(simulation run; no upload to the database is performed)
editing way #27139785, http://www.openstreetmap.org/browse/way/27139785
	name tag modified: "Dr. Georg Spohn Strae" -> "Dr. Georg Spohn Straße"
	(simulation run; no upload to the database is performed)
editing way #43591000, http://www.openstreetmap.org/browse/way/43591000
	name tag modified: "Joseph-von-Eichendorff-STraße" -> "Joseph-von-Eichendorff-Straße"
	(simulation run; no upload to the database is performed)
editing way #58882112, http://www.openstreetmap.org/browse/way/58882112
	name tag modified: "Sankt-Barbara-Straβe" -> "Sankt-Barbara-Straße"
	(simulation run; no upload to the database is performed)
editing way #92352722, http://www.openstreetmap.org/browse/way/92352722
	name tag modified: "Gottfried-Keller-STraße" -> "Gottfried-Keller-Straße"
	(simulation run; no upload to the database is performed)
editing way #113783375, http://www.openstreetmap.org/browse/way/113783375
	name tag modified: "Bernhauptener STraße" -> "Bernhauptener Straße"
	(simulation run; no upload to the database is performed)
editing way #144148166, http://www.openstreetmap.org/browse/way/144148166
	name tag modified: "Bettenhäuser STraße" -> "Bettenhäuser Straße"
	(simulation run; no upload to the database is performed)
editing way #144148167, http://www.openstreetmap.org/browse/way/144148167
	name tag modified: "Bettenhäuser STraße" -> "Bettenhäuser Straße"
	(simulation run; no upload to the database is performed)
editing way #171037302, http://www.openstreetmap.org/browse/way/171037302
	name tag modified: "Virgil-Stra0e" -> "Virgil-Straße"
	(simulation run; no upload to the database is performed)

(Das Zeichen im Weg #273139785 ist ein Unicode replacement character, der beim Einfügen in das Textfeld des Forums verlorengeht; jenes in #58882112 ist ein beta.)

Danke, Dir und den anderen Diskussionsteilnehmern ebenfalls.

Moin,

ohne das ich jetzt die ganzen 6 Seiten durchgelesen habe hier meine Anmerkungen zu dem Bot:

  • lt. Rechtschreibung wird nach langem a ß und nicht ss geschrieben. Ist soweit ok.
  • für die obrige Regel bilden die einzigen Ausnahmen Eigennamen oder von Eigennamen abgeleitete Substantive
  • Straßen sind Eigennamen und können daher auch mit ss geschrieben werden.

siehe http://www.duden.de/sprachwissen/rechtschreibregeln/strassennamen#K162

Frohe Weihnachten noch…

Jörg

Hallo Jörg

Straße ist und bleibt ein Begriff (Klassifizierung des Weges als Allee, Straße, Weg, Gasse, …), auch wenn es Bestandteil eines Straßennamens ist. Von daher steht es auch keinem Amt frei, Straße mit ss statt ß zu schreiben. Für den Rest des (Straßen)Namens gelten natürlich deine Aussagen, wobei Abweichungen von der richtigen Schreibweise bei Eigennamen (Personen oder Orte) normalerweise irgendwann korrigiert werden.

Auch dir (und allen anderen) noch schöne Festtage
Edbert (EvanE)

Hallo Edbert,

Nachdem sogar der Duden Ausnahmen (Abweichende Einzelfestlegungen) zulässt,
würde mich schon interessieren wo Du das her hast

Jörg

Ich bin kein Germanist … aber …

Worauf beziehen sich diese Ausnahmen?
Beispiel:
der verdiente Bürgermeister Hans Faß bekommt seine Straße

Korrekt wäre wohl: Hans-Faß-Straße
zugelassene Ausnahme wohl: Hans-Fass-Straße
aber ob die Ausnahme auch gilt für Hans-Faß-Strasse wage ich zu bezweifeln …

Email an Germanisten ist unterwegs :wink:

Hallo Jörg

Der Duden ist nicht das Maß für die Bennung von Straßen, Plätzen und Wegen.
Dafür gibt es einschlägige Verwaltungsvorschriften. Es würde mich sehr wundern, wenn die [Ss]trasse statt [Ss]traße zulassen würden.

PS: In der Schweiz gibt es kein ‘ß’.
Von daher heißen Straßen in der Schweiz Strassen.
(anderes Land, andere Regeln)

Edbert (EvanE)

Dies sollte eigentlich so sein, zumal “Straße” nach alter und neuer Rechtschreibung korrekt ist. Die Frage wäre natürlich, was ist, wenn ein Gemeinderat es in Unkenntnis der Rechtschreibung bzw. Verwaltungsvorschrift doch anders schreibt.

Einen Fall könnte ich mir aber vorstellen, in dem “Strasse” vielleicht sogar ligitim wäre. Es kommt ja durchaus vor, dass Straßen nach bekannten Straßen in anderen Städten benannt werden. Ein extremes Beispiel ist da der Ortsteil Berlin der Gemeinde Seedorf (Kreis Segeberg) mit Straßennamen wie “Unter den Linden”, “Kurfürstendamm”, “Potsdamer Platz”. Was ist nun, wenn eine Gemeinde die Straßen nach denen einer Stadt in der Schweiz benennt, die dort korrekt "Strasse genannt werden? Ist in diesem Fall nicht der gesamte Straßenname ggf. als Eigenname unverändert zu übernehmen?
Für sehr wahrscheinlich halte ich diesen aber Fall nicht, da ich nicht erwarte, dass sich ein Gemeinderat absichtlich dem Vorwurf aussetzt, dass er Straße nicht richtig schreiben kann, auch wenn der Vorwurf unbegründet sein sollte.

Insgesamt gibt es also wohl auch hier ein minimales Restrisiko. Das wäre für mich aber kein Grund, von einer Anpassung abzusehen, solange uns kein Indiz für einen Sonderfall vorliegt. Wenn ein Hinweis vorliegen sollte, sollten wir diesen allerdings möglichst auch entdecken. Deshalb sollte der Bot im Protokoll ein eventuelles Note-Tag deutlich hervorgehoben mit auflisten. Wenn es in Deutschland tatsächlich eine Straße geben sollte, die “Strasse” geschrieben wird, halte ich es ohnehin für sehr wahrscheinlich, dass die in OSM als “Straße” geschrieben ist, weil der Mapper den Sonderfall nicht bemerkt oder nur für einen Fehler auf dem Schild gehalten hat oder ein anderer Mapper (oder xybot) es bereits vermeintlich korrigiert hat.

Hallo Edbert,

zuerst geht es um die Korrektur von “falsch” geschriebenen Straßennamen,
dann um die Anwendung von Verwaltungsvorschriften.

Dazu habe ich auf die schnelle da gefunden http://141.74.33.52/stagn/Portals/0/ANWENDUNG%20DER%20NEUREGELUNG%20DER%20DEUTSCHEN%20RECHTSCHREIBUNG.pdf

Daraus ein Auszug:

Jörg

PS.: Warum das das hier überhaupt anfange:

Im amtlichen Straßenverzeichnis RLP stehen einige Straßen mit ss anstatt mit ß.

In Zusammenarbeit mit unserem Ortsbürgermeister, der Verbandsgemeinde und seit neustem der Kreisverwaltung
wurden die Schreibweisen überprüft. Dabei wurden zwei der Straßen als strasse gewidmet, was damit
auch die amtliche und damit richtige Schreibweise ist.

Jörg

Hallo Jörg

Auch amliche Unterlagen müssen nicht fehlerfrei sein. Z.B. wird in den Straßenlisten von Rheinlandpfalz häufig Straße mit Str. abgekürzt → definitiv falsch. Auch gibt es Abkürzungen im Namensteil, wenn dieser entsprechend lang ist. Ein paar echte Fehler sind auch dabei.

Nenn doch mal bitte Ross und Reiter - ähh - Ort und Straßen. Wenn sich das bestätigt, kann man das als Ausnahme eintragen. Letztlich nehmen wir bei OSM jedoch die Schreibweise, die überprüfbar ist, also insbesondere auf den Straßenschildern stehen.

Edbert (EvanE)