Komische Nutzer entdecken

In Schweden gibt es gerade eine Vielzahl sehr komischer Änderungssätze - von Nutzern, die sehr lange nicht aktiv waren und dann plötzlich sehr viele Changesets in sehr kurzer Zeit generieren. Vieles davon sieht nicht wirklich nach manuellem Mapping aus und wir wissen nicht, was da vor sich geht.

In einer Facebookgruppe hatten wir eine Diskussion, wie man sowas entdeckt und sind auf folgende Arbeitsmethode gekommen. Ich hab Sie ins deutsche uebertragen, in der Hoffnung, dass wir noch weitere interessante Anregungen kriegen.

Wer den Text bis zum Ende liest, sieht dass wir uns an bereits an die Dataworkinggroup gewendet haben.

Ein guter Ausgangspunkt ist
https://osmstats.neis-one.org/?item=countries&country=Sweden schwedische “Top Mapperliste”. Maschinelle oder komische Bearbeitungen landen meistens nach recht kurzer Zeit in dieser TOP Liste.
Einzelne Nutyer kann man nun detailierter anschauen. Um das Beispiel leichter begreiflich zu machen, nehmen wir den Nutzer “coach-potato” der im Moment die TOP Liste anfuehrt.
Ein Klick auf den Nutzernamen fuehrt uns zu:
https://hdyc.neis-one.org/?couch-potato
Wir sehen sofort: Sehr wenig Aktivität und plötzlich 4411 changesets am 28. oktober. Klicken wir auf den “Detail” link bei “recent changesets” kommen wir hierhin:

https://resultmaps.neis-one.org/osm-suspicious?uid=12197966#6/61.825/16.578

Hier sieht man mehrere hundert der letzten Änderungen die der Nutzer gemacht hat und wir können Details zu den Changesets aufrufen indem wir entweder auf einen Marker oder oder auf “öffne changeset in OSM” klicken. Macht man dies mit einigen Changesets kann man leicht Muster erkennen und was gut und was schlecht ist analysieren. (Manchmal gibt es Apps wie Streetcomplete etc, die erstmal viele Changesets mit wenigen Details enthalten - aber meistens unproblematisch sind. Man muss also ein wenig die Gesamtheit betrachten).

Entdeckt man nun etwas komisches geht man wie folgt vor:

  • man öffnet ein beliebiges Changeset was etwa so aussehen sollte: https://www.openstreetmap.org/changeset/94947709
  • Der erste Schritt ist das changeset zu kommentieren, das tut man indem man in der linken Spalte einen höflichen Kommentar mit konkreten Fragen eingibt. Das gibt den Nutzer die Möglichkeit sich zu äussern. Der Kommentar ist wichtig, denn bei der Bewertung von etwaigen Massnahmen ist es wichtig zu wissen, ob und wenn ja wie der Nutzer antwortet.

Antwortet der Nutzer lange nicht - oder ist man sich seiner Sache sicher kann man die Profilseite des Nutzers aufrufen, in dem man in der linken Spalte auf den Nutzernamen klickt. Dass fuehrt einen hierhin: https://www.openstreetmap.org/user/couch-potato

Hier gibt es ganz rechts einen Link “diese Person anmelden” - und man kann das Forumlar ausfuellen und eine kurzen Satz auf englisch schreiben.

Wichtig ist, dass man damit nichts komisches auslöst - man teilt den Verdacht lediglich einer Gruppe ehrenamtlich arbeitender Menschen mit, die ein Auge auf solche Probleme haben.

Danke für den Tipp!

Zur Info:
https://lists.openstreetmap.org/pipermail/talk-se/2020-December/003928.html

Ich hatte das bereits in der Wochennotiz gelesen. Ich finde das sehr strange und ziemlich gruselig! Nicht nur, dass da jemand die Import-Richtlinien umgehen will, sondern auch noch die kriminelle Energie dazu aufwendet, eine Vielzahl anderer OSM-Nutzerkonten dafür zu hacken. Und mir fällt kein Grund ein, warum und zu welchem Zweck man solches tun möchte.

Ich will das nicht schönreden, aber 2 Sachen:

  • Dass Benutzeraccounts gehackt wurden ist eine ziemlich naheliegende Annahme aber (noch) nicht bewiesen
  • Importrichtlinien: ja, in der Masse ist das auch wieder sehr naheliegend, aber auch nicht bewiesen.

Fakten sind, soweit ich das überlicke: es wurden die derb unvollständigen Daten von Lantmäteriet-Dingsi abgemalt. Wie und warum ist aber zum jetzigen Zeitpunkt nicht bewiesen.
Ein Revert ist imho gerechtfertigt, weil die Daten unsauber sind und keinen wenig Mehrwert bringen, nicht weil da irgendwas illegal oder was auch immer ist.

Also entschuldige Bitte: Die Daten sind weder derb daneben noch in irgendeiner kontraproduktiven Weise unvollständig - jedenfalls in keinem der rund 2500 Changesets die ich mir angesehen habe, weil mein Mappinggebiet stark betroffen war.

Ganz im Gegenteil tragen Sie ja (vollkommen absurderweise) zu einer ganz wesentlichen Qulitätssteigerung aus Anwenderperspektive bei.

Die Lantmäterietdaten sind die besten Daten die wir nach survei vor Ort bekommen können, sie sind völlig legal uebernehmbar und werden von vielen Menschen in auch auf der importmailingliste diskutierten Verfahren auch direkt aus den Vektordaten einzeln importiert. Dagegen gab es keine Einwände.

Was mich an dem Ganzen Prozess am meisten fragwuerdig stimmt, ist die komische Betriebsblindheit und Ansprueche die mache zu befallen scheint. Es nuetzt doch nichts das Blatt weis zu lassen, weil man es besser fuellen könnte, wenn es keiner macht - eine weise Karte ist unbenutzbar. Die Information “da in 100m ist ein Waldweg” ist halt sinnvoller, als zu wissen, das in 3 Kilomter einer ist, dessen breite 3,4 beträgt, mit feinem Kies gedeckt ist und auf dem Rollstuhlfahrer nicht gut fahren können".

Also: Wenn Du oder irgendwer einen Weg kennt, solche Informationen in dieser Qualität zu importieren - und dass ohne die organisatorischen Merkwuerdigkeiten - wuerde ich sagen: Her damit! Alleine, dass es nie Wegedoppel (oder placedoppel) gibt, nie die Arbeit anderer Mapper in Mitleidenschaft gezogen wird und wirklich nur Elemente beigetragen wurden, die es vorher einfach garnicht gab, ist an sich eine erstaunliche Leistung und ein Merkmal, dass im Vergleich zu anderen Imports sehr positiv ins Auge fällt.

Zu den Daten selbst müßte man erst mal die Widersprüche aufklären. In der offiziellen Mail heißt es, die Daten wären unzusammenhängend und nicht an existierende Wege angeschlossen. Du schreibst, sie wären gut, das widerspricht dem. Was ist jetzt genau der Fall?

Es ist nicht das Ziel von OSM, die Karte möglichst schnell irgendwie voll zu kriegen.

Das wichtigste Gut von OSM ist es, daß die Daten frei von Rechten Dritter sind und absolut unangreifbar sauber. Daten aus zweifelhaften Quellen müssen entfernt werden, da sie das ganze Projekt in Frage stellen. Falls wirklich gehackte Accounts benutzt wurden, wäre das eine Straftat - und allein schon der begründete Verdacht ist für mich Grund genug, alles was damit zusammenhängt rückgängig zu machen. Kriminelles Vorgehen hatten wir AFAIK bisher noch nicht im Zusammenhang mit OSM, aber ich denke so etwas auch nur ansatzweise zu tolerieren würde die Datenbank genauso vergiften wie Daten die von Google kopiert sind. Abgesehen davon daß es einen Präzedenzfall schafft und jedem einen Freibrief ausstellt, in Zukunft jegliche Importguideline zu ignorieren/umgehen.

Bei den Stichproben (ca. 3-6), die ich mir am 4.12. gezogen habe, waren in jedem CS Wege eingezeichnet, die sowohl in Lantmäteriet als dann auch in OSM im Nichts beginnen und im Nichts enden. Wo man allerdings anhand Luftbildern deutlich erkennen konnte, dass die noch weitergehen müssen.
Ob das gut ist, dass man einen Flickenteppich importiert, den dann andere korrigieren (oder eben nicht…) kann ich nicht beurteilen.

Also Fakt ist, dass einfach grössere Objekte uebernommen wurden.

Im Sommer gab es einen gleich gelagerten Fall, in dem Ortsnamen importiert wurden (der komischerweise zu keinerlei Aktionen seitens der DWG fuehrte). Je Changeset ein Ort. Der Ortsname ist korrekt getaggt und befindet sich an der gleichen Stelle, an der die Landmäteriet den Schriftzug des Namens angebracht hatte. Also beispielsweise nicht in der Ortsmitte (wo er ja Details ueberdecken wuerde) sondern oft leicht versetzt auf einer Ackerfläche etc. Ist das jetzt schlecht oder gut?

Genauso ist es mit Waldwegen. Je Changeset wurde in der Regel ein Waldweg importiert - und wenn schon andere Wege da waren, an diese auch angeschlossen. Die Waldwege tragen lediglich das Tag “highway=track”, was ich ehrlich gesagt nicht als “unvollständig” empfinde, da ich beim Luftbildmappen auch keine andere Informationen hatte.

Es gibt auch Changesets in denen an einer äusseren Ecke angefangen wurde und nur ein “loser” Waldweg ohne jeglichen Anschluss an das Wegenetz importiert wurde. Teilweise sieht man deutlich, wie das eine fortlaufende Arbeit war - und später neue Wege hinzugekommen sind, so dass wieder ein Netz entstand. Da der/die/das Verursacher ja aufgrund seiner äusserst merkweurdigen Arbeitsweise immer wieder gestört wurde, kann man sich kein Urteil bilden, ob das nur ein legitimer Zwischenstand oder Scheisse ist.

Andere Beispiele die genannt wurden, sind Strassen, die die Landesgrenze ueberqueren, wo nur ein Teilstueck das innerhalb eines bestimmten Landes liegt. Da die Daten der Lantmäteriet nur landesweise vorliegen, ist das jedenfalls einfach zu erklären und verständlich.

Beispiele wo die Daten parallel zu einem schlechter gemappten Weg liegen oder in sonst irgendeinerweise Konfliktpotential mit der ARbeit anderer Mapper generieren, hat trotz mehrfacher Aufforderung niemand gefunden und sind mir völlig unbekannt.

Was die Auflösung angeht: Die Vektordaten der Lantmäteriet haben eine Auflösung, die zwar nicht dem technischem Maximum entspricht, allerdings mindestens mit manuellem Nachzeichnen vergleichbar ist.

Um es nochmals in aller Deutlichkeit zu sagen: Das ist hier der Fall. Es werden Rechte von Commitymitgliedern (also nicht dritten) verletzt, den unter scheinbar merkwuerdigen Umständen Edits “in die Schuhe” geschoben werden.
Die Lantmäteriet hat die Daten zur völligen freien Verwendung auch ohne Namensnennung freigegeben und in einem Dialogprozess sich mit der Community abgestimmt. Das man auf die Nennung des Urhebers verzichtet ist auf eine Anregung der Openstreetmapgemeinschaft (vertreten durch Wikimedia Schweden) zurueckzufuehren.

Völlig dacore - aber scheinbar ist mein Punkt untergegangen.

Es ist mindestens ungluecklich, dass die Qulität und Quelle der Daten in Frage gestellt werden. Die organisatorischen Umstände reichen völlig aus, um ein Handeln zu rechtfertigen.

Es ist nähmlich aus meiner Sicht absolut Wuenschenswert, wenn Menschen sich die Muehe machen, die Karte aus der legalen Quelle Lantmäteriet (entweder die bereitgestellten Kartenbilder oder auch die Vektordaten) zu verbesseren - und die möchte ich auf keinen Fall verunsichern.

Gleichzeitig ist es interessant, was da eigentlich warum passiert ist. Und ich nehme mir die Freiheit, den Wunsch zu haben, dass wir die aufgewendete Energie in den richtigen Formen konstruktiv fuer das Projekt nutzen können.

Nein, nicht irgendwie. Aber die amtlichen topografischen Karten sind nicht irgendwie - sondern hier wurde mit Sorgfalt gearbeitet und letzlich ein grosser Schatz zu verfuegung gestellt.

Und man darf sehr wohl die Meinung vertreten, dass es eine gewisse “Grundstruktur” braucht, um einer Separierung der Kartengebiete entgegenzuwirken. Viele Apps wie z.B. Streetcomplete funktionieren ja nicht, wenn es garkeine Objekte gibt - und es kann auch nicht unser Ziel sein, in einigen Gebieten die Gullideckel zu kennen und in anderen nichtmal die Seen oder kleineren Strassen

Daher wehre ich mich gegen die Diffamierung die Karte “irgendwie” voll zu kriegen und vertrete die These, dass eine gemeinsame Aktion die etwas gegen weise Flecken tut, wuenschenswert und dringend notwendig ist.

Es ist eine Mathematische Wahrheit, im Mittel 50 Mapper in einem Land mit einer grösseren Grundfläche als Deutschland es einfach nie schaffen können, mit den dort angewendeten Methoden ein ähnlich annehmbares Ergebniss zu erzielen.
**
Und Openstreetmap möchte laut Missionstatement eine Karte der Welt erstellen** - und nicht eine Sammlung Detailkarten ohne Verbindung.

Interessanter Fall, das ganze. Für mich sieht das eher so aus, als könnte man das geplant übernehmen und dann, unter Klärung des Ablaufes dann die Restfehler angehen. Nahe Straßen, die nicht verbunden sind, lassen sich ja relativ einfach erledigen. Die Sachen einfach nur in die Datenbank reinstopfen ist imho zu wenig, aber im großen und ganzen bin ich hier bei Skinfaxi. Die Daten sind vorhanden und sollten in einem vernünftigem Import verwendet werden.
Zu dem was Nop sagt: Naja, die Daten selbst können ja gut sein, aber wenn ich sie eben einfach nur reindumpe sind die nirgens verbunden. Das macht jetzt die Daten nicht schlecht, sondern den Import(er), der hier zu faul ist/war.

Wenn ich mich für OSM interessiere, das aufmachen und dann https://www.openstreetmap.org/changeset/94947709#map=13/63.3152/14.3197 so etwas sehe, dann ist das etwas deprimieren und ich mache wieder alles zu. Hier fehlt im Grunde alles. Ich mein, cool, wenn man zwei Wochen Urlauben machen will und die Zeit mit kartieren verbringen möchte, aber seien wir mal realistisch: das macht (wahrscheinlich) niemand. Da hat man Touristen, die im vorbeifahren vielleicht ein paar Sachen eintragen, wenns sie wieder zuhause sind, und der Rest?

Wenn allerdings mehr da ist, dann tut sich auch was. Wenn zumindest die Straßen da sind (dazu müssen die natürlich vorhanden sein), dann kann ich zumindest das Routing mit OSMAnd machen. Und vielleicht habe ich dann auch interesse doch mal Sachen einzutragen.

In Deutschland und Österreich tun wir uns recht leicht mit der höchsten Mapper / Land Ratio.

EDIT: Skinfaxi hat recht, hier geht es nicht um die Qualität der Daten von dem Import, sondern um das auffinden komischer Nutzungen.

und ich wollte nur nochmal klarstellen, dass ich den Klärungsprozess mit initiert habe, in verschiedenen Foren auf die Aktivitäten aufmerksam gemacht habe - und wie ihr unschwer erkennen könnt ja auch fuer das deutsche Forum einen Beitrag geschrieben hab, in dem es gerade darum geht, diese komischen Prozesse zu entdecken und anzumelden.

Dass das so nicht geht - also mit Konten deren Herkunft nicht geklärt ist und ohne Antworten in Changesets osv… - ist völlig klar und ich bitte in der Diskussion klar zu unterscheiden, was ich von den beigetragenen Daten und was ich von den Umständen unter denen die Daten den weg in OSM gefunden haben, halte.

Ich hätte ja wohl kaum Zeit und Energie verwendet, wenn ich der Meinung wäre, alles wäre in Ordnung :slight_smile:

Skinfaxi, Ich stimme dir zu.
Im Gegensatz zu der Vielzahl Leute, die kaum über ihre Provinz hinauskommen, bin ich gerne in der Fernen Welt unterwegs, und brauche dort Karten. Wie oft habe ich schon über unsere Karte gelästert, die im hoch-qualitativen Weiß erstrahlt!