Veröffentlichung über die Erkennung von Vandalismus in OpenStreetMap

Hi, da nicht jeder auf TALK-De mitliest, anbei meine Mail [1] von dort:

Seit ein paar Tagen ist eine neue Veröffentlichung über die Erkennung
von Vandalismus in OpenStreetMap online verfügbar. Ich habe wieder
darauf geachtet das es als OpenAccess und damit kostenlos für jedermann
angesehen werden kann. Die Publikation kann hier heruntergeladen werden:
http://www.mdpi.com/2220-9964/1/3/315

Worum geht’s? Im Paper werden unter anderem bereits bekannte & erkannte
Vandalismusfälle nach verschiedenen Kriterien untersucht. Von insgesamt
204 blockierten Usern bei OSM konnten 51 User als wirklicher Vandalismus
erkannt werden. Diese zeigten folgende Eigenschaften (Okt. 2009 - Juli 2012):

  • in 33.3 % der Fälle wurden fiktive Daten erhoben
  • in ebenfalls 33.3% der Fälle wurden lediglich Daten modifiziert
  • bei 43.1% der Fälle wurden nur Daten gelöscht
  • 76.4% der User waren neu beim OSM Projekt
  • in 82.4% der Fälle wurde der Potlatch Editor beim Vandalismus verwendet.

Im zweiten Teil der Veröffentlichung haben wir versucht eine prototypische
Implementierung für die Erkennung von Vandalismus umzusetzen. Wie die
Architecture im Detail aussieht und wie sie funktioniert kann im Paper
nachgelesen werden. Unser Ansatz hat verschiedene Vor- und Nachteile, es
sollte aber eigentlich alles im Paper enthalten sein. MM ist das Paper sehr
gut als Grundlage für weitere Überlegungen und Umsetzungen geeignet.

Von meiner Seite muss ich erwähnen, das ich nicht beabsichtigen werde eine
solche Software live in Betrieb zu nehmen. Mir fehlt einfach die Zeit dies
in einer akzeptablen Art&Weise umzusetzen. Die Idee von dem Paper war nicht
die Entwicklung einer fertigen Software, sondern überhaupt die Wichtigkeit
& erste Überlegungen zu dem Thema aufzuzeigen.

viele gruesse
pascal

[1] http://lists.openstreetmap.org/pipermail/talk-de/2012-November/099886.html

Ist ja eine schöne Sache soweit und wäre als ERgänzung ein nettes zusätzliches Tool, aber statt so einer komplexen Lösung wünschen sich viele User sicher das z.B. vorhandene Tools wie “WhoDidIt” oder “OSMMapper von ito” einfach noch einen Ticken flexibler wären. Z.B. nur Änderungen an einem bestimmten Schlüsseltyp (z.B. Hydranten) über den RSS Feed schieben, oder die Visualisierung der Änderungen noch übersichtlicher ist.

Das Problem daran [1] ist das das irgendwann in einer wikipedia-Admin Problematik ausarte kann wenn man nicht aufpasst. Das es dann so läuft wie bei mapmaker : gruselig! Das einfach jeder User mit den gleichen Rechten schaut (wenn er möchte) was der andere macht ist die bessere Lösung, da es sonst nur die “Produktivität” und Beteiligung insgesamt hemmt. Man darf halt nur nicht das Wort “Käse” in Mails an solche User verwenden wenn derjenige was falsch macht und darüber hier im Forum schreiben da man sonst einen Shitstorm erlebt… :wink:

[1] “As mentioned before, a possible solution could be to allow experienced users to review submitted content of new and, maybe, inexperienced users.”

Mir fehlt in erster Linie ein komfortables Tool, mit dem ich eine größere Mengen an Änderungen nachvollziehen kann.
Ein paar dahingekleckerte Zahlen die mir sagen, dass da so und soviel Nodes gelöscht wurden oder so und so viele Wege modifiziert wurden hilft da wenig. Ich kann ja nichtmal ohne größeren Aufwand nachvollziehen ob und was irgendwann gelöscht wurde.

Und eine Einschränkung dass nicht mehr 100 % sondern nur noch 44 % möglicherweise Vandalismus ist hilft auch nicht viel weiter. Wobei ja nichtmal sicher ist, dass in den verbleibenden 56% nicht ebenfalls Vandalismus enthalten ist?
Übrig bleibt also die Aussage, dass bei 18 Millionen Änderungen 8 Millionen Änderungen möglicherweise Vandalismus is, man es aber von mindestens einem am Tag sicher sagen kann.

Da gefällt mir doch der Ansatz, neue User (auf die 76 % des des Vandalismus zurückgehen) an die Hand zu nehmen und ihnen zu sagen wo Fehler liegen und wie sie die vermeiden können. Auch wenn das Ganze hier als Wikipedia-Admin-Problematik verschriehen ist, hat das ganze in anderen Projekten wo es nicht unter Qualitäts-ÜBERWACHUNG oder KONTROLLE läuft, sondern unter Mentoring oder NeumitgliederBETREUUNG eine ganz andere Akzeptanz.

Auch wenn die ersten paar Änderungssätze geprüft werden nachdem sie in der Datenbank, wird es doch die Ausnahme sein dass ganze changesets reverted werden müssen, sondern die Kommunikation mit dem neuen Mapper, führt zur zukünftigen Vermeidung der üblichen Anfängerfehler.

Wenn jemand 50 Straßen erstellt hat, dann kann man davon ausgehen, dass er Straßen erstellen kann.
Wenn jemand 20 Multipolygone erstellt hat dann kann man davon ausgehen, dass er mit Multipolygonen umgehen kann usw.

Wenn jemand etwas sabotieren möchte, dann macht er sich selten die Mühe erst Arbeit in 2000 Dinge zu stecken und dann alles kaputtzumachen.

Die Chancen eines globalen Betreuungssystems für Neumapper halte ich für nahezu bei null und eines Abseits von osm.org wird nicht viele Teilnehmer haben. Schön wäre die Möglichkeit nach der Anmeldung entscheiden zu können, ob Feedback zu den ersten Änderungssätzen erwünscht ist und das Mapper aus der Umgebung entsprechend reagieren könnten.

Das mit der Begrüßungsmail klingt gut, ggf. auch gleich mit ein paar Freiwilligen Ansprechpartnern aus der Region.

Ansonsten wäre ein graphisches diff-Tool, das den Unterschied zwischen Changesets auch rendern kann, sodass man einfach einen Vorher/Nachher-Vergleich erhält sicher hilfreich.

Hi,

ja, stimme ich dir in beiden Punkten zu. Automatische Erkennung oder Hinweise auf möglichen
Vandalismus ist die eine Sache, aber gute und vor allem verständliche visuelle Tools ist das Andere.

viele gruesse
pascal