Wandalizmy w OSM i im zapobieganie

Nie podejmujcie pochopnej decyzji. Zobaczcie ile błędów jest niezamkniętych na osmbugs, zobaczcie ile uwag na osm.org się starzej bo nie ma kto ich poprawić. Chcecie dodawać jeszcze robotę z przeglądaniem danych? Wtedy już w ogóle starzy mapowicze będą się zajmować tylko przeglądaniem changesetów… Strata czasu. Użytkownicy błędy zgłaszają i są też naszymi oczyma. My musimy na to reagować aby ich zachęcać do zgłaszania błędów. A moderacja spowoduje że:
a) Dodamy sobie roboty
b) Zniechęcimy część użytkowników tym, że zmiany na mapie pokazują się po długim czasie
c) część zmian pewnie nam umknie tak jak błędy i zgłoszenia, a co za tym idzie mapowicz już nigdy nic nie zedytuje.

Trochę zaufania. Człowiek z natury nie jest wandalem, a te jednostki, które niszczą trzeba wyłapywać i banować. Proste.

PS. Siła OSM to właśnie duża liczba mapowiczów. Główny atut osm chcecie przekreślić.

@Dotevo: a ktoś mówi o moderowaniu wszystkich zmian? Bo ja mówię o moderowaniu zmian wykonanych tylko przez początkujących i tylko noszących znamiona jakiegoś psucia (modyfikacja nieswoich danych lub kasowanie). Myślisz, że kolejka tego będzie aż tak wielka, że nowi będą się zniechęcać?

Ale na coś takiego o czym mówisz można zrobić jakiegoś watchdoga. Mail na talk-pl jeśli ktos w changeset usuwa dane, a jego edycji jest mniej niż X. Nie widzę pododu aby zmieniać OSM skoro można zrobić zewnętrzne narzędzia do tego.

Zgadzam się, pozostaje tylko to narzędzie stworzyć :wink:

Poruszamy temat zbyt ogólnie o “nowicjuszach” i co zrobić z ich edycjami.
To tak jakbyśmy mówili o zbawieniu całego świata.
Ja, na przykład chciałby wiedzieć,

  • ilu nowicjuszy przybywa nam miesięcznie?
  • ile jest tych nowicjuszy dokonujących mniej lub więcej niż 10 edycji w pierwszym miesiącu?
    Dopiero tego typu informacje i podobne statystyki mogą pomóc w podjęciu decyzji, jakie uruchomić mechanizmy i związane z tym aplikacje.

Dotevo, lepiej leczyć chorobę czy jej zapobiegać? Bugs i notes to też post factum i w dodatku trzeba na ten błąd natrafić, czyli albo podczas przeglądania/mapowania albo boleśniej gdzieś w terenie, gdy nas dane zawodzą, bo coś jest źle lub czegoś brakuje.

Jak już powiedziałem, ludzie równie mocno zniechęcają się tym, że mapa końcowa jest nieprzewidywalna i niegodna zaufania. Dotevo, wydaje mi się, że patrzysz na OSM za bardzo z pktu widzenia mapowicza, który używa OSM, a nie końcowego użytkownika, którego nie interesuje nic a nic mapowanie. Chcemy tworzyć mapę dla nas samych, dla naszego wąskiego grona, czy dla innych także? Mapowicz-użytkownik wie czego się spodziewać, jest bardziej tolerancyjny dla błędów, wie, że można je poprawić. Użytkownika-niemapowicza nie interesują takie sprawy - on chce być pewien, że dane go nie okłamują, a jeśli raz, drugi się na nich zawiedzie, to powie, że to szajs. Nie dość, że sam nie będzie używał, to odradzi innym. Nie wiem jak Ciebie, ale mnie najbardziej boli to, że potencjalny użytkownik mało poważnie traktuje OSM. Bez zaufania do OSM, produkty na osmowych danych nie będą pierwszym wyborem, tylko którąś tam alternatywą po znanym Google Maps, Nokii, Automapie i UMP.

Ale czemu sądzisz, że jeśli w jakiejś formie będzie prowadzona moderacja, to Ci ludzie odejdą? Jeśli mówisz, że największą zaletą OSM jest jego otwartość, to trochę mi przykro, ponieważ uważam, że cały projekt ma cały szereg zalet, a otwartość jest tylko jedną z nich. Myślę, że nowicjusze byliby w stanie przełknąć chwilę oczekiwania na pojawienie się zmian w zamian za większą jakość danych końcowych. Poza tym - nie myl ilości z jakością.

Prawdę mówiąc, są i starzy wyjadacze, których zmiany noszą znamiona może nie wandalizmu, ale głębokiej lamerii i/lub upojenia alkoholowego.

@ppece,

Całkowicie się z Tobą zgadzam.
Tylko poważni, końcowi użytkownicy powinni być celem.
Wielu profesjonalistów, traktując OSM poważne,oraz widząc OSM jako realną przyszłość, może się zaangażować i dużo wnieść w rozwój OSM mapy.

Około 150 w PL

Abakus sobie jakoś radzi z kontrolą danych. Czyli jeśli komuś zależy na zweryfikowanych danych to się da.
http://mapa.abakus.net.pl/watcher/

Przykro mi, że każdego potencjalnego mapowicza traktujecie jak wandala. Prosze bardzo, skoro uważacie, że kontrolowanie wszystkich zmian nowych użytkowników nie jest trudne to zacznijcie przeglądać zmiany w PL. A potem sprawdzie ile czasu, który mógł być poświęcony na mapowanie straciliście. Dodam, że wszystkich błędów nie wyłapiecie, bo błady w stylu dodanie oneway jest nierealne do sprawdzenia nie na miejscu, a więc nie unikniemy błędów, a stracimy duzo czasu.

OK.
@Dotewo,
Do czego właściwie ma służyć OSM?
Bo może tu zachodzi nieporozumienie co do celu.

Jeśli to ma być rzetelny GPS’owy przewodnik po terenie, to kontrola edycji jest niezbędna.
Nikt nie chce wylądować w nocy w ziemniakach, w terenie nieznanym, bo ktoś, pociągnął sobie dla zabawy “kreskę”.
Oczywiście, Zibi to poprawi, ale ja będę miał auto do remontu. :frowning:

PS. Na Wikipedii, wandalizm, może spowodować, że ktoś bazując na tej informacji wygłupi się w towarzystwie.
Na OSM, wandalizm może spowodować tragiczne skutki.

OSM to dane i dane posiadają błędy nie ważne czy są zbierane przez firmy, czy przez mapowiczów. Za to jeśli ktoś zobaczy błąd ma szansę go szybko naprawić. Swoją drogą miałem rozmowy z firmami i urzędnikami na gisforum kilka dni temu i te rozmowy nie wyglądały w stylu “Ale w dużo błędów tam macie” tylko “Świetne mapy. Są tak bardzo dokładne, że chcemy ich używać”.

Na mapach urzędowych są błędy, na mapach googla są błędy, na mapach navteqa są błędy i będą zawsze. Na naszych mapach jest mniej błędów bo więcej ludzi na nie patrzy, więcej ludzi je naprawia i kontrolowanie zmian nie ma sensu. Skończymy jak Google Maps gdzie takowa kontrola jest lub jak UMP. UMP jest dokładne i chwali się jakością map ale też mają błędy. Jeśli ktoś chce kontroli mapowiczów to proponuję przejść do UMP tam to jest.

PS. Nie chcę dyskryminować UMP, ale po co OSM ma być takie jak UMP. lepiej jak projekty są różne i żyją swoją metodą.

Nie przesadzasz trochę? Każde mapy mają błędy/nieaktualności (w OSM jest chyba więcej tych pierwszych i mniej tych drugich), nikt rozsądny nie używa map na ślepo.

Akurat ja robię na własny użytek (wprowadzam głównie dane które wykorzystam we własnym projekcie). Jeśli chodzi o “poważnych, końcowych użytkowników” to wszystko jedno mi czy używają map google, binga, OSM czy jeszcze innych. Dla mnie główną siłą OSM jest fakt iż normalny informatyk może te dane wykorzystać (na początku napisałem “człowiek”, ale typowa osoba sobie z obróbką danych nie poradzi).

A co do wersji przejrzanych - miałem z tym kontakt w Wikipedii i nigdy więcej nie będę już brał udział w walce z wielomiesięczną kolejką nieprzejrzanych edycji.

Poza użytkownikami ajfona, tak? :wink:

Ja mówiąc o wprowadzeniu danych w tryb coś jak stable/testing/live nie miałem na myśli moderacji każdego changesetu, więc przeciwnie - miałem na myśli domyślą akceptację jego zmian (jak w przeciągu tygodnia nikt nie zmoderuje czy nie wywali to wchodzi), jakby trójstopniową i dla mniej zaawansowanych userów (początkujących, bez jakiejś akceptacji itd).
Wyglądałoby to mniej więcej tak że dane każdego mapowicza początkującego szłyby do live, po pewnym czasie wchodziłyby do testing, a po jakimś tam czasie do stable - tu nawet można by zrobić jakieś zbiorowe update czy coś. Zmiany innych userów wchodziłyby od razu do testing. Używając danych można by sobie wybrać z jakiego “zestawu” chcemy korzystać - albo te zestawy oznaczać jakimiś tagami itd - to już technikalia.
Do przerobienia byłby model przepływu changesetów przez te poziomy. Szczególnie edycji danych i konfliktów.
Temat wg mnie warty dla projektów dla których bardziej chodzi o jakość danych, a mniej o szybkość ich pojawiania się - np w przypadku danych do routingu trasy, gdzie jest mniej istotne że godzinę temu pojawiła się nowa uliczka residental w Pcimiu Dolny, a większa obawa jest że ktoś dorysuje nową fikcyjną autostradę z Pcimia do Suwałk przez Wrocław - i to się wgra automatem na kilka tyś nawigacji np. Nie ma też problemu przecież aby w przypadku oddania takiej autostrady i jej edycji przez nowicjusza jakiś zaawansowany edytor commitnął jego zmiany szybciej niż “ustawowo” do testing.
Model jest sprawdzony w Debianie i funkcjonuje od wielu lat. Ja uważam że jeżeli OSM chce podnieść jakość swoich danych zachowując jednocześnie otwartość i szybkość nanoszenia - to jest to jedna z lepszych dróg do celu.

Ooo wypraszam sobie :wink:

I takie coś właśnie mi się podoba. Czyli stabilizacja mapy poprzez usuwanie wątpliwych danych, a nie moderowanie. Czyli synchronizacja z mapą live raz w mc i przez cały miesiąc wszystkie błędne changesety (lub wandalizmy są usuwane). Coś w stylu rozwoju Linux Kernel. Ale zanim to będziem miało sens potrzeba przynajmniej kilka razy więcej edytujących.

Słaby argument. Co oni monitorują? Hydranty i pikietaż? Czyli obiekty punktowe, których w dodatku jest mało.

Edit: A przepraszam, lasy jeszcze monitorują.

Monitoruj proszę wszystkie drogi w PL pod kątem takich Perimexów :stuck_out_tongue:

No jeśli wandalizmy już są problemem to nie wiem czy potrzeba czekać aż będzie ich więcej :slight_smile:
Poza tym taki model nie powoduje że nie możesz używać danych live, ale dane które są nowe i wrażliwe trafiają z większym opóźnieniem i jest szansa że jeśli są złe to zostaną usunięte zanim wejdzie ich commit.

No właśnie, do czego? Do nawigowania? Sprawuje się całkiem nieźle. Wylądowania w ziemniakach nie obawiałbym się nic a nic, gdyż prócz patrzenia w monitorek nawigacji, warto patrzeć na drogowskazy i znaki.

Pozwolę się nie zgodzić. Kontrola edycji, w postulowanej formie zatwierdzania zmian dokonanych przez użytkowników, nie jest rozwiązaniem. Bardzo szybko spowoduje zapchanie się kanału zatwierdzającego, spowoduje też podział kastowy na równych i równiejszych. Przerabiałem to na innym projekcie, wolałbym nie powtarzać tego błędu po raz kolejny.

W zupełności wystarczą narzędzia sprawdzające, o których pisze Dotevo, wystarczy też kilku “cerberów”, którzy w miarę swoich możliwości, i w miarę na bieżąco, obserwują zmiany. Jeśli jakichś narzędzi/filtrów brakuje — należy je napisać. I używać.

Szczerze mówiąc, z wandalizmem się nie spotkałem, co najwyżej z niedociągnięciami, bądź pomyłkami wynikającymi z niewiedzy. Albo z niechlujstwa, spowodowanego czy to dużym uproszczeniem, czy nieskalibrowanym podkładem.

Przykłady zmiany dróg wg ich statutu (powiatowe, gminne), a nie przejezdności, zdarzały się, zdarzają i będą zdarzały dopóty, dopóki pojawiają się nowi użytkownicy. Nie oczekuj(cie), że każdy przed rozpoczęciem mapowania przeczyta całą wiki, czy przejrzy forum → tej wiedzy jest po prostu zbyt dużo.

Cóż… Równie tragiczne skutki może spowodować używanie map googla, targeo, czy innej Automapy — skąd pewność, że zawarte tam informacje są prawdziwe? Tylko dlatego, że Google to marka? (Bardzo dobra w moim opdczuciu) Tylko dlatego, że za Automapę zapłaciłem? Tak, to powoduje wewnętrzne odczucie/uczucie, że skoro zapłaciłem, to mam prawo oczekiwać, że są wiarygodne. Ale to tylko moje odczucie.

G.

Jako że ostatnio próbowałem się bawić keepright’em (chociaż sukcesów nie odniosłem), to w tym temacie rodzą mi się następujące pomysły:

  1. Zrobić aplikacyjkę, która by czesała nowo wrzucane changeset’y
  2. Aplikacja by dla danego changeset’a odpalała walidatory JOSM / keepright
  3. Każdy changeset byłby oceniany pod kątem kryteriów - staż, ilość edycji, liczba błędów wykrytych przez walidatory. Dodatkowo pewnie można by dodać jeszcze parę kryteriów (np. zmiana dużej liczby tagów dla takiego Perimexa, czy coś takiego)
  4. Generuje listę top-X podejrzanych change-setów / podejrzanych użytkowników

Jest tu parę wyzwań związanych np. ze sprawnym wyznaczaniem kontekstu (obiektów, które należy obrać z bazy, by właściwie przeprowadzić walidacje), ale wydaje mi się to ogarnialne.

Szczególnie raport top-X użytkowników wydaje się pomocny, bo wskaże, komu trzeba jeszcze pomóc w mapowaniu i gdzie najwięcej można skorzystać.