Zauważyłem, że dzisiaj wystartowała masowa fala wandalizmu polegająca na usuwaniu tagów name:ru . Ten atak na OSM jest nieco bardziej zaawansowany niż to, co działo się niedawno, ponieważ teraz dotyczy również głównych nazw: Changeset: 140149701 | OpenStreetMap.
Szybko na kolanie opracowałem w pełni zautomatyzowane rozwiązanie oparte na GitHub - Zaczero/osm-revert: 🗺️ The next generation OpenStreetMap changeset revert tool. To rozwiązanie, w oparciu o proste regułki, sztuczną inteligencję, i ręczną weryfikacją, na bieżąco monitoruje wszystkie nowe zmiany OSM i automatycznie wycofuje te, które wandalizują mapę.
Obecnie analizuję potencjalne, właściwe rozwiązanie tego problemu — nie tylko zwykły patch, którym są reverty. Wierzę, że mógłbym opracować rozwiązanie dla interfejsu API OSM, które analizowałoby zmiany w zestawach w momencie ich napływania (przed dodaniem ich do bazy danych). Jeśli zmiana zostanie uznana za złośliwą, zostanie zablokowana na samym początku. Obecnie brakuje takiego zabezpieczenia, a wprowadzenie go przyniosłoby znaczne korzyści. To podejście korzystałoby z połączenia manualnych reguł (potencjalnie zarządzanych przez DWG), sztucznej inteligencji i ręcznej walidacji. W rezultacie można by utworzyć panel kontrolny, który uproszczałby zarządzanie i oferował monitorowanie sytuacji w czasie rzeczywistym.
Innym skutecznym rozwiązaniem może być rozszerzenie możliwości osm-revert. Mogłoby to obejmować automatyczne filtrowanie zestawów zmian w oparciu o predefiniowane reguły, a także możliwość automatycznego przywracania zmian do określonej daty - zasadniczo kompleksowy interfejs dla DWG. Takie podejście może być nieco prostsze w implementacji i oferować bardziej przewidywalne zachowanie.
Na przykład, funkcje mogą obejmować:
Wybór zakresu czasu
Wyszukiwanie tagów w zestawach zmian
Wyszukiwanie niewłaściwych słów w komentarzach
Przywracanie do daty
Przetwarzanie w tle
Automatyczne zgłaszanie podejrzanych zmian do DWG - hybryda moich 2 pomysłów
To także popieram. Nie ma to za bardzo żadnego pożytku, po za tym dla wandali. Limit do maksymalnie 2 użyć brzmi rozsądnie. Trzeba nie tylko naprawić tą dziurę, ale także przygotować lepszy tooling dla DWG do walki z czymś takim. Przeczytaj też mój 2 pomysł - ma on więcej sensu .
In the case of such massive vandalism, a “simple” rollback is not the best solution.
Offensive comments will remain in history
Modification date of objects will change. This will affect various statistics and tools like StreetComplete
Some users have already tried to rollback by themselves, which made the situation even worse, because many objects were modified several times.
IMHO, OPS’s should temporarily disable the API and do a full cleanup, including history.
I believe the reason for this report is that the user might have reverted a change, restoring a value that was similarly inappropriate due to multiple edits. This situation gave the appearance that the user performing the undo was responsible for the inappropriate content.
Aktualnie nie, jest to w nienajlepszy stanie jakościowym no i nie chcę dawać podpowiedzi wandalowi w jaki sposób filtrowane są dane, ale mogę ci przesłać kod w wiadomości prywatnej.
Thanks, no need to check me
I’ve reverted some of the offending changesets with https://revert.monicz.dev/ before seeing that it is a much more widespread problem and now leaving it to more approriate persons (e.g. the DWG).
Thanks, that is the issue here.
I’ve reverted three changesets that introduced three different (?) profanities on one way..
Two of those reverts did actually put back profanities.
Jeśli chodzi o to, to planuję to opublikować, tylko wymaga to trochę dopracowania. Więc jeśli nie ma pośpiechu (z tego co piszesz) to dam Ci po prostu znać kiedy będzie to publiczne.