Mapowanie brakujących adresów i miejsc - OSM vs PKW

Państwowa Komisja Wyborcza publikuje listę miejsc gdzie były komisje wyborcze. Można w ten sposób znaleźć obiekty i adresy które są dość istotne a nie są zmapowane w OSM.

Miejsce może być całkiem niezmapowane, lub zmapowane ale bez adresu. Oczywiście, PKW może też mieć błędne dane. Lub błąd jest w moim programie który szukał miejsc komisji wyborczej, nie znalazł jej i orzekł że w tym przypadku to błąd OSM.

Jednak większość raportowanych miejsc to rzeczywiste braki w OpenStreetMap.

Gdyby ktoś chciał takie miejsca poprawić a lubi maproulette to zrobiłem https://maproulette.org/browse/challenges/13921 z próbką 10 miejsc. Jeśli ktoś chciałby skorzystać - mogę wrzucić więcej.

Wyszukiwarka takich miejsc to efekt uboczny prac nad lokalizowaniem komisji wyborczych, który robiłem dla UJ.

Uwaga: program który szuka adresów w OSM jest programem który zrobiłem w ramach zamówienia opłaconego przez Uniwersytet Jagielloński. Poprawianie danych OpenStreetMap nie jest czymś co muszę zrobić, nie zobowiązywałem się że program zlokalizuje miejsca wszystkich komisji wyborczych. Deklarowałem że znajdzie przynajmniej 30% do 50%, program znajduje 70%-80% miejsc komisji wyborczych. Jednak poprawienie OSM w zakresie adresacji poprawi jego działanie.

Poprawiłem kilka adresów w Krakowie, poprawiłem kilka zdalnie i będę dalej poprawiał, jednak pewnie ich jest na tyle dużo że nie ma co się martwić że zabraknie.

W MR jest ich dosłownie 10 bo chcę sprawdzić czy ktokolwiek jest zainteresowany tym tematem i używa MR.

Mogę takie listy wygenerować też w innym formacie (np. lista adresów od PKW z ostatnich wyborów których prawie na pewno brakuje w OSM)

Rozwiązałem parę adresów na Dolnym Śląsku. W jednym punkcie program znalazł złą miejscowość o tej samej nazwie mimo, że adres istniał. Dla pewności dodałem addr:subdivision z gminą.

Myślę, że możesz śmiało dodać wszystkie te adresy na MR, ja na pewno chętnie porobię chociaż te w swojej okolicy.

W takich przypadkach daj znać w tym wątku.

Od teraz jeśli program nie znalazł adresu bo było kilka takich samych w różnych miejscowościach to nie jest to uznawane już za błąd w OSM.

Ponadto, jeśli było kilka komisji w tym samym miejscu to będzie tylko jedno zgłoszenie.

https://maproulette.org/browse/challenges/13921 ma nową porcję, nie jest to jeszcze wszystko (nie chcę dawać tego na ślepo, np. tym razem zauważyłem że duble były).

Przypominam by nie używać Google Maps i innych tego typu źródeł do weryfikacji (strony www danego obiektu są OK), i by nie zakładać że PKW ma zawsze rację - oni też mogą mieć pomyłki lub stare dane.

Jeśli adresy w całej miejscowości są skopane - to warto je też zaktualizować lub utworzyć uwagę i poprosić o pomoc w https://forum.openstreetmap.org/viewtopic.php?id=24265

A jeśli ktoś MR nie lubi a chciałby popoprawiać, to jest tu osobna pula, niezależna od tego co na https://maproulette.org/browse/challenges/13921 jest tutaj pula tego co zdaniem PKW instnieje a takich adresów nie ma w OSM:

Gminny Ośrodek Kultury w Bliżynie, Plac Broel-Platerów 4, 26-120 Bliżyn,
Klub Rolnika w Kuczowie, Kuczów ul. Wysoka 118, 27-230 Brody,
Miejsko-Gminny Ośrodek Kultury w Wąchocku, ul. Kościelna 7, 27-215 Wąchock,
Hala sportowa, ul. Wolności 24A, 28-221 Osiek,
Staszowskie Centrum Medyczne Sp. z o. o. w Koniemłotach, Koniemłoty pl. Ks. Romana Kotlarza 9, 28-200 Staszów,
Ochotnicza Straż Pożarna, ul. Podporucznika Zbigniewa Kruszelnickiego “Wilka” 49, 25-669 Kielce,
Sala gimnastyczna Szkoła Podstawowa Nr 1, ul. Mierosławskiego 1, 11-200 Bartoszyce,
Klub Seniora, Kamińsk ul. Obrońców Westerplatte 8, 11-220 Górowo Iławeckie,
Budynek przy ul. Działdowska 10A, Działdowska 10A, 13-230 Lidzbark,
Sala sportowa Miejskiego Ośrodka Sportu i Rekreacji, ul. 3 Maja 21A, 11-500 Giżycko,
Centrum Kształcenia Zawodowego i Ustawicznego, ul. Mrongowiusza 65, 11-700 Mrągowo,
Gminny Ośrodek Kultury, ul. Rynek 4, 13-340 Biskupiec,
Ośrodek Sportu i Rekreacji, ul. Konopnickiej 13E, 11-320 Jeziorany,
Szpital Pomnik Chrztu Polski, 3 Maja 37 - 39, 62-200 Gniezno,
Dom Ludowy, Chojęcin-Parcele ul. Bukowa 4, 63-640 Bralin,
Miejski Ośrodek Sportu i Rekreacji, ul. Szkolna 2B, 62-600 Koło,
Rodzinny Ogród Działkowy im. J. Słowackiego (świetlica), ul. Działkowa 20, 64-610 Rogoźno,
Gminny Ośrodek Kultury w Wysocku Wielkim, Wysocko Wielkie ul. Kościelna 52, 63-400 Ostrów Wielkopolski,
Siedziba Osiedla Koszyce, ul. Wenedów 8 A-B, 64-920 Piła,

A w jaki sposób Twój program szuka miejsc komisji wyborczej?

W tym momencie? Wyciąga z opisu (takie jak załączone powyżej) nazwę ulicy i nazwę miejscowości - i odpytuje Nominatim/Photon.

Adresy są filtrowane i te ewidentnie błędne odrzucane (jak adres był ul. Zielona 12a to Zielona 13, Zielona 12 czy Czerwona 12a zostaną odrzucne, adresy w innych miejscowościach są odrzucane itp)

Jeśli wróci dużo wyników rozproszonych w różnych miejscach - uznaje to za porażkę programu, jeśli trafi się jeden lub skupione koło siebie - uznaje to za sukces, jeśli nic nie wróci - uznaje że brakuje czegoś w OSM.

Usiłuje sobie radzić też z adresami bez ulic, lub z adresami gdzie nie jest pewne że chodzi o ulice. Ale to idzie dużo gorzej więc takie adresy nie trafiają do “chyba OSM ma problem”.

(w niedawnych wyborach PKW publikuje też adresy w już bardzie strawnej formie, z podziałem na ulicę/numer domu/itp - i za niedługo tą formę też wykorzystam, może będzie to lepszej jakości - jednak wyciąganie ulicy z adresu i tak praktycznie zawsze działa)

Dzięki za wyjaśnienia. Moje doświadczenia z Nominatim były takie, że nie działało ono najlepiej. Wręcz w OSM były dobre dane, ale wystarczyło trochę inaczej zapisać nazwę ulicy i już przy wyszukiwaniu był problem. Myślałem, że może istnieje już jakieś lepsze rozwiązanie.

Nominatim mógłby być sprytniejszy, rzeczywiście np. “B. Prusa 2 Jelcz-Laskowice” nie znajduje a “Bolesława Prusa 2 Jelcz-Laskowice” czy “Prusa 2 Jelcz-Laskowice” już tak.

Photon jest odrobinę lepszy, znajduje trochę więcej adresów (o 0.5%? 2%? więcej).

Część problemów listowanych jest rzeczywiście typu “Nominatim i Photon są głupie a PKW używa dziwnego zapisu nazw”, ale jest ich raczej dość mało według moich testów (dlatego opublikowałem ten zbiór danych jako “prawdopodobne braki w OSM”).