Ustalenie związku między place=* a terytem

Przeglądałem wczoraj dane OSM porównując je do terytu i wyszło mi, że rozbieżności występują w przypadku 11 tysięcy miejscowości. Znakomita większość to jakieś małe wioski do 100 adresów. Części z tych danych nie ma, ale cześć jest błędnie oznaczona jako przysiółki i inne części miejscowości podczas gdy z teryt-a wynika, że są odrębnymi miejscowościami.

Jako, że słownik typów miejscowości to zamknięty zbiór proponuję ustalić mapowanie tego zbioru na zestaw tagów, co pozwoli później napisać jakiś raport ułatwiający poprawienie tych danych, no i przede wszystkim jak będą jasane wytyczne łatwiej będzie tych danych używać.

Co myślicie?

Robiąc granice wsi, zauważyłem dużo rozbieżności pomiędzy oznaczeniami co jest wsią a co przysiółkiem według Emuia i Wrota Mazowsza.
Dotyczy to także terytów, których nie dodawałem, uważając, że szybciej będzie dodać je automatem. Jeśli to możliwe to proszę o dodanie ich w południowym woj. mazowieckim i północnym kieleckim. Dlatego nie jestem pewien czy nie pominąłem jakichś wsi traktując je jako przysiółki.
Dopisując linki do Wikipedii, zauważyłem, że też mają błędy w określeniu, czy to jest wieś/osada/przysiółek.
Powyższy raport byłby bardzo pomocny.

Troche boje sie zawsze kiedy proponowane sa narzedzia do raportow porownujacych place= do TERYTu. Raporty, a w szczegolnosci mapki gdzie cos jest kolorowane na czerwono i zielono maja duzy potencjal destrukcyjny bo ludzie chca zeby ich obszar zrobil sie zielony nie zwazajac na to, czy ma to sens (zob. przypadek mapy duplikatow wezlow w 2011, albo mapa kompatybilnosci z ODbL – a nawet raporty abakusa ktore nadal co rzadsze wartosci tagow nazywaja niepoprawnymi mimo, ze ustalono, ze lista wartosci nigdy nie jest zamknieta). TERYT jest znany z posiadania bledow. A place= to nie boundary=administrative i nie ma powodu zeby odzwierciedlalo administracyjnie ustalone “fakty”. Jesli potrzebne sa w OSM wartosci z terytu, to moze zrobic to w oddzielnych tagach?

OT
Andrzej - napisałem te tabelki, żeby wyłapać historie typu building=2a albo building=stacja paliw… z resztą na czyjąś prośbę - nie był to mój pomysł. Dodam do nich stosowną informację i zmienię nazwę na ‘…nietypowych…’, a jak po raz kolejny będę się musiał z nich spowiadać to je usunę… skoro są złe i tylko wprowadzają w błąd.
/OT

Skoro ten pomysł jest zły to może masz inny pozwalający na wyłapanie i naprawę tych 11 tysięcy braków lub błędów (bo chyba się zgodzisz że oznaczenie jako część miejscowości czegoś co jest autonomiczną miejscowością jest błędem)

Place to nie administrative, ale idąc tym tropem highway to nie droga itd…

Teryt oczywiście ma błędy, ale jest to jedyny taki oficjalny spis i nic innego nie będzie - lepszy taki niż żaden i pełna uznaniowość w przyznawaniu tego tagu, bo koloryzując ktoś zacznie oznaczać Błonie, Żyrardów i Grodzisk Mazowiecki jako hamlet, bo dla niego Warszawiaka to jest prowincja… Im mniejsza uznaniowość tym mniej miejsca na błędy, bardziej użyteczne dane i większa możliwość kontroli ich poprawności.

Na terycie pracuje coraz więcej służb i instytucji (bo taki mają obowiązek) i te służby takie błędy wychwytują i zgłaszają do GUS-u, a teryt jest poprawiany i cyklicznie wydawane są nowe wersje.

Zawsze można też ustalić dowolny sposób na oznaczenie w danych rozbieżności z teryt wynikających z błędu w terycie (teryt:note=błąd w teryt - ten przysiółek jest faktycznie miejscowością) co oznaczałoby na takiej mapie punkcik na zółto czy jasnozielono…

Ja wiem, rozmawialismy kiedys o tym na IRCu, i zgodziles sie, ze nie sa to niepoprawne wartosci. Wiec czepiam sie, ze strona mowi co innego. Gdyby mowila 1=2 tez bym sie czepial.

Wracamy do przypisywania na sile oficjalnych klasyfikacji. Mowisz, ze cos zostalo oznaczone jako czesc miejscowosci, czyli jak? autonomous=no? hamlet to jest male miejsce zamieszkale przez ludzi.

Ale akurat highway to droga, a place w geografii to toponim, nazwane miejsce zamiszkale przez ludzi. TERYT nie jest baza takich miejsc, a baza jakichs tam jednostek o administracyjnym statusie.

@balrog-kun
Prośba.
Czy mógłbyś używać polskich znaków diakrytycznych?
Twoje teksty są bardzo niezrozumiałe.
Bo nie wiem czy Kalemu ucięli czy Kali uciął. :slight_smile:

Tak, zgodziłem się… w sumie to uznałem, że mało kto wie o tych tabelkach a osoby, które ich używają wiedzą co autor miał na myśli więc obniżyłem priorytet, po czym zapomniałem… Nie mniej właśnie poprawiłem, już powinno być jasne

Na przykład http://wiki.openstreetmap.org/wiki/Tag:place%3Dsuburb czy http://wiki.openstreetmap.org/wiki/Tag:place%3Dneighbourhood to z definicji części miejscowości a używana jest do miejscowości (to nie jedyny przypadek, są i odwrotne)

To jak się ma highway=path,track,service, itd do tego:

Jasne jest dla mnie że nie cały teryt musi się znaleźć w OSM i nie każdy element place=* musi się znaleźć w terycie, ale oba zbiory danych mają bardzo dużą część wspólną i manipulując słownikiem typów miejscowości i części miejscowości w teryt oraz wartością tagu place=* można ten wspólny podzbiór danych wyłuskać i porównać… i właśnie o to mi chodzi.

Wydaje mi się, że do węzłów z place= lepszy jest zbiór danych z PRNG - jeśli chodzi o porównywanie danych i wyłapywanie błędów.
TERYT lepiej się nadaje do granic administracyjnych.
Ale to tylko moje zdanie.

Rzeczywiście, nie pomyślałem o suburb i neighbourhood.

Wydaje mi się że ta definicja w oczywisty sposób odstaje od powszechnego rozumienia drogi, można znaleść jeszcze bardziej specyficzne definicje. Poprzednim razem chciałem użyc słowa osada ale w terycie ma ona specyficzną definicję (po polsku Warszawa też jest przecież osadą).

Zgadzam się, że może się przydać np. do wyłapania literówek w obydwu zbiorach ale trzeba mieć bardzo ograniczone zaufanie do niego i już przy tworzeniu narzędzi trzeba pamiętać, że nawet doświadczeni mapowicze sugeruja się statystykami, rankingami, validatorami (typu keepright), czerwono-zielonymi mapkami itp.

@Władysław:
Postaram się w wątkach, w których piszesz, pisać ze wszystkimi znakami.