Moje pytanie dotyczy bazy danych Głównego Urzędu Statystycznego. Czy ich dane na temat populacji mogą być bezpośrednio zaimportowane do OSM (nie ma żadnych przeciwwskazań licencyjnych)? Jeśli tak to czy dałoby radę to zrobić za jednym pociągnięciem, tzn. pobrać te dane skryptem i wrzucić je na mapę?
Pytam, bo w wielu miejscach liczba ludności jest już nieaktualna, a aktualizowanie tego ręcznie nie ma chyba zbyt dużego sensu, jeśli jest możliwość zrobienia tego (pół)automatycznie.
Załącznik, Tabela 08. tylko to jest rozbite na wiele zakładek. Przy założeniu, że mamy wszędzie uzupełniony teryt:terc, to nie powinno być zbyt skomplikowane.
Przeglądam i wygląda całkiem fajnie. Jako wartość dałbym “GUS (2013-12-31)”.
Przy okazji jeśli już maglujemy tyle miast to proponowałbym zastanowić się nad innymi drobnymi poprawkami jak usunięcie “is_in”=*, skoro mamy w zasadzie kompletne pokrycie gmin.
Tylko jeszcze musisz dać w XML action=‘modify’ bo się nie wyśle (właściwie to nie musisz, można to zrobić inaczej, w JOSM)
Przychylam się, żeby wywalić is_in=, is_in:country=PL i addr:country=PL skoro już zmieniamy. Właściwie to można wszystkie addr:= wywalić (z wyjątkiem addr:postcode=), bo widzę tam różne kwiatki typu addr:street= itp.
Masz na myśli, by jeszcze relacje granic administracyjnych uzupełnić o population? Z tego co widzę na taginfo, to nie jest to stosowana metoda na świecie. Znacząco by to uprościło rysowanie mapy zagęszczenia ludności, ale może przez relację to można łatwo wyciągnąć? A plik robię z automatu.
Dzięki, poprawię.
Patrząc na taginfo, widzę, że też jest podawany tag w postaci population:date, ale nie wiem, czy warto się rozdrabniać. Wrzucam datę z myślą o tym, by komuś nie przyszło aktualizować wartości starszymi danymi.
Skąd ta wątpliwość? Właśnie, z tabeli 8 to biorę. Może słusznie zwracasz uwagę, bo w ten sposób ustawiam w siedzibie gminy populację dla całej gminy, a dla siedziby powiatu - całego powiatu. Działa to w dużych miastach, ale już na obszarach wiejskich spowoduje spore przekłamania. W takim razie, może rzeczywiście warto to wrzucić na poziom granicy?
Patrząc po stronach GUS-u, to nie widzę, by była opcja, by wyciągnąć dane o ludności w miastach w gminach miejsko-wiejskich, oraz miejscowościach w gminach wiejskich.
Ze źródeł, to widzę jeszcze Bank Danych Lokalnych na stronach GUS-u, ale tam mogę wyciągnąć ludność tylko wg NTS, wg TERYT mi nie działa
Zauważyłem, że wprowadzasz dane dla wsi, dlatego pytam.
Też mi się wydaje, że wprowadzanie liczby ludności gminy do punktu miejscowości (analogicznie dla powiatu) spowoduje błąd. Pewnie dla powiatów działa to tylko dla miast na prawach powiatu.
W pliku który wystawiam, znajdują się wszystkie węzły w Polsce, które mają podane teryt:terc, nie modyfikuję wszystkich. Dla jasności, dorzucam log, z informacjami co zostało dokładnie zmienione. W pliku, dodałem action=modify, tylko dla elementów, które zostały “dotknięte”.
W pierwszym pliku .osm pojawiło się nowe source:population dla wsi (przypadkowo wybranej z moich okolic) i widzę teraz również modify. Liczba również wskazuje na modyfikację. Dlatego drążę temat
Rozumiem, że zgadzamy się co do tego, że nie można wrzucić populacji gminy do jej “centrum”. Widzę również, że populacja gminy pojawiła się w niektórych jej wsiach (taka sama liczba).
To jutro będę miał poprawiony plik, na bazie informacji z GUS, które podlinkował marimil. Tutaj sprawa jest łatwa, bo dotyczy tylko miast.
Teraz parę pytań kontrolnych:
Usuwać wszystkie is_in:*? Widzę jeszcze is_in:county, is_in:municipiality, is_in:province?
Czy usuwać wszystkie is_in:* również dla place=village, place=neighbourhood, place=suburb i place=hamlet?
@marimil - możesz podać przypadek o który znalazłeś? Generalnie - to wyszukuje node’y po teryt:terc, co by sugerowało, że wieś ma teryt:terc taki sam, jak gmina, co wydaje mi się, że jest niepoprawne. Dobrze myślę?
Usuwać tylko is_in=* tak jak napisałem w poprzednim poście. is_in:municipality/county/province/village/city można na razie zostawić - w niczym nie wadzą, a czasami nawet się przydają (np. mnie przy mapowaniu).
Dobre pytanie. Z tego co czytam, to teryt:terc powinien kończyć się na poziomie gminy. Czy wsie leżące na jej terenie powinny mieć ten tag? Aktualizacja nastąpiła w 2009 r. (np. http://www.openstreetmap.org/changeset/954165)). Ja zerknąłem na wsie gminy Kocierzew Południowy.
Jeśli mają ten tag (i to jest poprawne), to nie powinno się nim sugerować. Jednak skoro population dla gmin ma trafić na granice i nie posiadamy wartości dla jednostek niższego rzędu, to problem nie istnieje. Jest jeszcze teryt:simc. Nie ma go chyba w danych ludnościowych GUS.
PS. Mam nadzieję, że nasze marudzenie Cię nie zniechęca. Dobrze, ze chcesz się tym zająć.
Zastanawiam się po prostu nad tym, czy nie usunąć teryt:terc z miejscowości, które znajdują się w jakimś obszarze (bo wynika to z relacji), a zostawić teryt:terc tylko na relacjach. Dla miejscowości powinno zostać tylko teryt:simc. Patrząc po taginfo, to wychodzi na to, że:
75k węzłów ma teryt:simc
25k węzłów ma teryt:terc
23k węzłów ma jednocześnie teryt:terc i teryt:simc
3 922 relacji z teryt:terc
Więc może warto wybrać którąś z dróg (uzupełniamy teryt:terc na bazie teryt:simc, albo kasujemy teryt:terc, bo wynika on z teryt:simc).
Populację bym ustawił tak, że dla:
-powiatów grodzkich, gmin miejskich oraz dzielnic, ustawiłbym populację na węźle i na relacji
-w pozostałych przypadkach - tylko na relacji