Propozycja automatycznej edycji - population=* na podstawie NSP 2021

Pomysł

Chciałbym przeprowadzić automatyczną edycję wpisując dane z Narodowego Spisu Powszechnego w 2021r. do tagu population=* w OSM.

https://wiki.openstreetmap.org/wiki/Pl:Key:population

Tagowanie

Liczba ludności oznaczana jest w tagach:

  • population=*
  • population:date=*

population:date jest często pomijany.

Przeglądając pobieżnie - wiele obiektów nie ma żadnego population, często jego wartości nie były zmieniane od kilkunastu lat. Są też miejsca, gdzie dane są uzupełniane - jeżeli nie wpisano population:date, to mogą zostać błędnie nadpisane :frowning:

Obiekty do edycji

Proponuję zastosować zmiany do obiektów:

  • które mają tag teryt:simc=*
  • z pominięciem tych, które mają population:date nowsze niż 2021-06-30
  • które zostaną dopasowane do danych urzędowych (po kodzie teryt)
Overpass

overpass turbo

{{geocodeArea:Polska}} -> .searchArea;
nwr["teryt:simc"](area.searchArea) -> .all;
node["population:date"~"^(202[234].*)|(2021-07.*)"]["teryt:simc"](area.searchArea) -> .new;

(.all; - .new;);
out body;

Zmiany

Chciałbym wpisać następujące tagi (lub zastąpić ich aktualną zawartość).

  • population=*
  • population:date=2021-06-30
  • source:population=Narodowy Spis Powszechny 2021

Żródło danych: Narodowy Spis Powszechny - ludność rezydująca w miejscowościach statystycznych


Dobry pomysł? Jakieś uwagi/coś do poprawy?

7 Likes

Polecam sprawdzić obiekty z "source:population"~"https://www.polskawliczbach.pl/.*"
Całkiem sporo już zostało zaimportowanych właśnie z population:date = 2021-06-30, ale nie wszystkie.

Z tego, co wiem te dane są z Narodowego Spis Powszechnego 2021, ale potencjalnie jakoś przekształcone.

cc @PLwLiczbach

4 Likes

A ten tag byłby dodawany do i węzła, i relacji? Może to być trochę problematyczne, jeśli ktoś w przyszłości zaktualizuje tag tylko na jednym elemencie.

OK, wziąłem się za realizację tego pomysłu i oczywiście nie było to takie proste.

Dane GUSu są identyfikowane numerami TERC. Są one nadawane jednostkom podziału terytorialnego - wydaje mi się, że bardziej pasują do relacji obszaru - i tak są zazwyczaj stosowane.
Niestety niewiele obszarów ma wypełniony ten numer.

Miejscowości w OSM mają często wpisany numer SIMC - on wydaje się bardziej pasować do węzłów odpowiadającym miejscowościom i to tym punktom chciałem przede wszystkim zaktualizować tag population.

W bazie TERC są wyszczególnione wszystkie miasta, gminy miejskie i “obszary miejskie” gmin miejsko-wiejskich, odpowiadające miastom.

Nie znalazłem nigdzie “konwertera” numerów TERC na SIMC dlatych obszarów, dlatego napisałem swój korzystając z bazy statystycznej SIMC ze strony GUS - w ten sposób uda mi się zaktualizować dane population=* dla węzłów oznaczających miejscowości. W następnym kroku zaktualizuję tagi dla relacji, ale nie będę dopisywał tam gdzie danych nie było wcześniej.

1 Like

874 miasta zaktualizowane/uzupełnione

1 Like

Hej, tak na przyszłość popraw sobie nazwę dla Wałbrzycha, bo GUS od czasów przywrócenia grodzkości, rozróżnia dwa Wałbrzychy i dopisuje do nazwy rok:


Już to poprawiłem jakby co :wink:

1 Like

No i teraz wartości tagu population na węźle i relacji są rozbieżne :upside_down_face:

Dzięki, sprawdziłem jeszcze raz i to jedyny taki przypadek. Poprawię na przyszłość swoje skrypty.

Tak, jeszcze nie poprawiłem ich, jutro wyślę kolejny changeset, ale chciałem przy okazji wykryć inne takie niezgodności, a do tego potrzebowałem żeby się zmiany rozpropagowały.