Popis stanovništva 2022 - uvoz

Napravio sam par test izmena da vidim kako izgleda evo primera kako to izgleda.
Samo ne znam da li bi trebali da uradimo reklasifikaciju naselja pošto na primer Prokuplje je slicne velicine kao i Gornji Milanovac, a Gornji Milanovac je place=town dok je Prokuplje place=city. Pa ako neko ima neki predlog da resi ili da jednostavno ostavimo ovako kako jeste.

Meni je OK ovaj primer što si uradio. Jedino ne znam da li za population:date da bude samo godina ili konkretan datum. Ali može i konkretan datum.

Ti si stavio u primeru podatke na relaciju i to je ok. Međutim, posle u primeru pominješ Prokuplje. Ako pogledaš, Prokuplje je u isto vreme i centar Topličkog okruga, i centar grada Prokuplja i centar naselja Prokuplja.. Ako imamo jednu tačku koja predstavlja centar raznih relacija, onda nema smisla da stavljamo population na tačku, jer nećemo znati na šta se taj broj stanovnika odnosi. Prva reakcija mi je da:

  1. Stavimo population i ostale pridružene tagove samo na relacije (automatizovano, mogu ja to)
  2. Sklonimo postojeće population tagove sa svih node-ova koji su centri relacija (ali - ostavimo ih za manja mesta koja nisu naselja u RGZ-u i gde vrednost za broj stanovnika nije došla iz popisa)

Šta kažu ostali?

Ne vidim zasto ne bi stavili population na node (prim.) to je pravilno i radi se svuda ja sam za to da se stavi i na relaciju i node kako si rekao u prvom odgovoru. A i verovatno ce pokvariti sajtove kao sto su ovaj.

Moj problem sa stavljanjem na node je što je onda vezivanje populacije dvosmisleno. Vidim da Groningen ima 201.000 stanovnika, ali Groningen je centar više relacija. Šta tačno ima 201.000 stanovnika - admin level 4 (provincija), admin level 8 (opština) ili admin level 10 (gradski centar)? Ovako na prvi pogled, ne znajući ništa o Groningenu, sve mi je moguće.

Ili, evo konkretnije, pogledaj ovaj link:
https://data.stat.gov.rs/Home/Result/3104020201?languageCode=sr-Cyrl&displayMode=table&guid=bfd1e715-2873-4efa-8883-c79438a56eef

Toplička oblast ima 77.341 stanovnika, Prokuplje opština ima 38.054, a Prokuplje gradsko naselje ima 24.627. Pitanje za tebe @Srdjan023 - šta bi mi trebali da stavimo na population tag za node za Prokuplje koji je centar sve tri ove relacije? OK mi je da se stavi na relacije, to smo se dogovorili. OK mi je da se dogovorimo nekako (npr. da se za population za node-ove uvek uzima relacija sa najvećim admin levelom i da postoji još jedan dodatni tag (population:note npr.) koji nedvosmisleno objašnjava na šta se population tag odnosi), ali mi nije OK da population tag ostane dvosmislen, kao u Groningenu.

Inače, čim se vratim sa odmora, mogu da popunim ove podatke automatizovano, za sad samo za relacije (osim ako me neko ne preduhitri).

Jedino ne znam da li za population:date da bude samo godina ili konkretan datum.

Mislim da nema nekog značaja koristiti datum. Statistika se radi po godinama.

Ako imamo jednu tačku koja predstavlja centar raznih relacija, onda nema smisla da stavljamo population na tačku, jer nećemo znati na šta se taj broj stanovnika odnosi.

To nas je vratilo na staru temu označavanja administrativnih granica. Ja sam i tada a i sad mislim da svaki administrativni nivo treba da bude zasebno upisan pa čak i onda kada kada jedna jedinica predstavlja više administrativnih nivoa.

Tako bi ovakvi problemi bili izbegnuti.

Dodavati dodatne opisne tagove nije dobro rešenje sa aspekta automatske obrade podataka. Podaci treba da u svojoj suštini budu jednoznačni. Bolje je jednoznačnost postići tako što su sami objekti na koje se stavlja population tag jednoznačno obeleženi.

Drugim rečima, kada se programski izvlače podaci o broju stanovnika, treba da bude dovoljno da se uradi filter po population tagu a onda iz objekta na kome je taj tag videti na šta se odnosi broj stanovnika.

Koliko sam video rawspoloživi su podaci o broju stanovnika na različitim administativnim nivooima (opština, grad, region, oblast). Jedno naseljeno mesto može biti centar više administativnih nivoa i logično je da se može imati podatak o broju stanovnika za svaki taj nivo.

Tradicionalno se ovo interpretira kao broj stanovnika naseljenog mesta predstavljenog čvorom (admin level 9 u našem slučaju), ali razumem potencijalnu dvosmislenost, te donekle spuštam nivo svog otpora dodatnom tagovanju administrativnih relacija. :slight_smile:

Ja sam stavljao population:date=2012 kad god sam ručno ažurirao podatke, to bi sad trebalo preflekati pri uvozu.

Bilo bi divno kad bi bot ažurirao i Wikidata, pa da to jednog dana završi i na Vikipedijama. Iskreno se nadam da sad imamo Wikidata linkove na svim naseljima? Ja sam davne 2007, kad bejah mlad i srčan, poluručno preneo podatke popisa iz 2002 na wp (List of populated places in Serbia) i to još od tad stoji manje-više neizmenjeno jer je ručno ažuriranje muka.

Odradio sam za sve nivoe (od Srbije do naselja). @Srdjan023 je već pomogao jer je odradio sve okruge - hvala! Ovo je šta sam stavljao na kraju:

population=N
population:census:2022=N
population:date=2022
source:population=RZS

Proverite po želji.

I dalje mislim da su neke stvari oko cenzusa vs. admin boundarija komplikovane, počeo sam temu ovde.

Nisam ništa radio za čvorove (admin centre), niti planiram jer je komplikovan problem. Treba staviti ove tagove na admin centar ako je admin centar od naselja, ali ne treba ako je to isto centar i mesne zajednice (jer će se misliti da je to broj stanovnika MZ-a). A pored toga onda treba naći sve admin centre od opština koji nisu u isto vreme centri naselja…ufff

Mogao bih, samo ne znam šta da se ažurira? Naselja ili i opštine/gradovi? Treba da imamo sve wikidata linkove. Ako šta fali, sada će se primetiti:) Ali treba mi pomoć oko wikidate - šta se dodaje - samo population - Wikidata ili ima još neki property? Vidim da wikidata ima koncept rural/urban populationa, možda se to mapira na RZS-ov “tip naselja” i čak male/female population. Odradio sam svih 5 population propertyija na Inđija - Wikidata, pogledaj jel to tako treba da bude pre nego što nastavim, @Duja !?

@Branko_Kokanovic Svaka administrativna jedinica ima zasebnu Wikidata stranicu, te tu ne bi trebalo da bude dvosmislenosti (možda kod par specijalnih slučajeva kao što je Beograd naselje/Beogradski okrug).

Naseljeno mesto Inđija je na Q309341 i Wikidata je povezana na čvor 60349665 , dok je opština Inđija na Q740472 i Wikidata je povezana na relaciju 1635715..

Sela imaju samo jednu Wikidata stranicu te tu nema problema.

Ako već radiš na botu, bilo bi dobro ažurirati i odgovarajući reference metapodatak na Wikidata. Mislim da je dovoljno staviti samo “Census 2022” ili sve ulinkovati na neku od knjiga popisa, kao što je urađeno ovde.

Kao što sam nagovestio, zvanično odustajem od zahteva da Wikidata bude ulinkovano samo na čvor – verovatno je dugoročno bolje i lakše za održavanje da bude ulinkovana samo na relaciju (te je treba ukloniti sa čvora), a rendering ćemo već rešiti.

Ovo mi nije jasno, možeš li da daš primer sa Inđijom, da ti popuniš, šta treba da stavim za property, a šta je vrednost? Gde se stavlja to, za svaki od ova 4 population statement-a? Čisto da kad krenem da pravim bota, da znam da idem u pravom smeru:)

Evo sredio sam Opštinu Inđija. Ukratko, za svaki podatak sam dodao isti par metapodataka:

  • kvalifikator point in time sa vrednošću 2022
  • referencu sa kvalifikatorom stated in koja upućuje na item 2022 Serbia Census (Q114356857). Taj je igrom slučaja već postojao pošto je neko napravio sr.wiki članak.

Mislim da je to dovoljno, pa kome treba tačna stranica neka malo kopa.

Nego, ja ne vidim da je RZZS igde objavio dataset sa podacima po naseljenim mestima (što je za prethodne popise bilo otprilike poslednje što je objavljeno, gotovo dve godine nakon popisa). Sve što postoji je statistika po opštinama i okruzima. Da idemo s tim što imamo ili da čekamo da objave sve?

Uneo sam sve podatke (u formi kako si rekao za Inđiju) za sve wikidata objekte, od admin levela 2 do admin levea 8 (država, pokrajine, statističke jedinice, okruzi, gradovi i opštine)! Rešen je i wikidata deo.

Što se tiče naselja, sad tek vidim da od 4721. naselja, samo 130-tak ima wikidata. Nabadanjem na par naselja, vidim da podaci postoje u wikipediji/wikidati, ali u OSM-u nemamo wikidata vezu. Ovo je nešto što bi bilo lepo da imamo, ali ne prihvatam se ovoga, deluje dosta posla.

Imamo Wikidata vezu na većini naselja, ali ne na relaciji nego na samom čvoru. Baci oko na moj omiljeni renderer:

E sad kolikoj tačno većini ne znam zasigurno, i jako varira po regionima. Jedno 50%, odokativno. Saćemo da priupitamo Overpasa…
Imamo wikidata na 3671 čvoru koji je place=village
Nemamo wikidata na 2848 (Edit: oko 700) čvorova koji su place=village
Verovatno mnogi od tih village treba da su hamlet ili neighborhood, ali eto prilike za jedan mali Mapatlon.

Krusevac, Cacak, Kragujevac su i onako lose mapirani, tako da neki mapaton posle rgz-a bi dobro doso

2 Likes

Ne razumem šta hoćeš da kažeš, ti podaci su objavljeni još u maju Старост и пол, 2022 (baza podataka)

hamlet je selo sa manje od 100 stanovnika to može da se promeni uvozom. neighborhood je gradsko naselje

Nisam našao taj pdf na sajtu (ne mogu reći da sam jako detaljno tražio) ali dobro, važno je da je tu.

Sredio sam danas nekih 200 naselja iz onog upita, ostalo je oko 500. Na naselja koja su admin_centre svojih relacija sam stavio wikidata tagove, a ostale sam stavio da su place=hamlet (a broj stanovnika im se shodno tome i ne zna). Sela sa manje od nekih 50 stanovnika sam takođe označavao sa place=hamlet. (Imamo li konsenzus da je 100 stanovnika donja granica za place=village ?) Mnoga u kuršumlijskoj opštini su i napuštena, ali tu sam ostavljao place=hamlet, šta ću.

Kada sva naseljena mesta dobiju wikidata, moći će da se napravi skripta da se pobrišu population tagovi sa naseljenih mesta (trenutno imamo stare podatke), wikidata premesti sa čvora na relaciju, a onda eventualno i popune nedostajući podaci na Wikidata.

1 Like

Iako to jeste alternativa mislim da je bolje da population tag pošto se obično koristi da bi se dobili podaci o stanovništvu na brz način, neke skripte to koriste, a i dosta renderera kao što su opentopomap Carto i dr. korisite ga da bi renderovale bitnije gradove na manjem zoom levelu. Bila je slična diskusija na Nemačkoj osm zajednici više puta ali ja ću preneti jedan od odgovora zašto je population tag treba da bude u OSM

Ja nemam neki čvrst stav da li population tagovi treba da budu na place čvorovima ili na boundary=administrative relacijama (ili na oba mesta). Jedino što tražim je da budu konzistentni. U ovom (doduše prelaznom) trenutku su podaci na čvorovima rezultati popisa iz 2001, 2011 ili 2022, kako gde, dok je podatke na relacijama nedavno ažurirao Serbian OSM Lint bot.

Ako ih želimo na oba mesta (kako bismo dobili odgovarajući rendering, a što jeste bitno upravo zbog razloga koji si citirao), onda će i OSM Lint bot morati da napravi još jedan prolaz da ih poravna i na čvorovima, a u narednih 10-tak godina će se sigurno naći neki dobrodušni maper da ih “ažurira” (tj. razdesi).

I meni je bitno da su konzistentni, i da samo javim da bot može ovo da poravna kada budemo rekli da hoćemo.

Gotov mapathlon! :innocent:

Trebalo bi da sada svi čvorovi naseljenih mesta u Srbiji imaju referencu na svoju wikidata stranu. Koristio sam upit https://overpass-turbo.eu/s/1AHp (svi place čvorovi koji imaju upisanu population a nemaju wikidata), koji bi trebalo da je prazan (trenutno tamo ima nekoliko gradskih četvrti kojima je neko upisao population ne znam otkud, i par napuštenih zaselaka). Bio bi pouzdaniji upit koji kombinuje place koji jeste admin_centre neke relacije na admin_level=9, al to ne umem da napišem.

Ostaje sad da nečiji bot popuni i Wikidata podatke o stanovništvu, podatke o stanovništvu za OSM place čvorove i eventualno premesti wikidata tagove sa čvorova na relacije (oko ovog se i dalje dvoumim). Valjalo bi usput i proveriti validnost wikidata linkova, tj. da stranica predstavlja instance of:human settlement… ili tako nešto tj. da nije đubre.