Hej wszystkim,
Prowadzę serwis https://www.polskawliczbach.pl/ i trafiłem tutaj przypadkiem bo zauważyłem, że czasem użytkownicy wrzucają dane z niego do relacji np. https://www.openstreetmap.org/relation/2907350
Widzę, że większość gmin ma dane o populacji jeszcze z 2013 i chętnie wrzucę aktualne dane z 2021.VI.30.
Wrzuciłem częściowe dane na próbę, ale oczywiście jak na złość oznaczyłem je błędnie jako 2021.12.31 kiedy faktycznie pochodzą z 2020.12.31 (co zamierzam oczywiście skorygować wrzucając faktyczne dane z 2021.VI.30 z prawidłowym oznaczeniem). Za błąd bardzo przepraszam - za bardzo skupiłem się na procesie automatyzacji zmian i niedostatecznie zweryfikowałem źródło danych.
Chętnie podejmę się zadania corocznej aktualizacji tych danych - mogę to zrobić na początek na próbę przeprowadzić na poziomie gmin.
Ogólnie to dobry pomysł by liczbę ludności aktualizować.
Jakie jest dokładnie żródło tych danych? Dla jakich obiektów robione będą edycje?
Np. https://pl.wikipedia.org/wiki/Wikipedia:Kawiarenka/Artyku%C5%82y_dyskusja/Archiwum/2022-luty#Wiarygodno%C5%9B%C4%87_%C5%BAr%C3%B3d%C5%82a_polskawliczbach.pl wspomina że nie jest jasne skąd się biorą niektóre dane na twojej stronie. Jest to gdzieś opisane?
Po dokładniejszej analizie, nie wszystko jest tutaj oczywiste. Po pierwsze wiążąc wyniki spisu dla obwodów statystycznych z mapą na portalu geostatystycznym, wychodzi na to że część obwodów łączy wsie sołeckie i niesołeckie w jednym obwodzie (wówczas polskawliczbach.pl zręcznie pomija na swej stronie wsie niesołeckie, dodając mieszkańców dla wsi sołeckiej), podobnie jest przy przysiółkach. Podsumowując portal jest słabym źródłem i wymaga dokładnej weryfikacji danych.Cyku new[reply] (dyskusja) 22:08, 9 lut 2022 (CET)
GUS niestety zbiera dane o liczbie ludności na poziomach poniżej gmin (i miast w gminach miejsko-wiejskich) tylko raz na 10 lat, przy okazji spisów. W dodatku dane te zbiera, jak już wyżej wspomniano, w jednostkach statystycznych (obwodach spisowych i rejonach statystycznych; podobno z ubiegłorocznego spisu mają być dane wg faktycznego położenia mieszkań)), które są agregowane do tzw. miejscowości statystycznych. Ta miejscowość statystyczna może odpowiadać faktycznej miejscowości, jednak nie musi (często obejmuje większą miejscowość i jakieś drobne miejscowości położone wokół, tyle że GUS nie podaje składowych tych miejscowości statystycznych), dlatego na podstawie danych GUS trudno jest ustalić liczbę mieszkańców miejscowości (może po ostatnim spisie coś w tym zakresie poprawią). Wniosek z tego taki, że nie wiadomo jaką liczbę ludności podaje strona polskawliczbach.pl – jeżeli na podstawie danych GUS, to jest to ich interpretacja tego dla jakich miejscowości GUS podaje dane.
A przy okazji: na https://www.polskawliczbach.pl/ jest wykorzystana mapka z danych OSM, z stylem mapy którego współatorem jestem.
Nie ma podanego żródła danych (jest tylko link do strony Leafleta).
Proszę, popraw swoją stronę.
Np. “© OpenStreetMap (ODBL)” linkujące do https://www.openstreetmap.org/copyright by rozwiązało sprawę.
https://www.openstreetmap.org/copyright
A, edycje takie jak https://www.openstreetmap.org/changeset/118917577
To rzeczywiście w iD było ręcznie edytowane? Czemu podajesz własną stronę jako źródło? Jak prawdziwe dane są z GUSu to GUS powinien być jako źródło podane, jak dane nie są z GUSu to skąd one się biorą?
A to kłaniam się nisko
Poprawię oznaczenie na mapach.
A, edycje takie jak https://www.openstreetmap.org/changeset/118917577
To rzeczywiście w iD było ręcznie edytowane? Czemu podajesz własną stronę jako źródło? Jak prawdziwe dane są z GUSu to GUS powinien być jako źródło podane, jak dane nie są z GUSu to skąd one się biorą?
Napisałem na szybko automatyzację korzystającą z przeglądarki, więc był to edytor iD, ale w trybie półautomatycznym. Zdaje sobie sprawę, że to nietypowe podejście, ale podobnymi rzeczami zajmuję się zawodowo na co dzień, więc było mi tak najłatwiej, a do edycji samych tagów w pełni wystarcza.
Z linkowaniem do GUSu sprawa jest o tyle problematyczna, że regularnie usuwają archiwalne dane (np. https://stat.gov.pl/obszary-tematyczne/ludnosc/ludnosc/ludnosc-stan-i-struktura-ludnosci-oraz-ruch-naturalny-w-przekroju-terytorialnym-w-2013-r-stan-w-dniu-31-xii,6,12.html) ) albo udostępniają je w formie mało przystępnej dla darmowych rozwiązań (np. https://stat.gov.pl/download/gfx/portalinformacyjny/pl/defaultaktualnosci/5468/7/18/1/powierzchnia_i_ludnosc_w_przekroju_terytorialnym_w_2021_roku_tablice.xlsx) ) - otwiera się u mnie na mocnym komputerze przez parę minut za pomocą OpenOffice, o próbie otwarcia na komórce to można nawet zapomnieć. Takie kwestie były m.in. inspiracją do powstania strony - gdzie dane są łatwo dostępne nawet na komórce, i dodatkowo można sprawdzić je dla lat ubiegłych i kolejnych (jeśli nastąpi aktualizacja strony przed aktualizacją samych tagów OSM)
Ogólnie to dobry pomysł by liczbę ludności aktualizować.
Jakie jest dokładnie żródło tych danych? Dla jakich obiektów robione będą edycje?
Np. https://pl.wikipedia.org/wiki/Wikipedia:Kawiarenka/Artyku%C5%82y_dyskusja/Archiwum/2022-luty#Wiarygodno%C5%9B%C4%87_%C5%BAr%C3%B3d%C5%82a_polskawliczbach.pl wspomina że nie jest jasne skąd się biorą niektóre dane na twojej stronie. Jest to gdzieś opisane?
Po dokładniejszej analizie, nie wszystko jest tutaj oczywiste. Po pierwsze wiążąc wyniki spisu dla obwodów statystycznych z mapą na portalu geostatystycznym, wychodzi na to że część obwodów łączy wsie sołeckie i niesołeckie w jednym obwodzie (wówczas polskawliczbach.pl zręcznie pomija na swej stronie wsie niesołeckie, dodając mieszkańców dla wsi sołeckiej), podobnie jest przy przysiółkach. Podsumowując portal jest słabym źródłem i wymaga dokładnej weryfikacji danych.Cyku new[reply] (dyskusja) 22:08, 9 lut 2022 (CET)
GUS niestety zbiera dane o liczbie ludności na poziomach poniżej gmin (i miast w gminach miejsko-wiejskich) tylko raz na 10 lat, przy okazji spisów. W dodatku dane te zbiera, jak już wyżej wspomniano, w jednostkach statystycznych (obwodach spisowych i rejonach statystycznych; podobno z ubiegłorocznego spisu mają być dane wg faktycznego położenia mieszkań)), które są agregowane do tzw. miejscowości statystycznych. Ta miejscowość statystyczna może odpowiadać faktycznej miejscowości, jednak nie musi (często obejmuje większą miejscowość i jakieś drobne miejscowości położone wokół, tyle że GUS nie podaje składowych tych miejscowości statystycznych), dlatego na podstawie danych GUS trudno jest ustalić liczbę mieszkańców miejscowości (może po ostatnim spisie coś w tym zakresie poprawią). Wniosek z tego taki, że nie wiadomo jaką liczbę ludności podaje strona polskawliczbach.pl – jeżeli na podstawie danych GUS, to jest to ich interpretacja tego dla jakich miejscowości GUS podaje dane.
Dane mogę zaktualizować dla województw, gmin, powiatów, miast (dane są aktualizowane przez GUS co najmniej dwa razy w roku) oraz ewentualnie w przyszłości dla miejscowości statystycznych (tutaj dane pochodzą ze spisów narodowych, ale również z rejestru pesel 2009). Dane zawsze są powiązane z unikalnymi identyfikatorami TERYT czy SIMC, więc nie ma tutaj miejsca na niejednoznaczności czy pomyłki.
maro21
March 26, 2022, 8:25pm
9
Nie © OpenStreetMap (ODBL) , tylko © Autorzy OpenStreetMap
Obie wersje są OK, a ta druga nie jest w 1000% ok bo nie podaje licencji.
Licencja ODBL pozwala na dowolny sposób który jasno podaje autora, “© Autorzy OpenStreetMap” to nie jest jedyna możliwa forma.
PLwLiczbach:
A, edycje takie jak https://www.openstreetmap.org/changeset/118917577
To rzeczywiście w iD było ręcznie edytowane? Czemu podajesz własną stronę jako źródło? Jak prawdziwe dane są z GUSu to GUS powinien być jako źródło podane, jak dane nie są z GUSu to skąd one się biorą?
Napisałem na szybko automatyzację korzystającą z przeglądarki, więc był to edytor iD, ale w trybie półautomatycznym. Zdaje sobie sprawę, że to nietypowe podejście, ale podobnymi rzeczami zajmuję się zawodowo na co dzień, więc było mi tak najłatwiej, a do edycji samych tagów w pełni wystarcza.
Z linkowaniem do GUSu sprawa jest o tyle problematyczna, że regularnie usuwają archiwalne dane (np. https://stat.gov.pl/obszary-tematyczne/ludnosc/ludnosc/ludnosc-stan-i-struktura-ludnosci-oraz-ruch-naturalny-w-przekroju-terytorialnym-w-2013-r-stan-w-dniu-31-xii,6,12.html) ) albo udostępniają je w formie mało przystępnej dla darmowych rozwiązań (np. https://stat.gov.pl/download/gfx/portalinformacyjny/pl/defaultaktualnosci/5468/7/18/1/powierzchnia_i_ludnosc_w_przekroju_terytorialnym_w_2021_roku_tablice.xlsx) ) - otwiera się u mnie na mocnym komputerze przez parę minut za pomocą OpenOffice, o próbie otwarcia na komórce to można nawet zapomnieć. Takie kwestie były m.in. inspiracją do powstania strony - gdzie dane są łatwo dostępne nawet na komórce, i dodatkowo można sprawdzić je dla lat ubiegłych i kolejnych (jeśli nastąpi aktualizacja strony przed aktualizacją samych tagów OSM)
Jak regularnie usuwają archiwalne dane (arghhhhh) to można od razu Internet Archive podlinkować.
Dalej lepsze niż nieoficjalna strona.
charl3s
(Charl3s)
March 27, 2022, 7:41pm
12
Obie wersje są OK, a ta druga nie jest w 1000% ok bo nie podaje licencji.
Licencja ODBL pozwala na dowolny sposób który jasno podaje autora, “© Autorzy OpenStreetMap” to nie jest jedyna możliwa forma.
OBDL przeciętnemu userowi nic nie mówi, za to “© Autorzy OpenStreetMap” docenia pracę ludzi nad rzwojem OSM.
Zauważyłem, że w OSM informacje odnośnie liczby ludności miast przeważnie były/są dodawane do punktów z tagiem place=,a nie relacji granic tych miejscowości (dotyczy to głównie miast, które leżą w gminach miejsko-wiejskich, ale i nie tylko).
W tych edycjach, liczba ludności została jednak dodana tylko do relacji, przez co w wielu przypadkach liczby nie pokrywają się między wartością w relacji a niezaktualizowaną wartością dodaną w tagach punktu z place= .
Na przykład, Żychlin:
relacja
punkt z place=town
Moim zdaniem, aby nie robić “rewolucji” w sposobie tagowania i nie dublować danych, najlepiej by było po prostu przenieść te dane z relacji do punktów.
@PLwLiczbach Pamiętaj by poprawić źródło linkujące do twojej strony na link do GUSu, gdyby była zgoda na edycje tego typu.
Ewentualnie korzystając z https://archive.org/index.php jeśli GUS lubi je psuć