Inwoneraantallen hebben ik altijd al interessant gevonden en ik maakte wel eens lijstjes op basis van verzamelde informatie. Het meeste is helaas niet bewaard gebleven.
Diverse complicerende factoren zijn al genoemd. Internationaal is er het probleem dat niet voor alle landen betrouwbare statistieken zijn te geven als gevolg van gebrekkige registratie. Soms is er in de praktijk een behoorlijk aandeel aan niet-geregistreerde bewoning bovenop het officiële bevolkingsgetal. Het andere grote probleem is het verschil in bestuurlijke indeling. Je kunt moeilijk tot een eenduidige definitie van een woonplaats komen die tot een bevredigende lijst leidt. Een stad als agglomeratie kan tientallen miljoenen inwoners hebben terwijl het volgens bestuurlijke indeling soms maar honderdduizenden of tienduizenden heeft.
O.a. voor Parijs, Tokio en Brussel ontkom je niet aan een nadere onderbouwing van de gebruikte rekenmethode / definitie.
Voor Nederland wordt wat betreft de steden vaak uitgegaan van de gehele gemeente. Dat geeft een aardig beeld en soms is de stad gelijk aan de gemeente maar in veel gevallen ook niet. En de losse cijfers zijn niet altijd gemakkelijk te vinden. De CBS-indeling is vaak verwarrend en niet gelijk voor elke gemeente. Soms is een dorp niet als geheel terug te vinden en met andere woonkernen samengevoegd onder één noemer of juist opgesplist. De afsplitsing ‘verspreide huizen’ kan vraagtekens oproepen.
Het al genoemde Emmen is een goed voorbeeld van een groot verschil tussen het inwonertal van de gemeente en de woonplaats Emmen. Dan is er Almere waar de oorspronkelijk opzet van verschillende woonkernen als Almere-Stad, Almere-Buiten, Almere-Haven, enz. is verwaterd maar die nog wel als stadsdelen bestaan.
Van de grootste steden bevat alleen gemeente Den Haag officieel geen andere woonplaatsen maar wie is opgegroeid in Scheveningen zal daar anders over denken. De gemeente Groningen bevat een aantal wel of niet-oficiele woonplaatsen die wel of niet volledig zijn opgeslokt door de stad (zoals Hoogkerk).
De losse cijfers zijn dus niet altijd duidelijk en de status van een kern is niet altijd duidelijk. Wanneer is iets wel of niet een dorp? Voor Fryslân is daarover voor mij geen verwarring. Daarover wordt meestal geen tegenstrijdige informatie gegeven. Er stond ooit ook eens een volledige lijst op de website van de provincie. Op veel gemeentelijke websites zijn wel actuele cijfers per dorp te vinden.
Je zou wel kunnen betwisten of Breezanddijk, bestaande uit een deel van de Afsluitdijk en bevattende één adres (een tankstation) en vier inwoners, wel echt een dorp is maar het heeft wel die status.
Voor bijv. Groningen en Drenthe is er voor meerdere woonplaatsen onduidelijkheid of het dorpsstatus heeft of dat het een gehucht is waarvan de inwoners onder een ander dorp vallen.
Die dorpsstatus hangt zeker niet zomaar af van aantal inwoners of voorzieningen. Er zijn in Fryslân wel meer dan tien plaatsen met dorpsstatus die minder dan honderd inwoners hebben en soms aan een doodlopende weg liggen terwijl er in het noordoosten plaatsen zijn met honderden inwoners en actieve dorpsgemeenschap die als gehucht gelden.
Dan de vraag: moet OSM iets doen met inwoneraantallen of niet?
Gegeven het feit dat de database is gevuld met getallen die veelal totaal niet kloppen is het zeker gewenst om dat aan te pakken.
Als ik uitga van werkgebied Nederland dan is het ene uiterste om die tags gewoon te verwijderen en het andere uiterste is het corrigeren met exacte en actuele informatie voor alle officiële woonplaatsen in Nederland.
Dat laatste gaat me wat ver en zou ik alleen implementeren als het kan door het linken van data.
Het is wel waar dat de meeste inwoneraantallen niet gauw verouderen dus als er eenmaal goede invoer is geweest kun je jaren vooruit met eventueel alleen bijhouden van de gevallen van grote verandering (zoals aangewezen groeikernen en mogelijk plaatsen die net een bepaalde grens overschrijden).
Je zou ook kunnen werken met afgeronde getallen (het CBS werkt vaak ook met afronding op tientallen), maar afronding kan een extra arbitraire factor opleveren.
Jaren geleden is er al eens een voorstel gedaan dat niets heeft opgeleverd. Daar werd ondermeer opgemerkt dat kaartenmakers niet snel de getallen zullen gaan gebruiken.
Ik denk dat we ons hier zeker niet moeten gaan druk maken om de situatie in het buitenland zoals Los Angeles.
En voor Nederland zou ik zeggen: een indeling van vier categorieën is aan de krappe kant maar voldoende hanteerbaar.
Mijn voorstel is om toe te werken naar consensus over het gebruik van de tags place=city/town/village/hamlet binnen Nederland. Dus het vaststellen van criteria waarbij inwonertal de leidende maar niet enige factor hoeft te zijn en waarbij eventueel per provincie of regio kan worden gedifferentieerd.
Hele kleine maar officiële woonplaatsen zou ik altijd wel village i.p.v. hamlet geven omdat een dorpsstatus automatisch het belang van de woonplaats verhoogd.
Ik heb een overpass gedaan op alle place=city/town/village en de uitkomst daarvan (bijna 2800 plaatsen) in een spreadsheet gezet, met de volgende gegevens: @id, name, postal_code, population, source.
Het (read-only) spreadsheet staat hier.
/offtopic/
Wat is overigens het nut van een enkelvoudige postcode bij de tags, terwijl voor zeer veel plaatsen geldt dat ze minstens 2 verschillende postcodegetallen hebben?
/offtopic/
Bedankt voor de spreadsheet, vallen meteen een aantal zaken op.
Bijvoorbeeld één village zonder name tag (Buren), heb ik maar gecorrigeerd: https://www.openstreetmap.org/node/48489609
Is dit wel een village of is hamlet beter?
Verder veel schattingen met ~ wat me onwenselijk lijkt.
Over stad en dorp kun je ook nog even bakkelijen.
Buren heeft de omvang van een dorp, maar heeft in de Middeleeuwen stadsrechten gekregen.
Dergelijke kleine stadjes hebben we meer in Nederland. Rijssen bijv. is ook een stad. Op de plattegrond is duidelijk nog de omtrek van de vestingwal te zien.
Hoewel ik het op zich met je eens ben, is de OpenStreetMap Wiki op dit vlak vrij duidelijk: nergens wordt de status als city/town/village/hamlet gekoppeld aan historische (stads-)rechten, maar slechts aan bevolkingsgrootte, de aanwezige voorzieningen en een evt. regionale functie.
Vanuit rendering en cartografisch oogpunt, is dit ook de betere manier om er naar te kijken. De evt. status als bezienswaardig historisch stadje kun je beter illustreren met een tourism=x tag.
Overigens: mochten kleine “historische stadjes” toch met place=city zijn getagged, dan is er dus nog meer reden om die population tag te vullen, zodat er geen overmatig belang aan die plaatsjes wordt toegekend.
Je begreep me verkeerd of ik drukte me verkeerd uit. Ik ben het namelijk 100% met je eens. Ik bedoelde te zeggen, dat je plaatsen als Delden, Rijssen, Diepenheim beslist geen town moet noemen, maar inderdaad village.
Rijssen vind ik dan niet zo’n goed voorbeeld met ruim 30.000 inwoners. Delden met ruim 7.000 inwoners zou ook een ‘town’ kunnen zijn.
Stadsrechten worden al eeuwenlang niet meer vergeven of ingetrokken en hebben dus geen connectie met de actualiteit. De dorpsstatus wordt nog wel af en toe uitgedeeld of ingetrokken, al is er volgens mij geen exacte wettelijke definitie voor.
Plaatsen met stadsrechten die de facto dorp zijn zou ik daarom inderdaad niet als ‘city’ aangeven en andersom gehuchten die de jure dorp zijn wél als dorp aangeven.
OK, in plaats van nog langer door te discussieren, heb ik nu maar de eerste voorzichtige poging gedaan om de gegevens te corrigeren. Hierbij heb ik de door Marc Zoutendijk (bedankt!) geopperde route gevolgd:
In PDOK de bijbehorende buurt(en) opgezocht, en het met de “i” - identify - knop de gegevens opgevraagd.
Vervolgens in JOSM de bewoningskern van het juiste inwonertal voorzien
Dit alles werkt redelijk vlot. Een enkele keer is het noodzakelijk om meerdere “buurten” samen te voegen / bij elkaar op te tellen, omdat die 1 bebouwingskern in OSM representeren, maar dit gebeurd bij villages relatief weinig, omdat ze tenslotte al klein zijn.
Bij Bovenkarspel, waar Grootebroek in OSM nog als apart node is geplaatst, heb ik specifiek de buurt van Grootebroek geexcludeerd bij het optellen van de buurten van Bovenkarspel, en vervolgens bij Grootebroek gewoon de inwonertal volgens de CBS buurt ingevoerd. Dit was nog de meest complexe situatie tot nu toe (Bovenkarspel en Grootebroek zijn volledig samengegroeid en onder 1 gemeente), maar dit leek mij de meest logische oplossing hier.
Soms moet je dus maar een knoop doorhakken, maar de meeste situaties zijn recht toe recht aan.
Ik ben trouwens begonnen in Noord Holland. Als iemand anders nog wil helpen, begin dan dus in een andere provincie!
Mooi, Noord Holland boven het Noordzee kanaal is ook gedaan, zal hierna eerst Zuid Holland doen. Ik heb kleine plaatsen echter nog niet naar hamlet omgezet, zat hier echter wel over te denken. Het minimum inwonertal van 200 wat jij gebruikt, lijkt mij redelijk. Zal dit ook proberen aan te passen in Noord Holland.
Weet jij toevallig een Overpass query waarmee ik de plaatsen met < 200 inwoners kan selecteren? Probleem is natuurlijk dat de echte opgeslagen waarden tekst is, en niet numeriek. Ken Overpass niet goed genoeg om nu zo even te weten of je makkelijk kan converteren…
[out:xml];
{{geocodeArea:noord-holland}}->.searchArea;
(
node(user:"mboeringa")["place"~"village"]["population"](area.searchArea);
);
out meta;
>;
out meta qt;
komen al jouw wijzigingen (in NH) op de kaart. Als je ze dan in JOSM binnenhaalt kun je daar wél op grootte selecteren. Ik zie er 6 met minder dan 200 inwoners.