Population

+1

Beim Chaosradio gibt es eine hörenswerte Folge über Wikidata https://chaosradio.ccc.de/cr240.html. Google hat seine Faktendatenbank Freebase zugunsten Wikidata geschlossen und nutzt jetzt Wikidata. Wer mehr dazu wissen möchte, voila https://ai.google/research/pubs/pub44818
Mal schauen wann wir das über Google Maps sagen können :slight_smile:

Beim Durchschauen des Wikidata-Items für Berlin ist mir aufgefallen, dass Wikidata auch eine “Rückreferenz” zu OSM hat: OSM relation ID (P402). Ich denke mal, dass die das dann für die Infobox-Karte in Wikipedia nutzen können.
Wenn man also die Wikidata-ID bei der boundary relation hinzufügt, kann man auch gleich bei Wikidata die entsprechende OSM-Relation-ID für P402 setzen.

Edit: Das sollte natürlich auch für Naturschutzgebiete etc. möglich sein.

Ich hab jetzt mal bei wikidata für meine Heimatstadt Traunreut geschaut. Dort stammt der letzte Eintrag bei population von 1987. Bei den anderen drei Städten im Landkreis Traunstein sowie beim Landkreis selbst ist es nicht anders.

Zensus 2011: Traunreut sagt 19,941 für den 09.05.2011. Kannst du ja dann bei Wikidata eintragen/aktualisieren.

Das weiß ich, und wie bereits geschrieben gibt es die Fortschreibung jedes Jahr. Ich wollte aber zeigen, dass der Datenbestand bei Wikidata nicht besser als bei OSM ist.

Für Traunreut gibt noch nicht einmal einen population-Eintrag. Würde jetzt nicht sagen, dass das besser ist. :wink:

Wikidata/Wikipedia hat das gleiche Prinzip wie OSM. Wenn sich jemand aus der Community drum kümmert, bleibt es aktuell - wenn nicht, dann nicht. Aber ich gehe stark davon aus, dass Einwohnerzahlen bei Wikidata erheblich besser gepflegt werden als bei OSM.

Das population-Tag ist essentiell. Und zwar um den ganzen Nasen, die immer wieder isolated_dwelling oder hamlet in village umwandeln, den Wind aus den Segeln zu nehmen. :roll_eyes:

Da die Daten im Prinzip immer aus Fremdquellen stammen und durch Mappe praktisch nicht zu erfassen sind wäre die einzige Lösung ein automatischer Import von amtlichen Daten sobald diese Veröffentlicht werden mit zeitgleichem Sperren des Tags für manuelle Bearbeitung.
Ich glaube aber nicht, das so etwas jemals passieren wird.

Einfacher und intressanter wäre wenn die Auswerter auf Fremdquellen zugreifen könnten, was durch Gegenseitiges taggen mit Wikidata / Wikipedia möglich werden könnte.

Und dafür ist es auch unerheblich, ob da population=9 oder population=11 eingetragen ist. Für OSM bzw. die Nutzer der OSM-Daten (Renderer, Router,…) würde es auch ausreichen, wenn dort population=10 als Ergebnis einer Schätzung durch einen lokalen Mapper eingetragen wäre. Genauso wie bei Berlin “etwa 3.5 Miillionen” ausreicht. OSM ist kein Ersatz für den großen Brockhaus.

Oh weia,

mir scheint, hier sollte noch mal erklärt werden, was Überprüfbarkeit (Verifiability) in OSM bedeutet. Das bedeutet nicht, dass Zahlenwerte bei der Überprüfung auf die fünfte Nachkommastelle exakt übereinstimmen müssen. Wenn also einer die Einwohnerzahl mit 3.4 Millionen, ein anderer mit 3.6 Millionen bestimmt ist das völlig OK.

Es geht beim Tagging von population nicht um exakte Zahlenwerte, es geht um die Größenordnung. Ob ein Ort eher 1000 oder 10000 Einwohner hat lässt sich durchaus recht klar für den Mapper bestimmen. Wem das schwer fällt, der kann sich ein paar Links zu Luft/Satellitenbildern von Orten mit bekannter Einwohnerzahl zusammenstellen und dann einen unbekannten Ort damit vergleichen und einordnen. Und das Ergebnis könnte gelegentlich sogar deutlich genauer sein als was man in Wikipedia findet.

population ist auf jeden Fall besser verifizierbar als die Klassifikation city/town/village/hamlet - einem Tausend-Einwohner-Kaff im Norden Kanadas den city-Status anzudichten fällt viel leichter, als da mal ein paar hunderttausend Einwohner herbeizufabulieren.

Ich glaube Du bringst da einiges durcheinander.

  1. Ging es bei der Diskussion um die Frage, ob die Angabe der Bevölkerung bei OSM oder besser bei einem Dritten, bspw Wikidata aufgehoben ist.
  2. Hat niemand im Thread von einer Genauigkeit von 5 Nachkommastellen gesprochen. Warum die Polemik?
  3. Es ging bei dem Berlin Beispiel von mir darum, dass wir in unserer Hauptstadt einen 7 Jahre alten Wert drin haben. Das mag für Berlin unproblematisch sein, aber in anderen, weniger OSM aktiven Gegenden wachsen Städte in 7 Jahren erheblich. Das ist eine Frage der Wartbarkeit, nicht der mathematischen Genauigkeit.
  4. Egal was Du vorhast, wenn Du die Bevölkerung benötigst, bist Du besser dran, diese über Wikidata zu ermitteln. 33% der Städte in OSM haben einen population Tag, 44% eine Wikidata-ID. Und die Bevölkerung wird schon wesentlich länger erfasst als Wikidata-IDs

Ich bin auch ein starker Befürworter davon, die Daten zur Einwohnerzahl in OSM zu erfassen. Die OSM-Datenbank sollte für sich alleine schon nutzbar sein und nicht noch die Verknüpfung mit anderen Datenquellen erfordern. Wir sollten uns nicht zu sehr von Wikidata abhängig machen. Außerdem ist es für die Auswertung deutlich einfacher, wenn die Daten direkt in OSM enthalten sind.

Das Argument, die Einwohnerzahlen nicht in OSM zu erfassen, weil sie kaum aktuell gehalten werden können, kann ich so nicht nachvollziehen. Das ist kein Problem, was es speziell bei den Einwohnerzahlen gibt, das betrifft im Grunde alle Daten in OSM, manche mehr, manche weniger. Öffnungszeiten oder Telefonnummern von POIs können ebenso schnell veralten, werden aber auch erfasst. Das Hauptproblem bei solchen Daten ist derzeit, dass falsche/veraltete Daten kaum auffallen, im Gegensatz zu Objekten, die auf der Karte gerendert werden und wo Fehler sofort ins Auge springen. Hier mangelt es meiner Meinung einfach an Qualitätssicherungstools, die die Mapper auf potentiell veraltete Daten hinweisen. Speziell für die Einwohnerzahlen daher mal ein Vorschlag:

Zur Qualitätssicherung der Daten würde ich das Tag population:check_date=* vorschlagen. Dort trägt man den Stichtag ein, auf den sich die Einwohnerzahl bezieht. Mit dieser Information kann man Auswertungen bauen und gezielt die Angaben auf dem neuesten Stand halten (“gib mit alle Städte, bei denen die Einwohnerzahl mehr als zwei Jahre alt ist”).

EDIT: Ich sehe gerade, dass population:date=* schon etabliert ist: https://taginfo.openstreetmap.org//search?q=population

In diesem Zusammenhang wüsste ich aber gerne noch einmal, welche Quellen für die Erfassung dieser Daten in OSM erlaubt sind. Vermutlich wurden die meisten population-Werte in OSM aus Wikipedia oder Wikidata übernommen, doch das ist ja wegen der Lizenzen eigentlich nicht erlaubt. Da die Angaben dort auch nicht unbedingt aktuell sein müssen oder Fehler enthalten können, würde ich ohnehin . Dürfte ich die Daten aber einfach von Behördenseiten übernehmen, zum Beispiel https://www.neuss.de/wirtschaft/statistiken/bezirke/bezirkstabelle?

P.S.: Vielleicht was für eine Wochenaktion? Fehlende Einwohnerzahlen in Deutschland vervollständigen und gleich ein population:date=* ergänzen, wo es fehlt?

Darum ging es mir hier aber überhaupt nicht und die Frage ist hier in einem OSM-Forum auch etwas fehl am Platze - das müssen die Wikipedianer diskutieren (wegen ‘original research’ und so).

Mir ging es um die Frage, ob Ermittlungen/Schätzungen von Bevölkerungszahlen, insbesondere solche aus Primärdaten (Beobachtungen vor Ort, Luft- und Satellitenbilder) in OSM als überprüfbare Informationen dokumentiert werden können.

Bei Dingen, die in OSM nicht verifizierbar erfasst werden können, auf Wikidata als Alternative zu verweisen, ist völlig in Ordnung (so geschehen kürzlich zum Beispiel beim Thema Übersetzungen von Namen). Jedoch auch in den Fällen, wo eine überprüfbare Erfassung in OSM möglich ist, auf Wikidata zu verweisen, ist nicht angemessen denn es läuft darauf hinaus, OSM als eigenständiges Projekt mit eigenen Werten und Regeln zu untergraben.

Und was die rechtliche Problematik der Übernahme von Zahlenwerten angeht - da ist man, wenn man keine exakten Zahlenwerte übernimmt, im Grunde auf der sicheren Seite. Und der exakte Wert einer Erhebung ist sowieso ziemlich belanglos weil die Ungenauigkeit der Ermittlung in jedem Fall erheblich ist. Also wenn man für Berlin population=3500000 erfasst (zwei statt sieben signifikante Stellen), weil verschiedenen Quellen alle Werte in diesem Bereich nennen, ist das rechtlich einwandfrei und auch besser, als einfach den nächstbesten vermeintlich präzisen Wert abzuschreiben, den man finden kann.

Moment. Du sagst, die Aktualität bzw. deren Überwachung in OSM ist schon für alle bisherigen Daten ein Problem; möchtest dann aber noch eine weitere Datensparte (“population”) stärker etabliert sehen? Umgekehrt wird doch ein Schuh draus: Wir konzentrieren uns auf das wesentliche. Dazu zählt in jedem Fall nicht, was leicht aus dem Parallelprojekt wikidata durch einen einmal anzulegenden “Permalink” gezogen werden kann. So kompliziert ist die Auswertung doch nun auch nicht.

Dein Vorschlag, ein QA-Tool für population-Werte und deren Aktualität einzurichten, wirkt vielleicht für den ersten Moment wie ein gutes Mittel. Es wird aber nicht dauerhaft funktionieren. Schau mal z.B. auf die PLZ-Fools-Auswertung. Hier wurde seit vielen Monaten quasi nichts mehr gemacht. Ausnahme: Sachsen (und Brandenburg?) wird regelmäßig geprüft. Ich selbst habe mal mir ein paar Fälle in Berlin angeschaut und korrigiert. Dabei ist die Fools-Auswertung auch ein gutes Tool, um auf Anfänger aufmerksam zu werden, die - aus welchen Gründen auch immer - Daten am falschen Ort oder liederlich getaggt hochgeladen haben. Da ist alles dabei: von wheelmap, maps.me, neuen Mappern mit id, …
Anderes Beispiel: Seit Jahren ist - bis auf wenige Ausnahmen - die Zahl der geöffneten “notes” größer als die der geschlossenen. Es bleiben also immer mehr notes offen.
Ich könnte ad hoc noch einige Beispiele mehr nennen.

**Kümmern sich also dauerhaft ausreichend *OSM-Mapper um QA? Meines Erachtens: Nein, bei weitem nicht! Und ich bin mir sicher, nicht allein mit dieser Einschätzung dazustehen.
Warum also noch eine weitere, unvollständige Daten-Baustelle erhalten/einrichten, um die sich dauerhaft kaum jemand kümmern wird. Denn wer hat schon Lust abertausende Einwohnerzahlen manuell zu vergleichen und abzuschreiben, da es einen regelmäßigen population-Massenimport
wohl nicht geben wird?

  • Braucht man dafür ein Einwanderungsgesetz? :smiley:

population:date verwende ich für den Timestamp der Daten, so wie es oft in Wikipedia steht.
population:check_date wäre wohl dafür, wann ein Mapper diesen OSM-Eintrag geprüft hat.

Gruss
walter

Oops, dann habe ich Dich falsch verstanden, aneinander vorbei geredet…und war ganz zu unrecht getriggert.

Die Frage ob wir als OSM die Bevölkerung erfassen oder nicht, sollte nicht von Wikipedianern entschieden werden.

Ich habe vor einigen Monaten die Stadtteile meiner Heimatstadt mit aktuellen Einwohnerzahlen versehen und diese nicht gerundet. Quelle war das Amts- und Mitteilungsblatt, indem jeden Monat die Statistik veröffentlicht wird (Beispiel auf Seite 12).

Tut jetzt zwar nicht viel zur Sache, aber Traunreut hat seit 2008 ein population Tag
https://www.openstreetmap.org/node/29112429/history

Sonst wäre Traunreut auf meiner nach population>12000 gefilterten Karte auch nicht mehr aufgetaucht https://forum.openstreetmap.org/viewtopic.php?pid=708582#p708582

Ahh, OK. Ich hatte mir die Relation angeschaut, die keinen Label-Node hat. Hab es deshalb übersehen. Dann nehme ich das natürlich zurück.