Das ist ein leidiges gern diskutiertes Thema hier. Ehrlich gesagt war Dein Gedanke ursprünglich mein Grund für die Aufstellung der Statistik. Ich wollte sehen, wie verbreitet denn das “vollständige” Tagging überhaupt ist. Einige sagten ja, es sei ein Problem, wenn man nicht alle addr-Tags setzt, weil man mit den Adressdaten dann in einigen Usescases nichts mehr anfangen könne.
Meine Auswertung ergibt, das nur 74% der Adressen überhaupt “vollständig” sind und sogar nur 61 % der deutschen Gemeinden über Adressen dieses Schemas verfügen. Für mich heißt das, im Zweifel muss man die Informationen eh aus den Relationen/Polygonen herleiten. Ich setze deswegen z.B. kein addr:city|country und meist auch kein addr:postcode mehr. Löschen tue ich es aber auch nicht. Wenn es falsch ist, wird es wohl oder übel korrigiert.
An vielen Eingängen hängt aber noch das veraltete building=entrance, das jemand weltweit in entrance=yes korrigiert hatte, aber das wegen Massenedit wieder reverted wurde.
Mir hat der Eintrag addr:postcode an den Gebäude-Adressen beim Reparieren (Zurechtrücken) der PLZ-Grenzen in Hamburg sehr geholfen.
Um Fehler zu finden, ist addr:postcode in der Tat sehr hilfreich (gewesen). Der Sinn der Irrläufer-Aktion ist ja, die PLZ-Grenzen mit Hilfe von addr:postcode (und DPAG!) zu optimieren. In Zukunft kann, nach meiner Meinung, in den meisten Fällen/Gemeinden auf das Tag verzichten werden bzw. man braucht es nur für ausgewählte Marker setzen.
Auf jeden Fall sollte man es nur setzen, wenn man sich wirklich zu 100% sicher ist. In vielen Fällen war das offenbar nicht so (bzw. der Mapper war sich zu schnell zu 100% sicher). Man sollte auch bedenken, dass sich PLZ öfter ändern als man gemeinhin denkt. Bei einer Änderung müssen dann alle Adressen einzeln korrigiert werden (Massenedit ist ja allerstrengstens verboten!), anstatt nur die Relation zu ändern.
Kann man eigentlich irgendwie abschätzen, wieviele Adressen es in einer Stadt geben müsste (je nach Einwohnerzahl)? Ich nehme mal an, das ist nicht streng proportional zur Einwohnerzahl. Durch große Mietshäuser wird die Anzahl Einwohner je Adresse in Großstädten höher sein. Referenzwerte wären sicher nicht schlecht.
Bielefeld hat als sehr gut erfasste mittlere Großstadt mit 328.314 Einwohnern und 63.931 OSM-Adressen übrigens eine Quote von 5,1 Personen pro Adresse. In Dortmund sind es 5,9 Personen pro Adresse. Wäre das in Berlin genauso (wovon ich nicht ausgehe), müsste es in Berlin 578.829 Adressen geben. In OSM sind es nur 136.455.
Berlin ist nicht mal annähernd vollständig. Ich kann jetzt nur die Situation in Prenzlauer Berg beurteilen und da fehlen noch viele, viele Hausnummern, häufig wird noch interpolation benutzt. Außerdem sind viele Häuser sehr ungenau eingezeichnet, das geht besser.
es gibt in Berlin 385000 Adressen, dort gibt eine OpenData Hausnummernliste, die ich in meiner Hausnummerauswertung drin habe [1]. Wegen einiger Ungereimtheiten sind davon aktuell nur 375.000 in meiner Auswertung aktiv.
Aufgrund der bisher 11 vorhandenen städtischen und dörflichen Hausnummerliste habe ich versucht, Faktoren Einwohner/Adresse zu erstellen, siehe [2] (dort Abschnitt “Städtische und ländlische Hausnummer/Einwohnerzahlen”).
kannst Du mir sagen, wie viele Adressen es z.B. in Augsburg gibt? Ich finde auf Deiner Seite dafür keine explizite Angabe.
Meine Auswertung zählt dort nämlich schon 42.325 Adressen (Straße + Hausnummer). Ich werte aber nicht aus, ob Adressen doppelt erfasst sind (z.B. Geschäft mit Adresse in Gebäude mit Adresse).
es sind in der offiziellen Liste 41.622 Hausnummern vorhanden. Wenn Du eine Stadt, z.B. augsburg auswählst [2] und dort den oberesten Eintrag (den Stadtnamen selbst) auswählst, bekommst Du die Stadt-Gesamtzauswertung und am Tabellenende die Abdeckung und u.a. auch die soll-Anzahl. Bei Augsburg kommen da unten Soll 41387 Hausnummern an, weil die Hausnummern, die wir definitiv nicht finden, ausschließen und unten nicht mit gezählt werden (die soll-anzahl reduziert). Die Zahl am Absatzanfang ist die richtige.
Deine Zahl ist schon zu hoch und darin enthalten sinnd auch in Augsburg 419 Hausnummern, die nur in OSM vorliegen. Das sind zum einen neue Adressen und einige sich noch einige Fehlerfassungen.
Die Soll-Zahlen der anderen Städte kriegst Du über die gleiche Vorgehensweise am Tabellenende.
Das ist nun passiert: Berlin hat nun 139.546 Adressen vor Hamburg mit 137.902. Sonst hat sich im Städte-Ranking nicht viel getan.
Insgesamt zähle ich (2014-04-01) 5.325.822 Adressen in DE (65.376 mehr als vor 10 Tagen). Noch immer gibt es 2.543 Gemeinden ohne eine einzige Adresse.
Ich habe die Adressstatistik für vollständiges Tagging (inkl. country, city, postcode) aktualisiert. Das Städteranking ist kaum verändert. Nur Bochum hat seit der letzten Auswertung vom 2014-03-21 einen Satz nach oben gemacht (+5040 Adressen). Insgesamt haben wir in DE 3.943.609 dieser Adressen. Das sind 58.715 mehr als beim letzten Mal. Die Quote im Verhältnis zum sparsamen Tagging “Straße + Hausnummer” ist weiterhin bei 74%.
Nach längerer Zeit mal wieder eine Adresstatistik (Anzahl Adressen mit Hausnummer und Straße) für alle Gemeinden in DE: In den 43 Tagen seit der letzten Auswertung sind 367.158 Einträge hinzugekommen (> 8.500 pro Tag).
Im Städteranking hat sich Berlin mit vielen neuen Adressen deutlich vor Hamburg behauptet. Ein hoher Neueinsteiger in der Hitparade ist Essen mit insgesamt 52.929 Adressen.
49,0 % der Gemeinden haben weniger als 10 Adressen, 21,6 % sogar gar keine.
ich bin derzeit dabei, in Deutschland je Bundesland eine grafische Auswertung bereitzustellen, wo für jede Gemeinde die theoretische Hausnummerabdeckung dargestellt wird.
Auf der Startseite [1] sind einige kurze Infos über die Art der Darstellung angegeben, mehr Infos gibt es vorauss. im Rahmen meines Vortrags auf der SOTM-EU am Freitag.
Die noch nicht aktiven Auswertungslinks werden bis Donnerstag ja jeweiliger Fertigstellung aktiviert.
Wenn in einem Bundesland Gemeinden noch mit der Farbe ungültig oder gar nicht eingefärbt angezeigt werden, dann hängt das an der derzeit noch umständlichen Darstellungsart ab. Ich verwende die Gemeindepolygin der Straßenlistenauswertung und wenn eine Gemeinde keine Liste hat, fehlt leider noch die grafische Einfärbung. Das ist aus Zeitgründen passiert und werde ich nächste Woche abschalten, damit in allen Bundesländern möglichst alle Abdeckungen angezeigt werden.
Das ganze ist noch ziemlich einfach und umständlich gestrickt, aber ich wollte die gesamte Abdeckung einfach mal vorstellen, in Anlehnung an Gehrke’s Angaben früher.
viele Grüße
Dietmar aka okilimu
Cross-pot zur Meldung im Hausnummerauswertungs-Thread [2]
ich habe versucht, auszurechnen, wieviele Adressen wir in Deutschland haben könnten und komme auf insgesamt 19,3 Mio Adressen. Nach meiner Berechnung in den letzten Tagen haben wir deutschlandweit 34% aller Adressen (Hausnummer und evaluierbare Straßenzuordnung) in OSM.
Mit den Angaben Bevölkerung und Flächenausbreitung einer deutschen Gemeinde (z.B. aus dem Destatis Gemeindeverzeichnis) und den mir verfügbaren 26 Hausnummerlisten innerhalb Deutschlands habe ich die Formel
Faktor ea (Einwohner/Adresse) = 0,0013786206 * Bevölkerung / Fläche [km2] + 3,1463418179
berechnet. Damit habe ich die theoretische Anzahl
Adressen einer Gemeinde = Bevölkerung / Faktor ea
berechnet.
Natürlich ist die Formel ungenau, weil ich nur eine kleine Anzahl Listen habe und diese nicht repräsentativ sind. Aber ich versuche einfach mal, eine Zahl in den Raum zu werfen für die Gesamtanzahl deutscher Adressen.
Den Hintergrund und die Vorgehensweise werde ich vorauss. in meinem Vortrag auf der SOTM-EU am Freitag halten, wenn ich da noch genug Restzeit haben sollte.
Habe mal “als Postler” eine Auswertung der Adressen gruppiert nach PLZ und Gemeinde gemacht. “Spitzenreiter” ist, für mich überraschend, 47877 Willich: 15.186 Adressen in OSM. Erster Verfolger ist 41334 Nettetal mit 12.861 Adressen.
Meine Auswertung berücksichtigt jetzt übrigens auch “addr:place” und “associatedStreet”. Ich komme danach auf insgesamt 5.946.138 OSM-Adressen für DE (Dopplungen durch Mehrfacheintragungen oder Gebäude, die in 2 Gebieten gleichzeitig liegen, nicht ausgeschlossen).
Wenn “nach Gemeinde” admin_level=8 bedeutet, nicht ganz so überraschend, da die größeren Städte auf level=6 oder gar 4 liegen. Wäre aber auch “unfair”, da die größeren Städte auch mehr Gebäude und damit Adressen haben.
Bessere Maßzahl für ein Ranking wäre die prozentale Erfassung. Das funktioniert halt auch nicht, wenn viele Gebäude gar nicht erfasst sind.