Massig doppelt vorhandene Gebäude ...

Ich bin noch nicht so lange dabei, habe aber in der letzten Zeit einiges in meinem Wohnumfeld (Köln) gemappt. Nun habe ich gestern gesehen das jemand einen sehr großen Datensatz hochgeladen hat (Gebäude ohne Details) und nun sehr viele Gebäude doppelt vorhanden sind. Wie sollte man in so einem Fall denn vorgehen, hat da jemand Tipps was nun zu tun ist?

Hallo treet58,

willkommen im Forum.

Vermutlich geht es um Changesets wie dieses hier? Die Bearbeitungen sehen in der Tat sehr seltsam aus. Unter anderem gibt es jede Menge Knoten, die wohl Gebäudeumrisse bilden sollen, aber es gibt keinen zugehörigen Weg und die Knoten selbst haben ein building-Tag. Siehe als Beispiel dieses Gebiet. Erinnert mich ein wenig an das Ergebnis, das automatische Tools zur Flächenerkennung liefern. Oder einen misslungenen Import. Vielleicht handelt es sich auch um einen langen Offline-Edit, bei dem dann das Hochladen schiefgegangen ist.

Ich schätze mal, dass dort ein Revert angebracht wäre. Meine Empfehlung an dich: Erst einmal nichts ändern und nicht versuchen, Duplikate zu löschen. Den Mapper anschreiben und versuchen, in Erfahrung zu bringen, was er vorhatte. Falls dabei Kommunikationsprobleme oder auch nur -verzögerungen auftreten, ist das ein Fall für die Data-Working-Group.

Sofern du nicht weiterkommst, kannst du dich einfach hier nochmal melden.

Danke erst mal für das Willkommen!

Genau um diese Changesets geht es. 200000 Knoten macht man sicher nicht mal so an einem Nachmittag, von daher war meine Vermutung auch das entweder jemand sehr lange dran gearbeitet hat oder die Daten auf anderem Wege erstellt worden sind.

Ich wollte eben genau nicht einfach drauf loslegen und von anderen Leute Dinge löschen, von daher ist deine Auskunft genau das was ich mir erhofft hatte. Werde jetzt mal versuchen mit dem Kollegen in Kontakt zu treten.

Danke!

Interessantes Einstiegswerk (Der Mapper ist seit gestern angemeldet).

Hi

Das sieht mir stark nach einem automatischen Edit aus, vor allem da das insgesamt nur 4 Changesets sind.

Wenn da nicht eine wirklich plausible Erklärung kommt, bin ich für einen revert

Bernd

Andernfalls aber auch gerne!

Noch ergänzend zu den Anmerkungen von MetiorErgoSum: falls die Daten sich als legitim (=über Tage hinweg handgemalt) herausstellen, heißt es Aufräumen. Das geht mit dem JOSM Validator recht einfach: einen Teil des betroffenen Gebiets herunterladen und die Datenprüfung drüber laufen lassen. Viele Fälle mehrfacher Knoten und Wege kann JOSM selbständig korrigieren; lose Knoten auch (dabei sollte man sich jedoch auf die Knoten des fraglichen Users beschränken). Allerdings empfiehlt es sich, vor dem Hochladen noch einmal “Geändertes aktualisieren” auszuführen, weil die automatischen Korrekturen des Validators auch ziemlich viele Null-Edits verursachen. (Normalerweise bin ich dafür, den Verursacher selbst aufräumen zu lassen - aber in diesem Fall scheint mir das zu gefährlich.)

Im Falle eines Imports oder ähnlichem wird erstens nach der Quelle zu fragen sein, zweitens nach der Absprache mit den Mappern vor Ort, drittens nach der Methode, denn handwerklich gut gemacht sieht anders aus. Dann könnte eine komplette Löschung bzw. ein Revert der Änderungssätze angesagt sein, wenn die Regeln zu Importen oder die Lizenz der Quelle verletzt wurden.

Die Data Working Group ist eigentlich nur gefragt, falls keine Antwort kommen sollte.

PS. Die losen Knoten wirken ein bißchen so, als ob vor dem Hochladen noch Gebäude aus dem Datensatz entfernt wurden, die in OSM bereits vorhanden sind, dabei aber nur die Wege und nicht ihre Knoten gelöscht wurden. Das deutet nicht auf Arbeit mit JOSM hin, denn JOSM würde in dem Fall auch die Knoten löschen.

Danke auch an all die Anderen, ich habe dem betreffenden eine entsprechende Nachricht geschickt und nun schaue ich mal ob es eine Antwort gibt. Werde hier natürlich auch weiter darüber berichten.

HUHU
In meiner Gegend ( Wesseling) sieht es auch ziemlich daneben aus. Die Punkte sind zwar sehr genau aber ohne jeden Bezug. Es gibt jetzt aber auch hier doppelte Gebäude. :frowning: Da frage ich mich warum ich Tage damit verbracht habe Häuser zu taggen und von Luftbildern abzumalen. Gefragt hat er auf jeden Fall nicht!
Ich bin mal gespannt was der User zu sagen hat.

Schöne Grüße
Meik

Eine erste Reaktion hab ich mittlerweile erhalten. Er vermutet auch das irgendwie was beim Hochladen falsch gelaufen ist und erzählt etwas von einem Java-Script das Pbf in OSM wandelt und das nicht richtig funktioniert habe. Er versucht aber es zu ergründen. Ich habe nun mal nachgefragt auf welche Art er die Daten denn eingeben hat.

Vorgeschlagen habe ich ihm einen Revert seiner Changesets zu machen, die Daten zu prüfen und dann gegebenenfalls neu hochzuladen. Ob und wie er das hinbekommt, weiß ich natürlich auch nicht, da kenne ich mich hier noch zu wenig aus.

Na ja, fragen muss ja im Prinzip auch keiner, darf ja jeder gerne Daten eingeben, aber man sollte schon aktuelle Daten verwenden so das dann nicht Dinge plötzlich doppelt vorhanden sind. Im Prinzip sieht es Im Kölner Bereich an vielen Stellen jetzt so aus.

Bevor ich etwas hoch lade schau ich ob es in dieser Gegend bereits diese Daten gibt. Wenn ja und ich ändere diese bestehenden Daten oder füge sehr ähnliche Daten massenhaft ein, dann sollte ich vorher schon mal fragen. Sonst kommt es zu diesen doppelten Daten wie wir es jetzt haben.
Vor allem, wenn es wie bei mir mit sehr viel Arbeit verbunden war und fast alle Gebäude auch mit Adresse versehen sind.
Für diese Daten bin ich ein halbes Jahr durch den Ort gerannt und habe nicht irgendwelche Daten importiert. Da bin ich vielleicht etwas empfindlich! :wink:

Also so wie es scheint hat der Kollege nicht wirklich die Ahnung. Er sagt das er die Daten tatsächlich von Hand eingegeben hat mit JOSM. Er könnte jetzt einen Datensatz von Februar zurückspielen, aber ich denke das wäre auch nicht gut.

Vielleicht könnte sich ja jemand der Erfahrener ist mal mit ihm in Kontakt setzen und ihm bei einem eventuellen “revert” unterstützen, für das er laut Auskunft auch offen wäre. Englisch ist allerdings Voraussetzung für die Konversation mit ihm …

Das kann ich aus deiner Sicht sehr gut nachvollziehen, aber er hat ja auch keine Daten geändert, sondern nur welche hinzugefügt. Anscheinend hat er sehr lange an dem heruntergeladenen Datensatz gearbeitet und in der Zwischenzeit waren natürlich schon Änderungen von anderen vorhanden.

Egal, was er damit meint - bitte nicht. Er hat nur Daten hinzugefügt, keine bestehenden bearbeitet - da soll er bitte nicht zur Verschlimmbesserung mit alten Ständen hantieren. Das einzig sinnvolle scheint mir die Löschung seiner Daten: entweder selektiv dort, wo Dopplungen mit Beiträgen anderer Mapper bestehen, oder radikal. Letzteres geht schnell, aber dann sind auch mögliche sinnvolle Beiträge futsch. Falls es sich um einen Import handelt, wäre es allerdings kaum schade drum, denn dann ließen sich die Daten jederzeit reproduzieren.

Also wie war das? Von Hand eingegeben mit einem “Java-Script” (JavaScript oder Java-Programm?) zur Konversion von pbf in osm? Irgendwie paßt das alles nicht zusammen. Meint er vielleicht pdf (Abmalen oder Bilderkennung)? Mir fällt jetzt kein OSM-Editor ein, der bevorzugt PBF schreibt, was dann erst in OSM-XML konvertiert werden müßte. Und muß man mit einem Programm, das man nicht versteht, zu einem Projekt, das man nicht kennt, gleich hunderttausend Objekte hochladen?

Komisch - anhand des Änderungssatzkommentars (“… drawed …”) war ich mir sicher, es sei ein Deutscher.

Ich habe ihm, da ich sicher gehen wollte, meine Anfrage in derselben Nachricht in Deutsch und Englisch geschickt, geantwortet hat er dann in Englisch. Aber ich denke auch das seine Muttersprache nicht Englisch ist, sonder noch etwas anderes.

Was er genau gemeint hat, habe ich vielleicht auch aufgrund der sprachlichen nicht ganz verstanden. Es geht bei den Changesets aber schon um den ganzen Kölner Raum und wenn man sich da einzelne Bereiche, z.b. Weiden mal in JOSM anschaut, dann ist da eine selektive Löschung wirklich sehr sehr viel Arbeit.

Vielleicht erklärt sich ja doch mal jemand bereit das mit dem Kollegen direkt zu klären, denke das wäre einfacher als wenn ich mit meinem Halbwissen noch dazwischenstecke.

Da hatte ich mich nicht klar genug ausgedrückt: selektiv meinte ich hier als “Ortschaft für Ortschaft” bzw. “Stadtteil für Stadtteil”. Also in einem Ort, wo es Dopplungen gibt, seine Gebäude komplett löschen; wo keine nennenswerten Dopplungen bestehen, beibehalten. Ich habe keinen Überblick; aber je nachdem, wie verstreut seine Bearbeitugen sind, wäre das machbar. Alles mal unter dem Vorbehalt, daß sich doch noch zwingende Gründe für die radikale Lösung ergeben.

Da kann man nich mehr von verstreut reden, das ist flächendeckend im Kölner Süden.
Ich habe vorhin fast einen Schlag bekommen, als ich zufällig darüber gestolpert bin,
den Thread hier hätte sonst ich eröffnet.

Bernd

Wenn ich mir das In JOSM anschaue, dann mögen die Doppelungen vielleicht gar nicht mal so das Hauptproblem sein, sondern eher auch die Tags die irgendwie unvollständig sind.

Meine Meinung: Revert und dann erst mal in Ruhe klären, was er da überhaupt gemacht hat.

Dummerweise hängen da aber auch tausende von ihm erstellte ways dran.

Ich würde vielleicht erst mal einen entsprechenden Filter in JOSM testen und die nodes mit building=yes befreien.
Gefiltert werden muss nach User und Type:node
Ein Probelauf ohne Upload in Lövenich hat keine Nebenwirkungen gezeigt, außer eine Haufen Konten ohne Eigenschaften, die man mit JOSM problemlos entfernen kann.

Ich will mir aber meine Statistik nicht kaputt machen :wink:

Bernd

Das sollte dann aber ein erfahrener Mapper machen, ich traue mir das nicht zu und auch dem eigentlichen “Verursacher” wäre eher geholfen wenn er das nicht selber macht. Natürlich wäre es schade um die Arbeit, aber ich vermute er hat die Daten ja noch auf seinem PC und könnte sie nach einer Überarbeitung doch noch mal hochladen. Mit dem Revert hat er sich zumindest einverstanden erklärt:

Ich kann es revertieren wenn gewünscht

Bernd