überflüssige Tags entfernen

Ich denke, bei created_by sind die Unterschiede nicht so groß. Deine Vermutung mag zutreffen, andererseits gibt es gegenläufige Effekte. So ist OSM in DE relativ früh gestartet, in manchen anderen Ländern dagegen erst später in die Hufe gekommen - als die Editoren gar kein created_by mehr gesetzt haben. source hatte ich in der Auswertung noch vergessen, aber das wird den Altkanzler auch nicht schlank machen. oben ergänzt

Bei den sonstigen Tags gibt es länderspezifische Unterschiede. In NL etwa stammen die landuse-Daten und Gebäude größtenteils aus dem 3dShapes-Import und tragen massig Tags wie source=3dShapes, 3dshapes:ggmodelk=. Die Straßen hingegen stammen aus dem AND-Import und tragen AND:importance_level=, AND_nosr_r=* und gelegentlich noch anderen Mist. Wer also eine NL-Datenbank zum Rendern aufsetzen will, könnte evtl. in der lokalen Datenbank noch ein paar Prozent mehr Reduktion erreichen. Ähnlich dürfte es in anderen importgeplagten Ländern (FR/cadastre, USA/TIGER, CDN/kann weg, JPN/argrath, AUS/ABS2006, …), aussehen. Aber wie schon angedeutet, würde eine solche Filterung das stetige Wachstum des Datenvolumens lediglich um ein paar Wochen verzögern.

Dafür haut man jetzt eineige ziemlich große diffs raus. Man hat also kurzzeitig einen deutlich erhöhten Traffic. Der Plattenplatz verringert sich auch nicht, da die diffs Ewigkeiten auf dem Server liegen. Bspw. hourly seit ~2009

…und genau deshalb macht der Composer das ja auch automatisch für den 0815-Nutzer :wink:

Interessante Frage, vielleicht ein Fall für die rebuild-Liste?

Im Prinzip wäre es ja naheliegend, die alte CC-BY-SA-DB in eine ODbL-DB umzudiffen, also mit Diffs auf einen Stand zu bringen, der nur noch ODbL-lizensierte Daten enthält. Aber formaljuristisch wäre der so erzeugte Datenbestand ein abgeleitetes Werk der alten CC-BY-SA-Daten, welche die lokale DB enthielt…

Es kommt darauf an, wie der Neuaufbau der Datenbank technisch ablaufen wird, z.B. könnten sich alle Objekt-IDs ändern (das wurde überlegt, Ergebnis ist mir unbekannt).
Darüber wird man vermutlich dann genauer nachdenken, wenn man die Schritte davor erledigt hat. :wink:

Gruß,
Mondschein

Nur um ein mögliches Mißverständnis auszuschließen: es ging um (z.B.) wambachers lokale Datenbank. Die besteht jetzt aus CC-BY-SA-Daten. Wenn man der nun ein Diff verpaßt, sodaß sie nur noch die zukünftig unter ODbL veröffentlichten Daten enthält, ist der neue Datenbestand ein abgeleitetes Werk der alten CC-BY-SA-Daten und des Patches (unter welcher Lizenz auch immer), müßte aber als abgeleitetes Werk wieder unter CC-BY-SA stehen, obwohl er genau die Daten enthält, die OSM unter ODbL veröffentlicht, also dieselben Daten, als hätte wambacher den frischen ODbL-Planeten eingespielt.

Nach gesundem Menschenverstand ist das natürlich alberne Haarspalterei: das Ergebnis ist dasselbe, nur der Weg ist unterschiedlich aufwendig. Aber juristisch könnten beide Wege durchaus unterschiedlich bewertet werden. Zum Vergleich: Wenn Bing und Google von einer Region die gleichen Luftbilder (in gleicher Auflösung und identisch referenziert) haben, kannst du von einem von beiden Objekte für OSM abzeichnen, das Ergebnis ist in beiden Fällen identisch. Nur daß du von Bing abzeichnen darfst, von Google nicht. Und rechtlich ist nicht interessant, was du alternativ hättest machen können, sondern was du tatsächlich gemacht hast.

Nach der Logik wäre die zukünftige OSM-ODbl-DB auch ein abgeleitete Werk: Sie besteht aus den “alten” Daten minus den “unerwünschten”.

Ich stehe derzeit auf folgenden Standpunkt: Wenn “meine” DB nur noch Objekte enthält, die auch in der OSM-DB genauso drin sind, ist die meinige “sauber”. Wie ich dieses Ziel erreiche, ist unerheblich.

Der Vergleich hinkt ein wenig: Es ist dir bei Luftbildern unterschiedlicher Anbieter nie möglich, die Daten EXAKT gleich einzutragen. Mal stimmt das Datum nicht, mal der Versatz und es gibt bestimmt noch andere Unterschiede. Das Ergebnis sind “ähnliche” Daten aber nicht “identische”.

Aber warten wir mal ab, was auf uns zukommt.

Gruss
Walter

Dann hätte (oder hat) man das Problem auch jetzt schon, denn eine technische Trennung gibt es jetzt ebenfalls nicht.
Derzeit arbeiten wir auch nur mit einer “CC-BY-SA”-Datenbank, die Trennung erfolgt erst später.
Wenn man dieser “Haarspalterei” folgt, so hätte man eigentlich von Anfang an zwei getrennte Datenbanken verwenden müssen, um sicherzustellen, dass sich niemals “CC-BY-SA”-Daten in der CT-Datenbank befinden.

Spätestens wenn Gesetze auf Technik treffen, wird es kompliziert… :wink:

Gruß,
Mondschein

Ich geh davon aus, dass die neue OSM-DB changeset für changeset neu aufgebaut wird.

Wie Oli-Wan schon sagt, das Resultat (Software-Fehler mal außen vor) ist technisch identisch, aber juristisch ist es eben nicht identisch.

Entschieden ist das nicht, denn zuletzt wurde darüber diskutiert, ob man die Daten nicht einfach alle in der Datenbank belässt und nur entsprechend markiert.
Die Filterung würde dann die API übernehmen.

Gruß,
Mondschein

Nur zu gerne würde ich zustimmen, aber ich fürchte, daß die Juristen es eben anders sehen werden.

Gehen wir mal davon aus, daß Bing und Google Luftbilder eines Gebiets bei demselben Anbieter einkaufen, inklusive fertiger Georeferenzierung - dann ist es möglich. Oder: Als nach Weihnachten der Aerowest-Server nicht zur Verfügung stand, hätte man dort, wo Google die gleichen Bilder zeigt, von Google abmalen können - mit gleichem Ergebnis. Nur durfte man es halt nicht.

Der Bau der neuen Datenbank von OSM selbst ist noch einmal eine eigene Baustelle, für die möglicherweise (!) etwas andere Regeln gelten. Man könnte sich z.B. auf den Standpunkt stellen, daß die interne Datenbank unter gar keiner Lizenz steht, sondern nur den Absprachen (jetzt CTs) zwischen Serverbetreiber bzw. OSMF und den einzelnen Mappern unterliegt, und erst die veröffentlichten Daten unter die eine oder zuküftig andere Lizenz fallen. Und die Absprache lautet, daß die OSMF die jetzigen Daten unter CC-BY-SA veröffentlichen darf, bzw. unter CC-BY-SA und ODbL die Beiträge derer, die den CTs zugestimmt haben. Mit dieser Argumentation könnte man munter in der Datenbank herumlöschen, bis nur noch ODbL-Daten übrig sind.

Bevor wir uns nun ausgiebig über den vorigen Absatz streiten: Das soll nur eine beispielhafte Überlegung sein. Gut möglich, daß der skizzierte Standpunkt nicht haltbar wäre, es ist mir letztlich völlig egal. Ich will nur darauf hinaus, daß sich mit der Veröffentlichung möglicherweise die Spielregeln ändern, was man mit den Daten machen darf: was die OSMF im stillen Serverraum mit der Datenbank macht, unterliegt womöglich anderen Regeln, als die Nutzung der Daten durch User W.

Gesetze werden ja auch nicht gemacht, um Technikern Richtlinien an die Hand zu geben, sondern um Juristen ein Einkommen zu verschaffen.