Status Lizenzwechsel

Moin,

FYI: [OSM-talk] Licence redaction ready to begin – http://lists.openstreetmap.org/pipermail/talk/2012-July/063420.html

LG,

-moenk

Morgen (11.7.) soll dann der Redaktions-/Putzbot seine Arbeit aufnehmen.

Geputzt wird dann vom Ablauf wie folgt:
1. Irland
2. Vereinigtes Königreich
3. Westeuropa
4. Nordamerika
5. Australien
6. Rest der Welt

Edit: Die Objekte/Changesets werden vom Bot in der Datenbank erst mal nur, über einen extra API-Redaktions-Erweiterung, als versteckt markiert, sind aber vorerst noch da.

Die offizielle Ankündigung findet sich hier:
http://blog.osmfoundation.org/2012/07/09/licence-redaction-ready/
http://lists.openstreetmap.org/pipermail/announce/2012-July/000063.html

Und auch auf talk, talk-de und dev:
http://lists.openstreetmap.org/pipermail/talk/2012-July/063420.html
http://lists.openstreetmap.org/pipermail/talk-de/2012-July/096607.html
http://lists.openstreetmap.org/pipermail/dev/2012-July/025173.html

Und auf talk-ie und talk-gb, denn das sind die ersten betroffenen Gebiete:
http://lists.openstreetmap.org/pipermail/talk-ie/2012-July/000481.html
http://lists.openstreetmap.org/pipermail/talk-gb/2012-July/013536.html

Der Bot wird, nach derzeitiger Schätzung, insgesamt ca. einen Monat benötigen.
Hier ist er übrigens zu finden, falls ihn jemand haben möchte: :wink:
https://github.com/gravitystorm/openstreetmap-license-change

Um Konflikte beim Bearbeiten zu reduzieren, wird (während der Bot in der entsprechenden Region läuft) empfohlen, die Änderungen möglichst oft und zeitnah hochzuladen.

Gruß,
Mondschein

Woher weis ich wo und wann der Bot läuft ?

Ende der Woche könnte IE und GB fertig sein:
http://lists.openstreetmap.org/pipermail/talk-gb/2012-July/013538.html
Danach kommt dann Westeuropa.

Auf den offiziellen Mailinglisten und hier im Forum wirst du sicher erfahren, wenn es bei uns so weit ist. :slight_smile:

Gruß,
Mondschein

wenn ich all die Infos richtig verstanden habe, ackert sich der Bot so nach und nach durch die ganze Live-DB und wird dafür einige Wochen brauchen.

Daraus folgere ich, dass ab sofort die Diff-Files aus UK “ein wenig größer” werden, da bei dieser Aktion ja auch Sachen angefasst werden, die sonst niemand ändert.
Mal sehen, ob mein Diff-Import auf Minutenbasis das verkraftet.

Wenigstens brauch ich dann keinen Full-Import mit den sauberen Lizendaten machen.

Gruss
walter

Walter, das wirst du ohnehin machen müssen. Deine DB ist nur cc-by-sa un die kannst du nicht umlizenzieren. Aber das hatten wir doch schon mal ausdiskutiert…

Ja.

Ich versuche gerade herauszufinden, wie stark die Diffs (in Prozent) wachsen werden.
Ganz naiv:
Ca. 2% der Daten werden durch den Bot verändert oder gelöscht, dafür gebe ich ihm 3 Wochen.
Ca. 2% der Daten werden täglich durch normale Bearbeitungen erzeugt oder verändert.
Das bedeutet also, dass die Diffs um 1/21 (also ca. 5 Prozent) größer werden?

Ist das wirklich so wenig oder wo ist mein Fehler?
Sind meine Zahlen falsch, habe ich mich verrechnet oder habe ich da etwas völlig falsch verstanden? :confused:

Gruß,
Mondschein

jo, da war mal was. Diskutiert ja - ausdiskutiert, nicht unbedingt
werd ich wohl gelegendlich mal machen, aber nur damit anderer Schrott rauskommt. Allerdings sehe ich da für mich keine akuten Probleme, da ich derzeit eh nichts im Netz anbiete.

Im übrigen bin ich immer noch der Ansicht, dass eine DB, die nur ODBL-Daten enthält, “sauber” ist - egal auf welchem Weg das erreicht wurde.

schau’n mer mal, wie sich die Sache entwickelt und was dazu eventuell von unseren Lizenz-Gurus kommt.

Gruss
walter

Worauf basiert diese Annahme?

Ich versuche mal eine Abschätzung; dabei addiere ich Knoten, Wege und Relationen vereinfachend ohne Gewichtung. OSM enthält etwa 1.5G Knoten, 140M Wege und ein paar Relationen, macht grob 1.6G Objekte. In einem zufällig herausgegriffenen day-replicate aus den letzten Tagen finden sich 1,7 M Objekte. Das ergibt eher 10^-3 oder 0,1 % pro Tag.

Ehrlich gesagt, mach ich mir nicht allzu viele Sorgen darüber. Meine Toolchain (osmosis → postgresql/snapshot) braucht zum Verarbeiten der Daten einer Stunde ca 10-15 Minuten.
D.h. erst wenn ca 3-4 mal mehr rüberkommt als jetzt, wird es bei mir eng.

kann man schön an den Zacken rechts sehen: Rechner um 14:00 an und dann die Daten von ca 9:00-14:00 Uhr in Stundenblöcken reingezogen. Nach ca 1H ist das Lag nur noch 2 Minuten. Dann geht übrigens die Last im Grundrauschen des Rechners unter.

In der mittleren “Steilkurve” geht das noch fixer, da er hier die nächtlichen Daten verarbeitet und Europa tief geschlafen hat.
Dauert wohl noch ein wenig, bis rund um die Welt gemappt wird.

Gruss
walter

p.s. grafik wird hier nicht aktualisiert.

Ich wusste es, ich habe mich verrechnet. :expressionless:

Ja, da ist mir das Komma verrutscht, nach meiner groben Rechnung kommen ca. 0,2 % pro Tag heraus.
Hatte die Zahlen nur “grob” von odbl.de abgelesen. :slight_smile:

Jetzt nehme ich mal 0,1 % normale Bearbeitungen pro Tag an.
Beim Bot wären es dann ca. 0,1 % pro Tag (bei 3 Wochen).

Also könnte man dann grob mit einer Verdopplung der Diff-Größe rechnen?

Gruß,
Mondschein

@Oli-Wan das dürfte wohl eher hinkommen und wäre dann Faktor 2. Wobei das natürlich eher der Durchschnitt ist.

In einigen Regionen sind es deutlich weniger als 2% die gelöscht werden und wenn ich an Australien denke, dürften die Changefiles deutlich größer werden.

Wenn man meine obige Abschätzung zugrunde legt, ist ein Faktor 2 durchaus drin. Dabei ist noch zu beachten, daß die Laufzeit des Putzbots bisher nur eine wilde Schätzung ist, und sein Durchsatz je nach Region stark variieren könnte (je nachdem, ob die problematischen Bearbeitungen weitgehend isoliert oder mehr oder weniger stark mit anderen Beiträgen verflochten sind). Für Datenbanken, die beim Import schon nahe am Limit sind, könnte es durchaus knapp werden.

Nun, die Ansichten waren dargelegt, ohne daß einer den anderen überzeugen konnte. D.h. wir waren ungefähr an folgendem Punkt:

Das dürfte juristisch anders gesehen werden. Der lizenz- und urheberrechtliche Status eines Objekts ist (leider) keine Zustandsgröße. (Position B)

Einverstanden. :slight_smile:

Bin mal gespannt, wer da mithalten kann/will und wer nicht. :slight_smile:

Gruß,
Mondschein

Werden die Diffs nicht sowieso während dieser Zeit eingestellt und man muss danach einen neuen Planet laden? Ich meine das mal gelesen zu haben.

mag ja so richtig sein. Aber dann müsste ja auch die Live-DB, die ja (ab morgen?) “gebottet” wird, auch neu aufgesetzt werden?

Oder wollen/sollen wir hier in unserem deutschen Lande mal wieder päpstlicher als der Papst sein?
Hier interessiert mich momentan das Ziel mehr als der Weg.

Gruss
walter

p.s. woran erkennt man eigentlich (z.B als Anwalt) den Unterschied zwischen einer “gebotteten” DB und einem Neu-Import, wenn beide eh die gleichen Daten enthalten? :wink:

mir war auch so, dass ich das irgendwo gelesen hatte… kann sich aber natürlich geändert haben.

ist schon etwas länger her. Wenn das aber so wäre, dürften für die nächsten Wochen keine Diffs mehr kommen.
Das hatten unsere Kollegen ja auch Anfang April vor und dann kamen dennoch aktuelle Diffs rüber.

Aber die Diskussion ist hier sowieso schon hochspekulativ und bringt eh nicht viel.
Morgen rennt der Bot und wir wissen etwas mehr.

Gruss
walter

Bspw. weil deine DB eben nicht die gleichen Daten enthält, weil es beim updaten einen Schluckauf gab.

Der Unterschied zwischen deiner DB und der OSM-DB ist folgender: Die OSMF hat dir über eine gewisse Zeit die Daten unter cc-by-sa zur Verfügung gestellt. Das gibt dir aber nicht das Recht, diese unter ODbL zu stellen.

Die OSMF ist der Lizenzgeber für das Verteilen der Daten und kann die unter der Lizenz verteilen, die ihnen von den Mappern erlaubt wurde.

Das ist in etwa so, als würde ich dir ein Bild unter Lizenz A geben. Nur weil ich es aber jemanden anders das gleiche Bild unter Lizenz B gebe, hast du nicht das Recht, ebenso das Bild nach Lizenz B zu nutzen.