Frage zu den Sammeldatenbanken

Ich verstehe nicht genau den Unterschied zwischen Sammeldatenbanken und abgeleiteten Datenbank??!

Wenn ich die Tabellen von Openstreetmap in der gleichen PostgreSQL-DB habe, mit Prefix “OSM_” und die Navteq Daten als “Navteq_” ist das doch eine Sammeldatenbank, ne?

Wenn ich jetzt einen neuen Datensatz aus den beiden Tabellen erzeuge mit Prefix “mischmasch_” ist das eine abgeleitete Datenbank, die ich öffentlich machen muss? Aber woher soll jemand wissen, dass ich das überhaupt für mich gemischt habe?

In der odbl steht ja nur drin, dass man abgeleitete Datenbanken oder die Schritte dazu öffentlich machen muss; es wird da irgendwie grundvorausgesetzt, dass abgeleitete Datenbanken immer öffentlich sind.

Kapier ich nicht. Das ist echt schlecht erklärt, auch hier: http://wiki.openstreetmap.org/wiki/DE:Legal_FAQ

Aber woher will jemand wissen, wenn ich das für mich zuhause oder in der Firma mache? Und was ist öffentlich? Wenn Mitarbeiter drauf gucken? Sehr, sehr schwammig die Lizenz. Wäre doch niemals vor Gericht geeignet!

Ja, die Lizenz ist schlecht (erklärt). Aber was Du in Deinem Kämmerlein mit den Daten machst, geht niemanden etwas an.
Öffentlich ist das Geschehen **in **einer Firma eher nicht. Eine Website oder ein ggf. Geschäftsbericht schon. Bin aber kein Jurist.

Auch so eine Lücke in der Lizenz:

Wenn ich die Navteq und Openstreetmap-Daten mische, eine Umkreissuche mache, um Ergebnisse in einer Original Openstreetmap-Tabelle zu finden und daraus dann eine Karte mache - was ist das dann? Die abgeleitete Datenbank wird nie öffentlich, war aber Mittel zum Zweck.

Und schon ist die odbl ausgeheblt.

Ich habe ähnliche Probleme mit der ODbL. Zum Glück wird die Wahl gelassen, ob man nur ein Diff, die geänderte DB oder den Workflow offenlegt. Ich glaube, das die Lizenz hier im Rahmen des Wettbewerbsrechts nicht durchzusetzen wäre.

Wenn ich mir anschaue, wie viele Produlte es bislang auf OSM-Basis gibt (Halsketten, Tapeten, T-Shirts, Stadtpläne usw.) und wie viele Hersteller davon ihre abgeleiteten Datenbanken oder Workflows offengelegt haben, halte ich die Lizenz schon jetzt für gescheitert :expressionless:

Ich hatte es so verstanden, dass man bei produced works dies nicht machen muss, sondern in dem Fall eine Attributierung reicht.

Hier mal die Stellen:

Unvollständige und unverbindliche Übersetzung aus dem Wiki:

Das halte ich für nicht undurchsetzbar, da der Investition und Innovation somit vernichtet werden. Wenn ich mit einem Startup ein tolles, neues Verfahren zur Aufbereitung der OSM-Daten habe, muss ich die Daten oder die Methode also offenlegen, wenn ich die Ergebnisse öffentlich mache.

Nachtrag: Was viele auch nicht wissen ist, dass man noch nicht mal die Daten modifizieren muss. Laut Definition ist eine Derivative Database nämlich bereits eine Auswahl, ein Auszug oder eine Neuanordnung der Daten. Darum steht in der FAQ auch, dass man das osm2pgsql-Schema bereithalten soll.

Na ja, der Standpunkt bei der Erstellung der ODBL war, das jemand der Investition und Innovation für (finanziell) lau bekommt, der Community dies in irgendeiner Form wieder zurückgeben muss.
Wenn Du das als “innovationsfeindlich” darstellst, musst Du dies auch den professionellen Kartenanbietern vorwerfen, die ein entstehen von Innovation in Startups ja schon finanziell scheitern lassen.

Christoph

Ich erinnere mich, dass der Kerngedanke dahinter jedoch war, dass Verbesserungen zurückfließen sollten. Wenn ich nun die OSM-Daten so aufbereite (abgeleitetes Werk), um damit eine CNC-Fräse zu füttern und einen gravierten Schlüsselanhänger (Produkt) habe, ist das nichts, was der Community etwas bringen würde. Es würde vielmehr Dritten die Möglichkeit geben, das Know-how und die Investition, welche in die Entwicklung der Datenumwandung getätigt wurde, für ihre eigenen Angebote zu nutzen, die möglicherweise im Wettbewerb stehen.

Im Endeffekt könnte jetzt jedem Dienstleister, der auf Anfrage des Datensatzes nicht vollständig reagiert gekündigt werden

Natürlich tue ich das, aber sie haben das Recht ja ihren Daten so zu behandeln. Darum sage ich ja: wieso muss es bei OSM auch Auge-um-Auge gehen? Wieso nehmen wir uns ein Beispiel an den Unternehmen?

Hier mal ein Link zu einer (vernichtenden) ODbL-Analyse im Hinblick auf die Nutzung in Unternehmen und öffentlicher Hand: http://spatiallaw.com/Uploads/ODbL_and_OpenStreetMap__Analysis_and_Use_Cases_.pdf

War neulich in der Wochennotiz erwähnt.

Yop, das mit der fehlenden Datenlizenz habe ich am 1. Tag, als über eine Datenbanklizenz diskutiert wurde, bereits geäußert. Die ODbL soll Datenbanken schützen, die Elemente darin können aber unter CC0 oder weiß-ich-was stehen. Selbst, wenn ich einen unbedeutsamen Teil aus einer Datenbank entferne, können die Elemente immer noch urheberreichtlich geschützt sein. Aber das hat leider niemanden interessiert.

Nahmd,

Zu blöde, dass Deine CNC-Maschine die OSM-Originaldaten verarbeitet, seitdem Du deren Software hast erweitern lassen. Die Vorverarbeitung beschränkt sich auf das Herausschneiden des gewünschten Ausschnittes, und die Kommandozeile für diesen Vorgang stellst Du doch gerne zur Vefügung, oder?

Beispiel 2: Du hast eine tolerante Suche gebastelt, eine, die auch den “Zukspitz”, den “Wazzman” oder den “Glocknerkäse” findet (und damit auch Taggingkabbeleien überflüssig macht). Blöderweise operiert diese Suche auf banalen Textdateien (soll mal jemand versuchen, etwas anderes zu beweisen), und da Du die Wahl zwischen Algorithmus und Daten hast, stellst Du in diesem Fall die abgeleiteten™ Daten der interessierten Öffentlichkeit zur Verfügung.

Unangenehmer wird es im Beispiel 3: Du hast in vielen Jahren Arbeit aus den vielen theoretischen Ansätzen zur Karten-Generalisierung eine brauchbare praktische Anwendung geschaffen, die ohne manuellen Eingriff POI-Icons und Beschriftungen intelligenter als heute üblich auf einer Karte platziert, und willst die Allgemeinheit jetzt mit daraus erstellten Kacheln an Deinem Erfolg teilhaben lassen. Doch halt! Sooo einfach ist das nicht! Wenn Du die Kacheln bereitstellen willst, musst Du zuvor eine Datei mit den berechneten Positionen für die Icons und Labels bereitstellen.
Du wolltest eine kleine Belohnung für die viele Arbeit durch Verkauf von brauchbaren PDF-Karten zum Selberdrucken, doch daraus wird nichts: denn mit den veröffentlichten Positionsdaten kommt Dir einer der Großen™ zuvor. Dumm gelaufen.

Da Du aber schlau bist, verzichtest Du sowohl auf die Kacheln als auch auf die PDF-Karten, sondern verkaufst Dein Verfahren an Google, der ihn dann in den Ländern, wo dies möglich ist, patentiert.

Nach meinem Gefühl ist die ODbL nicht direkt innovationsfeindlich, sie behindert aber die Kleinen beim Aufbau eines Geschäfts, begünstigt dafür bestehende Große, und ist recht leicht zu umgehen (gerade durch mit allen juristischen Wassern gewaschene Große).

Aber auch wenn sie Mist ist, ist die ODbL vielleicht die beste Möglichkeit, das “sei fair” in die Welt der Juristen zu übersetzen?

Gruß Wolf

Da bin ich mir nicht sicher. Ist die Bedingung der ODbL erfüllt, wenn der Dienstleister am Ende nur eine Kommandozeile für sein internes Tool veröffentlicht, ohne das Tool selbst? Ich habe das immer so verstanden, dass alle Möglichkeiten gegeben sein müssen, um vom Ursprungs- zum Endstand zu kommen.
Ich bin davon ausgegangen, dass die Software in der PostGIS-Datenbank verarbeitet wurde. Aber wo setzt Du in Deinem Beispiel die Trennung? Was ist, wenn die modifizierte CNC-Software temporäre Dateien erzeugt? Die müssten dann doch ebenfalls wieder unter der ODbL veröfflicht werden - die Anwendung selbst und das Schnittprogramm aber nicht. Das ist ja das gleiche Beispiel, wie mit Mapnik: der Zeichenschlüssel muss nicht veröffentlicht werden, wenn ich aber die Daten in der PostGIS arbeite, z.B. alle aneinander grenzenden Highways zusammenfasse.

Wieso? Das ist doch korrekt… die ODbL lässt Dir die Wahl.

Meine veröffentlichten Positionsdaten stehen unter ODbL. Sobald die meine Positionsdaten auf ihre Karten kleben, müssen sie die ja wieder unter ODbL rausgeben und das ist doch eine Win-Situation (keine Win-Win g).

Ich hätte es lieber gesehen, das Copyleft auf Verbesserungen der Datenbasis zu beschränken und allgemein alle Veränderungen anzuziehen.

Also ich kenne die Disskussion so, dass ein Kartenrenderingstyle nicht veröffentlicht werden muss, weil es keine Datenbank mehr ist.

Ja, weil der Renderer die Daten nicht bearbeitet. Okay, das stimmt aber auch nur bedingt. Mapnik & Co. können Daten selektieren, vereinfachen (Simplify) und hinzufügen (Offset)… Aber das würde es auf die Spitze treiben.

Wir werden extrem Offtopic :slight_smile:

Nein, es wird vorausgesetzt, weil die ganze Geschichte mit der Pflicht zur Veröffentlichung nur dann greift, wenn du Daten oder Karten (oder Navisoftware … Schlüsselanhänger…) daraus herstellst und die veröffentlichst. Wenn nur du, deine Familie und deine Kollegen auf die Produkte sehen, kannst du machen was du willst. Über Grenzfälle, wie viele Leute Familie und Kollegen sind, kann man dann immer noch streiten…

Klar gibt es auch ganz viele Fälle, wo nie jemand draufkommen wird, dass irgendwo eine gemischte Datenbank existiert. Selbst der einfachste Fall ist schwer nachweisbar: Wir können oft nicht mal sicher sagen, ob einer Karten aus OSM oder aus anderer Quelle herstellt. Da die ganze odbl sich nur auf Datenbanken bezieht, kann man auch immer behaupten, dass so eine gemischte Datenbank nicht existiert und alles auf geheime und magische Weise in einer weiteren Verarbeitungsstufe passiert (so wie Wolf behauptet, seine Fräse könne OSM lesen).

Du musst ihm entweder die ganze Datenbank geben, oder “A file containing all of the alterations made to the Database or the method of making the alterations to the Database (such as an algorithm), including any additional Contents, that make up all the differences between the Database and the Derivative Database.” (odbl 4.6)

Wie der Satz zu verstehen ist, darüber kann man rätseln. Ein Nachfrager wird vielleicht ein “da mach ich $fachausdruck und lass dann noch mal $(in fachkreisen bekannter algorithmus) drüberlaufen” akzeptieren, ein anderer ist erst zufrieden, wenn du ihm ein Programm schreibst, das er bedienen kann.

Die Lösung, dem Anfragenden einfach die gesamte Datenbank zu geben, passt immer. Nur über das Format und den Datenträger müsste man sich einigen und über die Häufigkeit der Bereitstellung…

Man muss sich vorher Gedanken machen, wie man mit Anfragen umgeht und zum Verschicken der gesamten Daten muss man bereit sein, wenn man OSM mit anderen Daten verwendet. Wenn ein Interessent störrisch genug ist, wird er keine Beschreibung des Bearbeitungsweges akzeptieren. Zu häufige lästige Anfragen kann man dann nur noch mit “reasonable production cost for physical distributions” (4.6) in Grenzen halten.

Grüße, Max