Auch ich gestehe -wie errt- nicht alles im Detail gelesen zu haben. Aber ich kümmere mich regelmäßig um das Thema DQ [wenn auch mehr im Bereich Tagschreibweise (besonders im Umfeld Adresse)] und auch beruflich habe mit diesem Thema Berüherungspunkte.
Eine der wichtigsten Grundaufgaben im Bereich DQ ist eine Meßgröße festzulegen, um den DQ-Zustand der Daten festzuhalten (einfache OSM-Beispiel: Anzahl der oneway Tags mit unbekannten Werteausprägungen siehe http://www.familieverweyen.de/txt_0054.php)).
Dann muss eine (messbare)Definition festgelegt werden, was einen Datensatz mit gut Qualität (bzw. akzeptabler Qualität) und nicht ausreichender Qualität auszeichnet. Also z.B.: wenn sich bei einer Verwaltungsgrenze (nach Auflösung aller potentiellen Unter-Relationen) eine Menge von in sich geschlossene Wegen bildet, die sich nicht überlappen. (Akzeptabel wäre, wenn die Wege nach einer Sortierung (und ggf. Richtungsänderung) eine solche Menge bilden würden.) [Bewußt vereinfacht dargestellt!]
Danach muss man sich eine Menge der zu messenden Objekte festlegen (z.B. admin_level < x). In den Changeset-Dateien kann man sich dann alle Objekte mit diesem Schlüssel herausfischen und die Kontrolleroutine dazu laufen lassen. Wenn man keine große DB aufbauen will, sollte man sich die notwendigen Daten aktuell aus der Overpass-API organisieren.
Man sollte beachten, dass man natürlich nur entdecken kann, was man auch messen kann bzw. zum DQ-Merkmal bestimmt hat. Wenn sich im obrigen Beispiel zwei Gemeindegrenzen wohlsortiert und überschneidungsfrei abbilden lassen, können sich immer noch die beiden Gemeindegebiete überlappen und dies wäre mit den definierten Messungen nicht erkennbar (Merke: wichtig ist also eine vollständige Definition von guter Qualität).
Wenn erkannt werden soll, dass Daten mit admin_level=x gelöscht werden, wäre dies wahrscheinlich nur durch regelmäßige, resourcen intensive Abfrage aller Verwaltunsggrenzen möglich (Fläche aller Verwaltunsgrenzen mit admin_level=n+1 ist identisch mit der Fläche mit admin_level=n, Anzahl der Objekte reicht leider nicht ganz, denn hier kann es bei Verwaltungsreformen zu zuvielen Fehlalarme kommen). Allein aus diesem Grund wäre es sinnvoll eine lokale Liste (Datentabelle) aller bekannter Objekte mit Ihren Qualitätsmerkmal zu halten, dazu müsste man aber auch alle gelöschten Objekte (zumindestens Relationen und Wege, Knoten entfallen wohl bei diesem Fall), gegen die Liste der bekannten Objekte prüfen.
Mein persönliche Meinung ist, dass man sich nicht unbedingt vor April mit einem sehr schwierigen Variante dieses DQ-Thema beschäftigen sollte.
MfG Georg V. (OSM=user_5359)