Bad Language Beispiele

Ich bin ein Informatikstudent und entwickle ein Tool, um bei Namensänderungen unangemessene Begriffe zu erkennen. Gibt es bereits Beispiele für derartige Vorfälle im deutschsprachigen Raum? Falls so etwas bereits erwähnt wurde, tut mir dies Leid und wäre sehr dankbar für einen entsprechenden Link. Konkret ist so etwas gemeint: New York renamed 'Jewtropolis' in map hack - BBC News

Das halte ich meines Erachtens nach für noch überflüssiger wie einen Kropf.

Bei “unangemessenen” oder boshaft falschen Einträgen ändert oder revertiert man das selber oder man informiert die Moderation hier, die alles weitere veranlasst.

Sowas hatten wir vor kurzem hier in ähnlicher Art im Zusammenhang mit dem Ukraine- bzw. Israel-Gaza-Konflikt. Das such ich jetzt aber nicht extra raus hier …

Aber genau darum geht es ja: um das automatische Erkennen solcher Änderungen, damit das nicht proaktiv von der Community überwacht werden muss. Je mehr Zeit zwischen Änderung und Revert vergeht, desto größer die Chance, dass der Revert erschwert wird, weil jemand was „korrigiert“ hat.

2 Likes

Und wer überwacht dieses “automatische Erkennen” solcher Änderungen? Wer oder was steuert hier die Entscheidungs-Kriterien über das was “Unangemessenen” oder “Vandalismus” sein soll?

Etwa eine KI-Instanz wie bei Mapbox oder Snapchat erwähnt?

Wozu ist eine menschliche und lebendige Gemeinschaft wie OSM dann überhaupt noch notwendig und existent, wenn wir irgendwann ohnehin alles irgendwelchen Tools, KIs oder sonst was an Programmen überlassen wollen?

Wenn @Peer_van_Daalen Sie von der Sinnhaftigkeit meiner Arbeit reden möchten, eröffnen Sie bitte ein neues Thema. Um das Tool genauer zu beschreiben: Es soll hauptsächlich als Hilfedarstellung dienen, um unangemessene Namenänderungen von einem berechtigten User kontrollieren zu lassen. Meine Frage war eine ganz andere: Ich fand keine relevanten Änderungen welche mit unangemessener Sprache für Namensgebungen zu tun hatten im deutschsprachigen Raum für OSM (darunter fallen nur solche, welche keine korrekten Namen der Realität übernommen haben).

Hallo @dav_van_dect ,

Beispiele aus dem deutschsprachigen Bereich sind mir nicht bekannt.

Ich möchte es aber so formulieren:
Eine Namensänderung zu einem falschen Namen ist unangemessen, auch wenn der neue Name nichts enthält, was unter “bad language” einzuordnen ist - wie im angeführten “Jewtropolis”. Ich sehe da keine “bad language”. Das kann von “Dummer-Junge-Streich” bis zu Vandalismus gehen
Fällt der falsche neue Name zusätzlich unter “bad language”, so ist das noch schlimmer, so in dem von @Peer_van_Daalen angesprochenen Vandalismus.

Wenn Deine Arbeiten zu einem deutlich besseren Ergebnis führen, als der in Deinem internationalen Thema von @hfs angesprochene OSMcha profanity-Filter in der Maproulette-challenge (96% false positive, nach grober Durchsicht der gefixten eher 98-99% false positive), dann kann die Gemeinschaft sehr wohl davon profitieren, wie von @Nadjita bereits angesprochen.

Und ja - es ist nicht einfach: Meine Radtouren führen oft durch Farschviller (name:de=Farschweiler), gelegentlich auch noch durch Bitche - und Verwandtschaft stammt aus Tuntenhausen.

3 Likes

Bitte nicht so schüchtern @Vinzenz_Mai :slightly_smiling_face:

Hier in meinem lokalem Umfeld heißt ein Platz "Henger Herrjotts Fott
" (hinter dem Hintern Gottes) und bei jährlichen Platzfest werden Nonnenfötzchen serviert.
Dazu Gäste u.a. aus dem Eifeler Pissevenn bei Roetgen.

Leider war bislang niemand aus dem österreichischem Fucking zu Besuch und auch niemand aus Votzenthal oder Mösendorf.

1 Like

das Schöne schwäbische Poppenweiler nicht vergessen.

Hat sich übrigens 2020 in Fugging umbenannt… aus offensichtlichen Gründen.
Hab früher nahe Wixhausen bei Darmstadt gewohnt – so what?

1 Like

Kotzen werde ich bei der Frage nicht… :smiley:

Ja, aber nicht in erster Linie wegen des despektierlichen Namen, sondern weil ständig die Ortschilder geklaut worden sind. Das wurde den etwa hundert Einwohnern zu teuer auf Dauer.

@Vinzenz_Mai In der Nähe von Tuntenhausen besuche ich ab und an Freundschaft in Bad Aibling. Schöne Ecke da.

Kann es sein, da wir langsam OT werden :thinking:

Aber nein, das sind alles “This is not bad language Beispiele”, die für dieses Thema unverzichtbar sind.

Du hast übrigens den Beschissenberg vergessen, siehe Deinen Beitrag hier.

Also das ist zwar etwas unappetitlich, aber keine bad language. Da könnte ich noch den schönen Ort Eiterfeld beisteuern, aber das geht dann schon deutlich in Richtung off topic.

ganz off-topic:

Die Biermarke, die sich des alten Ortsnamens bedient hat, erfreut sich nach wie vor großer Beliebtheit …

Das Problem dürfte eher sein herauszufinden, welche “unangemessenen Begriffe” echte Namen sind und welche nicht.

Mir ist nur ein Beispiel bekannt, allerdings komplett fiktiv und keine Namensänderung:

Hier gibt es sogar einen Tittenberg:

Die Kackenköpfe sollten hier auch nicht vergessen werden:

2 Likes

@dav_van_dect Um mal wieder zur Ursprungsfrage zurück zu kommen: Wie wir sehen ist das mit der „Bad Language“ schwer zu entscheiden. Ich würde einen anderen Ansatz vorschlagen.

Welche Arten von Objekten haben einen Namen, der sich nie oder selten ändert: Städte, Gemeinden, Flüsse, Berge, usw.

Um erstmal Daten über unerwünschte Änderungen zu sammeln, könnte man in die Änderungshistorie dieser Objekte schauen. Wo wurde der Name geändert und dann wieder zurück geändert? Also: Alter Name – Änderung – Alter Name. Dann war die Änderung in der Mitte vermutlich unerwünscht.

Auf diesem Datensatz könnte man eine Untersuchung machen, welcher Anteil davon ist Vandalismus und nochmals davon welcher Anteil mit „Bad Language“.

Eventuell ist auch eine Art Machine Learning möglich, um die Wahrscheinlichkeit der Unerwünschtheit zu berechnen. Dazu müsste man aber vermutlich obigen Datensatz von Hand klassifizieren.

Wenn Du ein Tool entwickeln willst, das unerwünschte Namensänderungen erkennt, dann würde ich vom Gedanken „Bad Language“ weggehen und einfach alle Objekte mit (fast) konstanten Namen überwachen. Für ein Review der Änderungen wären hilfreich: Was hat sich im Namen geändert? Wer hat die Änderung gemacht – erfahrener oder unerfahrener Benutzer? Was wurde im Changeset noch geändert – Link auf Achavi oder OSMCha. Man könnte Benutzern anbieten, „ihre“ Objekte oder Gebiete überwachen zu können und bei Änderungen benachrichtigt zu werden. So ein Tool würde sicherlich Anklang finden.

11 Likes

Achso und Beispiele für unerwünschte Änderungen wollte ich noch mitgeben:

History des name der Vatikanstadt zeigt, dass auch der Name nicht immer klar definiert ist: OSM Deep History

Noch eine Idee zum Datensammeln: Es gibt einige Accounts, die nur für Reverts verwendet werden. Du könntest auch deren Changesets durchgehen und (automatisiert) durchsuchen, wo Namensänderungen zurückgesetzt wurden. Bei diesen Reverts ist ziemlich sicher, dass die zurückgesetzte Änderung unerwünscht oder Vandalismus war.

Danke für den Fingerzeig.

Das hab ich gestern gesucht, aber mir ist weder der Name noch die genaue! Örtlichkeit zwischen Hergenrath und Hauset eingefallen.

Ich wußte nur, daß ich noch so´n Schweinskram irgendwo in petto hatte.

Die Etymologe des Namen Beschissenberg ist auch nicht schlecht.

1 Like

Da die Data Working Group (die beiden genannten Konten sind DWG-Mitglieder) aber auch Änderungen von Sockenpuppen dauerhaft gesperrter Nutzer systematisch revertiert, um die Kontensperre nachhaltig durchzusetzen, sind deren Namens-Rückänderungen nur eingeschränkt als Trainingsmaterial geeignet.

1 Like

Almost none of the DWG reverts I do with that account are for “bad language”. There are a few - French schoolkids doing their mandatory OSM module (and not enjoying it) contribute a few.

Another recent source of related edits (but not on German or English) is the recent “name:ru” vandalism. It wasn’t for the most part obscene, it was things like “XYZ people are cattle”.

Other examples are words that have a perfectly normal use (in whatever language) but can also be used as a slur, and sometimes that slur is reappropriated by the community being stigmatised. Detecting problematic usage here requires that the context be understood, and that’s very difficult, especially for a non-native speaker.

2 Likes

@Mammi71

Dasselbe gildet dann aber auch für für Poppenhausen (5 km westlich der Wasserkuppe)!