Japan in OSM deutscher Stil mit chinesischen Bezeichnungen

Hi,

ziemlich neu hier, wahrscheinlich steht die Antwort irgendwo und ich habe sie uebersehen…

Wenn man das hier macht:
http://openstreetmap.de/karte.html#
→ Suche: Osaka (oder irgendwas in Japan)
→ Darstellung auf “OSM deutscher Stil”

Sind die Beschriftungen groesstenteils auf Chinesisch.
Schaltet man auf “OSM Standard (Mapnik)” um, sieht es authentischer aus.

Ist das so gewollt? Wunschdenken? Akute Aenderungen der grosspolitischen Lage in der Region? Lizenzfragen?

Gruss
jg

Vermutung:

  • deutscher Stil verwendet name
  • Standard verwendet name:de, falls vorhanden

Grund:
Keine Ahnung.

Hmmm… Nach ner Stichprobe ist in In den OSM-Daten ist die Übersetzung nicht drin, d.h., da muss jemand was im Renderer gebaut haben. Die von den Japanern verwendeten chinesischen Schriftzeichen haben ja im chinesischen eine eindeutige Transkription. Im japanischen allerdings kann ein chinesisches Schriftzeichen mehrere Übersetzungen im Sinne von Aussprache und Bedeutung haben. Das ganze ist relativ sinnlos. Ein Chinese kann das selber lesen, ein Japaner kann mit dem transkribierten Kram nix anfangen. Bringt nur was, wenn man chinesisch nicht lesen kann und einem Chinesen am Telefon einen Straßennamen durchgeben will. Aber ob man das so gut betonen kann, dass das für den Chinesen wieder Sinne ergibt? Hmmm…

Angezeigt wird nur das, was auch in den Daten bei OSM drin steht. :wink:

Hier ein Beispiel: http://www.openstreetmap.org/browse/node/267460443

Der deutsche Stil nimmt dort name:en, der Standard Stil hingegen name.

Eventuell trägt dies zur Aufklärung bei:
http://lists.openstreetmap.org/pipermail/talk-de/2013-August/104056.html
http://lists.openstreetmap.org/pipermail/talk-de/2013-July/103980.html
http://lists.openstreetmap.org/pipermail/talk-de/2013-July/103584.html

Ok, so einen Mist hätte ich jetzt nicht erwartet. :confused: Für die Suche mag es ja sinnvoll sein, aber für das Rendering eher weniger.

Das ist nicht suboptimal sondern schlicht Müll :slight_smile:
In China funktioniert das, weil wie schon gesagt jedes Zeichen dort genau einer Silbe entspricht und damit genau eine Transkription hat. Im Japanischen aber oft mehrere.
Man könnte vielleicht http://www.csse.monash.edu.au/~jwb/enamdict_doc.html als Basis einer Transliteration nehmen…

… im Gegentum zu einigen hier, habe ich keine Ahnung von asiatischen Sprachen. Deshalb hatte ich zu Svens Ankündigung/Bitte (u. a. in http://lists.openstreetmap.org/pipermail/talk-de/2013-July/103980.html - im August fortgeführt) nix beizutragen.
Sicherlich ist es der Aufmerksamkeit einiger, hier starke Worte gebrauchenden, entgangen, dass der Sven um Hilfe bittet …

Not amused Christian

Schließe mich hier chkr an: das sind sehr starke Worte für eine gut gemeinte Ergänzung!

Sicherlich ist das Ganze für Japanisch verbesserungswürdig (und vielleicht finden sich dazu hier ja auch weitere gute Ideen)
Im Gegensatz zu Japan sind die automatischen Transkriptionen in China nämlich eine deutliche Verbesserung, da man sich damit auch auf Straßenebene orientieren kann.

Kann man das? In welcher Sprache stehen dort die Straßenschilder? Wenn, dann sollte man die überprüften name:**-Tags nehmen anstatt sich selbst etwas zusammenzubasteln, dafür sind sie schließlich dar. Für die Suche kann man immer noch eine Transkription verwenden.

Solange Du dich in der Stadt bewegst, häufig als Schriftzeichen und Pinyin.
Und in der Provinz? Naja, wenn man ehrlich ist, wird Dir OSM dort sowieso nicht weiterhelfen, da selbst überregionale Straßen häufig noch komplett fehlen :smiley:

Für wichtige touristische POIs ist das auch heute schon der Fall. Nur China ist groß: Natürlich steht es jedem frei, sämtliche denkbaren Orientierungspunkte wie Straßen, Bushaltestellen, etc. mit name:de Tags zu ergänzen.
Angesichts des überschaubaren Kreis an Aktiven in China rechne ich damit, dass dieser Prozess im Jahre 2043 abgeschlossen sein wird :smiley:

Außerdem gab es hier im Forum Diskussionen, in denen Tagging sämtlicher Straßen mit name:de heftig diskutiert wurde und meiner Erinnerung nach tendenziell abgelehnt wurde, da aufgrund der festen Transkriptionsregeln überflüssig.

Stimmt nicht ganz: im Chinesischen gibt es einzelne Zeichen (1-2%) mit zwei Aussprachemöglichkeiten, z.B. wird 行 entweder háng oder xíng ausgesprochen. Im Japanischen hat fast jedes Zeichen zwei, drei oder vier Aussprachemöglichkeiten, so dass normalerweise die Lateinschrift als Aussprachehilfe genutzt wird.

Chinesen und Japaner verwenden die gleichen Zeichen und sprechen sie unterschiedlich aus. Chinesen, die nach Japan kommen, müssen dann die andere Aussprache erlernen (bzw. büffeln). 大阪 wird im Chinesischen als Dàbǎn und im Japanischen als Osaka ausgesprochen.

Das letzte Zeichen ist oft eine Ortsbezeichnung: 市 (shì) bedeutet Stadt und 大阪市 (Osaka-shi) bedeutet Stadt Osaka. 镇 (zhèn) bedeutet Landgemeinde, 乡 (xiāng) bedeutet Dorf, 路 (lù) bedeutet Straße, 巷 (xiàng) bedeutet Gasse.

In diesem Fall wäre ein China-Bot, der in China (nur in China) die fehlende Pinyin-Umschrift automatisch ergänzt, wohl die hilfreichste Lösung. Sollte der Bot einen Fehler machen, so können die chinesischen Mapper den evtl. Schreibfehler eigenhändig korrigieren, weil jeder Chinese das Pinyin-System kennt. Eine automatische Übersetzung ins Englische wäre manchmal hilfreich (z.B. dàxué → University), manchmal aber auch nicht. Xī’ān (西安) als West Peace zu übersetzen wäre zu wörtlich.

In China bietet es sich allerdings an, die mín zhú lù als Mín Zhú Street oder Mín-Zhú-Straße zu übersetzen.

In Japan lässt sich die Umschrift nicht aus den Kanji-Zeichen ermitteln. Hier müsste man einen Japan-Bot einsetzen, der name:en (in Klammern) und name:ja (ohne Klammern) ermittelt und eine fehlende Lateinschrift mit FIXME einfordert.

In beiden Fällen ist es einfacher, einen Bot zu schreiben, als Tausende von Mappern über irgendwelche nicht abonnierten Mailinglisten um Mithilfe zu bitten. Klar, man könnte allen in China oder Japan tätigen Mappern ein Rundschreiben schicken, aber das könnte psychologisch als Holzhammer aufgefasst werden.

Gruß #42429

Dazu sind einige Dinge zu sagen:

  • Ein Bot ist schnell vorgeschlagen, jedoch aufwändig zu realisieren.
  • Sven will keinen Bot, der die Datenfülle noch mal erhöhen würde.
    Sven will die Transliteration bei der Erstellung der Karte durchführen.
  • Ein Bot sollte möglichst wenige Fehler machen.
    Fehler als Bestandteil des Botlaufes zuzulassen ist eher unerwünscht.
    Und genau in der Vermeidung von Fehlern steckt ein Großteil des Aufwands.
    Denke an die umfangreichen Diskussionen vor dem Einsatz von Wall÷E.
  • Einen Bot laufen zu lassen erfordert einige Vorkehrungen.
    Insbesondere sind die Regeln für Automatisierte Edits zu beachten.
    (Diskussion mit den Betroffenen, Dokumentation, …)
  • Einen Bot von Europa aus über China oder Japan laufen zu lassen,
    könnte als unpassend von den regionalen Mappern angesehen werden.

Edbert (EvanE)

Das müsste leider auch technisch ein wahres Monster sein, da jedes einzelne Objekt in China angefasst werden müsste.

In China wurden die internationalen / deutschen Namen bis auf Ebene 市 von jemandem manuell ergänzt. Dasselbe wäre mit etwas Fleissarbeit sicher auch für Japan möglich. Das ist jedoch nur die halbe Miete: Der Charme von Svens Lösung liegt ja gerade darin, das alles bis runter auf Straßenebene on-the-fly transkribiert wird.

Ach Gottele… Mein erster Satz war eine flapsige Verstärkung dessen, was Sven Geggus schon selbst vermerkt hatte. Und dann ist der Beitrag ja wohl auch konstruktiv, mit einem Vorschlag für eine gute Datenquelle. Also bitte alle sich etwas beruhigen und sich um das eigentliche Problem kümmern. またね :slight_smile:

Hast ja Recht :smiley:

Aber was wäre denn jetzt die Lösung?

  • automatische Ergänzung / On-the-fly-Transliteration von fehlenden name:de Tag anhand des ENAMDICT-Lexikons (nehme an, dass damit die Transliteration von Straßennamen nicht möglich ist?)
  • manuelle Ergänzung der fehlenden name:de Tags für wichtige POIs, z.B. Städte
  • ?

… wäre in Japan sinnvoll

  1. wird in Asien meistens die englische Transliteration (name:en) verwendet
  2. Eine On-the-fly-Transliteration wird immer eine Fehlerquote von 1-2% beinhalten, weil es ca. 1000 Zeichen mit doppelter Lesung (duoyinzi) gibt. Manchmal ändert sich nur ein Buchstabe (bing/ping) oder ein Akzent, aber gerade bei geographischen Eigennamen sind die Ausnahmen nicht abschätzbar.
  3. Deutsche Mapper werden die fehlerhafte Transliteration nicht erkennen, weil Chinesischkenntnisse hierzulande eher selten sind.
  4. Chinesische Mapper werden die deutschsprachige Karte wohl kaum besuchen und deshalb auch keine Fehler erkennen.
  5. Eine On-the-fly-Transliteration wird also immer fehlerhaft sein (Fehlerquote in China ca. 1-2%, in Japan ca. 50-60%) und nur in Ausnahmefällen werden die Fehler auch erkannt werden. Eine Transliteration im lokalen Datensatz selbst wird von den Einheimischen eher korrigiert werden.

Soviele Mapper mit Chinesisch- oder Japanischkenntnissen gibt es nicht, um alle wichtigen POIS zu übersetzen.

Ich würde das für eine Transliteration gar für falsch halten, da es keine deutschsprachige Bezeichnungist, sondern die Japanische anders dargestellt. Also wenn, dann sowas wie z.B. “name:ja-latn”=* oder “name:ja-kana”=*.

Ich habe schon name:ja_rm gesehen, rm steht für “Romaji” (römische Schriftzeichen). Nun hat allerdings jede Zielsprache ihre eigenen Regeln. Im deutschen wird aus 東京 Tokio, im Englischen Toyko. Aber es gibt wohl was “offizielles”, was sich eng an der englischen Aussprache von Wörtern orientiert, da schreibt man dann Tōkyō. (Strich über Vokal bedeutet: Gedehnt gesprochen). Wenn man was in den OSM-Daten persistieren will, dann am besten wohl diese Form. Für genaueres müsste ich mal wieder ein paar alte Bücher raussuchen, es ist 20 Jahre her, dass ich mit EDICT und ENAMDICT und dem ganzen CJK-Kram rumgemacht habe…
Inwieweit man ENAMDICT für Straßennamen verwenden kann, müsste man mal untersuchen. In Japan haben viele Straßen keinen Namen (Adressen haben ein Stadt-Stadteil-Stadviertel-Häuserblock-Hausnummer Schema) und die Straßen heissen wie Orte u.ä. Benamsung nach Personen ist eher ungewöhnlich. Man könnte die Endung, die “Straße” o.ä. bedeutet abschneiden und dann in ENAMDICT nachsehen, ob man was passendes findet…
Will man die Daten nicht in OSM persistieren, wird man auf dem Renderer eine Lookup-Tabelle einrichten müssen, die man dann mit einem entsprechenden Programm füllt. Für den aktiveren OSM-Nutzer wird es dann aber verwirrend, wenn er auf der Karte einen falschen Namen entdeckt, seinen JOSM oder was auch immer startet und dann in den Daten nix findet, was falsch ist. Wenn er dann ein passendes name-Tag hinzufügt, wird die nächste Karte dann aber besser, da ja nur Werte aus der Lookup-Tabelle genommen werden, für die in der OSM-Datenbasis nix passendes vorhanden ist.