В русском языке ударение относится к произношению, но не к написанию.
В отличие, например, от испанского, но там и отдельные символы для ударных букв есть.
А тут ещё не предлагали юзать международный фонетический алфавит? Там все звуки, их длительность и ударение учитываются. Т. е. всё что надо для правильного произношения.
Да, еще есть французский язык, где многие гласные имеют accent grave и accent acute. В современном греческом вообще всегда все слова пишутся с ударениями http://osm.org/go/xwayrnu81- Никто из них не морочался с юникодами.
Когда прописывал name:ru столицам, нашёл какой-то город с проставленным ударением в русском неймспейсе. Выпилил. Ударение там явно появилось простым копированием из википедии…
В продолжение темы с ударениями: что делать с символом “ł” (x{0142})?
Есть например такое name=Kumiecie Małe http://www.openstreetmap.org/browse/node/31523136 (почему-то is_in=Poland)
В Калининградской области много таких названий
Спасибо, я тебе тогда чуть позже ещё несколько символов подкину для замены
add: liosha, ещё вопрос: если к примеру Польшу конвертировать с ключем --translit без указания --ttable=1251.cmap этот (и другие) символы правильно перекодируются?
и т.д. Все польские названия, принятые в русском языке неверны?
Upd. В википедии нашёл такое:
Также в послевоенное время произошли некоторые изменения в произношении некоторых звуков. Например, ł из твёрдого [л] превратилось в звук вроде белорусского [ў], а ę в конце слов стало произноситься с ослабленным резонансом и в речи многих поляков звучит как чистое e.
В английском и других языках с латинским алфавитом поисковики умеют искать и не давиться ударениями.
Так что есть 2 подхода:
Софт пусть подстраивается под людей, а не люди под софт. Пусть ударения в тексте пишутся, а искать корректно по ним - задача софта. Например, в английском языке заимствование raison d’être индексируется без проблем. Что мешает в русском сделать так же? Авторы рендеров могут ввести правило, что из кирилицы знак ударения выпиливается.
люди подстраиваются под софт и заводят отдельные теги name:ru:phonetic, name:phonetic (IPA), name:en:phonetic (“fo-NEH-tic”), ударения выпиливаются, софт остаётся к ним неприспособленным, и любой лишний символ всё ломает.
По-моему, лучше пусть софт и софтописатели подстраиваются под нас, чем тысячи рисователей под софт и миллионы пользователей, у которых то поиск не будет работать, а ударение в названии узнать можно будет только в энциклопедии.