Ударения в названиях

Согласен. Например, не думаю что всякие смайлики будут уместны в name :smiling_face:

В русском алфавите, состоящем из 33 букв, нет буквы “ударение”.

в русском алфавите нет буквы “пробел”, “минус”, цифр, запятых и т.д.

В алфавите нет, а в языке - есть

В языке есть и ударение

В русском языке ударение относится к произношению, но не к написанию.
В отличие, например, от испанского, но там и отдельные символы для ударных букв есть.

А тут ещё не предлагали юзать международный фонетический алфавит? Там все звуки, их длительность и ударение учитываются. Т. е. всё что надо для правильного произношения.

Предлагали: http://forum.openstreetmap.org/viewtopic.php?pid=133941#p133941
:slight_smile:

А почему тогда споры не утихают? :slight_smile:

Да, еще есть французский язык, где многие гласные имеют accent grave и accent acute. В современном греческом вообще всегда все слова пишутся с ударениями http://osm.org/go/xwayrnu81- Никто из них не морочался с юникодами.

Так что в итоге? Убираем ударения из name?

Я уже убрал :slight_smile:

Когда прописывал name:ru столицам, нашёл какой-то город с проставленным ударением в русском неймспейсе. Выпилил. Ударение там явно появилось простым копированием из википедии…

В продолжение темы с ударениями: что делать с символом “ł” (x{0142})?
Есть например такое name=Kumiecie Małe http://www.openstreetmap.org/browse/node/31523136 (почему-то is_in=Poland)
В Калининградской области много таких названий

Преобразовывать в обычную l, наверно. Добавлю.

Спасибо, я тебе тогда чуть позже ещё несколько символов подкину для замены :wink:
add: liosha, ещё вопрос: если к примеру Польшу конвертировать с ключем --translit без указания --ttable=1251.cmap этот (и другие) символы правильно перекодируются?

Нет, польская l с палочкой - это отдельная буква, читается как w, а не как l. Нельзя её пилить!

siberiano, есть другие предложения, как упихнуть её в cp1251?

Например, прочитайте названия польских городов:

Łódź
Łomża
Wrocław

и т.д. Все польские названия, принятые в русском языке неверны?

Upd. В википедии нашёл такое:

Также в послевоенное время произошли некоторые изменения в произношении некоторых звуков. Например, ł из твёрдого [л] превратилось в звук вроде белорусского [ў], а ę в конце слов стало произноситься с ослабленным резонансом и в речи многих поляков звучит как чистое e.

В английском и других языках с латинским алфавитом поисковики умеют искать и не давиться ударениями.

Так что есть 2 подхода:

  1. Софт пусть подстраивается под людей, а не люди под софт. Пусть ударения в тексте пишутся, а искать корректно по ним - задача софта. Например, в английском языке заимствование raison d’être индексируется без проблем. Что мешает в русском сделать так же? Авторы рендеров могут ввести правило, что из кирилицы знак ударения выпиливается.

  2. люди подстраиваются под софт и заводят отдельные теги name:ru:phonetic, name:phonetic (IPA), name:en:phonetic (“fo-NEH-tic”), ударения выпиливаются, софт остаётся к ним неприспособленным, и любой лишний символ всё ломает.

По-моему, лучше пусть софт и софтописатели подстраиваются под нас, чем тысячи рисователей под софт и миллионы пользователей, у которых то поиск не будет работать, а ударение в названии узнать можно будет только в энциклопедии.

Именно. Если не ошибаюсь с вариантами z, Ўодзь, Ўомжа, Ўроцўаў. В общем, эта буква, как и w, эквивалентна белорусской Ў.