Ударения в названиях

Magomogo · January 16, 2011, 3:06pm

Согласен. Например, не думаю что всякие смайлики будут уместны в name

Ilis · January 16, 2011, 3:44pm

В русском алфавите, состоящем из 33 букв, нет буквы “ударение”.

mguzelevich · January 16, 2011, 3:47pm

в русском алфавите нет буквы “пробел”, “минус”, цифр, запятых и т.д.

liosha · January 16, 2011, 4:42pm

В алфавите нет, а в языке - есть

lupin-de-mid · January 16, 2011, 5:16pm

В языке есть и ударение

liosha · January 16, 2011, 5:28pm

В русском языке ударение относится к произношению, но не к написанию.
В отличие, например, от испанского, но там и отдельные символы для ударных букв есть.

Ilis · January 16, 2011, 5:48pm

А тут ещё не предлагали юзать международный фонетический алфавит? Там все звуки, их длительность и ударение учитываются. Т. е. всё что надо для правильного произношения.

liosha · January 16, 2011, 5:51pm

Предлагали: http://forum.openstreetmap.org/viewtopic.php?pid=133941#p133941

Ilis · January 16, 2011, 5:57pm

А почему тогда споры не утихают?

Dimon1 · January 17, 2011, 9:27am

Да, еще есть французский язык, где многие гласные имеют accent grave и accent acute. В современном греческом вообще всегда все слова пишутся с ударениями http://osm.org/go/xwayrnu81- Никто из них не морочался с юникодами.

Fortress · January 17, 2011, 10:52am

Так что в итоге? Убираем ударения из name?

Ilis · January 17, 2011, 10:54am

Я уже убрал

Когда прописывал name:ru столицам, нашёл какой-то город с проставленным ударением в русском неймспейсе. Выпилил. Ударение там явно появилось простым копированием из википедии…

Fortress · January 17, 2011, 12:01pm

В продолжение темы с ударениями: что делать с символом “ł” (x{0142})?
Есть например такое name=Kumiecie Małe http://www.openstreetmap.org/browse/node/31523136 (почему-то is_in=Poland)
В Калининградской области много таких названий

liosha · January 17, 2011, 12:02pm

Преобразовывать в обычную l, наверно. Добавлю.

Fortress · January 17, 2011, 12:05pm

Спасибо, я тебе тогда чуть позже ещё несколько символов подкину для замены
add: liosha, ещё вопрос: если к примеру Польшу конвертировать с ключем --translit без указания --ttable=1251.cmap этот (и другие) символы правильно перекодируются?

siberiano · January 17, 2011, 5:14pm

Нет, польская l с палочкой - это отдельная буква, читается как w, а не как l. Нельзя её пилить!

liosha · January 17, 2011, 5:18pm

siberiano, есть другие предложения, как упихнуть её в cp1251?

fserges · January 17, 2011, 5:28pm

Например, прочитайте названия польских городов:

Łódź
Łomża
Wrocław

и т.д. Все польские названия, принятые в русском языке неверны?

Upd. В википедии нашёл такое:

Также в послевоенное время произошли некоторые изменения в произношении некоторых звуков. Например, ł из твёрдого [л] превратилось в звук вроде белорусского [ў], а ę в конце слов стало произноситься с ослабленным резонансом и в речи многих поляков звучит как чистое e.

siberiano · January 17, 2011, 5:29pm

В английском и других языках с латинским алфавитом поисковики умеют искать и не давиться ударениями.

Так что есть 2 подхода:

Софт пусть подстраивается под людей, а не люди под софт. Пусть ударения в тексте пишутся, а искать корректно по ним - задача софта. Например, в английском языке заимствование raison d’être индексируется без проблем. Что мешает в русском сделать так же? Авторы рендеров могут ввести правило, что из кирилицы знак ударения выпиливается.
люди подстраиваются под софт и заводят отдельные теги name:ru:phonetic, name:phonetic (IPA), name:en:phonetic (“fo-NEH-tic”), ударения выпиливаются, софт остаётся к ним неприспособленным, и любой лишний символ всё ломает.

По-моему, лучше пусть софт и софтописатели подстраиваются под нас, чем тысячи рисователей под софт и миллионы пользователей, у которых то поиск не будет работать, а ударение в названии узнать можно будет только в энциклопедии.

siberiano · January 17, 2011, 5:31pm

Именно. Если не ошибаюсь с вариантами z, Ўодзь, Ўомжа, Ўроцўаў. В общем, эта буква, как и w, эквивалентна белорусской Ў.