Ударения в названиях

Дык с буквой-то что делать?

А японский не пробовали в 1251 запихать? :slight_smile: cp1251 не расчитана на польский язык. Что ж вы пытаетесь польские тексты в ней писать? Не получится.

Ну можно транскрипцию на белорусский манер. Будет хохма.

Ещё вариант - l’, аналогично итальянцы и испанцы пишут, когда нет своей раскладки. Но все варианты буквы z вы там точно не напишете, как вы отличите в z’ звуки Ж от З от ЗЬ?

//как вы отличите в z’ звуки Ж от З от ЗЬ?
Зачем их отличать? :slight_smile:

siberiano, ещё раз вводная. Дано:

  1. В осм попалось польское слово с ł (name=Kumiecie Małe).
  2. Для целевой системы нужно 1251.
    Какие предложения?

Немного меняю своё предложение: тег name не содержит информации, на каком языке написан. Поэтому непонятно, по каким правилам его трактовать, то есть ударения в каноническом написании оставлять или нет. Потому что недостаточно смотреть, что это кирилица: может оказаться, в бурятском, монгольском или другом языке ударения используются и очень хитро, поэтому все их удалять нельзя.

Поэтому вариант такой: в name писать название в каноническом варианте, то есть в русском языке - без ударения, а в name:ru - с ним. При импорте должно быть правило, что из :ru надо ударение для канонического представления и индексации удалить. А name:yakut или тому подобные будут иметь своё правило.

name:ru так же не подходит: в русском языке слова пишутся без ударений. Нужен отдельный тег.

Как пример: http://mosclassific.ru/mClass/spravum_viewd.php?id=00010&ul=%F3%EB%E8%F6%E0%20%C5%E3%EE%F0%E0%20%C0%E1%E0%EA%F3%EC%EE%E2%E0
Название с ударением записано в отдельном специальном поле

Переписать целевую систему. Остальные варианты я уже написал. :slight_smile:

Не нужен. Если в русском ударения не пишутся, вот и отлично, пусть софтина уберёт их.

Напиши это полякам. Они тебе и раздел польши припомнят, и Катынь.

siberiano, ни одного реального варианта ты не предложил.

Целевая система задана извне, и на неё влиять нельзя.
Транскрипция неуниверсальная, поэтому не годится.
l’ тоже не подходит, потому что получается разделительный символ в середине слова, где его быть не должно.

Ещё предложения будут?

Откуда взялась софтина? Вопрос пока о правилах написания

Вероятно, раздел Польши где-то тут

Если домик не замкнут, пусть софтина замкнёт его. Если русское имя не задано, пусть софтина придумает его.

Что за манера - устанавливать НОВЫЕ правила для СТАРЫХ тегов.
Наверное, надо решить раз и навсегда - все новшества исключительно в новых тагах: хочешь транскрипцию - придумай для нее новый тег и продвигай его, а не вноси искажения в уже существующий.

l (твердая “л”).
См. http://ru.wikipedia.org/wiki/Польско-русская_практическая_транскрипция
Произношение http://ru.wikipedia.org/wiki/Ł_(латиница) в данном случае вторично.

Это, я понимаю, такое “спасибо”. Я и не собирался решать за тебя твои задачи, занимайся ими сам.

Если транскрипция, то практическая. Или транслитерация.

Транслитерировать/практически транскрибировать некириллические символы в кириллические. См., например, http://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%BB%D1%8C%D1%81%D0%BA%D0%BE-%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%82%D1%80%D0%B0%D0%BD%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%86%D0%B8%D1%8F

вот вот. если установленно что в теге можно юзать любые юникодные символы - хочешь тег без ударений - придумай новый и пиши там только ascii

Чтобы OSM стал свалкой костылей из одинаковых, но немножко других тэгов? Спасибо, нет.

Совершенно верно. База данных ОСМ - первична, и ее растаскивают себе разные конвертеры для собственных нужд. Если целевая система имеет ограничения - пусть она подгоняет данные под себя. Ни в коем случае не надо ограничивать ОСМ.

Для cp-1251 предложено абсолютное верное решение - транскрипция.

Добавлю про ударения, чтобы два раза не вставать. Речь не идет о том, чтобы везде ставить ударения. В подавляющем большинстве случаев это не нужно, но есть и исключения.