unicode это самый логичный способ указать ударение.
Если вынести его в отдельный тег, то у нас получится два тега вида
name=“Пола”
name_with_accent=“Пол́а”
при этом name нужен главным образом, конвертерам.
а name_with_accent это лишная сущность без большой на то необходимости
А дублирование одной и той же сущности в разных тегах это плохо. Например если имя указано с ошибкой, то нужно будет править два тега, и проверять что то они одинаковые. Рано или поздно они все равно “разъедутся” и понадобиться очередной валидатор, и куча добровольцев, которые эти два тега будут синхронизировать.
В соответствии с современными веяниями (semantic web и т.п.) действительно имело бы смысл использовать символ \u0301 однако это может оказаться “слишком гибким” решением, в том смысле, что в базе-то хранить это можно без проблем, а вот как выдавать наружу - вопрос.
Видеть ударение в карте нужно далеко не всем, более того, это вообще может даже и мешать. Так что это вопрос - нужно ли превращать OSM в “топонимический фонетический справочник”.
Что, к слову, было бы не худшим вариантом: наличие тэга name_ipa, содержащего фонетическую запись (транскрипцию) названия, может помочь тем, кто не читает на языке, а также запись в IPA куда лучше поддается машинному чтению, чем естественный язык.
Не болтайте ерундой! А ещё он найдёт “361234566”, “36-я авеню, дом 6” и прочее… Ещё одно поле для глюков. Не нужно писать заумный поисковик, а надо структурировать базу так, чтобы ему искать было проще!
А сколько таких случаев, помимо 36,6 ?
Если будет написано Тесто́вская улица - это дополнительная работа конвертарам и поисковикам, чтобы в навике искалось по написанию через букву “о”, а не “о́” - это же абсолютно разные символы!
Да и иностранцам к нам в таком случае въезд заказан, т.к. не думаю, что там даже продвинутые знают особенности русского OSM
Я за использование названий так, как они прописаны в документах !
Ну не может 36,6 быть зарегистрирована как “36♥6” (секретарша просто таких символов не знает :)), а требований к содержанию вывески у нас не существует, за некоторым исключением
В допетровской орфографии было принято указывать ударение (нескольких типов) — такова была церковнославянская (старославянская) традиция, восходящая к греческим канонам правописания. (В несколько упрощенной форме эта традиция в греческом существует до сих пор).
Теперь же по правилам русского литературного языка ударение ставится в местах неоднозначности, словарях и учебных книгах.
С другой стороны есть очень много слов, в которых допускается разные варианты ударений, а также не одно ударение.
В OSM надо заносить верифицируемую информацию.
Никакой полной и всеобъемлющей методы верификации названий хотя бы географических объектов и населенных пунктов нет.
Значит скатимся к проставлению от балды, от вкуса, и войне правок.
Уже приводил пример старославянской википедии cu.wikipedia.org . Когда там решили расставить ударения — месяцев на 8 другая работа встала вообще. Расставляли ударения по всем текстам, меняли линки, меняли там, где неверно расставили. А как верно-то? Единая норма далеко не для всех слов известна, известна далеко не всем и т.д. и т.п. В качестве эталона в случае отсутствия примеров из старослава, используют какие-то определенные южнославянские диалекты, наименее изменившие систему ударений за последнюю тысячу лет.
Сейчас вроде там с этим делом уже очуняли, в общем, от идеи отказались, расставляют примерно так же, как и в русском варианте - только в начале статьи. Пора бы там страничку про OSM забабахать
хз. по правила русского её можно ставить или не ставить. но как поиск происходит если в названии одна буква, а ищут с другой? улица Академика Королёва так вообще должна быть с ё
Надо ли ставить в OSM — надо. Неоднозначность недопустима, так же как и в словарях, и т.п. Всё по правилам РЛЯ.
Различает ли валидатор — вопрос не праздный. Оба варианта имеют право на жизнь. Строгий вариант возможен, только когда в базе валидатора есть верные буквы ё. Стогим вариантом можно вылавливать отсутствие ё. необходимое по первому пункту.
Различают ли поисковики — дело вкуса, чаще всего это не нужно, так как люди опускают различие в запросе.
По нашим правилам её нужно ставить всегда. Поиски сами разберутся, а в валидаторах это актуально только при сравнении со сторонними базами, в которых буква ё присутствует не везде, и решается это тривиально.
Кстати, грамотно реализовано: название отдельно, название с ударением - дополнительно.
Именно на такой вариант и следует ориентироваться тем OSM-ерам, для которых в названиях не хватает ударений.
В “оформленном документально” - такое же игнорирование правил, как и везде (даже в офигенном питерском реестре заменяют ё на е, не говоря уже об откровенном мусоре вроде кладр). Название - это то, как объект называют местные, и деревня Ёлочки никогда не станет Елочками, даже если ни в одном официалном документе название не написано через “Ё”. Но додумывать, конечно, не стоит - лучше написать так, как название вам встретилось, и добавить fixme.