На табличках-аншлагах стали писать -ая, -ой, -ый вместо -я -й -й и т.д.
Соответственно некоторые пользователи вводят новые стили написания, но они остаются в меньшинстве старых данных и их “нормализуют” под одну букву. Что же будем делать с name=* и addr:street?
Я лично сам пару раз полу-автоматом сокращал до одной буквы все случаи, а теперь понял масштаб изменений и теперь только при осмотре буду менять одно на другое либо чужое не трогать.
Оказалось к тому же что в русском языке есть не правило но какая-то условность на эту тему:
В addr:street пишут то что написано в оригинале, т.е на указателе. В name аналогично.
Причем здесь русский язык.
Можно попросить wowik’а сделать выборку из фиаса, там я думаю будет в равном кол-ве оба варианта.
Статья имеет рекомендательный характер, да и работает она в пределах осм. И если на всех указателях будет писано “улица 2-ая Луговая” то так ее и будут искать и сильно ругаться если поиск будет обламываться из-за каких-то там умников.
ОСМ же отображает реальность а не управляет ею.
А вот расписать алгоритм нормализации для поисковиков будет гораздо эффективне
Рекомендательный потому что так проще искать в сырых данных:
“Луговая 1-ая улица” и “Луговая 2-ая улица” часто цитируют как
“1 луговая” и “2 луговая” - отбрасывая незначащие части в конкретном городе или даже
“1 л” “2 л”
“1 луг” “2 луг” в поисковых запросах
слово “улица” наоборот может быть значимым если есть “улица Ленина” и “проспект Ленина” в одном городе/районе
Для OSM важна одна вещь: единообразность обозначений. При этом смысла делать все единообразно, но безграмотно - нет. Так почему не делать все грамотно и единообразно? Известно, что по правильному варианту предположить автоматически множество неправильных - проще, чем наоборот.
Учитывая уровень грамотности населения, делать буквальный поиск, который будет требовать “2-я Луговая” - бессмысленно: среди населения найдутся те, кто напишет и “2-ая”, и “2-рая”.
Если какой-нибудь безграмотный идиот сделает табличку с названием улицы “праспект Ленена”, ее ведь в таком виде никто в своем уме вносить не будет (про отдельных идиотов говорить смысла нет).
В ФИАСе всякий бред представлен в ассортименте, там без окончания бывает, как мне кажется.
P.S. посмотрел бегло. Везде натыкаюсь на 1-й, 2-й.
Вот есть 106-ой танковой бригады
Но вот вдруг, к примеру в Татарии, видим среди 1-й, 2-й, 3-й, 6-й вдруг видим одинокие 2-ой, 3-ий
Подмосковье - мешанина из 2-й и 2-ой.
Тут возникает связная тема про 1 Мая, 8 Марта и прочих 26 Бакинских Коммисаров. Там ведь даже падеж не ясен в таком написании.
С “1 Мая” и прочим, мне встречалось объяснение, что это части имени собственного, а не порядковые числительные. Буквенные наращения же используются с порядковыми.
То есть “26-я улица Бакинских Комиссаров”, но “улица 26 Бакинских Комиссаров”.