Населенные пункты без name:ru

Возник вопрос о том, что неплохо бы заполнить теги name:ru у всех городов, где это возможно.
Как ни странно, такие нашлись даже среди областных центров РФ. (как говорится, куда уж дальше!)
Собственно, абсолютно для всех н/п это сделать нереально, поэтому я выбрал из общей базы только те, у которых проставлены теги name:en или int_name. Таковых нашлось более 60 тысяч. Думаю, если организовать тематическую неделю и распределить обязанности, то значительную часть из них (или даже все) можно снабдить и тегами name:ru.
На всякий случай привожу еще три выборки:

  • со всего мира города с населением более 100 тыс. человек,
  • из ~СНГ (то, что есть на ГИС-лабе),
  • только по СНГ и только более 100 тыс.ч - прямо в тексте сообщения.

Ссылки:
planet.osm (ок. 60 тыс.): http://zalil.ru/30546721
planet.osm - только с населением более 100 тыс.ч. (ок. 300): http://zalil.ru/30546735
full.osm (с ГИС-лаб: РФ + Украина + Беларусь + …) (ок. 4200): http://zalil.ru/30546740

id=27504067, place=city, name:en [Kazan], int_name: [Kazan], population=1133420
id=27505266, place=city, name:en [Yaroslavl], int_name: [Yaroslavl], population=613200
id=27505285, place=city, name:en [Barnaul], int_name: [Barnaul], population=603500
id=27505509, place=city, name:en [Orenburg], int_name: [Orenburg], population=548800
id=27505582, place=city, name:en [Ryazan], int_name: [Ryazan], population=510000
id=34395338, place=city, name:en [], int_name: [Nazran], population=126700
id=93711720, place=city, name:en [Nalchik], int_name: [Nalchik], population=273900
id=191641244, place=city, name:en [Maykop], int_name: [], population=162400
id=191644503, place=city, name:en [Makhachkala], int_name: [Makhachkala], population=466800
id=191655065, place=city, name:en [Kyzyl], int_name: [Kyzyl], population=108300
id=191657470, place=city, name:en [Abakan], int_name: [Abakan], population=165197
id=191659791, place=city, name:en [Grozny], int_name: [Grozny], population=223000
id=191697061, place=city, name:en [Astrakhan], int_name: [Astrakhan], population=506400
id=191723030, place=city, name:en [Yuzhno-Sakhalinsk], int_name: [Yuzhno-Sakhalinsk], population=174700
id=191749240, place=city, name:en [], int_name: [Naberezhnye Chelny], population=517356
id=191773560, place=city, name:en [], int_name: [Angarsk], population=247100
id=191850710, place=city, name:en [], int_name: [Nakhodka], population=149300
id=191863710, place=city, name:en [Miass], int_name: [Miass], population=158500
id=191864581, place=city, name:en [], int_name: [Ussuriysk], population=157800
id=191875199, place=city, name:en [], int_name: [Kislovodsk], population=129800
id=191880979, place=city, name:en [], int_name: [Khasavyurt], population=129573
id=191891797, place=city, name:en [Yelets], int_name: [], population=111000
id=191903740, place=city, name:en [], int_name: [Derbent], population=100800
id=276628719, place=city, name:en [Arkhangelsk], int_name: [Arkhangelsk], population=351600
id=339945971, place=town, name:en [Stepnogorsk], int_name: [], population=200000
id=537561303, place=city, name:en [], int_name: [Ekibastuz], population=121814
id=729610410, place=city, name:en [Aktau], int_name: [Aktau], population=280332

PS. Данные planet.osm за 22 декабря прошлого года, но, думаю, не очень сильно устарели. full.osm - от 6 февраля с.г.

name:ru нужен только для тех НП, у которых есть name:что-то другое (особенно name:en). Просто как пара к name — преждевременно.
int_name здесь вообще ни при чём.

робот, проставлявший name:ru для place с name:en уже ходил, неплохо бы его снова запустить.

Не нужно здесь роботов!
Практика показывает, что от них больше вреда, чем пользы. Единственная безусловная польза от робота - сбор и просеивание информации. Именно это я и сделал.
Ориентируясь на name:en и int_name я преследовал две цели:

  1. Выделить города, которые, по мнению нарисовавшего, могут представлять интерес для иностранцев. Обычно именно в этом случае проставляют один или оба из указанных тегов.
  2. Выделить города, для которых есть хоть какая-то зацепка, по которой можно восстановить имя по-русски. Очевидно, имя на английском (или международное имя) - и есть такая зацепка.

А чем плох робот по тегам :ru Какие могут быть ошибки с переносом скажем в Казани, Астрахани, Абакане.
Единственное - перед записью в БД нужно глазками пробежаться по логу чтобы убедиться что косяков нет …
Вот по Казахстану - да.

Не надо дублировать информацию из name в name:ru.

Ключевое слово ПЕРЕнос. Откуда именно переносить? Если из тега name, то это абсолютно бессмысленная работа, т.к. ее может выполнить непосредственно конвертер или рендер. Если из внешнего источника - то следует его назвать.

Зачем у Русских городов, название которых написано на Русском, указывать name:RU?

Исключительно для удобства автоматизации. Что-бы не нужно было добавлять анализ языка страны расположения точки.

Don’t map for automation

Map for automation - не проблема. Я считаю что тежить нужно с учётом возможной автоматической обработки. Просто в схеме предлагается проставить тег ru для Казани, а для мелких городов не предлагается, т.е. некий произвол. А если ставить тег RU везде то получается тупое дублирование данных в России.

Россия - страна многонациональная и имеющая множество этнически определенных республик, имеющих собственный государственный язык.
Опять же, для определения “государственного” языка необходим анализ в виде определения, находится ли точка в полигоне границ государства, а теги позволяют получить искомое название без ресурсоемких вычислений.

Предлагается ставить тег name:ru не для “мелких городов”, а для тех городов, которые имеют тег name:en либо int_name. Т.е. для тех, которые их “рисовальщик” посчитал интересными для иностранцев.

И, еще раз повторяю, основной список получен для planet.osm, т.е. для всего мира.

Есть подозрение, что у всех вышеупомянутых городов проставлен тег “addr:country=RU”, что и делает бессмысленным простановку name:ru.

P.S. Так, для злобы дня, - давлю name:ru там, где встречаю :wink:

RU в addr:country - это код страны
ru в name:ru - это код языка

Чтобы соотнести одно с другим нужна ещё стороняя таблица соответствия страна - язык. А есть ещё страны где несколько официальных языков.
Нет ничего невозможного, но усложняет жизнь авторам конвертеров/рендереров.

Я не о кодах и их значениях, я о том, что нахождение объекта на территории России подразумевает, что в name записано русское название (за исключением пограничных объектов). А то можно докатиться и потребовать везде использовать name:ru вместо name… Только потому, что софту так удобнее.
Я так скажу, что если какой либо софт будет требовать наличия name:ru и игнорировать name, то кол-во его пользователей будет стремиться к нулю. Просто потому, что неудобно.
Надо уметь пользоваться тем, что уже предоставлено. И вносить дополнения только тогда, когда задачу невозможно решить за счет существующих средств.

Откуда это следует?
Русский - далеко не единственный государственный язык на территории РФ.
А ест еще страны, где в ЛЮБОЙ точке страны несколько государственных языков. IMHO правила должны быть одними и теми же для разных стран. Иначе вообще теряет смысл применение тегов name:*.

Существуют неопределенности, от которых можно избавиться ТОЛЬКО таким способом.

Вопрос изначально поставлен некорректно.
Никто не предлагает исключить из употребления name.
Просто чем больше будет name:, тем меньше будет процент ошибок при отображении.
Ну и потом, если появится какой-нибудь достаточно полезный софт, обладающий этим свойством, (не использовать name) то name:
очень скоро появятся.

Во-первых, действительно не существует надежного алгоритма определения, на каком языке написан name.
Во-вторых, эти редства могут иметь существенно различающуюся ресурсоемкость.
Теоретически можно подобрать любой пароль, на практике же для этого требуется такой объем вычислений, что пароль будет найден намного позже, чем запароленные данные окончательно и бесповоротно устареют.
Так что даже сам факт алгоритмической разрешимости задачи отнюдь не свидетельствует, что задача должна быть разрешена именно алгоритмическим путем.

Единственный. У субъектов могут быть свои языки, но они не будут государственными для РФ.

andriano, не надо быть уверенным на 100%, достаточно предполагать, подразумевать. “нахождение объекта на территории России подразумевает, что в name записано русское название”. Этого достаточно.
Все национальные имена должны быть записаны в соответствующие name:xxx (например name:tat для татарских имен). А если они вписаны в name вместо name:xxx, то это ошибка и их нужно туда переместить.

Хорошо. Давай возьмем Канаду. Там два государственных языка - английский и французский. Проведи исследование, как там заполняют теги name?

А я ровно про то же самое, просто рассматриваю ситуацию не одной единственной страны, а всех. Ведь мы тут не глобус РФ всё-таки рисуем. Вот это самое “нахождение объекта на территории XX подразумевает что в name записано название на языке YY” - это и есть усложнение софта и использование доп. справочников.

Софту было бы удобнее если бы name без указания языка вообще бы не было. Но что выросло - то выросло…

P.S. Так, для злобы дня, - давлю name:ru там, где встречаю

Ну и мудак.

Очень приятно. А я - Игорь :wink:

А если бы владел сущностью вопроса, то знал бы, что эти name:ru расставлены ботом простым копированием name, причем очень криво… Потому и давлю.