Сравнивая теорию (вики-документацию) с практикой (leningrad.osm) обнаружил следующее существенное расхождение. Статистику использования можно глянуть на latlon - http://stat.latlon.org/ru/leningrad/latest/tags-a.html
На странице описывающую адресацию http://wiki.openstreetmap.org/wiki/RU:Key:addr выше улицы идёт город потом страна. Никаких тебе районов, областей и т.п. Тем не менее в данных активно встречаются такие ключи - addr:state, addr:region и addr:district.
Вопрос - а как принято у нас? Может стоит внести какое-то упоминание в страницу http://wiki.openstreetmap.org/wiki/RU:Key:addr ? Какое? В см.также? Другой вопрос - state и region считаем равнозначными или необходимо что-то конвертировать во что-то? В leningrad.osm addr:region - 2424 раз, addr:state - 6177 раз.
Схожая история и с addr:district. Лишь всколь упомянуто в http://wiki.openstreetmap.org/wiki/Proposed_features/House_numbers/Karlsruhe_Schema/Additional_tags без примеров и каких-либо ссылок на то как это можно использовать в России. И это приводит к двусмысленности. Так на той странице описано addr:urban_district и addr:district а в реальных данных под addr:district идут как Волосовский район Ленинградской области так и Пушкинский район Санкт-Петербурга. При этом addr:urban_district не используется совсем.
Отсюда финальный вопрос - addr:region и addr:district это служебные поля для СитиГИДа или же общеиспользуемые? Используются ли эти данные или их можно смело игнорировать? Кто и как их поддерживает эти данные и с кем можно общаться в сообществе по вопросу приведения данных к общему знаменателю?
Ну хорошо что описание ключей есть в форуме а не в логах irc Хотя конечно кажется что было бы лучше формализовать стандартным образом - как часть предложения (proposal). Мне лично пока и так пойдёт.
А что делать с addr:state=“Ленинградская область” встречающийся у 6174 элементов?
Ну может тогда просто добавить соответствующий текст на станицу http://wiki.openstreetmap.org/wiki/RU:Key:addr ? Самое простое - создать секцию “Адресная схема, используемая osm2mp (гармин/навител)” и скопировать туда текст из форума. Всё-таки форум лучше подходит для обсуждения а не для хранения документации.
Кстати, addr:state в Московской области использован 1259 раз тогда как addr:region 5089 раз.
Насколько я понимаю, Россия - федеративное, а не унитарное государство. Поэтому субъекты федерации следует обозначать как state.
В нашем случае это относится к областям, краям и республикам, а также городам Москва и Санкт Петербург.
Соответственно, эти субъекты подразделяются на районы, для которых наиболее подходящий термин region. Но иногда используется district.
Хотя мне кажется логичнее (учитывая, что термин “район” у нас понятие неоднозначное - обозначает как единицу “выше” города - часть области, так и “ниже” - район города) термин district для городских районов. Впрочем, тут он практически совпадает с suburb.
Зачем плодить лишние сущности?
Есть общепринятый список ключевых слов, зачем изобретать новые, если искомая структура вполне вписывается в рамки общепринятой?
Фактически, речь идет лишь о том, как корректнее провести сопоставление:
state=субъект_федерации и region=район
или
region=субъект_федерации и district=район
Вся сложность состоит лишь в том, что часть базы реализована по первой схеме, а часть - по второй.
Соответственно, решением проблемы будет принятие общего подхода и корректировка в соответствии с ним всей территории РФ.
Я объяснил, который из вариантов я считаю более подходящим для данной ситуации, и почему.
Еще раз: составленная нами часть базы долджна корректно интерпретироваться в любой другой стране, где составители программ рендеринга, адресного поиска и пр. незнакомы ни с нашей спецификой, ни вообще к кириллицей.