Кладротеги

Ну если откатить одним махом, то в случае если кому-то они понадобятся их так же в большинстве можно будет вернуть взад. Но я не думаю, что это потребуется. Ну и альтернатива для однозначности НП какая-то должна появиться в замен. Только в этот раз там где это действительно необходимо, а не на всём подряд.

Ну я как вношу, с тем же успехом могу и не вносить, мне меньше возни, вносил можно сказать по инерции.

Какая разница, конструктивно или нет?
Если данные нужны хоть одному человеку, выпиливать их нельзя.
Данные нужны мне.
Предлагаю вопрос на этом закрыть.

Кирилл, если ты не видел меня лично, это не значит, что меня не существует.

Полностью за, и даже если сейчас никому не нужны - в любое время могут понадобиться (например, в историческом плане), люди их вносили, тратили силы, они никому не мешают и вряд ли сильно перегружают базу.

Вот придумал пример, пусть он немного высосан из пальца, допустим я начальник этого кларда, хочу вывести на чистую воду своим сотрудников, отнёсшихся к своим обязанностям “спустя рукава” и проверяю базу на ошибки.

Приезжай на конференцию :slight_smile:

http://planet.osm.org/planet/full-history/history-latest.osm.bz2

Вопрос той темы - да.
И открыть вопрос этой темы - как именно они используются? Почему именно cladr:code, а не kladr:user?

Вы плохо себе представляете что это за данные.
Большей частью их вносили не люди, а бот, качество этих данных весьма хреновое, а при отсутствии рабочего валидатора этих тегов их качество будет только ухудшаться. Теги cladr:xxx, отличные от cladr:code дублируют содержимое КЛАДР, их никто не валидирует и не обновляет после выхода обновлений. Это что касается тегов на улицах и точках НП.
Теги cladr:code на домах ставились ботом по ближайшей улице, смысла в них вообще никакого.

Единственный, кто их как-то использует (andriano) делает это только для упрощения своих алгоритмов конвертации, аналогичную задачу можно сделать и без этих тегов.

Ну и? Предлагаете скачать архив в почти 40 Гб что бы узнать, что Вы имеете в виду? Или ссылку можно использовать по другому?

Сдаюсь, это не моя тема.

Еще раз поясню назначение тега kladr:user - этот тег используется для установления однозначного соответствия между улицей в КЛАДР и улицей в ОСМ, в тех случаях, когда это невозможно сделать другими способами, например по имени. То есть “сплошное” заполнение этого тега совершенно не нужно, более того даже вредно. Но если у кого-то все-таки есть потребность в таком заполнении, то убедительная просьба использовать для этого другой тег. Мне же эта затея кажется совершенно бесполезной и даже вредной, данные неизбежно будут протухать очень быстро, рано или поздно вам надоест их поддерживать, в общем получится очередной cladr:*, который уже не первый раз предлагается выпилить. В общем рано или поздно это придется сделать, что бы там кто не говорил.

Оттуда можно достать удалённые КЛАДР-тэги…

ДА, Aleksandr Dezhin поднял очень правильный вопрос:
все кто вносит кладротеги - как вы следите за их актуальностью?
Особенно это касается ситуаций, когда код меняется у крупного объекта (e.g. город) и вместе с ним у всех подчиненных ему объектов.

Вносил только теги kladr:user для отдельных НП, беря их из Dezhin’ского валидатора, в случаях одноименных НП в одном районе (например, “село” и “посёлок при станции”).

По тегам могу сказать что cladr:* были выпилены из RU LEN пару месяцев назад, более не появился ни один и никто не писал претензий, правка отдельная была, потому могли откатить, но раз претензий нет, мне кажется что cladr: умер…

  1. Для различения при поиске одноименных названий.
  2. Потому что когда писался фрагмент кода, о котором речь, kladr:user еще и в проекте не было. В принципе, дойдут руки, добавлю kladr:user с боле высоким приоритетом, чем cladr:code. Но от cladr:code все равно отказываться не собираюсь. Потому как бот исходил из геометрии, и даже при наличии ошибки она все равно будет где-то вблизи нужного района, что для моих целей вполне годится.

Строго говоря, лично я никакие теги cladr:* кроме cladr:code не использую.
Поэтому от сноса cladr:name, cladr:suffix, etc. не пострадаю. И, в принципе, думаю, никто не должен пострадать, т.к. эта информация всегда доступна в КЛАДР, кому надо - найдет.
Так что если вопрос стоит “сносить все cladr-теги кроме cladr:code”, - у меня возражений нет.

Теоретически - эту задачу можно было бы решить с использованием геометрии.
На практике это, увы, невозможно.
Причин несколько:

  1. Данные OSM неполны - в настоящий момент границы имеют менее половины (!) всех населенных пунктов.
  2. Количество границ идет на десятки тысяч, поэтому в условиях постоянной редактируемости ни в один момент времени все существующие границы не находятся в исправном состоянии.
  3. Существующие в OSM границы проведены по чему угодно: кадастру, ОКАТО, ОКТМО, но только не по КЛАДРУ, а потому восстановить именно адресацию по имеющимся данным задача если и решаемая (в чем лично я не уверен - даже при гипотетическом наличии всех границ, причем, в исправном состоянии), то весьма нетривиальными средствами (возможно, с массированным использованием ФИАС для поиска соответствий. Но в ФИАС есть свои ошибки).

В общем, боюсь, это Вы плохо себе представляете, что такое пытаться восстановить КЛАДР по данным OSM.

Это юмор такой - там внутри 700 Гб xml.

Такой задачи никогда и не стояло, поэтому непонятно зачем её вообще решать.