Кто-то основательно починил границы Отчёт по свежему дампу выдал сокращение разрывов контуров почти на 20%
попробовал проверить валидатором Хохольский район. возникли такие вопросы:
что не так с хутором Долженки http://www.openstreetmap.org/node/1584906419 http://atd.osm.rambler.ru/r1144853.html ?
там же “Маслов лог” и “Никольское на Еманче”, “Посёлок опытной станции ВНИИК”, “Розы Люксембург”.
Костенки - не находит т.к. ошибки с Е/Ё ?
ошибка с двумя “Заречье”. в одном указано okato.
У меня почему-то хутор Должёнки.
посёлок считается префиксом а не частью name. Т.е.“посёлок” + “опытной станции ВНИНИК”. А вообще, когда создадите сельские поселения все эти расхождения будут более прозрачны. Маслов лог у меня записан как Маслов Лог, хотя регистр вроде не должен иметь значения.
http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%81%D1%82%D1%91%D0%BD%D0%BA%D0%B8
ОКАТО данный валидатор не использует. Что с этим делать не особо ясно, поэтому такого рода неоднозначности пока будут.
было бы удобно разделять таблицу на сельские(городские) поселения и НП (стобец “Тип”). большая часть поселений сейчас не отмечена (и будет отмечена не скоро т.к. нет легкодоступных данных). и было бы визуально проще находить ошибки среди НП, если бы они были отделены от поселений.
и для таблицы с НП не понадобится стобец “Центр”
было бы хорошо, если бы в таблице выводились так же НП из базы, но которые не найдены на местности. т.е. если бы в таблице были также “Должёнки” и “опытной станции ВНИНИК” помеченые как ненайденные, то сразу бы стало понятно в чём ошибка.
вообще это важно. т.к. в этом случае мы валидируем не только присутствующие но и вообще все НП.
я заметил, что отсутствующие НП отображаются, если есть сельское поселение. http://atd.osm.rambler.ru/r2591561.html
использовать ОКАТО (или что-то в этом роде). ведь сельские поселения будут отмечены ещё не скоро.
Не мапить под валидатор
исключая ложные ошибки легче искать настоящие.
Зато какой мотиватор, чтобы их все-таки отметить!
Мне нравится предложение freeExec - если количество одноименных нп внутри одного региона совпало, значит все хорошо.
Валидатор по свежему дампу отработал, но так как с работы у меня нет выхода результаты будут позже вечером. Беглый взгляд показал что высокоуровневых сломанных границ нет, в общем проход нормальный.
Ну а поскольку есть некоторое время то попробую поисправлять некоторые свои ошибки.
тоже хороший вариант.
самый интересный вариант - помечать как “не ошибка” на стороне валидатора, любым пользователем, анонимно или нет. с коментарием. но это потребует существенной доработки валидатора. идея на будущее.
Откуда берутся данные по населению НП?
Перепись 2010
Заходим в Краснодарский край - населения нет ни в одном НП.
Население с контура берется, для Армавира есть например.
Пока свойства (например, население) берутся только с полигона. Сейчас наиболее важная задача - сопоставление названий/типов, поэтому все усилия туда. Свойства с точки/полигона будут проверяться на предмет непротиворечивости немного позже, когда я разберусь с сопоставлением.
Валидатор ещё не обновлён, но несколько мелочей поправлено. Теперь, например, прямые кавычки которые обозначаются как " сопоставляются верно с кавычками в базе. Но вопрос с кавычками остаётся. По логике нужно использовать какой-то один тип кавычек дабы не плодить зоопарк в названиях населённых пунктов, но какие кавычки правильнее держать у нас? Я до сих пор в ОСМ использовал только обычные двойные кавычки так как их можно без ухищрений ввести с клавиатуры.
Всё, валидатор обновлён.
fixed. Была бага в индексе, названия склеивались хотя и не должны были. Но это поселение - реально жесть, сколько населённых пунктов с одним названием! Легко приехать/прислать не в ту деревню …
Починено. Там был самый первый алгоритм, по сути пробный, когда в базе данных и полей для сопоставления не хватало. Сейчас всё типизировано, поэтому проверку сделал более точной.