Бета версия валидатора административно-территориального деления и населённых пунктов Российской Федерации располагается по адресу http://atd.osm.rambler.ru/
Во время бета-тестирования данные будут обновляться вручную. Валидатор обычно обновляется по рабочим дням около 21-22 МСК, и один из выходных дней в 15-17 МСК.
Валидатор, в отличие от конвертера, занимается поиском ошибок в данных, поэтому число найденных объектов у валидатора обычно намного меньше чем у конвертера, так как конвертер склонен “прощать” некритические ошибки.
Данный валидатор считает что объект административно-территориального деления (АТД) или населённый пункт (НП) обозначен правильно, если формирует правильную иерархию и не содержит существенных ошибок. Ниже перечислено то что валидатор принимает во внимание при оценке качества объекта объекта АТД:
admin_level соответствует ожидаемому уровню
Объект расположен в объекте АТД более высокого уровня формируя правильную цепочку (ФО - Регион - ГО/МР - ГП/СП - район и т.п.)
Название объекта АТД однозначно приводится к эталонному значению
для НП:
Объект расположен в объекте АТД более высокого уровня формируя правильную цепочку (ФО - Регион - ГО/МР - ГП/СП - район и т.п.)
Название НП соответствует эталонному названию
Если название НП не соответствует эталонному то проводится дополнительная проверка на alt_name (берётся весь текст до символа “;”)
Генеральные планы муниципальных образований можно найти здесь - http://fgis.minregion.ru/fgis/ раздел АТД, далее выбирается нужное муниципальное образование.
Да, пока плохо с населёнными пунктами где есть слова “станция”, “имени”, нестандартные кавычки прочие украшательства. Частично я буду править эту информация в БД а частично будем править в ОСМ.
Каннельярви похоже будет правиться в моей БД, это не чистый посёлок (как у меня) а “поселок при железнодорожной станции Каннельярви”.
Upd - Каннельярви я у себя поправил. В следующем прогоне посёлок должен отождествится.
Валидатор не может взять данные о численности населения, если населённый пункт имеет обозначенную границу, но данные о численности указаны не на границе, а на точке. Например, в Заводоуковском городском округе (http://atd.osm.rambler.ru/r1711469.html) выводятся данные о численности населения только тех населённых пунктов, у которых нет границ.
Там же не опознаются населённые пункты, у которых в OSM есть “ё”.
Пока точки никак не отрабатываются (только находятся и привязываются). Валидация значений на точке и контуре - одна из ближайших задач. Буквы “ё” в Заводоуковском округе поправлю.
На самом деле нужно делать хитрее - «Ё» в эталонной базе должно совпадать только с «Ё» из OSM, но «Е» - и с «Ё» и с «Е». Таким образом отсутствие Ё в эталонной базе ничего не портит, но отсутствие Ё в OSM (при наличии в эталонной базе) отлавливается.
Вот оно, типичное мышление ёфикаторов. Вариант с ё считается заведомо (sic!) правильным.
Ладно бы еще эта самая эталонная база заслуживала бы доверия. Будем надеяться что fserges’у надоест ее (эталонную базу) править, и он сделает отождествление е и ё ))
А есть ли другие официальные документы (не ФИАС) в котором они приведены? Навскидку открываем Википедию и таких НП не видим. Можно поискать и по законам, но и там никаких рабочих посёлков я не нашёл.
Вот это самое разумное предложение. Пока это не приоритетная задача, т.к. надо переписать некоторое количество кода (две функции вместо одной как сейчас).
А вообще я считаю что есть два типа мапперов. Перфекционисты будут видеть ё и добиваться его правильного использования (красный цвет напрягает) а остальным несколько лишних красных строчек не создадут проблем - ну ещё одна ошибка, и что с того.
P.S. У меня есть “ё” в отчестве а в паспорте её нет … Но я не очень пойму человека который назовёт меня по паспортному, ведь отчество - от отца.
P.P.S. В Питере есть улица, которую обожают анти-ёфикаторы - улица Лени Голикова.