Импорт адресов из открытых данных Москвы

Месяц назад я считал количество адресов в OpenStreetMap и в реестрах для Москвы и Петербурга. В обоих городах официально около 200 тысяч адресов. Но замаплено у нас гораздо меньше: 80 тысяч в Москве и 37 тысяч в Петербурге.

Не для всех городов мы можем найти адреса, но у Москвы есть портал открытых данных. А там — реестр недвижимости с адресами. 219 тысяч объектов, и у 210 из них есть координаты и улица с номером дома. Давайте посмотрим на качество этого реестра и попробуем с его помощью улучшить наши данные.

Первый этап: только простые адреса (без строений и без владений). Начинаем с Северного адм. округа. Из 6846 адресов 770 не сматчились со зданиями, на 646 зданий добавляем адрес и на 320 исправляем несоответствия. Последнее — часто замены на угловых домах, но встречаются и явные ошибки (1, 2, 3).

Сейчас валидируем ВАО.

Короткое описание кнопок: «Good» — всё нормально; «Skip» — пусть другой решает, «Don’t Change» — не изменять объект. После нажатия можно либо ввести причину, либо нажать «Create New Instead», чтобы создать новую адресную точку там, где тусклый маркер. Если в импорте всё нормально, но нужно не забыть поправить карту, — напишите комментарий в «fixme».

Тем временем, я в одно лицо провалидировал аналогичный импорт для СЗАО. Новые точки более-менее правильные, как и везде. На изменение — 660 зданий. Из них 120 (18%) — зря (в основном, стилобаты и части больших зданий) и 220 (треть) — с правками (в основном — создать новую точку вместо изменения существующего здания).

Очевидно, что как есть импортировать данные нельзя: половину изменений нужно править. Валидация, впрочем, отлично работает. Пожалуйста, помогите довалидировать САО. Я дописал туда подробную инструкцию.

Всего будет 12 импортов: 9 по округам Москвы, Зеленоград и два куска Новой Москвы. Первые шесть (север и центральный пояс) я подготовил. В них в среднем по тысяче изменений для валидации, кроме ЗАО, где 1800. По результатам импорта в Москве появится, по моей оценке, около 25 тысяч адресов. То есть, все для зданий без указания номера строения. Думаю, это сделает город пригодным для геокодирования в любых целях.

Вот этот объект
http://audit.osmz.ru/run/mos_addr_aeroport/646467522
привязался к точечному POI, а должен был к зданию

Да, ты прав: я ожидал большого количества адресных точек, но реально их около 150 на всю Большую Москву. Оставил матчинг только со зданиями. Этот импорт перезаливать не буду, он почти закончен, а остальные пересоберу.

Нужна поддержка угловых домов, хотя бы отображение (а лучше - какая-то умная магия для матчинга) addr2

Ну это не столько к этому конкретному импорту, сколько ко всему осму в целом. Потому что двойная адресация не поддерживается никем. Даже в открытых данных нет двойной адресации, только номера домов с дробями, без указания второй улицы.

Ну почему же, у Дмитрия Киселёва в газеттире есть поддержка. И она явна проще в реализации чем множество точек внутри дома.

Хорошо, ты опроверг моё «никем» :slight_smile:

Но насчёт проще, чем множество точек, можно поспорить. И в картировании сложнее (см. кучу тем про способы тегирования), и в использовании (см. кучу способов тегирования).

Это всего лишь значит, что у программистов не было такого в мыслях, но это не значит, что двойных адресов нет ни в паспортах, ни в документах, ни на табличках

Заметил, что в последние годы таблички с “второй” адресацией (по соседней улице) в Москве начали массово снимать. Остается табличка с одной стороны, а за углом - ничего.

Продолжаем разговор. Ранее отклонённые точки так и будут показываться всем подряд (с маленькой надписью “The last reviewer rejected this change”), пока кто-нибудь (ну хоть кто-нибудь!!) не нажмёт большую зелёную кнопку?
Кажется мне, смысл валидации несколько теряется…

Нет. Каждая точка в валидаторе проверяется два раза. То есть, один раз кто-то точку отклоняет, и потом кто-то другой должен сделать то же самое. После этого всё, вердикт утверждается и больше никому не показывается.

Ага, понял. Логично.
Только не описано :slight_smile:

Не работает в IE11 для отсталых, на кнопки Good и пр. не нажать:

Это очень странно и означает, что перед заполнением таблицы тегов произошла какая-то другая ошибка. К сожалению, у меня нет windows-машин нигде. Если встретишь ещё раз, загляни в консоль на предмет предыдущих ошибок, пожалуйста.

Наконец-то отвалидировали первые три округа: Северный, Северо-Западный и Северо-Восточный. Я хочу их импортировать с учётом результатов проверки. Ссылки ведут на карты, где можно посмотреть точки и вердикты по каждой. Если что-то не так, там же можно нажать «edit this» и поправить.

Как по вам, импортировать, или есть какие-то систематические ошибки?

Если всё ок, предлагаю начать валидацию Западного административного округа. В нём больше всего изменений.

На мой взгляд, вместо адресных точек нужны домики. Руками, да.
Но для этого надо полностью перерабатывать сам принцип валидатора - прикручивать туда вызов JOSM’а и регулярно выкачивать обновления осм.

никто не запрещает нарисовать домик вокруг точки и перенести теги с точки на контур домика.
чтобы не терять точку, ее можно будет смерджить с одной из новых точек контура.

при этом, адресная точка уже будет работать даже без графических зарисовок домиков, а до их зобрисовки может пройти месяцы-годы.

BuildingsTools автоматом переносит адресные теги на контур здания, точку, кажется, удаляет, а не мерджит, но ничего в этом страшного нет.

Интересно, где именно я попросил научить меня рисовать домики? (и не терять точку при этом, ведь это так важно!)

Просьба была в том, что список ненарисованных домиков более полезен, чем куча точек, размазанных по всем промзонам Москвы.