Самые распространенные ошибки - ошибки адресации

Хотя подобная тема уже существует http://forum.openstreetmap.org/viewtopic.php?id=13622 , решил создать новую. Хотя бы затем, чтобы в первом сообщении темы указать на основные типы ошибок и способы их устранения.
А, учитывая количество этих ошибок, и пять одинаковых тем - не слишком много.

Итак, если в среднем доля ошибок в указании каких-то параметров составляет единицы (а то и доли) процента, то в отношении адресации - десятки процентов. Год назад было около 80%, т.е. из каждых 10 адресов 8 были заданы неправильно.
Сегодня этот процент примерно вдвое ниже (думаю, в значительной степени благодаря первой теме), но, увы, еще очень высок.

Самая распространенная из ошибок адресации - “улица не задана”. Т.е. в адресе присутствует поле addr:housenumber, но отсутствует addr:street.
Обычно маппер указывает на доме его номер, убеждается в том, что этот номер “появился на карте”, т.е. в мапнике, и на этом успокаивается.
А между тем, кроме изменения на картинке ничего не произошло: дом по прежнему не может быть найден адресным поиском, его невозможно указать для построения маршрута и т.п.
Исправить это можно одним из двух способов:

  1. Указать addr:street непосредственно для дома (это вариант предпочтительнее для Potlatch),
  2. Внести этот дом в отношение улицы (создать это отношение, если его еще нет) (этот вариант предпочтительнее для JOSM).
    Следует помнить, что вариант 2 имеет приоритет, т.е. при одновременном использовании обоих способов указания улицы данные будут браться именно из отношения.

Следующая по распространенности ошибка адресации - несовпадение имен в поле name самой улицы с полем addr:street у дома. Типичный пример:
улица: name=Шевченко улица,
дом: addr:street=Шевченко.
Обе надписи должны быть идентичны, включая наличие статусной части (улица, проспект и пр.), а также на одном языке. Нередка ситуация, когда сама улица названа на одном языке, а дома на ней - на другом. Обычно это бывает в том случае, когда кто-то решает “поправить” язык улицы, совершенно забывая про дома, и ломает тем самым адресацию по всей улице.

В первой теме уже упоминался валидатор http://peirce.gis-lab.info/qa , Это хороший инструмент, обладающий, однако, некоторой спецификой:

  • он разработан на базе конвертера карт в формат навигатора Ситигид. С одной стороны это хорошо - проверяются как раз необходимые для реальных приложений параметры. С другой - у Ситигида есть своя специфика, которая приводит к тому, что некоторые ошибки валидатором просто не замечаются (т.к. отсекаются на этапе конвертации OSM=>MP до валидатора), а в некоторых случаях появляются ложные сообщения об ошибках,
  • он реализован так, что не умеет работать с большими объемами данных, из-за чего “карту” OSM приходится нарезать на довольно мелкие кусочки. А как следствие - заметный процент фиктивных ошибок, вызванных обрезкой данных по границе. Т.е. реальной ошибки нет, но из-за того, что часть данных отрезана границей и потому недоступна валидатору, он обнаруживает “ошибки” в оставшейся части данных.
  • валидатор “заточен” под кириллицу и славянские языки, поэтому пропускает часть ошибок, которые поддаются алгоритмическому исправлению с учетом дополнительной информации о языке. Например, названия “улица генерала Корнилова” и “Улица Генерала Корнилова” - это различающиеся строки, но валидатор будет считать их одинаковыми.
  • валидатор обладает некоторой “тормознутостью”, поэтому если в течение 10-20 секунд Вы не дождались полной загрузки страницы, паниковать не нужно, нужно еще немного подождать.

Кроме того, могу порекомендовать еще один валидатор: http://tools.geofabrik.de/osmi/

  • он более универсален, - анализирует более широкий спектр потенциальных ошибок,
  • он работает непосредственно с данными OSM, а не с результатом их конвертации в MP, поэтому определяет больший процент ошибок и имеет меньший процент ложных срабатываний,
  • он не требует “нарезки Мира на мелкие кусочки” и потому свободен от наведенных вследствие обрезки фиктивных ошибок и, кроме того, позволяет легко перемещаться из одной области в другую без утомительной процедуры возвращения в общее меню и загрузки другого фрагмента карты,
  • он быстрее работает.

Но это не значит, что второй валидатор лучше первого, они - разные, и целесообразно пользоваться обоими.

И, в заключение, хочу еще раз напомнить, что рисование “домиков” без адресной информации - занятие малополезное. Поэтому, нарисовав полигон, и поставив на него тег building=yes, не забудьте проставить также addr:housenumber и addr:street.
Точка с адресом несет больше пользы, чем тщательно отрисованный контур дома без адреса.

Это ещё не все ошибки. Есть ещё

  1. непривязанность населённых пунктов районного значения к своим районам (актуально для тех н.п., которые имеют “однофамильцев” в всвоей области).
    Я такие ошибки уже только в GPSmapEdit замечаю :frowning:
  2. наличие в одном н.п. улиц с одинаковыми названиями, но непривязанных к addr:suburb. Их косвенно можно отследить в nadoloni. По куче дублирующихся номеров домов.
  3. проблемы с мультиязычными названиями. Ну, тут уже скорее проблема в упёртости liosha. Или в непродуманности адресной системы OSM.

Кстати, вопрос: нужно ли дублировать мультиязычные названия населённого пункта на его границе? _sev пишет, что на границе достаточно place_name.

Конечно есть. Я привел лишь самые массовые.

Не думаю, что проблема здесь в Леше.
Задачу непонятно как формализовать.
Кроме некоторой эмпирики ничего в голову не приходит.
А эмпирика, как показывает практика, дает погрешность минимум от единиц до десятков процентов.

По логике - не нужно.
Если удается идентифицировать точку и полигон как элементы одного объекта, - это лишнее.
А если нет, обычно значит, сама граница неисправна. И тогда какие на ней теги - не имеет значения.
Идентификация происходит по трем признакам:

  • совпадение значения place,
  • совпадение значения name,
  • точка лежит внутри полигона.
    Кстати, place_name - устаревший тег. Сейчас вместо него рекомендуется использовать обычный name.

На кордоні достатньо place=* i name=*. Все інше повинно бути на точці.
Не використовуйте place_name.
http://wiki.openstreetmap.org/wiki/Proposed_features/drop_recommendation_for_place_name

А чомусь пан _sev наполягає на використанні place_name на полігонах населених пунктів. Та прибирає мої name, name:ru з кордонів сел. :confused:

напишіть на нього скаргу в DWG :slight_smile:

не знаю чому _sev так робить
погугліть place_name по openstreetmap.org - всі останні рекомендації кажуть про те, що place_name є застарілим тегом і використовувати його не варто
http://wiki.openstreetmap.org/wiki/RU:%D0%9E%D1%88%D0%B8%D0%B1%D0%BA%D0%B8_%D0%B3%D1%80%D0%B0%D0%BD%D0%B8%D1%86
http://wiki.openstreetmap.org/wiki/Proposed_features/drop_recommendation_for_place_name
http://forum.openstreetmap.org/viewtopic.php?id=14007

Вибачте, але я не наполягаю. Півроку тому, поки цю схему не було змінено, я дійсно давав таку рекомендацію. Але навіть тоді не було жодних наполягань ні з одним з ОСМерів.

Тоді поверніть мої теги name, name:ru :confused:
До речі, треба перевірити, чи зрозуміє льошин конвертер такі ситуації, коли:
а) на точці села є name, name:ru, а на полігоні лише place_name без усяких :ru, :uk, :en
б) на точці села є name, name:ru, а на полігоні лише name
в) на точці та на полігоні тегів name, name:ru чи place_name намає, але є релейшен, у тегах якого є place=village, name=, name:ru=
http://wiki.openstreetmap.org/wiki/RU:Relation:boundary

andriano

С этим не могу согласится. Конечно если использовать OSM как дорожный атлас или карту для ориентации в больших городах (то есть необходим адресный поиск) то здание без адреса бесполезно.
Но, если использовать OSM как карту топографическую (хоть это и проблематично сейчас), то польза от нанесенных полигонов зданий становится весьма существенной, как раз адреса там не так важны как сами объекты.
И к тому же полигоны зданий можно прорисовать просто по снимкам, а вот addr:housenumber и addr:street еще где то взять надо.

PS ИМХО многие к сожалению забывают что карты нужны не только автомобилистам и вебсервисам, но и например туристам. И кстати здесь же лежит и противоречие с типами дорог. Мне было очень трудно принять схему дорог OSM так как я привык что на карте показан вид дороги а не её назначение. Это кстати серьезное препятствие для попыток отрендерить топографическую карту из данных OSM, одно из. (

Ну, вот я рисую домики без адресов по спутниковым снимкам. И чего тут плохого? А кто-то из местных потом проставит номера домов и название улицы. Или я проставлю, если летом доеду до этих мест (есть планы летом объездить Песочин).
Насчёт классификации дорог: у меня тоже есть сомнение в принятой классификации, но раз уж братва её приняла, то так и рисую.
Впрочем, никто не мешает проставлять на дороге тип покрытия, качество покрытия, ширину, кол-во полос и т.д. жаль, что нет рендера, который бы отражал не класс, а характеристики дороги. Хотя, как я погляжу, у нас в Украине состояние дороги обычно соответствет её классу.

а местные проставят в части домов адреса
а потмо появится кто-то со списком адресов и местоположением домов.
и вместо простой заливки домиков придётся изобретать велосипед, как перенести теги с одного многоугольника на другой.

dima_ua

Это потом может будет а может и нет, если вообще будет. А карта нужна как бы сейчас.
С такой логикой тогда вообще не нужно ничего рисовать, а нужно ждать пока не свалится манна небесная в виде импорта из какой-нибудь другой базы. :roll_eyes:

Навіть якщо потім щось буде, то не факт, що воно якісне буде. США майже цілком імпорт даних. На перший погляд - дуже зручно і швидко, але якщо подивитися США в різних валідаторах, то стає очевидно, що виправляти ті дані доведеться ще не один рік, бо активних користувачів на площу менше ніж навіть в Україні. Та і якість тих даних, наприклад геометрія доріг, дуже незадовільна (особливо поза межами великих міст - можна подивитися по знімкам Bing).

Ну, по Харькову манна всё-таки была :slight_smile:
Правда, там не 100% точная инфа. Есть достаточное кол-во косяков, которые без осмотра вживую не узнать и не разрулить.

ИМХО, лучше всего таки вручную.

Бинг - не истина в последней инстанции. Снимки могут быть устаревшими и сдвинутыми.
Надо по трекам смотреть. Кстати, надо бы больше треков. Особенно по всяким деревням и прочим “медвежьим углам”.

Не треба виривати окремі фрази з контексту. Я говорив про Bing в США. Ось відкрив довільну область - зум 19, актуальність - жовтень 2011-го. Навіть якщо присутнє велике зміщення, то геометрію можна однозначно побачити.

сколько ты вручную будешь набивать 64 000 адресов?

Не всегда. В далеких селах residental часто бывает непролазной грязью, а бывает, что track - симпатичный асфальт. Ну и service/unclassified может быть любой из крайностей :slight_smile:
Просто мне как велотуристо покрытие важнее предназначения. И я маплю в первую очередь грунтовки, так как я не шоссер.

Посмотрите тему в Российском форуме про Эстонию, они там как раз адреса “импортируют” вручную

А как часто обновляются данные валидатора СитиГИДа ?

раз в полтора-три дня

можна підписатися на rss-повідомлення окремих регіонів, наприклад
http://peirce.gis-lab.info/qa/UA-E/rss