Приведение названий улиц в соответствие соглашению и правка адресов

А есть, что бы находил дома с addr:housenumber начинающиеся на д. и дом?
И чтобы действовал на всю Россию.
В идеале ещё и с “142 к 5” и “145а”.

Для такого не нужен валидатор, достаточно одного селекта к базе. Вот, держите номера домов на ‘д%’ и ‘Д%’

http://чепецк.net/housenumber-d.csv

Благодарю

с кодировкой какие-то проблемы

На дворе 2012 год. Кодировок кроме юникода не существует уже в принципе.

unicode это стандарт, а не кодировка. Хотя этот стандарт вчисле прочего включает и семейство кодировок UTF.

Кодировка может быть UTF-8, а может быть UTF-16 или UTF-32 (хотя встречается реже).

Прошу пройтись манглером по Вятке (которая Киров), а то в связи с появлением там бинга он подвергся набегу большого количества новичков со всеми вытекающими от этого последствиями.

AMDmi3, а можешь в Нижнем Новгороде пройтись по остановкам ОТ (public_transport=stop, public_transport=platform, railway=tram_stop, highway=bus_stop), и те, что содержат признаки наследования названия от улицы (улица, ул., пр-т и т. д.) обработать своим ботом?

Вообще, я б перенёс соглашения по улицам и на остановки, названные по ним.

Конечно. Займусь на следующей неделе.

Я об этом думал, и склоняюсь к тому, что так делать не стоит. Всё-таки это самостоятельные названия остановок, пусть и “по мотивам” названий улиц. Хотя сокращения убрать скорее всего стоит в любом случае.

Занялся вопросом глубже. Выяснилось что манглер состоит из двух частей

  1. собственно программа.
  2. наполняемая вручную-полуавтоматически база.
    Мои претензии относились к положению статусной части в названии и думалось что бот сам определяет куда её ставить (типа AI). Оказывается это не так.

Понимаю что AMDmi3 мои извинения побоку, но должен признать свою ошибку. Спасибо за работу, а база… Базу можно и изменить в локальном форке.

У нас есть асфальтированная пешеходная дорожка в лесопарке, называется “Тропа здоровья”. Бот, похоже, принимает её за улицу с названием в виде статусной части и имени собственного и изменяет на “тропа Здоровья”. Это неправильно. Прошу настроить бот так, чтобы название этого физкультурного объекта он не трогал.

http://www.openstreetmap.org/way/60328363
http://www.openstreetmap.org/way/60328372
http://www.openstreetmap.org/way/302411271
http://www.openstreetmap.org/way/302411272

Как насчёт прогнать по Крыму?
А то там в некоторых местах сплошные “Будённого улица”:
http://www.openstreetmap.org/#map=17/45.88050/34.55490
http://www.openstreetmap.org/#map=16/45.8525/34.4908

А с чего вы решили что на эту дорогу общие правила не распространяются?

Честно говоря не уверен что горю желанием. Во-первых, его статус всё ещё не ясен, во-вторых там наверняка много самобытных топонимов которых нет в словаре, поэтому либо значительная часть улиц останется кривой, либо нужно потратить значительное время на пополнение словаря, в-третьих, я бы для начала спросил крымских мапперов. Ну и нужен дамп крыма, на гислабе я оный не нашёл.

отдельного там не было, можно вырезать из украинского

Однако, не забывайте, пожалуйста, про
name:ru

addr:street
addr:street:ru

и в отношениях type=associatedStreet
name
name:ru

name:ru обрабатываются, про addr:street:ru ничего не знаю, отношения не поддерживаются и не будут.

тогда лучше и впрямь пока не ломать то, что есть.

Мне кажется, правильно «Тропа здоровья». Это что-то типа Дня здоровья.

Тестовый прогон по Крыму показал что в базе не хватает ~20% названий улиц (5-6 тысяч). Можно пока пополнять базу, а сконвертировать при желании - дело нескольких минут.