AlRight
101
если речь про этот импорт аэропортов, то автор уже попытался вычистить дубликаты (свои). Есть места, где этого не произошло? Ссылку на карту, плз. Будем посмотреть
gps-Max
102
А как вы собираетесь автоматически со стопроцентной надёжностью выявлять “неправильный” дубликат? (риторический вопрос)
Предлагаю привести номера домов к единому стандарту, который указан на http://wiki.openstreetmap.org/wiki/RU:Key:addr , т.е. заменить, например, “48К2С1 владение 1” на “48 к2 с1 в1”. Это однозначное и полезное преобразование, которое не вызовет никаких ошибок.
Komяpa
(Komяpa)
104
Пожалуй, повторюсь.
Готовы ли вы лично быстро разбирать все последствия данного действия, причём не в ключе “А что тут такого, я ж ничего плохого не сдееелал”?
Какие последствия? Тут всё однозначно и никаких ошибок не может быть. Какие могут быть проблемы от замены большой буквы на маленькую?
gps-Max
106
Лень искать по форуму, но есть два больших и подробных обсуждения по номерам домов. Я тоже некогда задавался этим вопросом, пока не понял, что не всё так просто.
Хотелось бы знать конкретно что именно не так просто, потому что я не представляю какие могут быть проблемы от элементарного действия.
Komяpa
(Komяpa)
109
Превосходно. Спасибо, что решились взяться за такое занятие.
Сделал выборку всех встречающихся в базе номеров домов.
http://latlon.org/~komzpa/hno.txt
Варианты:
- Вы делаете табличку, в которой каждому из них сопоставляете правильное написание.
либо
- Вы пишете код (желательно на питоне, но подойдёт почти любой собираемый под линух язык), в котором описываете точные правила однозначного преобразования и приведения всех номеров домов к каноническому виду.
После этого я генерю для вас файл osm с изменениями, и лично Вы их заливаете в базу.
Просьба к остальным форумчанам: не мешайте человеку, пусть выполнит серьёзную работу самостоятельно, раз так этого хочет.
Ну всякий некорректный мусор-то не надо рассматривать. Здесь, конечно, надо в ручном режиме. Все ошибочные номера домов залить куда-нибудь на OpenStreetBugs, чтобы люди исправили вручную (и я бы, кстати, занялся бы этим).
Я предлагаю рассматривать только формата “48АК2С1В1” или “48А К2 С1 В1”. Надо просто вставить пробелы (между буквой и буквой и между цифрой и буквой) и заменить большие буквы на маленькие. Судя по http://latlon.org/~komzpa/hno.txt полностью слова никто не пишет, поэтому работа со словами отпадает.
Komяpa
(Komяpa)
111
Простите, что такое некорректный мусор? Весь файл взят практически напрямую из дампа.
Хорошо. Пожалуйста, подготовьте таблицу ручных замен, которые вы считаете необходимым провести. Исходные данные у вас есть.
С моей стороны пока возражений нет, выполняйте. 
Ну не может же быть номер дома знаком вопроса или нулём. Не могут быть две буквы у адреса. Не может быть латинских букв (речь о РФ). Не могут быть тире. В общем всё отличное от “48АК2С1В1” или “48А К2 С1 В1” не может быть.
Надо, наверное, создать страничку где все такие некорректные данные были бы представлены на карте, чтобы их исправлять.
Какую таблицу?
А → а
Б → б
Никаких других таблиц я составить не могу.
Komяpa
(Komяpa)
113
TarzanASG, не увиливайте от работы, которой сами пожелали заняться.
Вам всего-то надо вычитать одну табличку и предоставить результаты. Если у вас есть особые пожелания насчёт некоторых значений, проставьте их в третьем и последующих столбцах.
Можно поинтересоваться, а в чем же именно состоит польза от подобного преобразования?
С моей точки зрения - польза отсутствует напрочь, а вот вероятность возникновения ошибки при ЛЮБОМ действии бота отлична от 0.
Собственно, все, что можно сделать автоматически ботом с исходными данными, можно сделать не менее автоматически либо с локальной копией данных, либо при их конвертации в нужный формат для конкретного использования.
Так что напрашивается очевидный вывод: либо преобразование данных посредством бота бесполезно, либо вредно, а вероятно - и то и другое вместе.
То есть ВООБЩЕ ЛЮБОЕ преобразование, осуществляемое на основе лишь данных OSM. Например, КЛАДР-бот осуществлял свою работу, основываясь на другом источнике данных, и то его работа имела некоторые негативные последствия.
Komяpa
(Komяpa)
115
andriano, успокойтесь.
Если TarzanASG действительно сделает полезные преобразования, и сделает это очень просто, как и обещал - я только за. Но дайте человеку хоть раз в жизни сделать что-то серьёзное своими руками. И почувствовать на себе, что это такое - автоматические правки в OSM. Может быть, у него действительно есть гениальные идеи, как это сделать так, чтобы всех устроило.
ikz
(Igor Zhitko)
116
Ша. И тире бывает, и дробь, и латиница…
Например вот и вот.
И при этом всем еще и без улицы 
Komяpa
(Komяpa)
117
таблица в виде файла с разделителем-запятой.
старое значение,новое значение,а1,а2,а3,а4…
где а1, а2, а3… - поля, в которых вы можете оставить какие-нибудь заметки для себя, не для бота.
Умение пользоваться программой Microsoft Excel, или, если вы более уважаете свободное ПО, OpenOffice.org Spreadsheet, насколько мне известно, есть практически у всех, кто учился в последние десятилетия в школе или институте. Если это не так, то рекомендую вам в любом случае этому научиться - полезный навык. Скрипты на бейсике писать можно и там, и там - это может несколько помочь вам в вашей работе.
После этого файл можно выложить на какой-нибудь хостинг, или даже хотя бы на pastebin.ru.
Извиняюсь, не знал. Но ничего автоматически делать с такими адресами я не предлагал.
pankdm
119
Очень прошу - поаккуратнее правьте адреса в своем списке, плизз.
А то очень не хочется потом полезное дело откатывать…
Zkir
(Kirill Bon )
120
Почему Вы так думаете?
Могут: вот, полюбуйтесь.