А что, данная точка находится НЕ в Пошехонском районе Ярославской области?
И вообще удаление полезного (правильного, соответствующего действительности) сделанного кем-либо - вандализм!
Не хотите добавлять подобные тэги сами - не добавляйте, а чужой труд трогать не стОит, если оно так есть - значит оно кому-то так надо.

Напишите себе плагин для JOSM’a который будет прятать “мусорные” addr:** и будет вам счастье.
Никто никого не заставляет ни вносить эти данные, ни использовать.

+1

Эм… учитывая, что вы пишете нам валидатор такое рассуждение меня явно пугает! Потому что строить индекс addr: покрайней мере странно. Конечно как вариант, что ваш алгоритм для каждой деревни строит САМ , а не на основе дяди васинного написания , тогда с индексами соглашусь, а если он берёт сырое , то у вас часть деревень банально пропадёт.
Я даже это обсуждать не буду. Вы сами себе превратили тривиальную задачу в очень тяжёлые методы. Выборка в определенной области делается за несколько секунд по России. А загрузка в БД актуальной версии из shp файлов занимает менее 30 минут.

к тому же главное отличие заключается в том, что индексы создаёт сама БД, а не вы вручную. Так же и тут я принял бы “переизбыток” если бы эти тэги проставлялись автоматически на уровне БД или JOSM, а они проставляюются вручную. Так что сравнение с переизбытком и индексами не совсем корректно.

Вандализм целенаправленная порча данных. В данном случае идёт речь о устранении избыточности- раз, что в свою очередь уменьшит размер БД - два, что приведёт к ускорению работы- три. Если бы я удалил place и name да это вандализм.
Самый яркий пример http://www.openstreetmap.org/browse/node/723871952/history и http://www.openstreetmap.org/browse/way/58366864/history противоречат друг другу по номеру дома. Когда при таком подходе этой ошибки бы не было.

А вообще Paravoz рекомендую почитать про БД. Вы со своим нотбуком вполне можете подконнектится к БД через psql и задав простые запросы получить ответы. Тем самым сэкономив заряд батареи.
И вы мне приведёте действительно стоящий аргумент? А то слова вандализм не применимо, т.к. информация стоит на соответствующих отношениях МР.

Когда POI - отдельный объект, то спору нет, адрес там не помешает. Но, если n-ное количество привязанных к полигону POI снабдить адресами (совпадающими с полигонным), то получится «слегка» некрасивая картинка, а именно - здание, испещрённое, например, «12 к1»
И как это расценивать? Данные верные. Кому-то это надо (иначе не вбивал бы адреса), но этот «кто-то» мог и ошибиться, переусердствовать и т.п.
Сам расцениваю, как мусор.

А в чем ошибка? Общежитие имеет неверный адрес, или точку занесло в этот дом по ошибке, и ее надо передвинуть, сюда: http://www.openstreetmap.org/browse/way/58366889
?

В каждом таком случае надо разбираться, причем по сути, а не сносить теги, неотвечающие принципу геометрической вложенности.

Это бага мапника, в мапсерфере ее поправили, и получается *красивая *картинка.

Как я понимаю предлагается удалять addr именно на отдельных объектах. Вообще продвигаемая таким образом идея ИМХО губительная для OCMа - тк потом кто-то станет удалять теги к примера цвета задний - зачем - ведь все равно перекрасят)))

Для меня в таких подходах видится одна большая проблема - за несколько лет у нас сформировался определённый алгоритм действий, определённые решения для определённых задач. Сейчас по воле ОДНОГО человека нам предлагается полностью перестраивать всю “технологическую цепочку” - что для нас совсем неприемлемо - тк мы не программисты и свободное время посвящаем не изучению psql а несколько другим вопросам.
Я вообще всегда считал что ОСМ строится на определенных правилах, в том числе и система тэгирования, где присутствует addr. Так вот - на основании какого правила/решения или чего либо другого хотят удалят addr, что нарушаю я добавляю addr?

Paravoz вообще то это кто обсуждает решили превратить тему: ААА караул, тэги удалять хотят : DDDD
Хотя изначально мысль была совершенно иная просто я высказал свою точку зрения о том, что фактически это лишняя работа. Если сейчас нет какого-то инструмента, то не факт, что его не будет завтра. На такую простановку тэгов требуется колосальное кол-во времени . А получения автоматизорванным путём на самом деле быстро и просто.
Для примера тот же пример с нп который вам требуется. Берём за основу пошехонский район. Составляем запрос на выборку:

SELECT 
  bpl.name as "Название района", sp.name as "Название нп"
FROM 
  public."boundary-polygon" bpl
  INNER JOIN public."settlement-point" sp ON (ST_Within(sp.geom,bpl.geom)) WHERE bpl.name like 'Пошехонский район' ORDER BY sp.name ASC;

Запрос выполнился за 52мс, вывел 422 точки НП. Что вывело красивую табличку:


Название района| Название нп
Пошехонский район | Авдеево
Пошехонский район | Аверковское
....
Пошехонский район | Ясная поляна

Ради интереса попробуй вашим способом. Сколько времени на выполнение и сколько НП?
Если изменить запрос на запрос на

SELECT 
  bpl.name as "Название района", sp.name as "Название нп"
FROM 
  public."boundary-polygon" bpl
  INNER JOIN public."settlement-point" sp ON (ST_Within(sp.geom,bpl.geom) AND a_dstrct = bpl.name) WHERE bpl.name like 'Пошехонский район' ORDER BY sp.name ASC;

То он выведет 420 НП. Куда то подевались 2 НП (проверка addr:district на написание района)!
Правда не стоит переносить на всю Россию. Т.к. я специально их прописывал и много времени потратил на addr , и как я понимаю что зря.

На дак я и о том речь веду - кто считает проставление addr лишней работой - их не проставляет, а тот кому они нужны - проставляет, если появится сервис способный отловить ошибочные addr - я буду только рад и приму участие в их корректировке.** Самое главное - не удалять тэги соответствующие реальности, правилам ОСМ установленные другим человеком.**

Ну так сравнивать, мягко говоря не корректно. Фильтр по атрибутам через osmfilter на всю планету займет минут 30, сколько займет нарезка региона и загрузка в бд? Учитывая что еще и постгрешку надо ставить.

dkiselev постгрешка ставится столько же сколько ваш любимый медиапроигрыватель. Дабы подкрепить, что можно заиспользовать shp2pg используя выгрузку http://beryllium.gis-lab.info/project/osmshp/ загрузка России… не беря в расчёт распаковку из 7z (минут 10), время скачивания (минут 10), и перекачка в БД минут 10 : ).

Всё будет хорошо, не переживайте :slight_smile: Главное не забывать принципов ОСМ-а - результат обязательно будет, просто не обязательно завтра. ОСМ это удовольствие а не аврал и горячка. И уж совершенно точно ОСМ это не для перфекционистов (до ОСМ я считал что highway это “автомагистраль”).

Ещё раз - если есть валидные данные (а за это отвечает валидатор), то как использовать данные волен будет решать каждый самостоятельно. Не нужно решать за других как пользоваться информацией, какими инструментами. Надо не сужать количество потенциальных потребителей информации ставя им максимальные барьеры а наоборот - расширять, предоставляя максимум удобно подготовленных (валидных) данных.

lenux, ты не знаешь моего любимого медиапроигрывателя, и уж тем более сколько он ставится. Хорошо, допустим постгрешка уже стоит.

Допустим мне нужна информация которой в шейпе нет (точнее не допустим, а так и есть), или гислаб не режет шейпы на нужную территорию. Ну и просто, если ты не считаешь время на нарезку шейпов - это некорректное сравнение. Шейпы нарезаются довольно долго.

Конечно, когда речь идет об одном примере, где звезды конкретно у тебя встали кругом и пляшут - все шоколадно. Но шаг в сторону, и выясняется что надо или очень крепко подумать, или 64гига оперативы и рейд на ssd’шках. Зато ни капли избыточности.

На самом деле, у тебя все так быстро, потому что большую часть вычислений за тебя сделал гислаб :slight_smile: Я тоже недоумевал, чего это номинатим обновляется редко, когда за 5 минут загрузил все домики по москве с гислабовской бд. Как только я попробовал заморочится с большим куском территории - краски утухли. Можешь спросить у Жени сколько строится индекс по РФ для openstreetmap.ru и на сколько это было легко и просто.

Хм. Получается, что Мапник - некий отщепенец, перманентный гадкий утёнок, необтёсанная заготовка :frowning:
И одновременно - официальное лицо OSM
Вышеописанный метод тегирования+мапник=очень некрасивая, страшная, кривая картинка.
Пластическая операция, как я подозреваю, не предвидится (в этом столетии :smiley: )

Это proof-of-concept и этим всё сказано. И с текущими мантейнерами его стиля он будет долго оставаться таковым.
Кроме того, многие красивости зачастую имеют плату в производительности. И для высоконагруженых систем иногда приходится поступаться красивостями дабы втиснуться в существующие ограничения по железу.

Уже давно нет. Есть куча других, гараздо лучших стилей отрисовки. У того же mapbox, например.
В отличии от google и яндекса у OSM нет единого официального рендерера, есть много разных, разной степени красивости.
И поэтому не очень понятны мотивы тех кто выбирает один из самых некрасивых и потом жалуется на это.

Нет, тут просто “дефолтный мапник=очень некрасивая, страшная, кривая картинка” и ожидать от него чего-то другого на данный момент не стоит.

Давай разговаривать более конкретно, какой инфы нет в шейпе?
Какой твой любимый проигрыватель?
А зачем считать время на нарезку? Это само уже обсчитано на гислабе. Или пользоваться готовым это не кошерно? Надо обязательно придумывать своё, потом это обрабатывать на старом железе? Если так уж прям нужна территория, я думаю можно каким-нибудь сконтактироваться с гислабом, правда если это относится к России.

А так да, я с тобой соглашусь, что обрабатывать всю планету это время затратно. И снова… если у тебя проект , который что-то просматривает по областям, то зачем загружать local.osm? Скачивай текущую область и отдельно её загружай. К примеру ЯО выгружается в БД за 40 секунд.

В целом я удивлён тому что нет выгрузки в planet.sql может это бы сэкономило грандиозное кол-во нервов у людей.

Нехилый, надо сказать, получился proof-of-concept :slight_smile:
Сие означает, что на него следует попросту забить. Жестковато.
И всё же не соглашусь, что сейчас Mapnik - не официальное «лицо» OSM. Хотя бы потому, что это стандартный дефолтный слой на http://www.openstreetmap.org Не так уж он и плох. Не вижу смысла в нанесении на него «полоски гвоздём» при каждом «удобном» случае, мол «ай, всё равно это лишь концепт, заготовка, пример, полигон для испытаний (читай: мальчик для битья?) и т.п.» Особенно это касается адресного тегирования, о котором шла речь выше.

Планета в postgres с индексами весит гигабайт 400. Мне страшно себе представить сколько времени она будет выгружаться в sql и сколько будет весить.

LLlypuk82, вот откуда эта советская привычка назначить что-то обязательно “официальным” и на это пытаться молиться, под это подстраиваться и вечно на это ссылаться?
Стиль по умолчанию - да, безусловно. К большому сожалению.
“Не так уж плох” - вообще ничего не значащая обычно фраза, потому что ее обычно применяют к какому-то дерьму, которое лучше, чем ничего. Собственно, так и есть, это дрянной стиль, который сложился исторически (как и почти все в OSM, что далеко не всегда хорошо) и весьма лениво поддерживается и обновляется. Сравните с тем, что делает один (!) человек - стиль mapsurfer или http://чепецк.net/ - вот с этим нужно сравнивать, со стилями, которые разрабатывались с определенными целями и при наличии представлений, как этих целей достичь, а не просто чтобы отобразить худо-бедно данные, раскрасив все в разные цвета от балды. Проще найти несколько стилей, которые для своих целей значительно лучше Мапника, чем стили, которые были бы еще хуже.

Хм… и давно Чепецк вернулся в строй ?