Обсуждение массовых правок по Российской Федерации

highway=path вовсе не шоссе, а waterway=dam вообще без воды.

Не надо переводить мнемонику

Дело не в мнемонике. Без building = entrance тег building = * обозначал бы только здания.

Так у меня и был план. Но начались возражения ("building = entrance нужен кому-то, и т.д.).

Ок, тогда зафиксируем, что наличие двух полных синонимов никак не помогает ОСМу не развалиться. Соответственно, это аргументом против замены устаревшего тега ЗАГСа (которая никак не отменит принцип Any Tags You Like) на новый не является.

Напомню, что принцип Any Tags You Like относится к фичам, которые еще не зафиксированы в вики (и он не означает, что вы можете выдумывать бесконечное числео тегов-синонимов - в противном случае “other users might eventually convert your contributions to fit that scheme”) https://wiki.openstreetmap.org/wiki/Any_tags_you_like

Порог был назван условно. Ситуация та же, что и с консенсусом: в подавляющем большинстве случаев используется entrance=*. Вот если бы buiding=entrance встречался в 20% случаев - тогда им точно было бы проблематично пренебречь.

А почему вхождение именно в топ-60 является достаточным признаком значимости тега? Почему, например, не в топ-50 (куда он уже, кажется, не входит)?

Не надо ничего удалять из вики. Надо указать, что тег устарел и привести ссылку на замену. Это в статье сделано, в самом верху.

Про этот принцип literan уже расписал в предыдущем сообщении. Он про отсутствие излишней бюрократии и согласований, но почему-то некоторые участники его понимают как green light to chaos.

Системность не появляется сама по себе, для этого надо приложить усилия. Само по себе всё только может свалиться в бардак. А если его отстаивать, то понятно, что ничего кроме него и не будет.

Я вот ещё какой момент не понимаю: как вы пишете, потребителям данных всё равно поддерживать обе схемы. Окей. Тогда, получается, для вас никакой разницы, как именно будет меняться соотношение между ними в базе. А основной принцип OSM - have fun. Если другому пользователю доставляет удовольствие, что база будет в системности - ну пусть сделает. В OSM приветствуется инициатива. Но нет, почему-то вы отстаиваете позицию, что именно что нельзя убирать хаос из базы, это пошатнёт основы проекта. Хаос ради хаоса. Как будто новичок, увидев, что все ЗАГСы обозначены одинаково (какая неожиданность!) подумает: “Ой, да тут у них всё строго, никакой свободы, полный ГУЛАГ и я сюда не пойду”.

Или убрать поддержку оставшихся случаев из софта. Тогда мотивации исправить данные в базе будет гораздо больше, чтобы всё заработало :wink:

Начнём с того, что SLA с потребителями данных никто не подписывал. Вон когда принимали в ЕС закон об авторских правах, overpass в знак протеста вообще сутки не работал, и не только он. Я больше скажу - пункт про отказ от гарантий есть в любом коммерческом EULA (с которым обычно все соглашаются, не читая), только с вас за этот отказ ещё и денег возьмут. И да, у нас добровольный проект, а не serious business, где клиент всегда прав, и надо вывернуться наизнанку, но ублажить его.

А то недавно был один такой “потребитель данных”, который увидел, что адресов мало, потратил аж целых три часа своего драгоценного бизнесменского времени на передирание их с кадастра, а когда правки откатили, то у него знатно подгорел фитиль. Пользователь данных - это хорошо, но до тех пор, пока он не начинает требовать, чтобы проект подстраивался под его бизнес-нужды. Пускай присоединяется на равных условиях (а других у нас нет) с остальными участниками, принимает участие в обсуждениях, голосует. А не так, что “я пользователь, у меня бизнес, поэтому я всегда прав и это не обсуждается, вы тут ботаники-задроты хернёй страдаете, а я бабки кую”.

Это пожалуйста в Sticky: на верх форума,
тут такие “партнеры” тоже встречаются.

Да, действительно, нет никакой разницы, как меняется соотношение в базе. Пока тег присутствует в базе, и сохраняет свою семантику (т.е. известно, что он обозначает), его приходится поддерживать.

Ну да, have fun. Но вы так пишете про системность, как будто вы ее когда то видели. Когда последний раз вы ее видели в реальном мире? Когда она последний раз встречалась в ОСМ?

Если этому другому участнику нравится системность, ну пусть сделает. Но почему он ее за 10 лет не сделал? Вы понимаете, что мы обсуждаем одно и тоже десять лет? Где же ты моя системность?

Позиция не в том, что порядок хуже беспорядка.

Позиция в том, что такая системность, которую вы хотите достичь, просто не существует в реальном мире, и недостижима в языке, который этот мир должен описывать (т.е. в системе тегов осм).

То что на первый взгляд кажется системностью, это игнорирование реальной сложности, переупрощение.

С building=entrance полемика вертелась вокруг (игнорируемой) разницы между входом и подъездом.
Загсы (замену amenity=register_office → government=register_office) я не готов обсуждать, но подозреваю что там будут свои сложности.

Ну например, все ли загсы во всех странах государственные? Могут ли быть частные, или муниципальные? Это не так смешно, как кажется, например, частные камеры контроля скорости уже существуют. Ну, и еще почему register_office – это именно загс? как обозначать всякие отделения регистрации ГИБДД? Не ждет ли amenity=police таже участь?

Если честно логика в отношении “amenity” отсутствует напрочь.
Сказано - Инфраструктура, благоустройство (amenity=*). И вдруг - Теги для указания общественных мест. К ним относят аптеки, банки, уличные телефоны, школы и т.п.

Я бы отдал предпочтение “building” для здания и “amenity” для территории на которой стоит здание. Тем более что ключ building=* используется для указания здания.
А пока каша - тут тебе и amenity=bar (помещение), и amenity=biergarten (открытое пространство). Ну и amenity=drinking_water как бельмо в глазу.

Так ведь ещё есть и тег “leisure=*” используется для обозначения мест, где люди проводят своё свободное время. А разве в баре люди не проводят своё свободное время?

Конкретно в РФ частных не существует. Муниципальные органы власти – это также government. За все страны мира не знаю, конкретно в этой ветке обсуждается только РФ.

Вы абсолютно правы. leisure = bar был бы более уместен.

Я в OSM менее 10 лет.

Речь идет об обозначении одной сущности одним методом, не более того.

Изначально туда помещали все POI. Поэтому и существуют amenity = register_office/shop, т.е. до введения *office = ** и *shop = ** офисы и магазины обозначались через *amenity = **. Тенденция отказа от него имеет место, например количество amenity = embassy сейчас уменьшается, а office = diplomatic увеличивается, есть PR для osm-carto, который удалит рендеринг amenity = embassy.

В том-то и дело, что речь идет о чем-то другом, что как раз и приводит к размножению методов.
Были building=entrance и amenity=register_office, вот и пользуйся ими, одна сущность – один метод. Но нет :smiley:

Это тоже проблема. Системность/порядок должен быть глобальным, а если каждая страна будет упорядочиваться как-то по-своему, на глобальном уровне опять возникнет беспорядок. Не карта *всего *мира, которую может редактировать каждый, а совокупность локальных нарисуек (с).

Всё еще впереди. :slight_smile:
Пословица вспомнилась:
*Кто в молодости не был реформатором — у того нет сердца, кто в зрелости не стал консерватором — у того нет ума. *
не спрашивайте к чему она ))

Я не имею возможности обеспечить глобальный порядок, но я могу приблизить OSM к нему. Этого достаточно.

Тут Вы не правы.

В погоне за системностью отдаю предпочтение стабильности. А здравый смысл направляю на второй план. Здравый смысл элемент не стабильный. Сегодня демократы, завтра республиканцы. Но пока они не меняют конституцию - порядок незыблем.

Признаком значимости тега является конечно не вхождение в топ-N, наличие определенной семантики (описания на вики) и его частотность относительно опечаток.

Вот давайте посмотрим как устроен тег building=*

Всего в базе есть 400 миллионов вхождений ключа building, и принимает он 12,643 различных значений. 12 тысяч тегов – это сопоставимо с числом слов в языке.

В первом, самом грубом приближении можно обрабатывать все значения building=* единообразно, например для того чтобы отрисовывать дома полигонами на карте.

Дальше пользователи начнут жаловаться, что повылезали не-здания, building=no и building=entrance. Их придется исключить.

Если вы захотите сделать какую-то классификацию зданий, например чтобы их отрисовывать разным цветом, или втыкать разные 3D-модели для разных тегов, как это делают некоторые 3D-рендеры (X-Europe так делает), то придется посмотреть какие теги популярные, и где заканчиваются кодифицированные теги и начинаются опечатки.

Львиную долю занимает building=yes – 81%
Уже четвертый тег building= garage – меньше процента.
39-й тег building=semi пробивает психологическую границу 0.01%. Можно ли отбросить хвост тут? нет, это только начало кодифицированных и используемых тегов.
building=cathedral, две с половиной тысячи вхождений, это уже 0.001% одна тысяча вхождений. это как не странно, тоже популярный тег.
Полезные теги, которые могут быть использованы, продолжаются и дальше, где-то до топ-250.

Дальше начинают доминировать опечатки и издержки гуманитарного мапинга, типа такого. По хорошему этот хвост надо чистить, но это почему-то вообще никого не беспокоит.

Вывод из всего этого: частотность тегов сама по себе не очень важна. Если что-то встречается в 10 случаях из миллиона, его стоит поддержать. Может это что-то такое, что придает этому месту уникальность. Это как словами в языке. Сколько слов нужно выучить, чтобы понимать иностранный язык. тысячу, десять тысяч, сто-тысяч, миллион? при этом чем слов больше, тем их относительная частота меньше. Если понятие, стоящее за словом, входит в круг твоих интересов, то хорошо бы его знать.

P.S.
С highway=* ситуация получше, всего 954 разных значения.