Актуальная база тегов

К примеру, мне понадобились космодромы. Есть тег aeroway=spaceport, есть даже страница на вики с красивым описанием и картинками, а вот на https://wiki.openstreetmap.org/wiki/Map_Features его нет. Отсюда вопросы:

  1. Насколько актуальна ссылка https://wiki.openstreetmap.org/wiki/Map_Features ? Может быть там все давно прокисло?
  2. Как часто обновляется статистика по используемым тегам
  3. Как правильно искать теги, которых нет на https://wiki.openstreetmap.org/wiki/Map_Features, но которые есть в вики, пропозалах и прочем?

Чисто моё мнение - Map_Features большая помойка. Одни тормоза в браузере в ожидании загрузки чего стоят. Искать всё равно приходится поиском, так почему бы сразу туда не отправиться. Так же неплохо помогает анализ taginfo по смежным тегам.

На странице для spaceport написано: «This feature is still in discussion». До завтрашнего дня идёт голосование.

Я подожду, а в нормальном браузере и тормозов не будет. Зато эта страница отлично показывает всю многогранность ОСМ. Да и вообще картографических объектов, я много нового узнал из этой страницы.

Потому, что если ты знаешь что искать, то ищешь. А если не знаешь, что тебе надо?

Мне же нужны “большие объекты”, как раз порты и космопорты сюда попадают. А что еще? К примеру, я нашел вулканы, а мог бы их и не найти, если бы их в списке не было.

И часто это происходит? Т.е. космопорты вроде как есть, но тегов нет? Я спрашиваю с позиции человека, разрабатывающего софт под это все, а не наносителя меток. Мне просто непонятно где брать теги для своего софта. И что будет с тегом, если его не примут - космопорты исчезнут?

лучше иметь обратную связь с пользователями-мапперами)) они завсегда придут и попросят запилить поддержку каких-то актуальных тегов. “мы тут давеча мапили, а оно не показывается”.

по частоте использования как-то ловить. много натэжено — больше интерес к тегу.

есть параллельно живущие системы тегирования. но все разрабы тянут и новую и старую. и народные исторические костыли. это как провода в подъезде)) всегда безопаснее бросить поверх, опуская старое в “культурный слой”.

параллельные системы теггирования могут вступать в противоречие. это ок.))

нигде нет исчерпывающей базы тегов.

Если оно не показывается в каком-то крупном сервисе. А если оно не показывается в приложении от Васяна (т.е. в данном случае от меня), то об этом никто и не вспомнит.

Боюсь, такое сложно вылавливать. К примеру, мне попадалось описание частных конторок, где инфо было заполнено аж на 3х языках (Москва). Разве что будет 10+ языков в объекте. Но подобные вещи должны быть, как я думаю, только на крупных городах, а они и так по тегу городов пойдут в базу. Но спасибо, учту. Сделаю тестовые выгрузки.

А как же planet.osm?

Толсто.
Из него сделал https://a.safe.moe/PwHMp.txt
Теперь задача - разобаться в этом

Кто-то изобрёл taginfo.osm.org

Ну, оказалось проще написать самому, чем разобраться во всех сервисах. Тут теги непонятно как искать, а уж сервисы и того сложнее. Ссылку эту видел, ее дали в англоязычном форуме первым делом.

Космопорты не исчезнут, тег просто посчитают не важным и не будут добавлять на другие страницы, включая Map Features. Но голосование закончилось положительно, так что могут и добавить.

Нужно принять, что тегов в OSM, даже только популярных, значительно больше, чем может перечислить одна страница в вики. Если вам нужен классификатор, то это лучше к TagInfo: у него можно скачать базы в sqlite и получить описания для всего популярного.

Я как-то не могу понять, как именно. Как этим вообще пользоваться.

Вот к примеру, на https://taginfo.openstreetmap.org/tags после сортировки по нодам выходит, что power=tower гораздо больше, чем деревьев.
Видимо мы все живем в стране чародеев (Spellbinder), что энергетические башни встречаются на каждом шагу.
А на https://taginfo.openstreetmap.org/keys, введа в поиск description, я надеялся увидеть стройные ряды описаний на разных языках. По факту, их настолько мало, что этим ключем можно вообще пренебрегать. Что, похоже, все остальные и делают.

Мне вот нужны “крупные объекты”, а какие - я сам не знаю. Космопорты, аэропорты, известные горы, водопады, ну и само собой крупные города. И если Map Features еще можно весь перечитать и удовлетворить мой запрос на 90%, пропустив что-то такое, чего там нет, то я несколько теряюсь в этом taginfo.

Вы не забывайте, что это база не того что есть на планете, а того, что замаплено.
А мапятся обычно в первую очередь искусственные объекты, т.к. они более важны для карт.
Кроме того, естественные объекты (леса, поля, реки) мапятся обычно площадными и линейными объектами а не точечными.

Итак.
Если тебе что-нибудь надо, сделай это сам (ц)
И я продолжаю изобретать свой ТагИнфо

Отличная мысль, но как говорилось выше, я пошел дальше - начал искать объекты, на которых много названий на разных языках. Предположительно, это важные объекты и в них не должно быть ошибок.

Из выборки были затем удалены сами имена и википедия: ^name|alt_name|int_name|old_name|wikipedia
Затем из выборки были удалены теги, значения которых являются числовыми, они мне неинтересны
Удалены теги с менее чем 3 вхождениями, равно как и ключи, уж очень много мусорных или ошибочных (с моей точки зрения)

Вот выборка с 3+ языками на метке:

place (284617)
   = village (142810)
   = locality (59632)
   = hamlet (47668)
   = town (17516)
   = city (4175)
   = suburb (3796)
   = region (2138)
   = county (1911)
   = island (1214)
   = state (1060)
   = isolated_dwelling (1014)
   = neighbourhood (876)
   = country (224)
   = farm (172)
   = islet (114)
   = quarter (93)
   = sea (77)
   = yes (23)
   = province (14)
   = allotments (12)
   = municipality (9)
   = subdistrict (9)
   = peninsula (8)
   = continent (7)
   = archipelago (7)
   = district (6)
   = ocean (5)
   = islands (4)
   = bay (3)

На удивление, очень даже нормальная статистика, которой я верю. И это именно те теги, которые я искал и то, что я ожидал увидеть. Семпл: https://a.safe.moe/VJzmf.txt

Если увеличивать количество языков, то выборка меняется, космодромы и вулканы исчезают уже на 10 (космодром вообще один - Байконыр, так что из выборки удален), но с другой стороны, такая “топовая выборка” тоже интересна

place (1880)
   = city (812)
   = town (335)
   = state (302)
   = country (223)
   = sea (59)
   = village (58)
   = locality (26)
   = suburb (19)
   = island (11)
   = region (10)
   = county (8)
   = continent (7)
   = ocean (5)
   = hamlet (3)
is_in:continent (911)
   = Europe (329)
   = Asia (269)
   = Africa (128)
   = South America (71)
   = North America (68)
   = Oceania (22)
   = Central America (14)
   = Australia (9)
is_in:country (829)
   = Japan (62)
   = China (50)
   = Germany (44)
   = Italy (37)
   = Spain (34)
   = France (28)
   = Russian Federation (26)
   = България (25)
   = USA (24)
   = Brazil (23)
   = Україна (22)
   = Republic of Korea (17)
   = Brasil (16)
   = Belgium (15)
   = Poland (11)
   = United Kingdom (11)
   = Lithuania (11)
   = Canada (11)
   = România (10)
   = Danmark (10)
   = Chile (9)
   = Czech Republic (9)
   = Россия (9)
   = Austria (9)
   = Switzerland (8)
   = Iran (8)
   = The Netherlands (8)
   = South Africa (7)
   = India (7)
   = Greece (7)
   = Australia (7)
   = Algeria (6)
   = United States (6)
   = Georgia (6)
   = Ukraine (5)
   = Egypt (5)
   = Bolivia (5)
   = Slovenia (4)
   = LV (4)
   = Saudi Arabia (4)
   = Cyprus (4)
   = Russia (4)
   = Colombia (4)
   = Argentina (3)
   = Mauritius (3)
   = Croatia (3)
   = Abkhazia (3)
   = Vietnam (3)
   = Uzbekistan (3)
   = North Korea (3)
   = Syria (3)
   = Hungary (3)
   = Pakistan (3)
   = Syria سوريا (3)
   = Norway (3)
   = Afghanistan (3)
   = Denmark (3)

Если кому-то интересно, то можно посмотреть семпл https://a.safe.moe/nfC1s.txt - отлично видны особенности маппинга в разных странах

Если кому интересны выборки по разному количеству языков, то сделал до 30: https://a.safe.moe/YItYl.zip

Сразу говорю, что датасет у меня старый, на новую версию планеты у меня нет места. Впрочем, похоже это никому и не нужно. Как пользоваться ТегИнфо, я так и не понял, равно как и его выборками.

Много языков бывает от безумного импорта их из вики. Часто наблюдается у населённых пунктов.
В этом смысле статистика коррелирует с количеством статей на вики.

Gotegomadi, вы по выборке голых тегов (и снимков со спутника, вероятно) хотите понять, что ими обозначено? А «поняв» — обозначать что-то своё?
Или подогнать эти теги под то, что вам хотелось бы обозначить, базируясь на собственном представлении о назначении того или иного тега?
Поступая так, вы рискуете (сильно) только увеличить чехарду в этом вопросе (тегирования).

Да, но это - следующий шаг. Классифицировать уже существующую чехарду - непросто. А новая чехарда будет уже внутри моего приложения.

Тогда не понимаю, зачем вам какая-то статистика применения тегов в OSM и собственно osm-теги. В своём приложении вы можете делать так, как вам удобно.

Чтобы не тащить в свою базу деревья, аптеки и энергобашни, которые в моем приложении точно не нужны. А как понять, что тащить? Или предлагается “стырить все, а потом разбираться что не нужно”?

Обычно играют от противного: хочу отображать дороги → ищу теги как они обозначены, добавил магазины и т.д. добавляете элементы по одному. В ОСМ всё и всегда заканчивается ручной разборкой завалов и юстировкой. Для примера любые импорты, валидаторы, конвертеры, конфиги для Навитела, Гармина, Ситигида, рендеры и т.д. - всё делается понемногу и вручную. Просто так прийти и хапнуть все теги не получится, разве что для черновика ))