Список подозрительных тегов. Есть такое?

RusFox · September 15, 2012, 10:45pm

Сейчас вот разгребая ошибки рендера состряпал на скорую руку скриптик, который выводит подозрительные теги.
И подумалось, что вдруг такое есть уже? А если нет, не будет ли другим интересно?
Пример вывода:

Подозрительные теги по bridge:
Значение Количество
P62 1
pipe 4
plank 3
pontone 1
pri 3
true 1
yes;no 1
Деревянный мост через р.Ел… 1

ну и там выводится список со ссылками на объекты

Nikolya · September 16, 2012, 2:46am

RusFox есть статистика используемых тегов. сайтик не помню. там и странные теги в ТОПе есть

Elkim · September 16, 2012, 3:39am

Некоторые валидаторы находят опечатки в тегах, например:
http://keepright.ipax.at/report_map.php?zoom=10&lat=59.93949&lon=30.47604&layers=B0T&ch=0%2C220&show_ign=1&show_tmpign=1

Если вы будете дополнять список находимого, то многим будет интересно.
И особенно если точки со ссылками оформить в виде слоя на карте.

andriano · September 16, 2012, 7:01am

Очень в этом сомневаюсь.
Исходя из написанного, под “подозрительными” понимается пара код=значение. Список таких комбинаций огромен. Даже если взять только один код, то окажется, что уникальных (т.е. встречающихся в единственном экземпляре) кодов несколько сотен (анализировал давно, возможно, сегодня их количество уже перехрлдит за тысячу).

RusFox, напишите, пожалуйста, по каким признакам Вы отличаете подозрительные теги от всех остальных? И что именно Вы подразумеваете под стовом “тег” - пара код=значение или только код?

fserges · September 16, 2012, 7:16am

Я такие списки составлял не раз но исправить что-то не спросив автора - а что конкретно он имел в виду непросто. Действуя своей логикой можно внести вандализм а логика создавшего бывает порой очень нетривиальной.

kisaa · September 16, 2012, 9:32am

На http://taginfo.openstreetmap.org таких тегов можно сотни найти. Например, на последних страницах http://taginfo.openstreetmap.org/keys/landuse#values :
landuse=Гаражи
landuse=“residential=rural”
landuse=farmtard
landuse=ineustrial
landuse=Cimetiere
и т.д.
Был бы бот, который бы правил явные опечатки - было бы прекрасно, но описать это алгоритмом - имхо, нереально, только самому следить и ручками исправлять.

RusFox · September 16, 2012, 9:32am

Ну пока алгоритм такой: отметаются сначала те, что есть в вики (список вручную делал), из оставшихся выбираются те, что в единственном экземпляре (эти явно подозрительные), потом выбираются те, что имеют маленький коэффициент использования относительно общего количества.

RusFox · September 16, 2012, 9:36am

вот про это я и спрашивал. ну тогда и незачем велосипед изобретать.

pankdm · September 16, 2012, 10:04am

Непонятен в чем конечный профит. При таком подходе можно будет исправить очень мало. (да и то непонятно можно ли?). Трудозатраты помоему существенно больше чем полученный результат.

Hind · September 16, 2012, 10:16am

Но ведь он же есть.

kisaa · September 16, 2012, 10:40am

Видимо, он не справляется. Объект “landuse=farmtard” создан 04.01.2012 и за 8 месяцев бот не обратил на него никакого внимания.

Hind · September 16, 2012, 1:18pm

См. раздел «Suggestions».