Откат импорта name:etymology:wikidata

Предыстория

В 2022 году пользователь https://www.openstreetmap.org/user/korobkov внёс 400 тысяч name:etymology:wikidata (пример правок Changeset: 126317660 | OpenStreetMap)

  1. Обсуждения импорта не было
  2. Импорт был низкого качества. Самый заметный пример: Changeset: 139168964 | OpenStreetMap (что быстро вспомнил)
  3. Есть подозрение, что импортёр втупую пытался сматчить объекты по корню слова. Что убивает пользу от этого тега.
  4. Мало кто знает как правильно редактировать объекты с name:etymology:wikidata
из-за чего получаем такое

И учитывая, что ни iD, ни JOSM не помогают редактировать его (или хотя бы не портить) ситуация будет ухудшаться. Плюс импортёр удалил свой аккаунт, что выглядит особенно наплевательски

Что делать?

  1. Откатить в России все правки name:etymology:wikidata пользователя https://www.openstreetmap.org/user/korobkov
  2. Учитывая, что импорт частично связан с редактором Mapcomplete, нужно понять качественные ли правки делают его пользователи

Или не откатывать?

Если вы видите, что можно что-то сломать при откате или есть идеи как исправить импорт — велкоме


Также обсуждение на английском: Undiscussed import name:etymology:wikidata

4 Likes

Я добавлю, что источник импорта не известен, есть подозрение, что это некая база с неясным лицензионным статусом.

Поддерживаю откат импорта.

2 Likes

Не поддерживаю откат импорта. Я, конечно, не лингвист, но на мой взгляд он не настолько ужасен. Не хуже импорта name:uk.
Проблемы с редактированием есть у всех тегов, которые вешают на линии дорог. Некоторые из них стоило бы перенести на отношения, но это нерешаемый отдельный вопрос.

Но не все теги зависят от других тегов на линии. Вспоминаю только wiki* и name:*.

Похожие связи есть в тегировании POI. Но всю мороку с ними на себя взяли пресеты. Плюс POI обычно точечные, а значит разделять их как линии нельзя.

Пресеты не спасают. Но написать тест, который будет отлавливать разные name c одинаковыми name:etymology:wikidata представляется не очень сложной задачей.

а есть аргументы кроме “там испачкали, значит и тут можно не убирать”?

С именами слабый пример. Не вижу тут такого, что имя на одном языке начинает резко обозначать другой объект.

Зато пресеты не дадут вам из условного Магнита сделать кафе (ну в сырые теги не лезть)

А есть цифры, подтверждающие высокий процент ошибок или ссылки на базу из которой это могло бы быть взято? “Подозреваю” - так себе аргумент.

name=Прямая улица
name:ru=Косая улица
Чем не разные объекты?
JOSM вполне позволяет накатить один пресет на другой, да и ID, насколько я помню, ругается только при наличии wiki тега.

Как такое обнаружить понятно. А вот как этимологию проверить нет. Если бы автор выложил свой список названий улиц -> Q123, его бы и проверить, и поддерживать можно было. Сейчас же ни автора, ни списка, ни поддержки редакторами.

1 Like

на все эти вопросы должен был ответить автор во время обсуждения импорта

1 Like

1000 значений. По пользователю не отфильтровывал.

1 Like

!! вот это сохранить.
а в базе географических данных (бд осм таки не филологическая замудрения) выкинуть.

Я когда думаю о том, сколько всего можно выкинуть из бд осм, то от открывающихся возможностей аж дух захватывает. Но говорят нельзя - эни тегз ю лайк и всё такое :weary:

1 Like

если это тоже необсужденный импорт с сомнительным качеством из неизвестного источника - то давай, открывай тему, я наверняка поддержу.

Так кто и когда откатывать будет?