Население: синхронизация [Википедия / Викиданные / OSM]

Всем привет.

Предлагаю всем желающим принять участие во взаимном пополнении и уточнении двух крупнейших открытых хранилищ знаний: Викиданных и OpenStreetMap.
Для этого потребуется иметь учётные записи как в проекте Викимедиа, так и в OSM.

Начать можно с самого простого: численности населения.

Как видно на следующей схеме, связей между базами много, я отметил только основные:

И каждая из них требует проверки и укрепления.
Польза от этого будет как для Википедии, так и для OpenStreetMap.

В качестве источника достоверных данных можно взять документ, выпущенный Государственной службой статистики Украины:
http://www.ukrstat.gov.ua/druk/publicat/kat_u/2015/zb/06/zb_nas_14.zip

В первую очередь, нужно наладить связь.
На примере Зенькова:
https://www.wikidata.org/wiki/Q269547 <–> https://www.openstreetmap.org/relation/3628438
(см. схему)

Затем можно сверять и уточнять данные.

Готов выслушать ваши вопросы и предложения.

Для начала предлагаю исправить таки расхождения в значениях тега population (и population:date) на точках и на границах населенных пунктов
Тип ошибки “population differ” тут
http://wowik.000space.com/places/ua/err.htm
а заодно и посмотреть “wikipedia link differ”

хотел об этом написать, да на схему не влезло :slight_smile:

смысл моего предложения в том, чтобы сфокусировавшись раз на одном объекте, сразу по максимуму внести о нём данных

Объект в природе один, но в ОСМ представлен несколькими взаимозависимыми, которые должны быть непротиворечивы.
Насчет внесения по максимуму - я сильно против. Вносить только то, что исторически принято вносить в ОСМ, для всего остального есть другие места.

во-первых, я имел в виду редактирование обеих баз
во-вторых, я рекомендую в первую очередь сфокусироваться на тех данных, которые я отметил на схеме:
красным: название
зелёным: численность населения
пурпурным: координаты
фиолетовым: связь с элементом Викиданных
голубым: связь с отношением OpenStreetMap
внесение этого набора данных полностью соответствует традициям как Вики, так и OSM

Мы не можем ничего вносить из ОСМ в wikidata , например координаты. Это против OSM лицензии и CT .

В другую сторону тоже мне не совсем понятно, что там за лицензия. Пока не вникал.

я не большой специалист по авторскому праву, но мне ситуация видится вот так:

  1. координаты - это свойство объекта реального мира, творческий вклад тут минимален
  2. копировать их не обязательно, числовые данные можно использовать для сверки с другими источниками и формирования своего собственного экземпляра “данных”
  3. я не предлагаю вносить в Викиданные всю базу OSM, это было бы глупо и именно от этого защищает ODbL. предоставить же возможность добросовестного использования данных, насколько я понимаю, как раз является целью OpenStreetMap

содержимое Викиданных распространяется по лицензии CC0 1.0, что эквивалентно общественному достоянию
то есть, направление Викиданные->OSM свободно

На этой странице http://ausleuchtung.ch/geo_wiki/ можно вывести гео-маркеры на карту по координатам из статей Википедии, а также по тэгам OSM в радиусе 10 км вокруг места клика.

Для Украинского языка Википедии нужно проставить код uk. Код языка Википедии, а также позиция карты и зум последнего поиска запоминаются. Карту не нужно будет передвигать к нужному месту заново.

Поиск по тэгам OSM занимает две - три секунды, так как ищутся не только точки (nodes), но и пути (ways) и регионы (areas), и рассчитывается центр.

А по координатам из Википедии поиск занимает менее секунды. При поиске в центре города лучше уменьшить радиус с 10 км до, скажем, 3 км, чтобы не выходило слишком много маркеров.

Каждый маркер имеет ссылку на ресурс Википедии.

супер инструмент для перелинковки баз, спасибо большое

Пожалуйста.

Если у Вас в процессе использования появятся идеи или предложение по улучшению этого инструмента, дайте знать, пожалуйста.

дошли руки, наконец, нормально протестировать инструмент
могу сказать, что его качества уже достаточно для того, чтобы им пользоваться
однако, улучшений ещё можно сделать много
из того что я заметил:

  1. У элементов Викиданных есть свои названия. Их вполне можно отображать на OSM-карте.
  2. Также, на OSM-карту можно добавить информацию о самом OSM-объекте: ссылку на него и его название.
  3. Некоторые объекты на Wiki-карте не видны. К примеру: Благовещенский собор
  4. С картой неудобно работать мышкой - случайно мимо маркера ткнул - пошла новая загрузка данных.