Опубликована статистика НКЯ. А что у нас?

Опубликована общемировая статистика (анти)Народной карты Яндекса: http://clubs.ya.ru/narod-karta/replies.xml?item_no=9556

Если у нас данные о нашем проекте по всем этим пунктам? Если нет, то не мог бы кто-нибудь посчитать статистику. Естественно в целом у нас данных больше, но хотелось бы узнать на сколько больше. Ещё бы хотелось сравнить с Викимапией. У них, наверное, должно быть больше. И, конечно, хотелось бы знать что у нас и у всех них только по России.

TarzanASG, самая подробная статистика по OSM в формате XML, брать здесь.

Мне надо в формате “текстом, по-русски”.

Если мне не изменяет память, зданий (в виде полигонов) миллион или полтора, населенных пунктов примерно столько же, сколько и в Яндексе.

http://gis-lab.info/projects/osm-stats.html

Есть статистика по России и отдельно по областям: http://gis-lab.info/projects/osm-stats.html
Там можно посмотреть в виде графиков или табличных данных.
Но там просто кол-во объектов, без подсчёта всяких длин и площадей.

Домов по России на 28 февраля: 1273260
Населённых пунктов в виде точек: 84390

У них не по России.

Это сводная статистика по всем проекту народных карт. А у них даже в Вашингтоне 2 домика отмечено. Конечно таким мизером можно пренебречь, но вот прорисованные тысячи километров дорог по США уже не проигнорировать. А по домикам Украина и Белорусь вносят существенный вклад.

И как тут сравнивать? Только по всему миру, или просить Яндекс сделать выборку только для России.

Я понимаю, что не по России. Поэтому я и сказал, что хотелось бы это узнать. А пока что сравнивать только по всему миру.

Fortress и Sergey Astakhov, надо не по России, а по всему миру.

TarzanASG
некоректно сравнивать НЯК и ОСМ. Слишком много нюансов и особенностей. Данные OSM вполне материальны - любой может взять их и посчитать. В НЯК указаны какие-то цифры в профилях пользователей, но насколько они верны и насколько корректно их складывать - неизвестно.

НЯК покрывает по большому счёту только Россию и ближайшие страны. Да - можно пересчитать по пальцам одной руки города в Австралии. Но это не начало большой перспективы - там особо нечего рисовать по имеющимся снимкам.

В НЯК при удалении объекта он не вычитается из статистики создавшего его пользователя. Никто точно не знает, какая часть статистики завышена.

В НЯК могли произвести автоматизированный импорт каких-нибудь данных. Неизвестно, засчитаны ли эти данные кому-нибудь из пользователей.

Чтобы сравнение было сколько-нибудь корректным, надо при анализе как минимум ограничиться территорией xUSSR, например, взять full.osm.bz2 с гис-лаба. И тут же всплывёт куча проблем.

В НЯК отмечены Чёрное и Каспийское моря. В OSM они размечены костлайнами, первое при этом ещё и не замкнуто. Более того, в дамп они попадают не целиком, поэтому посчитать площадь даже замкнутого Каспия не получается. Миллион квадратных километров разницы, которую тяжело учесть.

В ОСМ можно как-то определить понятие POI. Что входит в НЯКовское понятие “Другого”? Да что угодно.

Итог - любые показатели будут очень условны. На них можно посмотреть из интереса, но делать выводы не получится. И уж тем более не надо превращать это в нелепые и пафосные оды на хабре.

Я планирую делать подобную такую статистику создать в ближайшем будущем (месяца через два-три), хотя площадь озёр и морей - вряд ли. Но для этого нужно будет осилить работу с геометрией.

Это кстати правда. Через ya_transport импортировали остановки. И его убрали из топа не так давно. Потому что он бот и потому что был на первом месте в топе :slight_smile:

А так как статистика считалась по топу, то вклад этого бота, получается, не учитывался.

По идее вот его вклад, можно ручками добавить… http://n.maps.yandex.ru/users/yatransport/
Но кто знает общее число таких ботов? А сколько таких ботов может в статистике иметь 0 при ненулевом вкладе?

Вот пришла следующая мысль, которая бьет предыдущую :wink: Данные в народных картах есть на всех континентах, но проект известен только в нескольких странах. Т.е. тут тоже проблема: нельзя сравнить, например, осм-овские штаты, нарисованные сотнями американцев, и те, которые в народных картах, нарисованные 1-2 русскими. Это нечестно. Они же там ещё не открылись.

P.S.: но вклад километраж вносит существенный. Так что вообще загадка, как это всё корректно сравнить.

На тему корректного сравнения я думал. Если скачать с НЯК истории всех правок всех пользователей - то получим гораздо больше информации. Но это нужен мега-краулер, потому что придется скачать очень много страниц… А чтобы не забанили придется качать медленно. В общем, я решил в это не влезать, а высвобождающееся время посвятить ОСМу.

И вопрос - а кто-нибудь разбирался, что за данные закачал Яндекс роботом Ya Transport? Я подумал, может стоит выкачать список созданных им остановок и соорудить валидатор для ОСМа?

По городам и границам есть.

Источник данных - Gis-Lab. Территория - Россия, Беларусь, Украина, Азербайджан, Армения, Грузия, Казахстан, Киргизия, Таджикистан, Туркменистан, Узбекистан. Длины считались по формуле ST_Length_spheroid(st_intersection,‘SPHEROID[“GRS_1980”,6378137,298.257222101]’), площади - ST_Area(geography(ST_Transform(st_intersection,4326)),true).

Дороги 1422.23 тыс. км
Железные дороги 166.92 тыс. км
Реки 636.75 тыс. км
Леса 176.03 тыс. км² (в том числе Беларусь 91.53 тыс. км² - пламенный привет фаззеру)

Населённые пункты 150850

POI точечные 94723
POI полигональные 81657
(в качестве POI считаются amenity, leisure, tourism, sport)

Здания 1625028
Точки с адресом 13223
Полигоны с адресами 485044
(проверяется по наличию addr:housenumber; адрес может быть не только на здании)

Станции 7317 (метро не считается)

Остановки 38891 (только _stop, public_transport= не считались)

Ещё раз напоминаю, что сравнивать с НЯК всё это некорректно. Слишком много нюансов.

В любом случае, эта статистика может быть интересна сама по себе. Особенно, если отслеживать её в динамике. Да и на Эхо Москвы (вдруг :)) будет что предъявить.

Зато приятно видеть по каждой позиции обгон )) мотивирует к рисованию, так запускаем JOSM…

НЯК
Пользователей: 40854 (http://n.maps.yandex.ru/users/?sort-by=changed&p=2043)

Объекты: 384387+43300+4956+ 85916=518559 (по другим оценкам: 1271866 )

Дороги: 502.09 тыс. км

Железные дороги: 142.65 тыс. км

Реки: 210.21 тыс. км

WM http://wikimapia.org/stats/action_stats.php?fstat=6&period=3&y=2011&m=3
Пользователей: больше милиона

Объекты: 14603375 (удалено объектов: 4,3 млн, т.е. 14,6+4,3=18,9 млн всего нарисовано :relaxed:)

Дороги: ~6 млн км

Железные дороги: ~1,3 млн км

Реки: ~2,7 млн км

Паромные переправы: ~460 тыс. км

OSM http://www.openstreetmap.org/stats/data_stats.html
Пользователей: 365785

Точек 996183568 (если в одном полигоне в среднем 10 точек то: 99 млн объектов! )

Линий 84434404

Отношений 888323

Silver87, объясните, пожалуйста, как Вы считали - например, по какому региону. По данным GisLab на территории СНГ (Россия, Беларусь, Украина, Азербайджан, Армения, Грузия, Казахстан, Киргизия, Таджикистан, Туркменистан, Узбекистан) чуть более двух миллионов полигональных объектов и менее полутора миллионов линейных.

А публикация каких-то цифр без разъяснений ведет лишь к пустым холиварам :frowning: