Если у нас данные о нашем проекте по всем этим пунктам? Если нет, то не мог бы кто-нибудь посчитать статистику. Естественно в целом у нас данных больше, но хотелось бы узнать на сколько больше. Ещё бы хотелось сравнить с Викимапией. У них, наверное, должно быть больше. И, конечно, хотелось бы знать что у нас и у всех них только по России.
Есть статистика по России и отдельно по областям: http://gis-lab.info/projects/osm-stats.html
Там можно посмотреть в виде графиков или табличных данных.
Но там просто кол-во объектов, без подсчёта всяких длин и площадей.
Домов по России на 28 февраля: 1273260
Населённых пунктов в виде точек: 84390
Это сводная статистика по всем проекту народных карт. А у них даже в Вашингтоне 2 домика отмечено. Конечно таким мизером можно пренебречь, но вот прорисованные тысячи километров дорог по США уже не проигнорировать. А по домикам Украина и Белорусь вносят существенный вклад.
И как тут сравнивать? Только по всему миру, или просить Яндекс сделать выборку только для России.
TarzanASG
некоректно сравнивать НЯК и ОСМ. Слишком много нюансов и особенностей. Данные OSM вполне материальны - любой может взять их и посчитать. В НЯК указаны какие-то цифры в профилях пользователей, но насколько они верны и насколько корректно их складывать - неизвестно.
НЯК покрывает по большому счёту только Россию и ближайшие страны. Да - можно пересчитать по пальцам одной руки города в Австралии. Но это не начало большой перспективы - там особо нечего рисовать по имеющимся снимкам.
В НЯК при удалении объекта он не вычитается из статистики создавшего его пользователя. Никто точно не знает, какая часть статистики завышена.
В НЯК могли произвести автоматизированный импорт каких-нибудь данных. Неизвестно, засчитаны ли эти данные кому-нибудь из пользователей.
Чтобы сравнение было сколько-нибудь корректным, надо при анализе как минимум ограничиться территорией xUSSR, например, взять full.osm.bz2 с гис-лаба. И тут же всплывёт куча проблем.
В НЯК отмечены Чёрное и Каспийское моря. В OSM они размечены костлайнами, первое при этом ещё и не замкнуто. Более того, в дамп они попадают не целиком, поэтому посчитать площадь даже замкнутого Каспия не получается. Миллион квадратных километров разницы, которую тяжело учесть.
В ОСМ можно как-то определить понятие POI. Что входит в НЯКовское понятие “Другого”? Да что угодно.
Итог - любые показатели будут очень условны. На них можно посмотреть из интереса, но делать выводы не получится. И уж тем более не надо превращать это в нелепые и пафосные оды на хабре.
Я планирую делать подобную такую статистику создать в ближайшем будущем (месяца через два-три), хотя площадь озёр и морей - вряд ли. Но для этого нужно будет осилить работу с геометрией.
Это кстати правда. Через ya_transport импортировали остановки. И его убрали из топа не так давно. Потому что он бот и потому что был на первом месте в топе
А так как статистика считалась по топу, то вклад этого бота, получается, не учитывался.
По идее вот его вклад, можно ручками добавить… http://n.maps.yandex.ru/users/yatransport/
Но кто знает общее число таких ботов? А сколько таких ботов может в статистике иметь 0 при ненулевом вкладе?
Вот пришла следующая мысль, которая бьет предыдущую Данные в народных картах есть на всех континентах, но проект известен только в нескольких странах. Т.е. тут тоже проблема: нельзя сравнить, например, осм-овские штаты, нарисованные сотнями американцев, и те, которые в народных картах, нарисованные 1-2 русскими. Это нечестно. Они же там ещё не открылись.
P.S.: но вклад километраж вносит существенный. Так что вообще загадка, как это всё корректно сравнить.
На тему корректного сравнения я думал. Если скачать с НЯК истории всех правок всех пользователей - то получим гораздо больше информации. Но это нужен мега-краулер, потому что придется скачать очень много страниц… А чтобы не забанили придется качать медленно. В общем, я решил в это не влезать, а высвобождающееся время посвятить ОСМу.
И вопрос - а кто-нибудь разбирался, что за данные закачал Яндекс роботом Ya Transport? Я подумал, может стоит выкачать список созданных им остановок и соорудить валидатор для ОСМа?
Источник данных - Gis-Lab. Территория - Россия, Беларусь, Украина, Азербайджан, Армения, Грузия, Казахстан, Киргизия, Таджикистан, Туркменистан, Узбекистан. Длины считались по формуле ST_Length_spheroid(st_intersection,‘SPHEROID[“GRS_1980”,6378137,298.257222101]’), площади - ST_Area(geography(ST_Transform(st_intersection,4326)),true).
Дороги 1422.23 тыс. км
Железные дороги 166.92 тыс. км
Реки 636.75 тыс. км
Леса 176.03 тыс. км² (в том числе Беларусь 91.53 тыс. км² - пламенный привет фаззеру)
Населённые пункты 150850
POI точечные 94723
POI полигональные 81657
(в качестве POI считаются amenity, leisure, tourism, sport)
Здания 1625028
Точки с адресом 13223
Полигоны с адресами 485044
(проверяется по наличию addr:housenumber; адрес может быть не только на здании)
Станции 7317 (метро не считается)
Остановки 38891 (только _stop, public_transport= не считались)
Ещё раз напоминаю, что сравнивать с НЯК всё это некорректно. Слишком много нюансов.
В любом случае, эта статистика может быть интересна сама по себе. Особенно, если отслеживать её в динамике. Да и на Эхо Москвы (вдруг :)) будет что предъявить.
Silver87, объясните, пожалуйста, как Вы считали - например, по какому региону. По данным GisLab на территории СНГ (Россия, Беларусь, Украина, Азербайджан, Армения, Грузия, Казахстан, Киргизия, Таджикистан, Туркменистан, Узбекистан) чуть более двух миллионов полигональных объектов и менее полутора миллионов линейных.
А публикация каких-то цифр без разъяснений ведет лишь к пустым холиварам