SEO данных OpenStreetMap

В развитие затронутой темы — вопрос:
А что выдают поисковые системы по запросу «карта+ваш город» (в самом упрощённом виде)?
Яндекс и Google соответственно покажут свои сервисы, а далее — всякую лабудень, где (в лучшем случае) окажутся одна-две ссылки на страницу, так или иначе использующую osm (и не факт, что с copyright). Но http://www.openstreetmap.org/ вы там не увидите (и не то что в топе результатов, а вообще). Я не нашёл таковой на первых 15 страницах результатов поиска гугло-яндекса, а дальше и смотреть не стал. Такая же картинка будет в 99,9% (или 100%) запросов, независимо от города.
Как вы полагаете, это влияет на популярность openstreetmap и количество потенциальных редакторов, вносящих ценную информацию?
Это решаемо, хоть как-то?

Да, для этого нужно расшарить результаты геокодинга для всей планеты (или России).

Идеально: один статический URL - один объект

Либо программы должны расшарить свои POI с прямыми ссылками на https://www.openstreetmap.org/way/1 и https://www.openstreetmap.org/node/1

В самом простом варианте можно скормить планету вот в это:
https://github.com/kiselev-dv/gazetteer/tree/develop/Gazetteer, натянуть поверх читаемые метки и добавить ссылки на osm.org

“Все аптеки в городе …”, а на самой странице должны быть ссылки на osm.org.

openstreetmap.ru такого не делает потому как каталог POI там динамический и через JS работает.

… либо прикрутить https://ru.wikipedia.org/wiki/Sitemaps

Хороший вопрос, что самое интересное подобный запрос не выводит на OSM ни в Нигме (ладно использующей поиск гугла и Яндекса), ни что более обидное в Спутнике (использующем ОСМ) :frowning:

Более того.
Из-за того, что везде все теперь выводится через асинхронные запросыХрен знает, почему, но невозможно найти даже то, что точно есть в OSM.
Вот есть, например, http://www.openstreetmap.org/way/234863141
Вбиваем в поиск гугла:

Сиреневый сад Л.А. Колесникова OpenStreetMap

Ни намека на исходную. Хотя, казалось бы, по правилам поисковой оптимизации, исходная должна быть показана и должна быть первой - там этот текст в заголовке второго уровня.
Некоторые вещи, которые точно есть в базе, также невозможно найти вообще.

Поиск - это основной инструмент, через который люди вообще о чем-то узнают в сети. Если поиск по какому-то источнику данных не работает, эти данные ни для кого не существуют. После этого, все разговоры о “популяризации OSM” другими методами - просто абсурдны или демагогичны.

Первая мысль (почти дословно), посетившая после попыток поиска :slight_smile:

Честно говоря, я не понимаю, почему оно индексируется так, как индексируется, то есть какими-то клочками.
Посмотрел сейчас robots.txt:


Sitemap: http://www.openstreetmap.org/sitemap.xml.gz

User-agent: *
Disallow: /user/*/traces/
Allow: /user/
Disallow: /traces/tag/
Disallow: /traces/page/
Disallow: /api/
Disallow: /edit
Disallow: /browse
Disallow: /login
Disallow: /geocoder
Disallow: /history
Disallow: /message
Disallow: /trace/
Disallow: /*lat=
Disallow: /*node=
Disallow: /*way=
Disallow: /*relation=

На сколько я понимаю, вещи вроде */way= мешать не должны - это же не /way/.

При этом, естественно, http://www.openstreetmap.org/sitemap.xml.gz не существует (кто бы сомневался).

Кто у нас тут в SEO хорошо рубит, есть такие?

Лучше внести этот вопрос в отдельную тему

Хотел, но решил забросить удочку здесь)
Модераторы подсобят, раз уж так получилось. Возможный заголовок:
«Проблема индексации данных, SEO для http://www.openstreetmap.org»

Я написал на эту тему http://www.openstreetmap.org/user/BushmanK/diary/37577 Получаю комментарии (не очень релевантные) от западных товарищей. Саймон Пул вот отметился, но очень туманно.

Я для osm.me генерю снапшоты объектов в осм в пригодном для индексирования виде
http://osm.me/api/sitemap2.xml

Вот что видит гуглобот
http://osm.me/?escaped_fragment=/ru/id/poipnt-2419078469-w250100339

Но, что-то я не уверен что гуглу/яндексу это шибко интересно. Гуглом и Яндексом хорошо индексируются уникальные тексты, если читать их руководства по оптимизации там между строк сквоззит, что справочники им не нужны, а нужны например отзывы коментарии и прочий маркетинговый текст.

Яндекс выдает ссыльки на осм, я уже отписывался, сейчас заглянул, ссыль на relation всм на второй странице поиска яндекса.
но странчики объектов осм имхо сильно отличаются от обычных страничек, потому и в рейтинга не набирают

Тем не менее, как я уже писал выше, Google прекрасно возвращает ссылки на некоторые объекты в топе. И сервисы типа wikimapia и esosedi, у которых есть гигантские sitemap.xml, прекрасно себя чувствуют на первой странице выдачи.

В ответах есть пример альтернативной поисковой системы, где даже гугл-карты проигрывают (что указывает на предвзятость поисковиков). Есть примеры использования особого синтаксиса запросов (в том же DDG) для повышения релевантности. Саймон намекнул на принятие некоторых мер в данном направлении, но пояснил, что они ещё в незавершённой стадии и что в конечном итоге не так важны в плане повышения конкурентоспособности с тем же гуглом (картами).
Некто _yog наиболее точно понял поднятый вопрос и высказался соответственно.
Ясно, что для тех, кто априори знает об OSM, не составляет проблему найти искомое тем или иным способом. А как заявить о своём существовании такому ресурсу, если о нём заранее ничего не известно целевой аудитории? Поисковые машины решают всё.

Я написал это там, повторю и здесь:

  • речь, главным образом, идет о проблеме того, что люди не получают ссылок на OSM, когда ищут просто по названиям объектов (не думая и не зная об OSM ничего), а не о том, что нельзя использовать Google для принудительного поиска по OSM - это делать можно, но речь не об этом. Потому использование инструкций вроде site: - к делу не относится.
    “Альтернативная поисковая система” - это Duck Duck Go, которым пользуется “чуть больше чем никто” (то есть всякого рода гики - те же, кто, вероятно, знает про site:).
    И речь не о конкуренции с google maps, а о том, что другие crowdsource-сервисы каким-то образом в топ вылезают.
    Ищем в Гугле станция Белокаменная и видим, что первая ссылка - на Википедию, дальше идет Wikimapia, потом всякая хрень типа mos.ru и urbantrip, а еще дальше - видео, foursquare и даже 2ГИС.
    Я, конечно, допускаю, что Google специально вредит, но почему тогда не вредит Викимапии? Или все же дело в том, что у Викимапии есть sitemap.xml, включающий буквально каждый объект?

Станция Белокаменная на Викимапии ранжируется столь высоко, благодаря тексту. Гугель любит текст. У нас для нее только координаты, вводить текстовые описания мы принципиально не хотим.

С кем мы должны бы были потягаться, не добавляя тот контент который мы принципиально, непонятно почему, не хотим добавлять (тексты, коментарии, фоточки), это gdevagon.ru (у меня пятая строка выдачи).

Сомневаюсь, что не оригинальный текст так уж добавляет ей веса на Викимапии (тем более, там есть и объекты без описаний вообще, которые неплохо ранжируются).
По поводу gdevagon - да, согласен. railwayz.info - туда же. У следующего за ними 2ГИС все еще хуже - там нет ничего, от слова “совсем”.

По какой-то причине отсутствуют реально заинтересованные и обладающие соответствующей компетенцией люди, могущие решить этот вопрос.
Возможно, что даже сама проблема для них (если они, всё-таки существуют) не является таковой, т. е. не просматривается.
Или решение представляет собой задачу высокой сложности, за которую никто браться не желает.

Скорее, это просто не считают проблемой. Например, когда я указал на несуществующий (даже какой-нибудь рудиментарный) sitemap.xml в репоизитории osm.org, тамошний мейнтейнер сделал круглые глаза: “а какой вообще смысл?”. Легко представить, что этим вопросом заниматься куда менее прикольно, чем, например, “экстренным картированием африканских стран с гуманитарными целями” - тут героем себя почувствовать проще.