Создадим открытую базу адресов производств в России

Однажды Wowik в чате обмолвился, что было бы не плохо с упаковок товара брать адреса промышленных территорий. Я всё думал, что он это реализует, тем более его валидатор обрабатывает промышленные территории, но видимо что-то сложилось.

Поэтому я решил взять это начинание на себя. И так, что я предлагаю: собрать набор адресов заводов и фабрик, где производят повседневные товары. Чтобы в дальнейшем обогатить этими данными OSM.

Я исхожу из того, что местные хорошо знаю, что у них в округе производят, но вот про адреса этих предприятий они не в курсе. Мы же попробуем объединить эти данные: там где известно название, мы добавим адрес, а там где кто-то указал адрес мы сможем указать название.

Чтобы помочь в этом деле скидывайте в эту тему фотографии этикеток. Если у вас продвинутый телефон, то можно попробовать автоматом разобрать текст, то скидывайте его вместе с фото. Самым активным предлагаю сразу присылать пулреквесты в репозиторий.

GitHub - GitHub - freeExec/OpenProductsDataset: Список адресов производств товаров в России
Лицензия - CC0 / Public Domain / Общественное достояние

В конце создадим карту производств, и узнаем, правда ли, что в каждом городе есть хлебзавод, а на область приходится три пивоваренных завода?

П.С. так же всех призываю не писать НПЗ в name, а указывать в тегах и направление производства, и конкретные типы товаров.

<резерв для пометок обработанных записей>

Значительная часть производств уже обозначена, а значит сбор их этикеток - пустая трата времени. Нужно каждый раз проверять на дубли - опять лишняя работа. Мелкий шрифт с упаковок никакой ии не распознает. В общем, ожидается куча работы сомнительной полезности.
Я бы для начала поковырял реестры Росаккредитации, поискал какие-то списки по отраслям на профильных ресурсах…

Интересный источник, но в словах mini-me есть правда.