Короче я до покупки нового ноутбука приостанавливаю попытки создать дамп России. Расскажите тогда где сейчас принято брать бесплатный и нормальный osm.pbf России. Хоть раз в неделю запускать валидатор чтобы отслеживать изменения.
Ну я не я, поэтому решил довести исследование до конца. Перенёс работу с дампами на корпоративный ноут. Он со своими свистелками и переделками и для постоянных запусков не подойдёт, но эксперименты провести может. Зато ноут мощный и быстрый, 2022 года.
В итоге получил результат из дампа планеты:
C:\SHARED>osmconvert RU-latest.osm.pbf --out-statistics
timestamp min: 2005-11-09T09:04:54Z
timestamp max: 2023-02-01T18:59:23Z
lon min: -180.0000000
lon max: 180.0000000
lat min: 41.1057232
lat max: 82.0586232
nodes: 492193026
ways: 47610075
relations: 1672127
node id min: 2
node id max: 10599670724
way id min: 37
way id max: 1137057675
relation id min: 83
relation id max: 15419830
keyval pairs max: 605
keyval pairs max object: relation 270056
noderefs max: 2000
noderefs max object: way 4320001
relrefs max: 29178
relrefs max object: relation 6535292
То есть инструментарий работает. Покспериментирую с этим дампом, но в целом наверное переберусь на чужие дампы - не хочу перегружать свой текущий ноут тяжёлыми дисковыми операциями пока в этом нет особой нужды. На ноуте всё-таки SSD-ка которой более 6 лет.
Вот, я тоже столкнулся с тем, что при обновлении .pbf страны, в нем стали появляться данные из других стран, причем очень далёких. Либо дифы кривые, либо osmupdate шалит… Ещё одна пичаль…
А пример! Очен хочется посмотреть на это чудо. Вы же используете POLY файл при обработке? Он всё отрезает, нет? Бывает появляется в картах чужак - но на поверку это как правило “Посольство”. И это наверное верно.
Сразу не понял. А вы качаете только обновления, а не страну целиком?
Шалит, это точно.
Я как-то обновил и стало лучше
Хм… А никто просто в формате SQL (Postgresql) не делает дампы?
для каждой задачи своя структура бд
Я не великий кодер, но разве не проще было бы из уже готовой адекватной БД, скопировать как надо?
А то я когда хотел повозиться с БД, меня (вместе с желанием) osm2pgsql просто убил своим быстродействием. А бежать за 128 гб оперативки как-то не очень была идея.
Хотя я не знаю, может уже и парсеры xml с закрытыми глазами пишутся на раз. (это я про гар бд фиас)))
Поскольку какой-то дамп в наличии получился, решил прогнать валидатор. Но перед этим решил обновить ОКАТО/ОКТМО. Какой смысл гнать на старых данных, если кто-то может уже что-то сделал на новых?
Но оказалось что изменения просто грандиозные. Они втащили кучу изменений за 2022 год и кое-что из 2021. В результате код ОКТМО изменился у 10% населённых пунктов! Мне такие изменения вносить в БД потребует какое-то время. Так что прогон валидатора случится скорее всего через несколько дней, когда я полностью обработаю все изменения, и это будет прогон по самой последней версии классификаторов.
Но всё же в слух подведу общую идею последних изменений. В начале нулевых случилась муниципальная реформа. Была идея, что власти на местах лучше понимают как сделать людей на местах лучше. Москва - она далеко, она решает стратегические вопросы, вопросы государственного и межрегионального уровня. Регионы решают вопрос регионального развития, а проблемы людей решают местные органы. У тебя есть местная проблема? Или в местные органы власти и решай! Иерархия власти предполагалась - от людей, к местным органам, дальше районные и только потом Москва.
Но спустя 10 лет что-то пошло не так и нижние уровни власти перестали восприниматься как элементы власти. Теперь всем заведует Москва, которая спускает указания в регионы. Нижние уровни власти оказались не нужны. Это просто чиновники, которые делают то, что им указывают начальники, назначившие их сверху. Москва знает как людям жить. У тебя есть проблемы в селе? Правильно - нужно писать Путину об этом. И лучше перед его ежегодным выступлением, вдруг он его услышит!
Хорошо это или плохо - не мне судить, но в плане АТД это означает сворачивание класса сельских/городских поселений как ненужных. И последние изменения ОКТМО показали существенный отход от идей муниципальной реформы. Ниже района (или как сейчас принято называть - округа) жизни нет. Поэтому после обновления валидатор покажет огромное количество ошибок.
Валидатор обновился! Данные по валидации существенно ухудшились, но это ожидаемо. В начале года Росстат включает все изменения за год, поскольку это имеет отношение к налоговой и бюджетной отчётности. А поскольку происходит активный демотаж муниципальной реформы, то изменения более крупные чем в последние годы.
Смотрите, исправляйте, комментируйте!
Пока планирую запускать валидатор раз в неделю, в какой именно день пока не решил. Валидатор бежит достаточно долго, мне нужно выбирать время когда это удобно. А там посмотрим. Может 2 раза в неделю будет ОК. Ноутбук всё-таки старый и слабый, буду смотреть по его самочувствию.
Как я писал, глобально я хочу переписать валидатор. Но я пока учусь PostGIS-у поэтому о сроках не думаю. Но надеюсь, что смогу таки сделать это к концу года
Вот ровно эта же проблема. Я из дампа планеты вырезал Россию. Вроде всё ОК. Но при каждом обновлении дампа стали прилетать объекты из других стран. Дамп стал нереально увеличиваться в размерах. За 2 недели прилетело такое количество иностранных релейшенов что смотреть страшно. У меня это было и в октябре. Дамп засирался иностранщиной а в какой-то момент и сломался. Здесь думаю будет тоже самое.
Я не верю что это какая-то проблема ноутбука, это скорее что-то относящееся к osmupdate. Но сейчас на это время тратить не хочу.
Поэтому буду пробовать чужие дампы. Если чужие дампы будут ОК, то всё ОК. Если будут какие-то проблемы (ну я думаю вы понимаете - новые границы и всё такое) то потребуется чужой новый дамп.
Но всё же. Могут быть какие-то проблемы с Poly файлом? Как проверить что poly-файл корректный. Россия переходит через 180 долготу, из-за чего poly получается сложный и JOSM не понимает его. Но я подозреваю что это косяк JOSM. Но в целом - как проверить валидность Poly файла России?
Вот мой poly. Но если что, этот файл работал летом без проблем, пока всё работало на старом десктопе. Всё стало плохо на новой связке osmupdate/osmconvert.
Российская Федерация
1
26.305822 60.026391
27.454846 60.249961
27.814977 60.595005
30.007285 61.801146
31.513054 62.896083
29.909208 63.748200
30.428439 64.055289
29.419312 64.867439
29.666900 65.648374
30.059208 65.736242
28.934208 66.940005
29.955362 67.670043
28.559208 68.188127
28.241900 68.863910
31.543536 70.308306
40.580535 68.594445
47.341142 69.563971
55.041395 75.984793
67.508097 77.392380
78.329156 81.527207
96.884813 81.580364
108.571611 78.457891
109.810387 77.176873
157.726000 77.453586
180.000100 71.978563
180.000100 62.228556
170.584568 59.412463
165.602074 59.097642
163.371505 55.055153
152.379446 46.755774
146.063232 42.977275
145.195109 43.778310
145.612626 44.522727
150.502111 47.098320
151.216981 46.881567
155.853646 52.098430
155.007576 55.189062
155.904602 58.354489
143.002636 59.058035
138.045272 55.827516
143.326325 54.611001
145.250112 48.648880
143.641553 45.835005
142.233810 45.575600
140.958861 45.847062
140.480831 47.860537
135.383055 43.356244
133.854209 42.570997
130.811297 42.098222
130.320130 42.719137
131.170438 43.130050
131.173421 44.406208
130.933045 44.861537
131.876830 45.351739
132.859324 45.098917
133.740488 46.374421
134.555101 48.310001
132.270602 47.621677
130.738508 47.669135
130.442494 48.629332
127.571061 49.643347
126.094900 52.539922
123.665326 53.488274
120.940246 53.252179
120.438472 52.955832
120.793385 52.461515
120.789305 52.031915
119.724566 51.026966
119.320699 50.067878
117.645265 49.410005
114.458561 50.124736
112.285363 49.281576
110.199756 49.123525
108.490168 49.311432
106.857015 50.139896
103.169134 50.119243
102.160801 50.657747
102.110282 51.146684
99.909150 51.725648
99.088964 51.973264
97.985348 51.294237
98.386803 50.415091
98.119976 50.041722
97.358438 49.632422
94.594976 50.012071
92.922367 50.602954
87.314658 48.938548
86.485421 49.426782
84.767866 49.599976
83.809770 50.831469
81.334608 50.642562
80.867064 51.115667
80.060477 50.705692
77.851597 53.251365
76.328104 54.091317
74.112415 53.347598
73.251215 53.453764
73.141069 53.960839
72.496514 53.891177
71.019894 54.095039
70.797157 55.064250
69.072401 55.292271
67.640510 54.697881
62.524864 53.905224
61.541518 53.905142
62.246242 52.956019
61.049914 52.899091
61.081892 52.296715
60.180822 51.936484
61.505930 51.427420
61.702084 51.264359
61.471244 50.793664
60.843007 50.643861
59.500864 50.478004
58.006475 50.894355
56.674217 50.826843
55.551940 50.485789
55.115602 50.774951
54.471427 50.451755
54.078202 51.110944
52.550420 51.423012
52.342806 51.675289
51.479350 51.356702
51.157185 51.550520
48.724774 50.548291
48.934611 50.002576
48.365930 49.735230
47.693331 50.319643
47.063603 49.832386
47.072826 49.035926
46.788873 48.917400
47.247839 48.091464
48.484006 47.612888
49.198964 46.442170
49.976178 46.059764
48.972332 45.443859
47.656947 45.188276
48.176178 43.984461
47.835794 43.127383
48.868133 41.893451
47.711591 41.094918
45.851356 42.044079
44.893744 42.615346
43.796266 42.528359
43.560328 42.797220
41.667458 43.182158
40.166216 43.549903
39.860256 43.176209
36.681576 44.855675
33.804036 44.110885
33.031288 44.436753
33.153326 44.858990
32.259859 45.207132
32.116298 45.497354
32.719224 45.823880
33.528062 46.023616
33.623584 46.313625
35.266340 45.801763
36.625788 45.653426
37.520576 46.844934
38.060793 46.875091
38.290798 47.608888
38.816260 47.874712
39.698212 47.995247
39.900146 48.188709
39.648333 48.589595
39.655378 49.040934
40.008251 49.453704
38.031752 49.885375
37.270932 50.387406
36.669050 50.210020
35.401450 50.363593
35.357281 50.869715
34.077400 51.309541
34.049958 52.149451
32.558336 52.252702
32.204971 52.035851
31.701314 51.996363
31.176288 53.146674
31.528212 53.263297
32.175808 53.114655
32.673404 53.433771
32.403692 53.567310
32.415636 53.702918
31.754654 53.779202
30.730615 54.809451
30.799846 55.313308
30.874846 55.495924
30.355615 55.805169
29.494558 55.697211
28.250814 56.059885
28.138314 56.141936
28.155622 56.451659
27.628087 56.839164
27.700203 57.098607
27.821006 57.214511
27.261368 57.570648
27.583128 57.881857
27.234555 58.866391
28.164672 59.395925
26.563567 59.648317
26.304062 60.009645
END
2
165.079793 55.365099
166.222101 55.743629
168.783639 54.570310
168.195178 54.227747
166.314408 54.510065
165.079793 55.365099
END
3
43.479134 80.536884
44.025499 80.943542
50.085608 81.568461
52.053055 81.474443
52.703090 81.077533
52.730936 81.480103
58.682084 82.255860
64.693172 82.025345
66.872360 81.025942
65.950244 80.452703
62.864817 80.214093
60.955314 79.579410
58.800796 79.378151
54.187183 79.760726
51.417039 79.508528
47.269513 79.666259
43.479134 80.536884
END
4
35.385507 79.919219
35.327730 80.367623
37.991579 80.377448
38.049357 79.929497
35.385507 79.919219
END
5
19.323907 54.443546
19.627495 55.119795
20.655719 55.396688
22.610609 55.162411
22.938751 54.807089
22.814975 54.335903
21.437901 54.313741
19.323907 54.443546
END
6
-179.683624 64.831283
-180.000100 64.742726
-180.000100 69.485804
-174.211119 67.815416
-173.867891 67.498605
-171.317524 67.296075
-168.769503 66.285683
-168.932072 65.307694
-169.832413 65.555804
-170.722476 65.106142
-171.405587 65.102666
-171.681511 64.162740
-172.749809 63.873930
-175.773252 64.426937
-176.820079 65.211946
-178.645052 65.161916
-179.683624 64.831283
END
7
-180.000100 70.486937
-180.000100 71.947199
-177.638159 71.710275
-176.617214 71.267213
-177.339818 70.704055
-180.000100 70.486937
END
8
-179.858579 62.413137
-180.000100 62.478021
-180.000100 63.061670
-179.755665 62.830108
-179.858579 62.413137
END
END
poly как раз не переходит 180, а делится на 2 части по нему.
Валидатор обновился. Взял дамп из геофабрики. Вроде всё ОК, но там поломана Чукотка. Не смотрел детально, но вроде как это проблема дампа. Я позже гляну - это не хватает нескольких точек, тогда добавлю их насильно. Или что-то более глобальное. А пока валидатор будет говорить что граница России сломана в Чукотке на 180-й параллели. Именно поэтому я предпочитал свои дампы до сих пор - всё под моим контролем.
По двум прогонам понял что вряд ли буду гонять валидатор чаще чем раз в неделю. Это делается долго, ноут старый, я не готов оставлять его без присмотра на часы. Минут на 30-40 ОК, но не на 3-4 часа. К ночи это тоже относится.
Пока план такой - стандартный прогон во вторник. Если прогон не удался (что-то сломалось или мне нужно куда-то ехать надолго) то вторая попытка в четверг. Так что текущий план - повторить прогон через неделю, во вторник
Пока что буду поддерживать режим “раз в неделю по вторникам”. Чаще пока не получается. А пока валидатор обновился.
С тем, что там не так в Чукотке ещё не разбирался.
Валидатор вернулся в рабочий режим. Он не любит глобальные изменения, а тут - большие изменения в Беларуси сделанные в последние месяцы. За 3 итерации валидатор всё переварил.
Так что надеюсь что скоро доберутся руки чтобы посмотреть что там не так в дампе с Чукоткой.
Пока придерживаюсь режимом работы по вторникам.
Но вопрос - а могу ли я редактировать прежние сообщения в теме? В этой версии всё выглядит иначе, есть смысл переделать топовые сообщения, но возможности редактирования не нашёл.
Нет, нужно добавлять в конец начиная с жирного заголовка. И так по каждому большому изменению.