ну да, на пирамидку смахивает. Посчитано по экстракту с Украиной от 2012 11 26:
NODE TAG highway COUNT 17266
WAY TAG highway COUNT 334345
W highway VALUE motorway COUNT 68
W highway VALUE motorway_link COUNT 147
W highway VALUE trunk COUNT 3438
W highway VALUE trunk_link COUNT 1424
W highway VALUE primary COUNT 6005
W highway VALUE primary_link COUNT 1420
W highway VALUE secondary COUNT 9827
W highway VALUE secondary_link COUNT 847
W highway VALUE tertiary COUNT 16133
W highway VALUE tertiary_link COUNT 454
W highway VALUE unclassified COUNT 31474
W highway VALUE residential COUNT 115212
W highway VALUE living_street COUNT 3768
W highway VALUE service COUNT 64529
W highway VALUE proposed COUNT 6
W highway VALUE footway COUNT 24221
W highway VALUE track COUNT 33670
W highway VALUE pedestrian COUNT 1801
W highway VALUE steps COUNT 3562
W highway VALUE path COUNT 8658
W highway VALUE cycleway COUNT 54
W highway VALUE bridleway COUNT 132
W highway VALUE road COUNT 6909
есть еще пара десятков битых тагов, с неправильными именами.
С понятием генерализации знаком, но да, роутер на PC и пока работает в пределах этого кусочка.
По поводу валидации тегов ref- с наскоку получилась вот такая картинка для WAYs (если надо - могу детализировать):
H- :primary_link COUNT 1
H- :secondary COUNT 4
H- :primary COUNT 56
O- :tertiary COUNT 15
M- :trunk COUNT 39
M- :secondary COUNT 2
M- :primary COUNT 4
M- :trunk_link COUNT 14
T- :secondary_link COUNT 7
T- :unclassified COUNT 5
T- :tertiary COUNT 27
T- :motorway_link COUNT 1
T- :primary COUNT 37
T- :secondary COUNT 683
C- :residential COUNT 14
C- :unclassified COUNT 36
P- :tertiary COUNT 1
E- :trunk COUNT 1