Данные в базе OSM хранятся в кодировке UTF-8 и я категорически против, чтобы под конвертер эти данные портить!
P.S. В нашем глобальном мире кодировка win-1251 постепенно должна уйти, из интернетов и компьютеров - точно. Годится только для локальных применений при ограниченных ресурсах.
Я просто заметил, что в результате одной правки из базы OSM был удален юникод-символ. Прочитав это обсуждение понял, что это было сделано ради конвертации. Что я понял не так? Если надо конвертировать в win кодировку - используйте iconv //TRANSLIT или //IGNORE
По-моему очень удобно иметь символ ударения в ситуации, когда непонятно как его ставить.
А что по поводу других символов юникода, например типографики? Неразрывные пробелы, дефис и пр. Юникод - это преимущество. Зачем загонять себя в рамки старой кодировки?
Я предлагаю всего лишь использовать теги по назначению. В частности ударение к названию никакого отношения не имеет, поэтому его в теге name быть не должно. А если хочется указать произношение, использовать для него другие теги.
На юникодные символы в общем случае никто не покушается. А вот для частных случаев, типа ударений, типографских украшалок и прочего, место не в этом теге.
Вся инфраструктура OSM отлично работает с юникодом, не могу понять зачем вводить ограничения? На счет ударения - это обычный символ, с точки зрения кодировки.