Ударения в названиях

Magomogo · January 14, 2011, 12:06pm

Данные в базе OSM хранятся в кодировке UTF-8 и я категорически против, чтобы под конвертер эти данные портить!

P.S. В нашем глобальном мире кодировка win-1251 постепенно должна уйти, из интернетов и компьютеров - точно. Годится только для локальных применений при ограниченных ресурсах.

liosha · January 14, 2011, 12:35pm

Magomogo, ты неправильно понял вопрос.

Magomogo · January 14, 2011, 2:53pm

Я просто заметил, что в результате одной правки из базы OSM был удален юникод-символ. Прочитав это обсуждение понял, что это было сделано ради конвертации. Что я понял не так? Если надо конвертировать в win кодировку - используйте iconv //TRANSLIT или //IGNORE

liosha · January 14, 2011, 2:57pm

Magomogo, символ был удалён, потому что такого символа не должно быть в названии.
Конвертация просто помогла выявить этот символ.

Magomogo · January 14, 2011, 3:01pm

По-моему очень удобно иметь символ ударения в ситуации, когда непонятно как его ставить.

А что по поводу других символов юникода, например типографики? Неразрывные пробелы, дефис и пр. Юникод - это преимущество. Зачем загонять себя в рамки старой кодировки?

liosha · January 14, 2011, 3:05pm

Magomogo, для ударений можно придумать отдельный тег, если хочется. Можно хоть в IPA названия писать. Но в обычном name этого делать не надо.

А это к чему? С этим никто никогда не спорил.
Только типографика к названиям никакого отношения не имеет.

Magomogo · January 14, 2011, 3:07pm

Просто хочу понять - вы предлагаете не использовать юникод в значениях тега name?

liosha · January 14, 2011, 3:13pm

Ну и где я так предложил?

Я предлагаю всего лишь использовать теги по назначению. В частности ударение к названию никакого отношения не имеет, поэтому его в теге name быть не должно. А если хочется указать произношение, использовать для него другие теги.

Magomogo · January 14, 2011, 3:16pm

но ведь конвертер падает, если встречает юникод в тегах, правильно? И ваше решение - удалить юникод из базы, правильно понимаю?

Ezhick · January 14, 2011, 3:19pm

Удалить неподходящий юникодный символ из одного тэга!!!

gps-Max · January 14, 2011, 3:21pm

На юникодные символы в общем случае никто не покушается. А вот для частных случаев, типа ударений, типографских украшалок и прочего, место не в этом теге.

Magomogo · January 14, 2011, 3:29pm

То есть речь идет обо всех тегах name?

Вся инфраструктура OSM отлично работает с юникодом, не могу понять зачем вводить ограничения? На счет ударения - это обычный символ, с точки зрения кодировки.

Ezhick · January 14, 2011, 3:30pm

Вы видели хоть в одной карте названия с ударениями? Или, может, указатели с ударениями?

gps-Max · January 14, 2011, 3:33pm

(европейские не в счёт - там это именно символы алфавита и никаких ударений)

borism346 · January 14, 2011, 3:34pm

Magomogo, если очень хочется, введите себе тег - имя с ударением,и вставляйте туда сколько влезет…

Magomogo · January 14, 2011, 3:42pm

Первое, что пришло в голову, какое-нибудь кафе E=mc²

gps-Max · January 14, 2011, 3:45pm

Это ведь не ударение и не украшалка.

Magomogo · January 14, 2011, 3:48pm

Но ведь от этого символа конвертер упадет? Значит кто-то из вас придет, и такой name исправит, вместо того, чтобы чинить конвертер.

Fortress · January 14, 2011, 3:49pm

Просьба модераторов выделить тред про ударения в отдельную тему.

Magomogo · January 14, 2011, 3:56pm

Речь вообще не про ударения. Речь про юникод-символы.