Заповнювати name:uk i name разом

Хочу заповнювати name:uk на основі name, де цього не зроблено тим самим підвищуючи заповненість картки об"єкта :slight_smile:

1 Like

Привіт! Якщо назва в name чисто українська, тоді можна її продублювати в name:uk. Це, наприклад, такі назви як «Соборна площа», «Німецький дім», «Білий Лотос», «Перша міська гімназія» і т. д. Але є багато назв, таких як «Old Dutch», «Celentano», «Roshen», «Lviv Croissants». Такі назви не можна сліпо копіювати в name:uk. Іноді про такі назви можна сказати що вони написані англійською мовою, чи італійською, але дуже часто це просто вигаданий набір літер латиницею. Чи можна однозначно сказати якою мовою написані назви «Monobank», «Ulitka», «Каффа», «Le Komora»?

2 Likes

Думаю для початку треба буде визначатися за якими правилами(алгоритмом) ви будете це робити, щоб одразу більш досвідчені мапери вас застерігали від тих чи інших помилок.

Ну а якщо не хочете розкривати правила, можна принаймі вибірку яку ви плануєте за дублювати на 100-300 назв, і там буде теж зрозуміло чи достатньо гарно ви прописали алгоритм.

Звісно що я все кажу про автоматичні правки.

2 Likes

Я б був радий, якби ви навели пояснення, для чого це вам потрібно. Які переваги від цього отримають користувачі даних чи інші маппери?

Перше, що почув - тільки кирилиця, ок.
А далі - пряме копіювання. Для чого? Я десь бачив, не пам"ятаю де саме, що якщо у юзера стоїть наприклад uk ru en уподобання мови, і є name i name:ru, без :uk, то воно покаже ру варіант. Тобто відповідаючи на питання МучічкиС і повторюючи - для більшої заповненості картки об"єктів.
Що думаєте?

Дійсно, в випадку коли є інші мови, деякі сервіси віддають перевагу локальним назвам замість головної. Але деякі більш розумні сервіси як Nominatim визначають основну мову за default_language і описаної вами проблеми не буде. Тому треба зрозуміти, як саме ви це бачите?

  1. Доставляти name:uk для об’єктів в яких є інші локальні назви але немає name:uk
  2. Доставляти name:uk для всіх об’єктів навіть там, де є латинка
  3. Доставляти name:uk, там де назва українського походження незалежно від того чи є інші локальні назви чи їх немає
1 Like

Думаю, що 3й варіант найлегший, ніби нічого поганого немає :grey_question:

1 Like

Дивіться як класно :heart: :heart: :heart:

Якщо name містить кириличні символи, то тоді така назва копіюється в name:uk

Вийшло гарно :slight_smile:

:heart: :heart: :heart:

1 Like

Переглянув набори змін, стало краще ніж було раніше, назви з чистою латиницею не потрапляють в name:uk, до чого у мене і було зауваження.

Але якби я робив такі зміни, я б намагався відвести критику від моїх автоматизованих змін максимально. Я б вибирав для дублювання з name в name:uk лише назви що не містять жодних латинських символів, російських кириличних «ы», «ъ» тощо. А потім би ще хоча б раз читав той список і прибирав би з нього всякі відверто помилкові чи незрозумілі назви. Є багато назв що заслуговують на виправлення а не на дублювання в name:uk. Наприклад, назву «Туалет» треба не дублювати у name:uk а замінити на теґ amenity=toilets. А name=Споруда треба взагалі видалити.

Ідея — щоб набір name:uk був не максимально заповненим, і байдуже чим, а, можливо, десь неповним — зате з максимально якісними і перевіреними українськими назвами.

4 Likes

Але є таке наприклад “Сервіс-Центр Apple” або “ЖК Banana”, то тут є кирилиця, думаю що цілком логічно його заповнювати теж?

це цікава думка, треба помислити в цьому напрямку!

так, є ще “гаражі”, “будівля” і т.п., проблема в тому, що усе таке важко піймати, людський фактор як не як :woozy_face:

список стоп-слів, ок, подумаю

2 Likes

Що придумав:

  • якщо буде в назві “вул.Назва вулиці” без пробіла після “вул.”, то додати пробіл:
вул.Назва вулиці
вул. Назва вулиці
  • якщо в імені є “республ” і “луганс|донец|банк|супермаркет|оператор”, то з такого рядка видаляти усі слова із коренями:
республ
народн
банк
супермаркет
оператор
держав

(сепаратизм/тероризм не підтримуємо)

  • ЛДНР, ЛНР, ДНР - видаляти із назви (сепаратизм/тероризм не підтримуємо № 2)
  • “перевулок” замінити на “провулок”, мені не дуже подобається слово “перевулок”, наче перекотиполе
  • також не копіювати слова в будь-якому регістрі:
туалет
будівля
гараж
гаражі
будинок
дім
дом
спуск

  • Також не копіювати значення в яких є символи ыъэё в будь-якому регістрі

Які думки?

1 Like

Тепер ще гарніше :slight_smile: :green_apple:

:world_map: :heart:

1 Like