Łączniki w nazwach

Rolę łącznika w nazwie Czerwionka­‑Leszczyny mogą pełnić takie znaki:

  • U+002D (-) — hyphen­‑minus czyli znak zazwyczaj dostępny z klawiatury, używany jako łącznik i minus,

  • U+2010 (‐) — hyphen czyli łącznik,

  • para U+00AD i U+2011 (­‑) — soft hyphen czyli miękki łącznik i non­‑breaking hyphen czyli łącznik niedzielący.

(Matematyczny minus ma swój własny znak, U+2212 (−).)

Pierwszego używa się najłatwiej, ale jest on nieprawidłowy (lub: mniej prawidłowy) gdy mamy do dyspozycji drugi lub trzeci. Drugi znak jest prawidłowy, ale warto skorzystać z ostatniej kombinacji, ponieważ pozwala na właściwe rozdzielenie nazwy na dwie linie: „Czerwionka‑” w pierwszej i „‑Leszczyny” w drugiej.

Według taginfo.openstreetmap.org w tagu name:

  • U+002D występuje na 1 378 967 różnych wartościach, a najpopularniejsza wartość występuje 11 569 razy (w Polsce 39 334 / 637);

  • U+2010 występuje na 88 różnych wartościach, a najpopularniejsza wartość występuje 11 razy;

  • U+2011 występuje na 39 różnych wartościach, a najpopularniejsza wartość występuje 62 razy;

  • para U+00AD i U+2011 występuje na 3 różnych wartościach (dodane przeze mnie).

Kilka przykładów współpracy (lub braku) różnego oprogramowania z unikodowymi łącznikami:

  • Nominatim potrafi znaleźć dzielnicę Rybnik­‑Północ (U+00AD i U+2011) niezależnie od tego, jakiego łącznika użyję w zapytaniu;

  • OsmAnd potrafi znaleźć tę samą dzielnicę tylko jeśli w zapytaniu użyję pary U+00AD i U+2011 (lub odstępu);

  • JOSM wyświetla wszystkie znaki (łącznie z U+00AD) tak samo (ale to chyba problem Javy) — zgaduję, że dlatego dzamper usunął moje łączniki z Górnośląsko­‑Zagłębiowskiej Metropolii;

  • Mapnik nie pozostawia łącznika na końcu pierwszej linii gdy dzieli nazwę na dwie linie (U+00AD i U+2011);

  • większość oprogramowania nie wyświetla znaku U+00AD gdy nie ma w jego miejscu złamania linii — prawidłowo, ale przez to trudniej zauważyć ten znak np. w przeglądarkowym edytorze.

Co myślicie o zamianie U+002D na U+00AD i U+2011 w roli łącznika nazw wieloczłonowych?

Nie jestem przekonany do zamiany na parę łączników, tam jest jeden łącznik.

Tak z punktu widzenia amatora którego zawsze bawiły dyskusje typu https://en.wikipedia.org/wiki/Wikipedia:Arbitration_Committee/Noticeboard/Archive_7#Arbitration_motion_regarding_hyphens_and_dashes :slight_smile:

W przypadku miejscowości z własną adresacją taka zmiana w ich nazwach będzie regularnie generować mrówki na nowo dodanych POI/adresach.

Może lepszym rozwiązaniem byłby inny tag z taką wersją nazwy? Przynajmniej nikt specjalnie lub przypadkowo by jej nie zmienił, jak to było z Górnośląsko­‑Zagłębiowskią Metropolią.

Tak, to dokładnie dlatego — zazwyczaj soft hyphen nie wyświetla się w tekście w ogóle o ile przejście do nowej linii nie wypada tak, że powinien się pojawić (po to zresztą jest). Uznałem, że przy wcześniejszej poprawie „Górnoslasko” na „Górnośląsko” po prostu przypadkowo dodała się druga kreska. W ogóle nie spodziewałem się, że JOSM robi takie numery. Mimo że osobiście nie jestem do końca przekonany że powinniśmy tak robić, to gdybym wiedział, że jest tam właśnie taka kombinacja znaków, to w ogóle bym tego nie ruszył.

Bez sensu. Zostawiłbym rozwiązanie najprostsze i niech sobie oprogramowanie z tym radzi.

Też tak myślę. Gdyby jeszcze soft hyphen występował na klawiaturze, można by się pokusić o jakieś zmiany. W obecnym stanie rzeczy to tylko proszenie się o problemy.