Zapis fonetyczny w OSM

Rozmawialem ostatnio z kolega po fachu który powiedzal mi czego OSM jeszcze nie ma co inni maja:
Otóz jesli robi sie profesjonalna nawigacje, to nazwy ulic i miejscowosci zapisywane sa takze w sposób fonetyczny,
bo technika text to speech daje tak mizerne rezultaty ze sie jej nie uzywa.

Zapis fonetyczy opisany jest na stronce:
http://en.wikipedia.org/wiki/Speech_Assessment_Methods_Phonetic_Alphabet

Gdyby uzywac dodatkowo tagu:
name_spoken:*
to mozna by smialo takze w tym obszarze konkurowac.

co myslicie?

Wg mnie ma to sens, ale nie jako tag. Nazwy ulic się bardzo często powtarzają. Może lepszym sposobem było by zrobic strone na wiki i tam spisywac wszystkie kombinacje dla danego państwa? Co nieco nawet mozna pobrac z wikislownika http://pl.wiktionary.org/wiki/Warszawa . Może nawet są jakieś generatory?

Generator znalazlem przykladowo dla jezyka niemieckiego http://familientagebuch.de/rainer/2007/38.html#4
Nie wiem jak jest w Polsce. To w sumie nowy dla mnie temat.

Mi tez sie podoba ten pomysl, mam nadzieje ze sie rozpowszechni.

Prawdopodobnie slownik pomoglby w niewielu przypadkach, glownie nazwy ulic w duzych miastach, bo nazwy sa zbyt unikalne. Ale napewno istnieje generator dla polskiego bo w polskim wymowa jest latwo przewidywalna. Nie wiem natomiast czy to jest az taki zysk w porownaniu do text-to-speech. Bo dochodzi jeszcze akcentowanie i inne rzeczy ktore pewnie uniemozliwilyby jednemu programowi poprawne dzialanie dla wszystkich jezykow.

Jak pisalem - to nie moja dzialka, nie znam sie na tym. Gdyby zysk nie byl spory, to pewnie najwieksi dostawcy danych dla nawigacji nie bawili by sie w ogóle w fonemy.
Tak wiec cos jest chyba na rzeczy. Popytam dalej i opowiem :slight_smile:

Kolegom z Niemiec pomysl sie podoba.
Proponuja syntaks:

name:ipa,
name:pl:ipa
name:sampa

itd…

Szczególnie dla osób niewidomych lub niedowidzacych byloby to fajne.
co do intonacji to faktycznie duzo rzeczy trzeba manualnie poprawiac nawet jesli jest to zrobione fonemami, ale jakosc jest ponoc o wiele lepsza.

Jest jeszcze ciekawsza prozycja rozbudowujaca poprzednia: zapisywanie wymowy w dialektach. W Polsce pewnie bylyby to Kaszubski, Slaski, Wielkopolski, Góralski.
Cos takiego moglo by byc naprawde hitem :slight_smile:

Moim zdaniem nazwy odczytywane techniką text-to-speech brzmią bardzo poprawnie. Opieram to na dwóch używanych przeze mnie aplikacjach do nawigacji na Androida i darmowym (jak na razie) głosem IVONA. I to jest bardzo widoczna przewaga takiej nawigacji nad fabryczną np AutoMapą. Gdzie AM mówi “skręć w prawo”, mój telefon mówi “skręć w prawo w ulicę Armii Krajowej”. I wypowie nazwę ulicy nawet jeśli to będzie “Chrzęszczyrzewoszycka”.
Nie mam większych zastrzeżeń do intonacji, chociaż oczywiście słuchanie zawodowego aktora/aktorki jest przyjemniejsze dla ucha.

Nawigacja oparta na OSM jest jednak wyraźnie gorsza od płatnych rozwiązań z powodu dużej ilości białych plam na mapie. Wolałbym aby wysiłki społeczności szły raczej w kierunku poszerzenia bazy aktywnych mapperów i zapełniania tych białych plam zamiast poświęcania czasu na niepotrzebne wodotryski. Niemcy etap mapowania ulic mają dawno za sobą, więc niech się bawią, skoro nie są zadowoleni ze swoich syntezatorów mowy.

Ale na pewno powiecie że się czepiam.

Zgadza się, Ivona sobie radzi całkiem fajnie, tylko pytanie, jak sobie poradzi, gdy do odczytania będzie miała niepolską nazwę? Podejrzewam, że przeczyta to “po polskawemu”?

Ja tak nie powiem, ponieważ zgadzam się z tym co napisałeś. Poza tym, nikt i tak nic nie zrobi w tym kierunku, ponieważ wszyscy są zajęci… mapowaniem :wink:
(inaczej mówiąc od pomysłu do realizacji u nas długa droga)

Rozwój OSM jest chaotyczny i chyba w tym jest jego sila. Gdyby bylo inaczej, zastanawiano by sie nad nowymi funkcjami dopiero po skonczeniu jakiegos etapu pracy.
Oczywiscie ze najwazniejsze jest pozyskiwanie nowych mapowiczów i zapelnianie bialych plam.

Byc moze aplikacja która opisujesz ma dobrze rozwiazany text2speech, jednak propozycje opieram na podstawie wysluchania opinii ekspertów którzy od lat rozwijaja ta technologie.
Gdyby text2speech bylo zadowalajace, to Navteq i Teleatlas nie wywalal by pieniedzy na zbieranie tych informacji, zas Daimler, Porsche, BMW,Audi, VW, Renault, Peugeot oraz wszyscy producenci nawigacji japonskich nie zadali by w specyfikacji zapisu fonetycznego. A zadaja. I nie jest o zadanie na terenie Niemiec tylko dla calego swiata, przy czym tak sie sklada ze Niemiecki jest akurat precyzyjniejszy w dostosowaniu pisownie do wymowy niz wiele innych jezyków.

Nazwa w IPA bylaby o tyle fajna ze wymowe w dowolnym jezyku zapisuje sie tak samo, nie trzeba zmieniac syntezatora/glosu kiedy sie udostepnia aplikacje w roznych krajach.

Mysle ze duza czesc pracy da sie zrobic z automatu bez zabierania czasu mapujacym.

Macie rację, synteza mowy jest z zasady bardzo hermetyczna w sensie języka, którym się posługuje. Nie pomyślałem o wyjeżdżaniu z nawigacją za granicę.
Czyli zamiast “skręć w lewo w champs elysees” będzie można usłyszeć “skręć w lewo w szanzelize” :slight_smile: Jestem za!

Nadal jednak białe plamy w Polsce to ważniejszy problem.

Mam wiesci od fachowców. Otóz IPA nikt w branzy professional nie uzywa ze wzgledów praktycznych. IPA nie bazuje na ASCII, za to robi to SAMPA.