Pravilno imenovanje RGZ ulica u OpenStreetMap-ama

Kao što možda znate, RGZ ulice daje u stilu “VELIKIM SLOVIMA”. To nama za OSM ne odgovara i treba nam konverzija u “Normalna Imena Ulica”. Ja sam softverski probao to da uradim, ali ima još grešaka. Sad nam treba “crowdsource” kampanja da ručno proverimo ta imena ulica. Od ovog posla će da imaju koristi i import kućnih brojeva i import ulica! Ovde sam izvadio svih ~36.000 imena ulica u Srbiji:

https://lite.framacalc.org/tgux01sydx-9ztp

Kolone su:

  • rgz_name - Ime ulice u RGZ-u (sve velikim slovima)
  • name - ono što mislimo da treba da je pravilno ime ulice (ali ne mora biti)
  • source - odakle nam dobro ime ulice. Može biti “OSM” (povukli smo ime iz OSM-a), “BestEffort” (algoritam je probao da izvuče pravilno ime ulice prema RGZ imenu) i “ref:RS:ulica” (našli smo ime u OSM-u preko reference - danas ovakvih nema mnogo, ali će biti kako radimo import ulica).
  • ljudska provera - ono gde mi “crowdsource” naporima treba da proverimo i ostavimo tačna ime (tj. ime koje je ovde se smatra da override-uje sva druga imena koja možemo da imamo u OSM-u)

Ideja mi je da svako od nas uzme i pogleda ove vrednosti i da ih ili potvrdi ili da ih promeni. Dovoljno je da prođemo kroz listu i da u kolonu "ljudska provera" upišemo vrednost tamo gde se ne slaže sa "name" kolonom. A idealno je da za svako ime ulice čovek dođe i proveri i to bude upisano u “ljudska provera”.

U softveru sam dodao podršku da imamo “override-ovana” imena ulica iz ovakvog finog skupa. Ja ću sa vremena na vreme da ove vrednosti prebacim u report ovde, pa će svi da imaju dobre ulice. Tj. jednom kada ovde ispravite da je “9. Maja” zapravo “9. maja”, svaka ulica u Srbiji i svi njeni kućni brojevi će imati pravilnu vrednost u izveštaju i importu. I ko bude radio import kućnih brojeva, neće morati da menja prilikom importa kućnih brojeva za svaki broj, već će sve biti već sređeno. A ako prođemo celu ovu tabelu, onda se otvara mogućnost da se neke stvari automatizuju.

Bilo bi dobro da znate pravopis dobro za ovaj posao. Npr. meni je tek nedavno @BrackoNe otkrio da se “Dr” piše bez tačke (“dr.” znači “drugi/a/o”), nisam znao (sramota možda, ali eto). Pa izvolite prelistajte kada nađete vremena i ispravljajte!

Ako neko zna kako da napravimo da ne proverava više ljudi iste ulice, recite (ili samo krenite u dokumentu da popravljate

Napravio sam izmenu na tabeli očekujući da na kraju snimim kopiju ali izgleda da su sve izmene u stvarnom vremenu tako da su upisane u tvoj original ;(

U svakom slucaju, preimenovao sam kolonu ljudska provera u izmena i dodao kolonu konačno

U kolonu izmena treba upisati ispravan naziv ulice ako je to potrebno. Ali, ako je vec ispravno u OSM onda samo upisati znak minus (-).

Formula u koloni konačno će preuzeti ili vrenost iz kolone name ili iz kolone ispravka zavisno od sadržaja kolone ispavka.

Ako je kolona ispravka prazna onda kolona konačno neće biti popunjena.

Na ovaj način će sređivanje ići brže:

  • ako je name ispravno onda u ispravka samo upisati - i vrednost name će biti prepisana u konačno
  • ako je name neispravno u ispravka upisati ispravnu vrednsot pa će ta vrednost biti prepisana u konačno

Tako ne mora da se prepisuje isprvna vrednost a ujedno se jasno vidi šta je već sređeno u tabeli (popunjena je kolona ispravka, to jest, kolona konačno ima vrednost).

1 Like

Шта ћемо када назив улице у РГЗ очигледно није правописно исправан?
нпр 1 МАЈА уместо 1. МАЈА

Шта када у РГЗ број пише цифрама а у ОСМ пише словима?

Treba da koristimo pravilno napisano ime, tj. “1. maja”. Nema ovde dvosmislenosti, čak iako su oni zaboravili tačku, ne treba da ih slepo pratimo. Za neke primere gde nije čista interpunkcija, možda treba da imamo i " official_name", ali u ovom konkretnom primeru ne treba ni to, po meni

Nemam neko jako mišljenje, ali pošto u RGZ-u ima ulica koje su napisane i slovima i brojevima, išao bih na to da im verujem, tj. da ime iz RGZ-a bude u “name”, a varijacije bih stavljao u " alt_name", “short_name” i sl.

Kad smo kod toga, da li odmah da imamo i te kolone u Excelu?

Када срећујете ову табелу улица, можда је најбоље прво означити оне које су у ОСМ већ добро уписане, а оне за које нисте сигурни како је исправно оставите за касније.

Тако можемо брзо да скратимо списак на “проблематичне”.

Немојте нагађати, ако сте иоле несигурни како треба испавно, прескочите назив и идите даље.

А свакако би неко требало и да додатно прегледа оно што је сређено, да не промакну грешке.

РГЗ називи су пуни што правописних што словних грешака.

На крају би ваљало узети сређене називе, конвертовати их у велика слова, упоредити са РГЗ називима и РГЗ-у или коме већ треба послати све што је различито - да исправља.

Mislim da to net treba sa ovim da se rešava. Varjante su poseban problem. Ovde ima mnogo ponavljanja istog naziva ulice, i ako se u to ubace i varijante biće previše komplikovano. Kad se srede nazivi ulica, onda se može izvući spisak jedinstvenih naziva i na njima uraditi varijante.

Pridružio sam se i ja, uradio sam 0-9, dovršio B i danas planiram da dovršim V.

Ne bi bilo loše imati negde indeks slova pa da može da se precrtava. Da dodamo još jedan sheet ako forma podržava?

Ova online tabela je ograničenih mogućnosti. Nema u mnogo mesta za unapređenja.

S druge strane, pošto je sve online, kad god nekonešto izmeni to se odmah vidi, tako d asu šanse da dođe do konflikta vrlo male.

A i ovo mu dođe kao jednokratan posao pa se ne isplati praviti neku bolju alatku.

Prošao sam jednu ruku, uglavnom sam sistematski adresirao pojmove koji su se pokazali problematični.

Evo spiska, možda posluži za neki drugi prolaz ubuduće.
Malim slovima:

  • mahala
  • mala
  • žrtava
  • odred
  • salaši
  • kej
  • livade
  • četa
  • partizan*

Malim slovima, ako je broj ispred staviti tačku (za krak je uglavnom stajala crtica):

  • prilaz
  • deo
  • krak

Obrisati, uglavnom:

  • ulica

Малим словима (ако није прва реч у називу):

ливада
брдо
поток
мост
вода
трг
бригада
сокак
сокаче
њиве
њива
пут
баре
бара
руб
кут
храст
кула
дол
крш
брег
школа
рај
врело
друм
станови
тврђава
бунар
парк
поље
венац
гај
глава
умка

Ја бих рекао да ово не треба брисати. Осим увидом у одлуке и решења не можемо знати да ли је реч улица део назива или не а ако стоји пре ће бити да јесте део.

Различито писање имена са повлаком:

  • два презимена:
    Љубице Јовановић Радосављевић
    Љубице Јовановић-Радосављевић

  • име са надимком иза презимена:
    Љубомира Живковића-Шпанца
    Љубомира Живковића Шпанца
    Андре Ђорђевића-Мајора Дејана

  • надимак испред имена
    Џојина - Тихомира Трајковића

  • надимак између имена и презимена
    Будимира Буде Јелисавчића

  • назив пута
    Аутопут Београд-Остружница

  • назив насеља и име особе
    Билић - Господара Вучића

  • остали случајеви
    Баш Челика
    Баш-Челика

Када писати повлаку а када не, поготово ако у оригиналу има разлика: две улице назване по истој особи, за једну има повлака за другу нема.

Када је повлака измећу два презимена онда се пише спојено, али у овим осталим случајевима претпостављам да треба да повлака буде писана са размаком?

Видим да је неко сређивао називе на различите начине и то је сад шарено, у сређеним има и овако и онако.

Ако наиђете на неки случај у називу који је потенцвијално проблематичан, испаван облик зависи од тумачења или нисте сигурни, најбоље је да га не сређујете или ако сређујете, упишите како ви мислите да треба али ставите у напомени назнаку да то треба проверити. Тако бар по напомени можемо да издвојимо те случајеве.

Ово како се сада ради да се проблематични случајеви различито тумаче и уносе као сређени без икакве напомене да су проблематични није добро, јер не можемо никаквом аутоматском методом да их накнадно пронађемо и проверимо.

Зато смо и оставили могућност да разликујемо шта је сређено а шта није да би смо могли око тих проблематичних да се договоримо како ћемо их решавати.

Није циљ да све по сваку цену што пре означимо као срећено, него да средимо како ваља. Оно што ниеј проблматично може брзо да се решава а св ешто је проблматично треба прво продискутовати, усвојити неки принцип и онда једнообразно сличне случајеве решавати.

Шта са погрешним речима:

погрешно - исправно

засеок - заселак
Ајнштајна - Анштајна

+1. I ja mislim da ne treba brisati taj sufiks “ulica”.

Ovo za povlaku sam i ja kriv. Srediću moje (radio sam slovo “D”)

Ма то са повлакама треба накнадно добро прегледати, има свих могућих случајева и да се не корсити повлака и да се корсити повлака и да се корсити повлака али спојена са речима… и то је тако и у оригиналу и у исправкама…

Нисам ни ја у почетку обраћао пажњу.

То треба да се договоримо уз консулатације са Правописом како треба и шта радити када оригинал није како треба, и то што пре да би се сређивало како треба.