Kao što možda znate, RGZ ulice daje u stilu “VELIKIM SLOVIMA”. To nama za OSM ne odgovara i treba nam konverzija u “Normalna Imena Ulica”. Ja sam softverski probao to da uradim, ali ima još grešaka. Sad nam treba “crowdsource” kampanja da ručno proverimo ta imena ulica. Od ovog posla će da imaju koristi i import kućnih brojeva i import ulica! Ovde sam izvadio svih ~36.000 imena ulica u Srbiji:
rgz_name - Ime ulice u RGZ-u (sve velikim slovima)
name - ono što mislimo da treba da je pravilno ime ulice (ali ne mora biti)
source - odakle nam dobro ime ulice. Može biti “OSM” (povukli smo ime iz OSM-a), “BestEffort” (algoritam je probao da izvuče pravilno ime ulice prema RGZ imenu) i “ref:RS:ulica” (našli smo ime u OSM-u preko reference - danas ovakvih nema mnogo, ali će biti kako radimo import ulica).
ljudska provera - ono gde mi “crowdsource” naporima treba da proverimo i ostavimo tačna ime (tj. ime koje je ovde se smatra da override-uje sva druga imena koja možemo da imamo u OSM-u)
Ideja mi je da svako od nas uzme i pogleda ove vrednosti i da ih ili potvrdi ili da ih promeni. Dovoljno je da prođemo kroz listu i da u kolonu "ljudska provera" upišemo vrednost tamo gde se ne slaže sa "name" kolonom. A idealno je da za svako ime ulice čovek dođe i proveri i to bude upisano u “ljudska provera”.
U softveru sam dodao podršku da imamo “override-ovana” imena ulica iz ovakvog finog skupa. Ja ću sa vremena na vreme da ove vrednosti prebacim u report ovde, pa će svi da imaju dobre ulice. Tj. jednom kada ovde ispravite da je “9. Maja” zapravo “9. maja”, svaka ulica u Srbiji i svi njeni kućni brojevi će imati pravilnu vrednost u izveštaju i importu. I ko bude radio import kućnih brojeva, neće morati da menja prilikom importa kućnih brojeva za svaki broj, već će sve biti već sređeno. A ako prođemo celu ovu tabelu, onda se otvara mogućnost da se neke stvari automatizuju.
Bilo bi dobro da znate pravopis dobro za ovaj posao. Npr. meni je tek nedavno @BrackoNe otkrio da se “Dr” piše bez tačke (“dr.” znači “drugi/a/o”), nisam znao (sramota možda, ali eto). Pa izvolite prelistajte kada nađete vremena i ispravljajte!
Ako neko zna kako da napravimo da ne proverava više ljudi iste ulice, recite (ili samo krenite u dokumentu da popravljate
Napravio sam izmenu na tabeli očekujući da na kraju snimim kopiju ali izgleda da su sve izmene u stvarnom vremenu tako da su upisane u tvoj original ;(
U svakom slucaju, preimenovao sam kolonu ljudska provera u izmena i dodao kolonu konačno
U kolonu izmena treba upisati ispravan naziv ulice ako je to potrebno. Ali, ako je vec ispravno u OSM onda samo upisati znak minus (-).
Formula u koloni konačno će preuzeti ili vrenost iz kolone name ili iz kolone ispravka zavisno od sadržaja kolone ispavka.
Ako je kolona ispravka prazna onda kolona konačno neće biti popunjena.
Na ovaj način će sređivanje ići brže:
ako je name ispravno onda u ispravka samo upisati - i vrednost name će biti prepisana u konačno
ako je name neispravno u ispravka upisati ispravnu vrednsot pa će ta vrednost biti prepisana u konačno
Tako ne mora da se prepisuje isprvna vrednost a ujedno se jasno vidi šta je već sređeno u tabeli (popunjena je kolona ispravka, to jest, kolona konačno ima vrednost).
Treba da koristimo pravilno napisano ime, tj. “1. maja”. Nema ovde dvosmislenosti, čak iako su oni zaboravili tačku, ne treba da ih slepo pratimo. Za neke primere gde nije čista interpunkcija, možda treba da imamo i " official_name", ali u ovom konkretnom primeru ne treba ni to, po meni
Nemam neko jako mišljenje, ali pošto u RGZ-u ima ulica koje su napisane i slovima i brojevima, išao bih na to da im verujem, tj. da ime iz RGZ-a bude u “name”, a varijacije bih stavljao u " alt_name", “short_name” i sl.
Kad smo kod toga, da li odmah da imamo i te kolone u Excelu?
Када срећујете ову табелу улица, можда је најбоље прво означити оне које су у ОСМ већ добро уписане, а оне за које нисте сигурни како је исправно оставите за касније.
Тако можемо брзо да скратимо списак на “проблематичне”.
Немојте нагађати, ако сте иоле несигурни како треба испавно, прескочите назив и идите даље.
А свакако би неко требало и да додатно прегледа оно што је сређено, да не промакну грешке.
РГЗ називи су пуни што правописних што словних грешака.
На крају би ваљало узети сређене називе, конвертовати их у велика слова, упоредити са РГЗ називима и РГЗ-у или коме већ треба послати све што је различито - да исправља.
Mislim da to net treba sa ovim da se rešava. Varjante su poseban problem. Ovde ima mnogo ponavljanja istog naziva ulice, i ako se u to ubace i varijante biće previše komplikovano. Kad se srede nazivi ulica, onda se može izvući spisak jedinstvenih naziva i na njima uraditi varijante.
ливада
брдо
поток
мост
вода
трг
бригада
сокак
сокаче
њиве
њива
пут
баре
бара
руб
кут
храст
кула
дол
крш
брег
школа
рај
врело
друм
станови
тврђава
бунар
парк
поље
венац
гај
глава
умка
Ја бих рекао да ово не треба брисати. Осим увидом у одлуке и решења не можемо знати да ли је реч улица део назива или не а ако стоји пре ће бити да јесте део.
Ако наиђете на неки случај у називу који је потенцвијално проблематичан, испаван облик зависи од тумачења или нисте сигурни, најбоље је да га не сређујете или ако сређујете, упишите како ви мислите да треба али ставите у напомени назнаку да то треба проверити. Тако бар по напомени можемо да издвојимо те случајеве.
Ово како се сада ради да се проблематични случајеви различито тумаче и уносе као сређени без икакве напомене да су проблематични није добро, јер не можемо никаквом аутоматском методом да их накнадно пронађемо и проверимо.
Зато смо и оставили могућност да разликујемо шта је сређено а шта није да би смо могли око тих проблематичних да се договоримо како ћемо их решавати.
Није циљ да све по сваку цену што пре означимо као срећено, него да средимо како ваља. Оно што ниеј проблматично може брзо да се решава а св ешто је проблматично треба прво продискутовати, усвојити неки принцип и онда једнообразно сличне случајеве решавати.
Ма то са повлакама треба накнадно добро прегледати, има свих могућих случајева и да се не корсити повлака и да се корсити повлака и да се корсити повлака али спојена са речима… и то је тако и у оригиналу и у исправкама…
Нисам ни ја у почетку обраћао пажњу.
То треба да се договоримо уз консулатације са Правописом како треба и шта радити када оригинал није како треба, и то што пре да би се сређивало како треба.