kilka pytań na temat importów adresów i obrysów

Mam kilka pytań związanych z importami danych adresowych i obrysów budynków.

  1. Czemu nikt nie przeprowadzi importów dla całej Polski?

Z tego co rozumiem procedura importów wygląda tak, że ktoś wyraża w temacie na forum prośbę o przeprowadzenie importu i zazwyczaj taki import jest przeprowadzony. Czy nie lepiej by było pominąć proszenie i po prostu zaimportować wszystko?

  1. Gdzie znajdę listę (a najlepiej mapę) pokazującą, w których miastach importy zostały już przeprowadzone?

Znalazłem jakąś listę na wiki, ale zdaje się nie jest ona aktualizowana. Czemu?

  1. Czy jest sens dodawania samemu adresów w miastach, w których import nie został przeprowadzony?

Po pierwsze to trochę bezsensowna praca skoro może to zrobić automat. Po drugie, co się dzieje jak się importuje adresy na te które już istnieją? Nie spowoduje to duplikatów albo innych problemów?

  1. A czy jest sens obrysowywać domy?

  2. Czy narzędzie do importów można używać do innych rzeczy niż importy?

Np. jakiś czas temu zwróciłem uwagę, że w Łodzi jest pełno zdublowanych adresów. Odpowiedzią na zgłoszenie nie było poprawienie tych adresów tylko poinformowanie mnie, że import adresów został przeprowadzony starą wersją narzędzia i dlatego są tam duplikaty. Czy nie można wziąć tego narzędzia teraz i usunąć te duplikaty nie robiąc żadnego importu?

Na forum też pojawia się informacja o tym, że narzędzie merguje dane adresowe z obrysami budynków. Czy nie można teraz zaraz zmergować wszystkich adresów w całej Polsce z budynkami, na których one leżą?

  1. Jaka jest przyszłość importów?

Czy to są jednorazowe akcje, takie że już raz zrobione nie będą powtarzane? Czy może jest plan np. co 5 lat usuwać zdeaktualizowane adresy oraz dodawać te nowo powstałe?

Jeśli jakiś trol w dyskusji będzie jedynie wypowiadał się na temat ortografii, to prosiłbym moderatora o usuwanie takich postów. Dzięki!

Odpowiem na niektóre pytania.

Importy przeprowadzane są cały czas. Dane pobierane są z różnych źródeł i są różnej jakości. Raczej nie ma porządnych danych dla całej PL.

Mapa dostępna jest pod adresem http://osmapa.pl/w/adresy/. Dodatkowo warstwa http://osmapa.pl/w/adresy/?lat=52.3&lon=19.2&zoom=7&ol=P pokazuje kompletność adresów na gminę.

Co do aktualizacji - jeśli dane pochodzą z aktualizowanych źródeł to i w OSM mają szansę zostać zaktualizowane.

Jeśli chodzi o duble - są dwojakie:

  1. niektóre pochodzą z danych adresowych obiektów (np. POI) wprowadzonych do OSM,
  2. niektóre pochodzą z oryginalnych źródeł (np. dwie części tego samego budynku mają przypisany adres).

@janog: wzbudziłeś we mnie chęć odpowiedzi na Twoje pytania (trochę tych adresów zaimportowałem i trochę ogarniam temat), ale ostatnim zdaniem zabiłeś ją, bo sobie przypomniałem, że masz jakiś dziwnie roszczeniowy stosunek do OSM.

Dzięki za wyjaśnienia. Przy czym wciąż nie jest dla mnie jasne czy jest sens mapować adresy i budynki ręcznie, samemu. Pewnie nie ma porządnych danych z jednego źródła, ale pewnie wcześniej czy później będą?

Fajne wizualizacje. Czyli w zasadzie wychodzi na to, że brakuje tych kilkudziesięciu gmin żeby mieć całą Polskę.

Czyli fakt, że import w danym miejscu się odbył, nie oznacza, że teraz jest pora żeby ręcznie poprawić dane. Tylko lepiej czekać na kolejny reimport?

Czyli jak na mapie są dwa takie same adresy obok siebie, to może to oznaczać, że mogą to być dwie części tego samego budynku i nie powinno się z tym nic robić?

Intencją ostatniego zdania było spowodowanie, żeby osoby niemające nic do powiedzenia w temacie adresów, siedziały cicho. Szkoda, że tego nie zrozumiałeś. Swoją drogą, uważam, że postawa w stylu “wiem, ale nie powiem”, jest jeszcze bardziej żenująca niż czepianie się błędów ortograficznych.

Cieszę się, że masz swoje zdanie. Jednakże moja wiedza jest moją wiedzą i nie mam obowiązku się nią dzielić :slight_smile:

To by zajęło dużo czasu. Import jednej gminy, w zależności od tego - w jakim jest stanie wymaga pracy od 15 minut do jednej godziny pracy. 2500 gmin oznacza +/- osoborok pracy. Więc robimy na raty, gmina po gminie.

Nie, procedura tak nie wygląda. Wszystko zależy od danych. Jeżeli dana gmina zacznie prowadzić ewidencję adresów w iMPA, to pewnie po niedługim czasie Zibi zaimportuje dane z tej gminy. Generalnie - z tego co się orientuję, to (prawie) wszystkie gminy, które są w iMPA, są zaimportowane do OSM.

Natomiast są gminy, które prowadzą ewidencję adresów w innych narzędziach - w takich przypadkach wiąże się to z wysłaniem prośby do gminy o udostępnienie danych i ewentualny import, czy też pobieranie danych z EMUiA GUGiK, którego jakoś jest bardzo różna, w zależności od gminy. Jedną z możliwości uruchomienia tego procesu jest prośba na forum.

To jest drugi argument za tym, że nie został zrobiony import dla całej Polski - każda gmina może prowadzić swoją ewidencję w inny sposób, co utrudnia taką masową akcję.

Wizualizacja marimila wiele pokazuje, ja może w końcu przysiądę do tego, by pokazać rozjazd między tym co jest w OSM, a tym co jest w danych źródłowych. Ale czasu brakuje, pomoc by się przydała.

To zależy. Nie zawsze adresy są w danych źródłowych, więc może na taki trafisz. Z drugiej strony - to zależy, jakie źródła są dostępne w danej gminie.

Jeżeli dostępne są adresy, to rzeczywiście szkoda czasu na to.

Sporo o tym, jak działa mechanizm importu starałem się opisać tutaj:
http://wiki.openstreetmap.org/wiki/Talk:Pl:Importy/Adresy

Generalnie, istniejące adresy nie powinny powodować duplikatów, mogą natomiast powodować przesunięcia i tego typu problemu.

Narzędzie do importu nie tworzy duplikatów (poza pewnymi wyjątkami), natomiast nie usuwa duplikatów, które są w bazie. Więc narzędzie w usuwaniu duplikatów Ci nie pomoże. Wiąże się to z tym, że jest wiele przypadków (szczególnie często występuje to w EMUiA GUGiK) - kiedy wiele budynków ma przypisany adres. I w sumie trudno mi powiedzieć, czy to jest dobrze, czy źle.

W zestawie narzędzi jest narzędzie to przeprowadzania takiej operacji. Ale by ta operacja zadziałała poprawnie, warto sprawdzić wpierw, czy budynki są dobrze narysowane oraz czy adresy są poprawnie naniesione na OSM. Trudno to na raz sprawdzić dla całej Polski. Na obszarze jednej gminy jest to do zweryfikowania w krótkim czasie.

Moim marzeniem jest, by udostępnić narzędzie do importu dla mas, tak byśmy byli w stanie utrzymać aktualność danych adresowych na poziomie 1-2 lata. Stąd pomysł na stworzenie wizualizacji, jakie są różnice między źródłami a OSM, a stąd droga do linka, który by ładował rzeczy do modyfikacji do JOSM-a nie jest daleka. No ale trzeba zacząć od wizualizaji.

Jesli sa to dane zweryfikowane przez uzytkownikow, to takie przesuniecie nie powinno byc “problemem” tylko stanem poprawnym.

Zdecydowanie mozna poprawiac. Nie wiadomo czy i kiedy gmina poprawi swoje dane. Mozna jej zglosic bledy ale z efektami jest roznie.

Generalnie w OSM rzeczywiste dane wniesione przez uzytkownikow maja wieksza wartosc niz mirrory innych baz danych.

Mozna uzyc tez skryptow do importow adresow (nie tych samych, o ktorych pisze WiktorN) do usuwania duplikatow, ale wlasnie nie wiadomo czy zawsze nalezy je usuwac i jesli tak, to ktory adres zostawic. Mozna ich natomiast uzyc do znalezienia duplikatow i recznej pracy.

Bardzo sie boje takich narzedzi, w historii OSM bylo juz ich kilka i prowadza one do efektu czerwonych i zielonych punktow. Czerwone punkty (czerwone symbolicznie – moze to byc np. lista “dziwnych” tagow, albo cokolwiek innego co w jakis sposob wskazuje palcem na konkretne obiekty), nawet jesli wedlug autora czy dokumentacji nie oznaczaja bledu a tylko jakis status obiektu, dla uzytkownika sa sygnalem o “bledzie” i impulsem do “wyczyszczenia” swojego obszaru. W wielu przypadkach to prowadzi do usuwania dobrych danych i przyjeciu stanu np. urzedowego za rzeczywistosc.

Dziękuje za wyjaśnienia. Przy czym wciąż nie jest jasna dla mnie najważniejsza kwestia - czy jest sens mapować adresy i obrysy budynków. Z dyskusji wynika, że może mieć to sens, ale też równie dobrze może być to niepotrzebna praca. Niestety odnoszę wrażenie, że nie da się uzyskać na to jednoznacznej odpowiedzi. Szkoda.

Obrysy budynków zawsze warto narysować.

Jeśli w danej gminie nie ma (lub prawie nie ma) adresów, to pewnie warto najpierw zapytać o możliwość importu. Jeśli jej nie ma, lub jeśli większość adresów już jest, tylko czegoś brakuje lub się nie zgadza, to jest sens uzupełnić/poprawić to ręcznie. Ja wprowadziłem ręcznie adresy dla małego miasteczka zbierając te dane w terenie i wcale nie żałuję potrzebnego na to czasu :wink:

Ja wychodzę z założenia, że OSM nie poradzi sobie bez importów. Zebranie i wprowadzenie adresów w jednej gminie to pewnie wysiłek na >100rbh. A co więcej, wydaje mi się, nie ma sensu tego robić, jeżeli ktoś inny (a w szczególności - Państwo) to zrobił. Z drugiej strony - zostawianie takich importów w rękach paru wybrańców wydaje mi się sprzeczne z ideą OSM.

Celem dla mnie nie jest, by dane w OSM były zgodne ze stanem urzędowym i to chyba jest kwestia przyjęcia odpowiednich standardów, jak i komunikacji z użytkownikiem na stronie QA.

Z drugiej strony, jak ostatnio robiłem aktualizacje danych adresowych w Warszawie, to przeróżne kwiatki widziałem - i nie mówię o błędach wynikających ze słabych danych parę lat temu, ale też o tym, że użytkownicy OSM czasem też wprowadzali bzdury. Ciekawe też jest to, że po imporcie który robiłeś, przez 7 lat nikt tych błędów nie poprawił, a niektóre były oczywiste (typu - nagle wzdłuż ulicy pojawiają się adresy z inną nazwą ulicy, która jest oddalona o 500m-1000m - typowy błąd danych źródłowych, a nie widać go na mrówkach).

Bez narzędzi, to jedyny moment w którym jesteś w stanie to zauważyć, to gdy wbijesz adres w nawigacje i poprowadzi Cię nie tam gdzie trzeba. A to jest chyba za późno…

No bo kto mapując ulice/chodniki/czy cokolwiek innego, sprawdza przy okazji, czy adresy są zgodne z ulicami? Chyba trudno tego oczekiwać od mapowiczów.

A czemu nie wyłazi w mrówkach?

Definicja żółtej mrówki: “> 1.5km do ulicy z taką nazwą”. A tu akurat mieliśmy mniej niż 1.5km. Kłopot jest taki, że w terenach wiejskich trzeba by używać innych reguł niż w terenach silnie zurbanizowanych :-S

Hmm, a nie dałoby się zrobić reguły “trzy najbliższe ulice nazywają się inaczej”?

O to tez mi chodzi, celem zwykle jest znalezienie i poprawienie bledow (albo aktualizacja danych tak jak w tym przypadku), ale to ma duzy efekt uboczny. Jestem ciekaw czy przez odpowiednia komunikacje da sie tego uniknac, ale doswiadczenie OSM wskazuje na to, ze nie.

Tu chyba wracamy do dyskusji, ktora byla w innym watku o importowaniu adresow. Mysle, ze lepszy efekt niz laczenie w jednej wizualizacji QA i aktualizacji ma rozdzielenie tego: wizualizacja na potrzeby aktualizacji powinna pokazywac tylko zmiany w zrodle od czasu ostatniej aktualizacji informacji. W szczegolnosci nie powinna brac pod uwage roznic miedzy OSM a zewnetrzna baza, ktore moga wynikac z edycji.

A QA to mrowki, nawet jesli strona ma jeszcze pewne problemy.

Patrząc tylko na to, nie wyłapałbym błędnie zmienionych nazw ulic w OSM. Także patrzenie tylko na zmiany w źródle, to w mojej opinii za mało. W szczególności problem często dotyka budynków narożonych :slight_smile:

Ale zmienione nazwy ulic to kwestia QA, tu juz nie masz po co patrzec na zrodlo (zakladajac, ze dane adresowe zostaly wpierw zaktualizowane w OSM) a przynajmniej nie powinno to byc pomieszane z aktualizowaniem danych.

No ale takie rzeczy wyłapuję właśnie w procesie aktualizacji, bo wychodzi mi, że adres w OSM jest inny niż w źródle. I to jest przyczynek do tego, by sprawdzić, jak sprawa wygląda na miejscu. Bez odniesienia się do źródła, nigdy by nie przyszło mi do głowy, by to sprawdzić.

A to by oznaczało, że QA musi patrzeć na dane źródłowe.

A nie powinniśmy w wypadku, kiedy stwierdzamy, że dane rzeczywiste są różne od źródła importu, zostawiać gdzieś informacji co zostało zaimportowane? Choćby po to, żeby mozna było odsiać przy kolejnym porównaniu ze źródłem.

Ja to oznaczam teraz jako:
source:addr=survey

Co przy narzędziach do mergowania, przy obecnych algorytmach, wymaga krótkiej akcji. Idealnie by było mieć ref:addr (co jak się okazuje - w Czechach jest praktykowane), ale nie znalazłem zbyt wielu zwolenników takiego podejścia.

Przeciez mrowki wlasnie to, miedzy innymi, sprawdzaja. I jesli robisz aktualizacje to w OSM po niej masz dane przynajmniej tak dobre jak w zrodle, wiec do czego mialbys patrzec na dane zrodlowe?