Kody pocztowe w OSM

Patrząc na przykład miejscowości Bartąg oraz Bezrzecze w pdfie przytoczonym przez popeja wydaje się to niemożliwe… dalej niezbyt chciało mi się przewijać… Jak wygląda to w oficjalnych bazach adresowych dla tych “metropolii”?

Dla Bezrzecza mamy naniesione kody pocztowe i rzeczywiście są różne dla różnych ulic. Bezrzecze jest osadą, więc nawet dla village wizualizacja nie ma sensu. Dlatego też zdjąłem zielone mrówki. Nie zmienia to faktu, że mamy znaczne luki w kodach pocztowych i przydałoby się coś z tym zrobić :slight_smile:

Może przygotować mrówki dla punktów adresowych, które nie mają tagu addr:postcode, chyba że miejscowość w której leżą ma już dodany taki tag?

A to dla osady mamy jakiś specjalny place=? Jak dla mnie terytowe typy: wieś, osada, kolonia to place=village.

Możesz spróbować, ciekaw jestem jak to będzie wyglądać :slight_smile:

To może najlepszy efekt będzie miało wyświetlanie mrówek dla miast oznaczonych tagiem multi_postcode_city (zamienię niedługo na multi_postcode_place - można zrobić w skrypcie wsparcie dla obu)? W takich miastach i tak trzeba będzie głównie uzupełniać takie rzeczy ręcznie. Pozostałe wsie i miasta w których obowiązuje jeden kod pocztowy można ogarnąć jakimś automatem.
Zabezpieczy nas to przed przypadkiem, gdy ktoś doda addr:postode na węźle miasta i stracimy dla niego z automatu walidację - tak jest np. w dużych miastach dla których jest wpisany błędny kod.

@rogal:
Bardzo mi się podoba Twój pomysł. Poczta jest usługą wymierającą, a usługi kurierskie są obecnie na fali, co więcej - szybko uzyskamy uzupełnienie danych. Tylko wydaje mi się, że mówimy o tym, by do addr:postcode wpisywać dwie różne rzeczy - kody pocztowe oraz kody doręczeniowe. I może warto by na wiki doprecyzować, co znajduje się w addr:postcode w Polsce na wiki, oraz:

  1. Jeżeli jest, to opisać algorytm przejścia z kodu pocztowego do kodu doręczeniowego (może np. wystarczy zamienić ostatnią liczbę na 0?)
  2. Źródło dla kodów doręczeń / zarządcę tej numeracji (UKE na swojej stronie nic w tym zakresie nie ma) - pytanie, czy te różne źródła które znalazłeś, są spójne?
  3. Koegzystencja kodów pocztowych i kodów doręczeń w addr:postcode

na chwilę obecną mam na myśli tylko i wyłącznie kody pocztowe utrzymywane przez Pocztę Polską - kody doręczeniowe muszę jeszcze zgłębić :slight_smile:

Elengancko (i prosto) jest kiedy schemat nie ma redundancji i nie potrzeba synchronizowania kopii :wink:

Nie wiem jak jest teraz ale niestety pare lat temu z naszych doswiadczen z sejmometr.pl – czesc tego samego serwisu – wynika ze dane byly pozyskane jak sie da (za pomoca dziury w geoportalu) a na pytanie o to, jak sie ma ich deklaracja, ze dane sa “otwarte” do regulaminu zrodla bylo milczenie.

redundancja jest ograniczona tylko do danych na elemencie place=* :stuck_out_tongue: Na chwilę obecną nie znam lepszego sposobu - bo upilnowanie użytkowników, żeby każdy wpisywał addr:postcode jest niemożliwością :slight_smile:

//edit: może coś ciekawego będzie w “PRG - punkty adresowe”, przyjrzę się temu

//edit2: w PRG bieda z nędzą

hej!

Chciałbym w najbliższym czasie zaimportować do OSM jakieś 54 000 kodów pocztowych - otwieram dyskusję nad tematem ;). Generalnie wszystko jest obrobione i dopasowane do siebie - pozostaje kwestia licencji - źródłem był anonimowy (bez atrybucji ani licencji) plik XLS ściągnięty ze strony:

http://www.bphtfi.pl/files/(krCioq6erpippltVf4ih4pCjnG-lo9dtWVx1oZqwoKOmb6WikGNDXq6gZLHhomRmrorho4qWtdSSpObUplev5Q)/files/spispna.xls

Do importu idą kody dla miast i wsi dla których ze 100% pewnością przydzielony jest jedynie jeden kod pocztowy (pomijam takie oczywistości jak zgodność nazwy miejscowości, gminy, powiatu i województwa dla obu źródeł). Jeżeli w OSM jest już kod pocztowy dla danej miejscowości i jest on inny niż w imporcie, zostanie dodany tag fixme.

Niech fixme= będzie specyficzny, wtedy będzie można zrobić z tego jakieś mrówki. No chyba, że będzie tego mało (np. 20-30) to się od ręki poprawi.

no niestety takich niezgodności jest ponad 1200 :frowning: Dam w fixme jakiś łatwy do wychwycenia wzór.

jutro lub pojutrze chciałbym zacząć import kodów pocztowych - jeżeli ktoś ma jakieś uwagi lub pomysły związane z tematem, dajcie znać.

Najlepiej pokaż dane przed ich wysłaniem do bazy w formie pliku .osm :slight_smile:

Nie zrozumialem, czy kwestia kodow “nie-doreczeniowych” jest w tych danych rozwiazana, jest do poprawki na przyszlosc, czy moze uwazasz, ze te kody nie powinny byc brane pod uwage (ja sie nie znam).

No i kwestia braku zrodla danych o kodach w Polsce na wolnej licencji.

co masz na myśli pisząc kody nie-doręczeniowe? Chodzi o takie przypisane np. tylko dla urzędu, firmy czy oddziału poczty? To będzie rozwiązane w następnym etapie, na razie importuję tylko kody ‘doręczeniowe’ - dla miejscowości w których obowiązuje tylko jeden kod.

Docelowo chcę, aby każdy punkt adresowy miał tag addr:postcode, ale aby to osiągnąć trzeba najpierw zrobić etap pośredni - żeby chociaż każde place=city/town/village miało przypisany kod i na tej podstawie będzie można robić walidację i pilnowanie punktów adresowych.

@zbigniew: do importu zrobiłem własny skrypt, który pobiera miejscowośc, waliduje czy wszystko jest na swoim miejscu, dodaje kod jeżeli go nie ma oraz wrzuca spowrotem na serwer. Import będzie z osobnego konta, więc na próbę mogę wrzucić kilkaset punktów i podesłać Wam changeseta do wglądu :).

Co do licencji to właśnie jest kwestia do dyskusji - przenanalizowałem wszystkie ustawy na które powołuje się poczta polska, jej regulamin, nawet starą ordynację pocztową z lat 70 - i co? I nic :smiley: Kwestie kodów pocztowych są czarną dziurą - z jednej strony prawo wymaga, aby te informacje były publicznie dostępne do wglądu, co przyznaje na swoich stronach sama Poczta Polska. Z drugiej strony chyba są oni świadomi tego i za wszelką cenę chcą stwarzać pozory i zbierać kasę za ich udostępnianie. Chociażby zapis:

Trzeba się dobrze wczytać i skojarzyć, że dotyczy to praw autorskich do systemu informatycznego Poczty a nie samych kodów pocztowych, które opracowywane i zbierane są od 1972 roku.

IMHO są to dane, które można uznać za domenę publiczną, “Regulamin świadczenia powszechnych usług pocztowych” oparty na prawie pocztowym stwierdza, iż** nadawca zobowiązany jest umieścić w adresie przesyłki nazwę i kod pocztowy miejscowości, do której adresowana jest przesyłka**. Do tego wgląd do spisu kodów przysługuje w każdym urzędzie pocztowym.

I kod pocztowy występuje w każdym dowodzie osobistym :slight_smile: IMO kody PNA są informacją publiczną (i są informacją samą w sobie, więc jako taka nie podlega licencjom), pytanie tylko jak z licencją bazy, którą chcemy wykorzystać do zasilenia OSM.

No jeśli nie ma innego wyjścia to tak zrób, chociaż wygodniej byłoby popatrzeć na dane przed wysłaniem :slight_smile:

Tak, te ktore nie sa ‘doreczeniowe’. Chodzi mi o to, ze jesli sie je wezmie pod uwage to czesc miejscowoci ma wiecej kodow niz jeden i wtedy nie powinien taki kod byc na wezle miejscowosci. W UMP (i wikipedii) umieszczaja zakresy.

Dlatego w innych krajach sie je crowdsource’uje, i w Polsce chyba tez (w OSM). Jak pisze rogal nie maja specjalnego statusu, wiec raczej obowiazuja licencje jak na wszystko inne.

Docelowo to w ogóle z węzłów miejscowości powinny zniknąć kody pocztowe :). Stąd plan powinien wyglądac następująco:

  1. import kodów pocztowych na miejscowości + walidacja starych danych
  2. kopiowanie kodów z miejscowości na punkty adresowe + nadzór nad tym
  3. naniesienie kodów niedoręczeniowych - dużo ich nie ma
  4. usunięcie kodów z węzłów miejscowości
  5. pilnowanie na bieżąco status quo za pomocą ‘mrówek’

kodami niedoręczeniowymi na razie mocno bym się nie przejmował bo są używane dość rzadko

Ja bym się skłaniał do argumentacji Zbigniewa - trudno, aby te dane miały jakąkolwiek licencję skoro porozrzucane są dookoła jako wiedza powszechna - kody pocztowe pojawiają się m.in w danych geoportalu, zbiorach PRG (mało, ale jednak), danych iMPA, co drugi urząd gminy publikuje na stronie zestawienia kodów jakie u nich obowiązują. Owszem, Poczta Polska komercyjnie sprzedaje płyty CD z kodami i zastrzega zakaz rozpowszechniania jej zawartości - ale jakimś cudem jednocześnie na ich stronie jest dostępny ten sam plik do ściągnięcia ;).

Co do samego pliku, do którego podawałem link - jest on niestety anonimowy - nie ma żadnej atrybucji ani informacji o właścicielu.

Plik ze strony poczty jest chroniony prawem autorskim, na takiej zasadzie jak gazeta czy zdjęcie. Czyli nie są chronione numery i adresy ale sposób ich prezentacji. Natomiast zestaw kodów pocztowych stanowi bazę danych, co podlega ochronie wg innej ustawy. Może być ciężko uzasadnić korzystanie z bazy bez zgody właściciela.

A czemu? W czymś przeszkadza, żeby kod pocztowy była zarówno na węźle miejscowości, jak i na adresach w obrębie tej miejscowości? IMO to może być przydatne w sytuacji, gdy ktoś będzie chciał wyszukać tylko miejscowość używając kodu pocztowego jako ujednoznacznienia, np. ‘37-410 Dąbrowica’ (w nominatim to nie działa poprawnie)