Nomenclàtor mundial de l'IEC

Bones,

He fet un scraping de la web del nomenclàtor extraient tots els topònims que tenen, i ho he bolcat en un fitxer JSON (2.2Mb), després de netejar una mica les dades. El format de cadascú és el següent:

  {
    "id": 5056,
    "is_in": "Tunísia",
    "name:ca": [
      "Parc Nacional Ichkeul"
    ],
    "name": [
      "Ichkeul National Park",
      "المحمية الوطنية إشكل"
    ],
    "entity_type": "Patrimoni de la UNESCO",
    "latitude": "37.1330688824",
    "longitude": "9.65095208206",
    "url": "https://nomenclator-mundial.iec.cat/info.asp?id=5056"
  },

correspon bàsicament a aquest bloc:

name i name:ca són arrays perquè el nom original pot tenir noms en diferents idiomes/alfabets, o tenir els noms separats per un punt i coma o una barra.

El camp entity_type és bastant útil perquè pot classificar els diferents tipus de toponímies (nuclis, entitats administratives, rius, muntanyes, mars, etc…). A més s’inclouen les coordenades i l’url de la font.

Ara bé, aquest forum no deixa pujar fitxers, com considereu que es millor compartir-ho? Compte que és força gran, IMO, OSM-Catalan potser un candidat, o el web osmcatala.cat, o directamente un maproulette.

Què hi penseu? Digueu-me i us ho passo

1 Like

Molt interessant! L’ICGC ens havia de passar aquestes dades, però de moment no hi ha cap resposta així que està bé que anem tirant per altres mitjans. Sobre on penjar el fitxer, jo tiraria de la wiki i ho enllaçaria a WikiProject Catalan/Toponímia i exotopònims - OpenStreetMap Wiki però com vulguis.

Estaria bé importar-les a OSM i afegir-les a monitorOSM. Què tens pensat fer amb aquestes dades? Vols que ens organitzem d’alguna manera?

humm, però la wiki tampoc deixa pujar json, i són gairebé 100k linies per a fer un wiki d’això… :thinking: Bé, ja veuré com ho faig. Encara he vist que cal netejar l’arxiu una miqueta més.

No massa si et sóc sincer, la meva idea, era nar per blocs entity_type, com són tal q:

"Nucli de població",
"Illa, arxipèlag",
"Punta, cap, península, etc.",
"Riu",
"Orografia marina",
"País, territori, etc.",
"Capital",
"Serra, altiplà, massís, etc.",
"Patrimoni de la UNESCO",
"Golf, badia",
"Cim, pic, tossal, turó, etc.",
"Província, óblast",
"Estat o república d'un país",
"Fossa, estret, canal, vall sotaiguada, etc.",
"Llac, albufera",
"Mar, oceà",
"Regió natural o històrica",
...

podríem establir una correlació overpass, per example: nucli → place, riu → waterway, estat → admin_level, etc.. i cercar pel nom/noms originals “around” les coordenades dels elements.

El tema és que ara mateix estic en mig d’altres embolics, només volia compartir les dades perquè poguessin ser explotats més fàcilment, per example… convertir-los en un repte simple a Maproulette (crea un geoJSON) perquè uns altres mappers (menys tècnics) també puguin anar fent.

Ho pots afegir a GitHub - OSM-Catalan/icgc.osm: Eines i dades per les col·laboracions entre l'ICGC i OSM . Els de l’ICGC em van dir que la base de dades del nomenclàtor mundial de l’IEC és la mateixa i està sincronitzada amb la seva que utilitzen al Servei de Mapa Base | icgc . Si algun dia ens passen la seva pròpia base de dades ho podem comprovar i mirar de si el ref coincideix.

1 Like

He afegit la base de dades a Afegeix el Nomenclàtor Mundial de l'IEC i un tesaurus de països de l'IEC a OSM by jmaspons · Pull Request #7 · OSM-Catalan/icgc.osm · GitHub

Descripció a https://www.osmcatala.cat/icgc.osm/reference/iec_nomenclatorMundial.html i Tesaurus de països i territoris IEC - OSM — tesaurus_iec_paisos • icgc.osm