Buenas comunidad,
Os anuncio una propuesta de colaboración para identificar a las entidades de población.
Motivación
He estado agregando las referencias sobre las entidades de población de las que dispone el INE a todos aquellos place=*
que faltaban, o actualizando las incorrectas. Inicialmente, muchas de las existentes se hicieron con una importación, pero a lo largo de estos años se han ido agregando nuevos elementos que no han tenido su reflejo en OSM (por ejemplo, urbanizaciones).
Debido a múltiples factores1, hay elementos que es difícil de hacer casar de manera semiautomática, y por eso pido ayuda a la comunidad, para tratar de agregar los faltantes.
La idea consiste en agregar la etiqueta ref:ine a aquellos núcleos de población que todavía no la tienen. La gracia de esta etiqueta es poder clasificar de manera inequívoca todas y cada una de las entidades poblacionales del estado. Posteriormente, esto puede facilitar la actualización anual de la población o añadir la elevación2.
Puesto que llevar a cabo una nueva importación, aparte de las complejidades asociadas, no solventaría que dentro de X años volviesen a faltar nuevas entidades, he creado un repositorio en GitHub, donde se puede generar un GeoJSON con el que descubrir en qué lugares la referencia del INE falta. Asímismo, también se incluye el GeoJSON con el estado actual de los elementos aún no añadidos.
UPDATE: Se incluye un visualizador, que se actualiza todos los días, para descubrir los faltantes.
Cómo colaborar
La ayuda consiste en identificar el nodo que falta y añadir el código ref:ine indicado en las propiedades del GeoJSON. Paso por paso:
- Por comodidad, utiliza el visualizador para seleccionar un nodo y abrirlo con iD o JOSM. De manera alternativa, descargarse el fichero GeoJSON del estado actual y abrirlo con tu editor.
- Seleccionar un elemento y comprobar su existencia en OSM. La posición contiene las coordenadas que el IGN tiene almacenadas, por tanto busca por la zona en torno al punto, si existe algo con un nombre similar al que tiene el GeoJSON.
-
Si existe, y es un nodo: añadir el valor del campo ine a la etiqueta
ref:ine
del nodo3 existente. - Si existe, y es un área: puedes añadir el valor al igual que el punto anterior, pero es preferible extraer los datos estadísticos4 del área a un nodo, por lo de Un objeto, un elemento5.
-
Si no existe nada similar, creamos el nodo y añadimos el código y el
place
pertinente. - Si ya existe otro código, actualizarlo por el que viene en el fichero.
Opcionalmente, podemos agregar otros valores presentes en el fichero GeoJSON, tales como la elevacion (ele
), o la población (population
, population:date
).
Notas
El INE/IGN establece la siguiente clasificación de las entidades: municipio, capital de municipio, entidad singular, entidad colectiva, otras entidades y diseminado. En OSM la correspondencia es la siguiente:
-
municipio, es el código de las relations
admin_level=8
. Son las que acaban en seis ceros y actualmente ya están todas. La población es la suma del resto de entidades del mismo municipio (mismas primeras 5 cifras). -
capital de municipio, es el nodo que tiene el rol de
admin_centre
en las relaciones anteriores. El código suele acabar en 1 y el nodo debería contener también la etiquetacapital
. - otras entidades, el resto de localizaciones dentro de un municipio que se pueden considerar “agrupadas”.
- diseminado, son aquellas casas sueltas, suelen tener el código acabado en 99 y no deberían mapearse, a no ser que no exista otro valor, como por ejemplo, en Galicia y Asturias (que suele ser el único elemento existente).
- los tres elementos anteriores (capital + otras + diseminado) suman el valor de entidad singular para el dato de la población. Suelen acabar en dos ceros y no deberían incluirse, si existe alguno de los elementos de los que se componen.
Es aconsejable utilizar la capa WMS del mapa ráster del IGN para contrastar el dato.
Cualquier incoherencia, duda o error con el que os topéis, por favor, comentadlo por aquí mismo.
Muchas gracias!
1 Nombre divergente entre el INE y OSM, uso de diminutivos/artículos/caracteres especiales en los nombres, nombres diferentes dependiendo la lengua…
2 Son aquellos datos que aparecen en los ficheros del IGN
3 Si el nodo es un place=locality podemos cambiar el valor de locality por hamlet o el que toque. Suelen ser nuevas urbanizaciones.
4 Datos estadísticos pueden ser tanto ref:ine, como name, population, wikidata, wikipedia, ele… etiquetas únicas y exclusivas del sitio
5 Las áreas suelen ser landuse=residential. Es preferible que los datos estadísticos estén separados de los usos del suelo para evitar duplicaciones de información, algo por desgracia muy común en OSM. Por tanto, mejor dejar los datos identificativos en un nodo, y solo dejar el área con el valor del landuse