[PROYECTO COLABORATIVO] Referencias INE

Buenas comunidad,

Os anuncio una propuesta de colaboración para identificar a las entidades de población.

Motivación

He estado agregando las referencias sobre las entidades de población de las que dispone el INE a todos aquellos place=* que faltaban, o actualizando las incorrectas. Inicialmente, muchas de las existentes se hicieron con una importación, pero a lo largo de estos años se han ido agregando nuevos elementos que no han tenido su reflejo en OSM (por ejemplo, urbanizaciones).

Debido a múltiples factores1, hay elementos que es difícil de hacer casar de manera semiautomática, y por eso pido ayuda a la comunidad, para tratar de agregar los faltantes.

La idea consiste en agregar la etiqueta ref:ine a aquellos núcleos de población que todavía no la tienen. La gracia de esta etiqueta es poder clasificar de manera inequívoca todas y cada una de las entidades poblacionales del estado. Posteriormente, esto puede facilitar la actualización anual de la población o añadir la elevación2.

Puesto que llevar a cabo una nueva importación, aparte de las complejidades asociadas, no solventaría que dentro de X años volviesen a faltar nuevas entidades, he creado un repositorio en GitHub, donde se puede generar un GeoJSON con el que descubrir en qué lugares la referencia del INE falta. Asímismo, también se incluye el GeoJSON con el estado actual de los elementos aún no añadidos.

UPDATE: Se incluye un visualizador, que se actualiza todos los días, para descubrir los faltantes.

Cómo colaborar

La ayuda consiste en identificar el nodo que falta y añadir el código ref:ine indicado en las propiedades del GeoJSON. Paso por paso:

  1. Por comodidad, descargarse el fichero GeoJSON del estado actual y abrirlo con tu editor.
  2. Seleccionar un elemento y comprobar su existencia en OSM. La posición contiene las coordenadas que el IGN tiene almacenadas, por tanto busca por la zona en torno al punto, si existe algo con un nombre similar al que tiene el GeoJSON.
  3. Si existe, y es un nodo: añadir el valor del campo ine a la etiqueta ref:ine del nodo3 existente.
  4. Si existe, y es un área: puedes añadir el valor al igual que el punto anterior, pero es preferible extraer los datos estadísticos4 del área a un nodo, por lo de Un objeto, un elemento5.
  5. Si no existe nada similar, creamos el nodo y añadimos el código y el place pertinente.
  6. Si ya existe otro código, actualizarlo por el que viene en el fichero.

Opcionalmente, podemos agregar otros valores presentes en el fichero GeoJSON, tales como la elevacion (ele), o la población (population, population:date).

Notas

El INE/IGN establece la siguiente clasificación de las entidades: municipio, capital de municipio, entidad singular, entidad colectiva, otras entidades y diseminado. En OSM la correspondencia es la siguiente:

  • municipio, es el código de las relations admin_level=8. Son las que acaban en seis ceros y actualmente ya están todas. La población es la suma del resto de entidades del mismo municipio (mismas primeras 5 cifras).
  • capital de municipio, es el nodo que tiene el rol de admin_centre en las relaciones anteriores. El código suele acabar en 1 y el nodo debería contener también la etiqueta capital.
  • otras entidades, el resto de localizaciones dentro de un municipio que se pueden considerar “agrupadas”.
  • diseminado, son aquellas casas sueltas, suelen tener el código acabado en 99 y no deberían mapearse, a no ser que no exista otro valor, como por ejemplo, en Galicia y Asturias (que suele ser el único elemento existente).
  • los tres elementos anteriores (capital + otras + diseminado) suman el valor de entidad singular para el dato de la población. Suelen acabar en dos ceros y no deberían incluirse, si existe alguno de los elementos de los que se componen.

Es aconsejable utilizar la capa WMS del mapa ráster del IGN para contrastar el dato.
Cualquier incoherencia, duda o error con el que os topéis, por favor, comentadlo por aquí mismo.

Muchas gracias!


1 Nombre divergente entre el INE y OSM, uso de diminutivos/artículos/caracteres especiales en los nombres, nombres diferentes dependiendo la lengua…
2 Son aquellos datos que aparecen en los ficheros del IGN
3 Si el nodo es un place=locality podemos cambiar el valor de locality por hamlet o el que toque. Suelen ser nuevas urbanizaciones.
4 Datos estadísticos pueden ser tanto ref:ine, como name, population, wikidata, wikipedia, ele… etiquetas únicas y exclusivas del sitio
5 Las áreas suelen ser landuse=residential. Es preferible que los datos estadísticos estén separados de los usos del suelo para evitar duplicaciones de información, algo por desgracia muy común en OSM. Por tanto, mejor dejar los datos identificativos en un nodo, y solo dejar el área con el valor del landuse

2 Likes

Algún # a la hora de mapear para poder identificar las ediciones? #referenciasine?

Yo he estado poniendo #ref:ine, aunque no siempre jeje. Buena idea

1 Like

He añadido al repositorio un sencillo visualizador, se actualiza una vez al día, donde van apareciendo los lugares que quedan aún por etiquetar.

Facilitará tanto el hecho de ir desmarcando los ya creados, como ir detectando futuros elementos no creados.

1 Like

Puede que el 03006000200 y 03006000201 (la Llosa de camatxo) seán el mismo?

No exactamente, mira lo que contiene el fichero de ENTIDADES al respecto:

03006000200 la Llosa de Camacho 03 Alacant/Alicante Entidad singular 207 03006 0822-2 -0,00713688 38,77255001 Mapa 219 MDT FALSO FALSO
03006000201 la Llosa de Camacho 03 Alacant/Alicante Otras entidades 150 03006 0822-2 -0,00713688 38,77255001 Mapa 219 MDT FALSO FALSO
03006000299 la Llosa de Camacho 03 Alacant/Alicante Diseminado 57 03006 0822-2 -0,00713688 38,77255001 Mapa 219 MDT FALSO FALSO

03006000200 corresponde con entidad singular, que son los que estoy sustituyendo
03006000201 este es el que debes añadir, puesto que se refiere al núcleo poblacional
03006000299 este se ignora, puesto que están dispersos

Si te fijas Otras entidades + Diseminado suman el valor de población de Entidad singular. Así que el que estoy añadiendo es el acabado en 1, que es más realista para un conjunto de casas.

Claro, pero la Llosa de Camatxo es una pedania de Alcalalí. Si sustituyo el ref:ine y population, los datos del diseminado se pierden, no? Porque estaría cambiando el conjunto de la entidad + diseminados por solo la entidad.

edit: A no ser que tenga que añadir otro nodo solo para el núcleo urbano de la pedania

Los diseminados se deben perder puesto que no son un núcleo, si no gente que vive de manera dispersa. El valor de la población de las personas diseminadas, está recogido dentro del cómputo total del municipio.

En torno a Node: ‪la Llosa de Camatxo‬ (‪2063695774‬) | OpenStreetMap viven 150 personas en ese núcleo (en 2021), no más. El resto está por la zona, pero no concentrada en ningún punto, por lo que no tiene correspondencia con ningún elemento concreto de OSM. Ese 57 está incluído (agrupado) en Relation: ‪Alcalalí‬ (‪347418‬) | OpenStreetMap, el cuál es una área y por tanto sí puede contener todos los dispersos / diseminados.

Ah vale, ahora si lo entiendo. Disculpa :sweat_smile: