[PROYECTO COLABORATIVO] Referencias INE

Buenas comunidad,

Os anuncio una propuesta de colaboración para identificar a las entidades de población.

Motivación

He estado agregando las referencias sobre las entidades de población de las que dispone el INE a todos aquellos place=* que faltaban, o actualizando las incorrectas. Inicialmente, muchas de las existentes se hicieron con una importación, pero a lo largo de estos años se han ido agregando nuevos elementos que no han tenido su reflejo en OSM (por ejemplo, urbanizaciones).

Debido a múltiples factores1, hay elementos que es difícil de hacer casar de manera semiautomática, y por eso pido ayuda a la comunidad, para tratar de agregar los faltantes.

La idea consiste en agregar la etiqueta ref:ine a aquellos núcleos de población que todavía no la tienen. La gracia de esta etiqueta es poder clasificar de manera inequívoca todas y cada una de las entidades poblacionales del estado. Posteriormente, esto puede facilitar la actualización anual de la población o añadir la elevación2.

Puesto que llevar a cabo una nueva importación, aparte de las complejidades asociadas, no solventaría que dentro de X años volviesen a faltar nuevas entidades, he creado un repositorio en GitHub, donde se puede generar un GeoJSON con el que descubrir en qué lugares la referencia del INE falta. Asímismo, también se incluye el GeoJSON con el estado actual de los elementos aún no añadidos.

UPDATE: Se incluye un visualizador, que se actualiza todos los días, para descubrir los faltantes.

Cómo colaborar

La ayuda consiste en identificar el nodo que falta y añadir el código ref:ine indicado en las propiedades del GeoJSON. Paso por paso:

  1. Por comodidad, utiliza el visualizador para seleccionar un nodo y abrirlo con iD o JOSM. De manera alternativa, descargarse el fichero GeoJSON del estado actual y abrirlo con tu editor.
  2. Seleccionar un elemento y comprobar su existencia en OSM. La posición contiene las coordenadas que el IGN tiene almacenadas, por tanto busca por la zona en torno al punto, si existe algo con un nombre similar al que tiene el GeoJSON.
  3. Si existe, y es un nodo: añadir el valor del campo ine a la etiqueta ref:ine del nodo3 existente.
  4. Si existe, y es un área: puedes añadir el valor al igual que el punto anterior, pero es preferible extraer los datos estadísticos4 del área a un nodo, por lo de Un objeto, un elemento5.
  5. Si no existe nada similar, creamos el nodo y añadimos el código y el place pertinente.
  6. Si ya existe otro código, actualizarlo por el que viene en el fichero.

Opcionalmente, podemos agregar otros valores presentes en el fichero GeoJSON, tales como la elevacion (ele), o la población (population, population:date).

Notas

El INE/IGN establece la siguiente clasificación de las entidades: municipio, capital de municipio, entidad singular, entidad colectiva, otras entidades y diseminado. En OSM la correspondencia es la siguiente:

  • municipio, es el código de las relations admin_level=8. Son las que acaban en seis ceros y actualmente ya están todas. La población es la suma del resto de entidades del mismo municipio (mismas primeras 5 cifras).
  • capital de municipio, es el nodo que tiene el rol de admin_centre en las relaciones anteriores. El código suele acabar en 1 y el nodo debería contener también la etiqueta capital.
  • otras entidades, el resto de localizaciones dentro de un municipio que se pueden considerar “agrupadas”.
  • diseminado, son aquellas casas sueltas, suelen tener el código acabado en 99 y no deberían mapearse, a no ser que no exista otro valor, como por ejemplo, en Galicia y Asturias (que suele ser el único elemento existente).
  • los tres elementos anteriores (capital + otras + diseminado) suman el valor de entidad singular para el dato de la población. Suelen acabar en dos ceros y no deberían incluirse, si existe alguno de los elementos de los que se componen.

Es aconsejable utilizar la capa WMS del mapa ráster del IGN para contrastar el dato.
Cualquier incoherencia, duda o error con el que os topéis, por favor, comentadlo por aquí mismo.

Muchas gracias!


1 Nombre divergente entre el INE y OSM, uso de diminutivos/artículos/caracteres especiales en los nombres, nombres diferentes dependiendo la lengua…
2 Son aquellos datos que aparecen en los ficheros del IGN
3 Si el nodo es un place=locality podemos cambiar el valor de locality por hamlet o el que toque. Suelen ser nuevas urbanizaciones.
4 Datos estadísticos pueden ser tanto ref:ine, como name, population, wikidata, wikipedia, ele… etiquetas únicas y exclusivas del sitio
5 Las áreas suelen ser landuse=residential. Es preferible que los datos estadísticos estén separados de los usos del suelo para evitar duplicaciones de información, algo por desgracia muy común en OSM. Por tanto, mejor dejar los datos identificativos en un nodo, y solo dejar el área con el valor del landuse

4 Likes

Algún # a la hora de mapear para poder identificar las ediciones? #referenciasine?

Yo he estado poniendo #ref:ine, aunque no siempre jeje. Buena idea

1 Like

He añadido al repositorio un sencillo visualizador, se actualiza una vez al día, donde van apareciendo los lugares que quedan aún por etiquetar.

Facilitará tanto el hecho de ir desmarcando los ya creados, como ir detectando futuros elementos no creados.

1 Like

Puede que el 03006000200 y 03006000201 (la Llosa de camatxo) seán el mismo?

No exactamente, mira lo que contiene el fichero de ENTIDADES al respecto:

03006000200 la Llosa de Camacho 03 Alacant/Alicante Entidad singular 207 03006 0822-2 -0,00713688 38,77255001 Mapa 219 MDT FALSO FALSO
03006000201 la Llosa de Camacho 03 Alacant/Alicante Otras entidades 150 03006 0822-2 -0,00713688 38,77255001 Mapa 219 MDT FALSO FALSO
03006000299 la Llosa de Camacho 03 Alacant/Alicante Diseminado 57 03006 0822-2 -0,00713688 38,77255001 Mapa 219 MDT FALSO FALSO

03006000200 corresponde con entidad singular, que son los que estoy sustituyendo
03006000201 este es el que debes añadir, puesto que se refiere al núcleo poblacional
03006000299 este se ignora, puesto que están dispersos

Si te fijas Otras entidades + Diseminado suman el valor de población de Entidad singular. Así que el que estoy añadiendo es el acabado en 1, que es más realista para un conjunto de casas.

Claro, pero la Llosa de Camatxo es una pedania de Alcalalí. Si sustituyo el ref:ine y population, los datos del diseminado se pierden, no? Porque estaría cambiando el conjunto de la entidad + diseminados por solo la entidad.

edit: A no ser que tenga que añadir otro nodo solo para el núcleo urbano de la pedania

Los diseminados se deben perder puesto que no son un núcleo, si no gente que vive de manera dispersa. El valor de la población de las personas diseminadas, está recogido dentro del cómputo total del municipio.

En torno a Node: ‪la Llosa de Camatxo‬ (‪2063695774‬) | OpenStreetMap viven 150 personas en ese núcleo (en 2021), no más. El resto está por la zona, pero no concentrada en ningún punto, por lo que no tiene correspondencia con ningún elemento concreto de OSM. Ese 57 está incluído (agrupado) en Relation: ‪Alcalalí‬ (‪347418‬) | OpenStreetMap, el cuál es una área y por tanto sí puede contener todos los dispersos / diseminados.

Ah vale, ahora si lo entiendo. Disculpa :sweat_smile:

He actualizado el algoritmo para que también tenga en cuenta ciertos elementos diseminados (acabados en 99). Algo muy común en todo el norte peninsular, que carecen de cualquier otro núcleo poblacional. Claro que esto ha vuelto a disparar el número de elementos faltantes… :smiley:

No entiendo bien ahora el que aparezcan diseminados que no deberíamos añadir porque ese dato lo tenemos dentro del núcleo de población. Ese error no se va a poder suprimir.

Ejemplo:

18 Granada 017 Almuñécar 000800 TORRECUEVAS 791 378 413
18 Granada 017 Almuñécar 000899 DISEMINADO 791 378 413

Torrecuevas ya existe en OSM con el código acabado en 000800, no tiene sentido añadir un diseminado con el otro código.

No, no hay que añadir otro para el diseminado, si no que hay que sustituirlo (si aparece en el mapa). En el caso de Torrecuevas, hay que utilizar el 899 y no el 800.

La razón, es por que una Entidad Singular (también aplica para las colectivas) es una categoría, digamos, más lógica que física. O dicho de otro modo, es una especie de elemento que agrupa una serie de lugares/núcleos, los cuales sí que son físicos, es decir, que son un punto concreto al que pudieras dirigirte.

Viendo las fotos satélite, Torrecuevas tendría el núcleo donde más o menos está ahora, sin embargo, el INE lo ha clasificado exclusivamente como si se tratase de elementos diseminados, seguramente porque carezca de datos específicos. Lo más normal que he estado viendo hasta ahora sería que Torrecuevas tuviese una fila de tipo Otras entidades y luego la de Diseminados, y que ambas dos sumaran la Entidad Singular. Pero como no es el caso, sustituimos el “agrupado” (entidad singular) por cada una de sus “partes” (diseminado, en este caso)

Ya he completado la parte que le toca a Granada.
Este tema ya lo revisé hace unos años en Granada y recientemente en Huelva también, pero no tuve en cuenta algunos núcleos de población.

Gracias Hugoren_Martinako por tu colaboración haciendo esta herramienta que me parece imprescindible. Deberíamos tener bastante más completo el tema de las poblaciones debido a su importancia. Espero que más usuarios se animen.

Un saludo

Muchas gracias por completar Granada :clap: :clap:

En la wikipedia de la etiqueta Key:ref:ine - OpenStreetMap Wiki tambien incluí un par de queries overpass para identificar elementos erróneos, que se hayan colado en la parte semiautomática, o que estén mal de inicio.
Básicamente la comprobación consiste en mirar si un código está dentro del municipio que le toca, es decir, si un valor empieza por 18090, ha de estar dentro del área de la relación cuyo ine:municipio es 18090 (o cuyo ref:ine es 18090000000)

He añadido otra capa al mapa con el concepto inverso: señalar aquellos elementos que NO deberían tener una referencia, ya sea porque es errónea o porque el INE la ha marcado como suprimida.

Para tales valores, hay que quitar la etiqueta ref:ine y probablemente también se deban eliminar population y population:date, ya que serán falsos. O tal vez actualizar population:date con el último año que el INE la contabilizó de manera independiente.

1 Like