Corrección masiva de nombres incorrectos, abreviados o siglas

Buenos días, sobre este tema se ha hablado bastantes veces y creo que la gran mayoría conocemos el problema. En la wiki ES:Nombres - OpenStreetMap Wiki se explica con claridad el uso correcto para la etiqueta name y alternativas.

Tenemos algún otro tema en el foro relacionado con esto, como El uso de las siglas IES, CEIP y otras delante de los nombre propios de los Centros Educativos - #7 by jeslop, pero en este caso quiero abarcar algo más para ver si entre todos podemos acordar corregir esto y evitarnos tener que seguir viéndolo en tantos casos que llevan ya años y entiendo que por cuestiones del tiempo que se tarda en ir caso a caso pues cansa.

Hoy he dado con un plugin de JOSM (Help/Plugin/Comfort0 – JOSM) que me ha dado una alegría para tratar este tema, que era algo que desde hacía tiempo no sabía cómo podría corregir de una forma más o menos sencilla y rápida. En la página se indica cómo se usa y es sencillo.
Teniendo un cierto conocimiento sobre expresiones regulares podríamos reemplazar las partes incorrectas de los nombres por lo necesario y nos ahorramos bastante tiempo de ir elemento por elemento.
Por supuesto esto debe hacerse con mucho cuidado usando las expresiones regulares correctas y revisando los cambios después.

Hoy por ejemplo he hecho una prueba y he corregido los nombres con abreviaturas de todos los polígonos industriales de Andalucía. Véase Changeset: 143603742 | OpenStreetMap

Algunos casos que me gustaría corregir sobre todo por lo cansado que estoy de verlos serían:
Nombres de colegios con siglas. CEIP, IES, etc.
Nombres con abreviaturas. Ntra. Sra.Nuestra Señora, Avda.Avenida, Ctra.Carretera

Por ejemplo en notepad++ para hacer el reemplazo de nombres con la palabra Ntra. sería así:

En la opción de reemplazo marcar en modo de búsqueda la opción de expresión regular.
Qué buscar: name(.*)(Ntra\.)(.*)
Sustituir con: name\1Nuestra\3

Espero podáis dar más ejemplos de nombres que podrían corregirse y podamos darle una solución buena y pronto para hacer limpieza en la base de datos y que otros no tomen como ejemplo de uso lo que no está bien.

Un saludo

3 Likes

Probado con los CEIP de los “Municipios de Predominio Lingüístico Valenciano” y solo decir que una maravilla, tanto trabajo ahorrado en revisión que tenia casi atascado desde hace un año.

Conjunt de canvis: 143649094 | OpenStreetMap

1 Like

Añado una posible abreviatura a corregir: EDAR (Estación depuradora de aguas residuales).

1 Like

Hola Carlos. Por mi parte veo bien la idea, he pasado unas cuantas horas corrigiendo colegios y otros usuarios también además de institutos. Como en toda edición automatizada sigue todos los pasos que se señalan en la wiki.

Hay que tener en cuenta también los diferentes idiomas de cada comunidad autónoma.

Respecto al plugin, pese a la ayuda de la web, no me queda claro su uso, pero veo que ya hay dos casos de éxito, por lo que debe ser problema mío.

Explico los pasos a seguir para el ejemplo de sustitución de las palabras Ntra a Nuestra

1- En JOSM descargar elementos en España que en la etiqueta name contengan Ntra

[out:json][timeout:100];
(
  area["ISO3166-1"="ES"][boundary=administrative]->.a;
  nwr["name"~"Ntra"](area.a);
);
out body;
>;
out skel qt;

2- En la ventana de selección buscar todos los elementos con etiqueta name para que queden seleccionados.

3- En la barra superior de JOSM ir a Editar → Copiar como Level0.

4- Pegar texto en un editor de textos como Notepad++.

5- Hacer reemplazo de la palabra Ntra por Nuestra.

En caso de Notepad++ ir a Buscar -> Sustituir.
Marcar en el modo de búsqueda la opción expresión regular y lo que se crea necesario.

Introducir lo siguiente:
Qué buscar: name(.*)(Ntra)(.*)
Sustituir con: name\1Nuestra\3

6- Una vez realizada la sustitución copiar todo el texto y en JOSM ir a Editar → Pegar Level0. Con esto se habrán corregido las palabras Ntra. Aparece un mensaje abajo indicando el total de cambios realizados.

7- En la ventana de selección buscar todos los elementos con etiqueta name para que queden seleccionados y revisar el listado de nombres para ver que estén correctos.
Si es necesario reemplazar más palabras como por ejemplo SraSeñora, repetir los pasos anteriores. El resto de correcciones se pueden hacer a mano en el editor de texto antes de copiar a JOSM.

8- Se recomienda revisar en JOSM los cambios y pasar el validador.

Hoy he realizado algunas correcciones en España en elementos con nombres Ntra y Ntro, siglas CEIP y EDAR.
Conjuntos de cambios: 144039164, 144044328, 144044553 y 144054344

He tratado de añadir los nombres para otras lenguas también, aunque seguramente me haya dejado algo. Esto se podría corregir más tarde.

En las EDAR que se han corregido he podido añadir las siglas, aunque habría que hacerlo también en todas las que no lo tuvieran ya.

Para los colegios hay trabajo, ya que lo ideal sería añadir todos los nombres completos para todas las abreviaturas o siglas que se encuentren y traducir a sus lenguas adecuadamente.

Una vez hecho esto se podrían añadir las etiquetas short_name fácilmente con una sustitución usando expresiones regulares, tal que así:

Qué buscar: name = (Colegio de Educación Infantil y Primaria )(.*)
Sustituir con: name = \1\2\n  short_name = CEIP \2

Agradezco comentarios y revisión.

Un saludo

Por favor, Cuida mas con los bounding_boxes, Way History: ‪Carrer Nuestra Señora de Montserrat‬ (‪307768813‬) | OpenStreetMap

3 Likes

Si alguien dispone del plugin scripting de JOSM yo tengo algunos scripts para lidiar con este tipo de situaciones, por ejemplo, este para editar un tag específico mediante regex o texto plano.

Si alguien estuviese interesado y tuviera cualquier duda, no dude en contactarme. Recomendable tener cierto conocimiento informático.

La sustitución se hacía sobre Ntra y sí es verdad que en este caso no tuve en cuenta que podía ser distinto en catalán, mis disculpas. Lo revisaré y tendré más cuidado con esto para la próxima.

1 Like