ya he comentado este tema con algunos compañeros en las reuniones semanales y hace tiempo que quería exponerlo para ver si es posible corregir etiquetado y hacer limpieza.
Al igual que pasó con el etiquetado is_in:* creo que existe numeroso etiquetado addr:* que es redundante e inútil al existir ya límites administrativos asociados a este.
Da la impresión de que algunos usuarios lo usan para hacer consultas de datos de forma supuestamente más sencilla que por límites administrativos. Otros usuarios, normalmente nuevos o inexpertos, por desconocimiento simplemente copian de elementos que ya los tienen y los añaden también, tengan utilidad o no.
Por otra parte en muchos casos se hace mal uso del etiquetado y se comenten errores al escribir los nombres, por lo que ni siquiera son útiles.
Podría entender que en ciertos casos muy puntuales por dudas que pudieran existir en los límites administrativos o conflictos de otro tipo pudieran ser necesarias las etiquetas, pero para ello creo que más bien se deberían corregir los límites administrativos y usar notas, pero no establecer un etiquetado ya de por sí dudoso.
El hecho de exponer esto aquí es evidente, ya que estamos hablando de cientos de miles de elementos que en caso de hacer alguna acción se debe tener claro el procedimiento y los problemas que pudiera haber.
Espero vuestras respuestas y a ver si podemos actuar pronto con esto.
Algunas notas que me parecen útiles sobre el tema:
Es interesante recordar que la realidad de las direcciones postales en el mundo tiene una cantidad de variaciones y riqueza excepcional [1]. Las estadísticas de taginfo parecen ser globales en OpenStreetMap, y por tanto no representan las tendencias de uso específicas de las direcciones en España. Estas preferencias o hábitos locales en España tampoco aparecen documentados en la wiki (al menos a fecha de hoy).
Alinear criterios y documentacion pasará pues por determinar, para la comunidad española, cuáles son las preferencias y hábitos que se quieren consensuar, y asegurarse de que existe una base escrita que sirva de referencia tanto a quien contribuya en el futuro, como a quien desarrolle herramientas de edición.
Y respecto a los casos especiales, dudosos o específicamente divergentes de la norma, mi sugerencia sería añadir tantas etiquetas addr:* sean necesarias para calificar una dirección, sin tener que depender de información que pueda encontrarse en una nota aneja.
Y es menester guardar en mente que la edición de relaciones de límite administrativo sigue siendo una tarea muy difícil para los que somos más novatos, los que mapeamos con aplicaciones menos potentes, y los que tenemos simplemente “miedo a tocar una relación por si se rompe algo”.
Según Key:addr:* - OpenStreetMap Wiki* el esquema addr está relacionado con direcciones postales, y en este enlace podemos ver cómo luce una dirección para España, que llevado a terminología OSM sería:
addr:street, addr:housenumber addr:postcodeaddr:city addr:province (en las capitales de provincia se puede obviar esta indicación) addr:country (si es un envío internacional desde otro país)
En mi opinión, las dos últimas, provincia y país, al ser opcionales, me resultan redundantes.
Hay que tener en cuenta también que la mayoría de mapeadores utiliza iD, y este ofrece un formulario para la dirección con estos campos:
Es una muy buena idea cuando una dirección no entra en el molde.
Mi nota iba dirigida a la sugerencia de @kapazao de que “más bien se deberían corregir los límites administrativos y usar notas”, que quizás malinterpreto.
Para ilustrar mi punto de vista, un caso hipotético: estoy en un exclave de la provincia X dentro de la provincia Y, que no está mapeado (falta un límite administrativo dibujado en OSM). Si estoy por la calle en ese exclave, con Every Door abierto, creo que la opción más correcta es añadir addr:province=X a las direcciones que voy añadiendo al mapa, y que el uso de notas/fixme/description/… no es el lugar para indicar que la dirección en realidad pertenece a la provincia X. (Doy por obvio que no voy a pararme a mapear el límite administrativo con Vespucci a pie de calle.)
Los códigos postales no los añadí a la lista puesto que en España tenemos definidos muy pocos límites de los códigos postales (boundary=postal_code) y tampoco sé de dónde se ha sacado esa información, porque creo que no había nada oficial y que pudiéramos usar en OSM.
Tan solo se podrían eliminar las etiquetas addr:postcode en caso de estar bien definidos los límites.
Probablemente en muchos municipios que solo tienen un código postal sí podría hacerse la eliminación de addr:postcode, pero no en otros que tengan más de uno, o en ciudades, que normalmente tienen varios.
Los casos dudosos y el tema de solucionar preferentemente el límite administrativo es por lo siguiente. Pongo un ejemplo algo exagerado para que se entienda lo que quería decir.
Tenemos conflicto con los límites de España y Gibraltar y como no se atreve nadie a tocar el límite algunos deciden que los nodos que se ponen cerca del límite pues se les pone addr:country=España en territorio de Gibraltar y viceversa.
Dime qué confianza te da eso, qué es lo correcto y cómo lo solucionas.
Para mí es sencillo. El problema es el límite y la información de addr:* en los nodos conflictiva se elimina, puesto que para eso está el límite. Si hay un problema se mueven los nodos a su lugar correcto o se dejan notas indicando el problema, pero no se establece información conflictiva y dudosa que no ayuda en nada.
También hay que tener en cuenta importaciónes y otras ediciónes masivas.
Por ejemplo, parece que las Islas Baleares se destacan entre todas las provincias de España por el uso extendido de límites administrativos en direcciones. El enlace de Taginfo otra vez más, pero solo para Islas Baleares:
El uso de addr:subdistrict, addr:street_codeINE y varias otras etiquetas en España parece ser algo normal en las Islas Baleares, y casi desconocido en el resto del país. Y todo pasó hace 2 años:
Normal? Importación hecha por jmp_99_ | OpenStreetMap (71 ediciones) de las direcciones de Palma únicamente. Nombres de calles en mayúsculas que por supuesto no coinciden con las vías circundantes
De todos modos, lo que trataba de decir era que el uso de algunas etiquetas addr: vienen principalmente de ediciones masivas, mientras otras han crecido de una forma más “natural”. Si estamas hablando de eliminar etiquetas, creo que la manera de hacerlo seria distinto en cada caso.
Veo la problemática como un caso de llevar dos relojes que no dan la misma hora: ¿cuál da la hora buena?
Siguiendo tu ejemplo, separemos casos:
Mapeado redundante (el punto está dentro de límite español, y lleva addr:country=España): no hay ningún problema. Es más, creo que la redundancia es positiva (los dos relojes marcan exactamente la misma hora). OpenStreetMap nunca ha tenido vocación de ser una base de datos normalizada (es más, veo una tendencia a “desnormalizar” cuando se puede). La duplicación de información sirve de confirmación explícita, en una zona geográfica cercana a una frontera, en la que cualquier consumidor de datos puede tener dudas legítimas*. En otras palabras, si viene alguien y borra los addr:country cercanos a un límite administrativo porque le parecen redundantes, el mapa sigue siendo correcto, pero es más difícil de usar. Y no causa ningún mal que se dejen puestos.
Mapeado conflictivo (el límite administrativo pone el punto en un país, y la etiqueta addr:country=* lo pone en el otro país). La existencia del conflicto es fácil de detectar (supongo que se puede automatizar, por ejemplo con Osmose). La resolución del conflicto pasa por una de dos: mover los límites, o corregir addr:country, y hace falta un humano que lo decida, cotejando fuentes externas a OSM.
Si lo que hay que hacer es mover un límite (lo cual —insisto— no está al alcance de todos), entonces quitar etiquetas addr:country que son correctas y dejar una nota en su lugar me parece mala recomendación, puesto que quita datos correctos del mapa. Es mejor dejar las etiquetas que aportan información válida, y si se quiere, se puede añadir una nota adicionalmente, que dará más visibilidad y complementa la detección automática. Y cuando pase por la zona alguien que sí se atreva a editar el límite administrativo, se arreglará del todo.
Si el límite está bien y lo que hay que hacer es corregir addr:country, me parece que aporta más claridad un changeset que cambia addr:country de X a Y explicitamente (puesto que estamos en un ejemplo cercano a una frontera, donde la duda siempre es legítima), en lugar de un changeset que borra addr:country=X sin poner valor nuevo. Las dos opciones acaban funcionando igualmente.
*Pienso por ejemplo en una aplicación que consume datos OSM, y que, por decisión técnica (válida o no), simplifique las coordenadas de los límites administrativos, quitando nodos, y quitándole decimales de precisión a cada nodo (como vemos que pasa e.g. en la capa vectorial OSM MapTiler). Esto hará que le dibujo de la frontera sea más impreciso y ponga casas del otro lado de la frontera. Si no tenemos addr:country en las direcciones de esas casas, la aplicación que consume los datos acabará haciéndose un lío y poniendo direcciones en el país incorrecto. Si añadimos redundancia correcta se puede evitar este tipo de problema.
Hoy he procedido a eliminar el siguiente etiquetado addr:*:
country
county
state
region
province
municipality
island
ward
district
subdistrict
Aquí están algunos de los más importantes. He revisado los posibles casos conflictivos como comentamos que pudiera haber por límites territoriales pero no he encontrado problema alguno.
Procederé con otros casos próximamente, ya en principio menores en cantidad e importancia.
Cualquier duda o problema no dudéis en comentarlo.
He modificado un poco la sección de los números de portal en ES:Directrices de etiquetado españolas - OpenStreetMap Wiki, donde se listaban mogollón de addr:* que en este hilo se han eliminado, por lo que no tiene sentido que se invite a añadirlas de nuevo.