Importación Masiva de Instituciones Educativas con errores graves en Colombia

Hace aproximadamente dos semanas identifiqué una importación masiva de Instituciones Educativas (amenity=school) que abarca 24.434 nodos distribuidos en 11 changesets:

Tras una revisión exhaustiva de varias horas, he detectado errores sistemáticos y de gran magnitud que comprometen seriamente la calidad y utilidad de estos datos para OpenStreetMap.

En mi opinión, la base de la confianza y el valor de OpenStreetMap reside en la responsabilidad individual de cada mapeador. Cada vez que añadimos un dato asumimos el compromiso de que sea verdadero, correcto y verificable. Esto implica un mínimo de calidad en la confirmación de la precisión geográfica (¿está en el lugar correcto?), la veracidad de la información (¿el nombre y los atributos son los reales?) y el uso adecuado de las etiquetas (¿estoy usando key=value correctos según las convenciones de la comunidad?). Un dato erróneo no es solo inútil, es un detrimento activo para la integridad de una base de datos y la experiencia de los demás usuarios.
Ante la envergadura y la baja calidad de los datos, surgen interrogantes fundamentales sobre el proceso que se llevó acabo en esta importación:

  • Existe alguna documentación o discusión previa sobre esta importación en los canales de la comunidad de OSM Colombia?
  • Fue notificada la comunidad colombiana de OSM sobre esta importación masiva antes de su ejecución, de acuerdo con las Directrices de Importación de OSM?
  • Se discutió y aplicó una metodología que incluyera:
    • La verificación y validación de los datos y sus fuentes?
    • Una evaluación de las características de los datos iniciales y la selección apropiada de key=value para representarlos en OSM?
    • Una verificación de los datos finales después de su transformación a elementos OSM y antes de su carga a la base de datos OSM?

Los errores identificados son consistentes en todos los changesets revisados y difieren drásticamente de las directrices de la Guía para mapear sitios educativos en Colombia. Resulta particularmente preocupante que la mapeadora involucrada es coautora de dicha guía, lo que sugiere un desconocimiento u omisión de las propias convenciones de la comunidad.
Los errores más comunes incluyen:

  • Nombres y valores en mayúscula sostenida.
  • Nombres con abreviaciones no estandarizadas.
  • Selección erronea de la característica SEDE como nombre (name=SEDE…) de la institución educativa.
  • Selección erronea de la característica OTRA-SIGLA como nombre (name=OTRA-SIGLA…) de la institución educativa.
  • Errores de ubicación geográfica: instituciones educativas ubicadas en sitios donde no existe ninguna edificación cercana, en medio de la nada o aún más grave, sobre cuerpos de agua como el mar.
  • Identificación y Etiquetado incorrecto: identificación errada para jardines infantiles mapeados como amenity=school, a pesar de que la guía de mapeo de sitios educativos para Colombia recomienda explícitamente amenity=kindergarten para estos establecimientos. A su vez el uso de amenity=college para identificar instituciones educativas que dictan niveles de básica primaria.
  • Valores incorrectos para ciertas claves, como operator:type=NO OFICIAL que no se ajusta a los estándares OSM.
  • Uso incorrecto de addr:city=* en varias decenas de nodos, ejemplo:
    addr:city=ZONA BANANERA
  • Problemas de codificación UTF-8 o mojibake.
  • Uso de key inusuales como operator_t que posteriormente fueron corregidas por otro mapeador a su forma correcta operator:type

Mi principal preocupación radica en la nula utilidad de estos datos. Fueron agregados sin ningún control de calidad o verificación mínima, lo que resulta en información errónea, mal ubicada y mal etiquetada.
¿Qué valor tiene para OpenStreetMap un volumen tan grande de datos (24.434 nodos) con serias falencias de todo orden (key=value, nombres, ubicación real y características)?
¿Quién podría usar estos datos erróneos de manera productiva?

Mi opinión es que, dada la baja calidad, estos datos no tienen ningún valor para OpenStreetMap. No existe una regla que valide esta importación por un “porcentaje aceptable de calidad”, para que la importación sea útil, el 100% de los datos deben tener un mínimo de calidad aceptable (datos verdaderos, correctos y verificables), datos incorrectos son simplemente basura cartográfica que degrada el mapa.

También quiero añadir que esta situación se agrava al observar patrones similares en otros changesets de la misma mapeadora, donde se han añadido miles de elementos de diferentes tipos con errores de ubicación y/o etiquetado, y sin discusión o información previa.

Por último, quisiera saber:

  • Que medidas deben tomarse con estos changesets?

Y considerando el patrón de contribuciones del autor de estos CS y el volumen de datos, como se debería proceder?

  • Hacer los debidos comentarios en los CS señalando los errores encontrados?
  • Es apropiado notificar al Data Working Group (DWG) para que evalúe la situación y tome las medidas correspondientes?
  • O simplemente hacernos los de la vista gorda y permitir datos inutiles en OSM?

Debido a la naturaleza de mi trabajo, siempre he considerado a las instituciones educativas rurales referentes para la ubicación de determinadas poblaciones, las instituciones educativas son un elemento importante de nuestra geografía que deben ser abordadas y mapeadas según las directrices de la Guía para mapear sitios educativos, de lo contrario ¿que sentido tiene el tiempo y esfuerzo dedicado por numerosos colaboradores de OpenStreetMap a redactar y mantener estas guías?

1 Like

Considerando que hacen mas daño que bien, y que no cumple con las directrices de importacion de datos, “AFUERA…”

Si claro, comentarios en los changesets y mensajes al autor solicitandole amablemente una explicacion. Al menos inicialmente asumir buena fé y que es un error no advertido.

Si no se soluciona el inconveniete con el punto anterior, si, es el paso siguente.

No, nunca, OSM depende de que ninguno de nosotros mire para el costado para mantener un nivel de calidad adecuado.

Estuve chequeando y confirmo las mismas observaciones, con veterinarias, farmacias, etc. Me resulta llamativo la densidad de farmacias y veterinarias en esta ciudad Changeset #159759269

546 nodos=

10000 nodos=

En este caso no es el etiquetado o los datos en si, me preocupa es la importación masiva sin discusión previa o documentación de lo que se añadiría a OSM (si existe tal discusión me disculpo y quisiera que se me compartiera la URL donde se discutió) y teniendo en cuenta lo que sucede con las Instituciones Educativas, estos 2 últimos CS tienen verificación o validación de posición?

Mi querido mapero, tanto rencor en ese escrito. Ahora pone en medio a una mujer para confrotar a otro mapero, que guapo eres. La comunicación asertiva sale a flote, usted ha compartido espacios conmigo, no le costaba nada escribirme directamente como lo han hecho otros maperos para saber el método que usé para importar esos datos. Entonces, es usted el que me va a acastigar? Es que solo los hombres tienen el derecho de importa datos masivos y de cometer errores? Considera que me inventé esos datos? Crear comunidad le quedo grande a usted.

Hola.
Como usted podrá ver, utilice un lenguaje neutral para describir la situación. No he inventado nada de lo que escribi, simplemente me remiti a describir la situación encontrada y preguntar debidamente que debe hacerse en este caso. En un principio pensé en escribir en los CS pero al revisar un comentario sin respuesta de otro mapeador donde señala que no existe determinada Institución Educativa entendí que no recibiría respuesta tampoco.
Respecto a=

No me interesa ser parte de ninguna comunidad donde se normaliza la baja calidad de los datos y simplemente se mira hacia otro lado.
En mi escrito inicial nunca hablé o pedí un castigo, simplemente he señalado una situación que no debe ocurrir y que por el contrario debe abordarse y corregirse.
Me disculpo si heri alguna susceptibilidad pero no he obrado mal al señalar esta situación.

En otro post escrito por mi recibi este mismo comentario después de señalar una situación parecida y desglosarla punto a punto.
Al parecer no soy bueno abordando este tipo de problemas ya que las personas involucradas terminan acusandome de lo mismo.
No hay que desviar la atención del tema principal, por el contrario, hay que enfocarse en una posible solución y/o corrección de estos datos.

3 Likes


Lo que no debe de ocurrir es que usted se considere con la verdad absoluta, se crea con el derecho de hablar de una mujer, le falto decir que soy su amante. y haga juicios sin valor de que en la comunidad no existe correcciones entre nosotros. Le recuerdo que las mujeres también podemos objetar, y porque considere que somos cercanos no tengo porque correrles. Ahora pues las mujeres mapeadoras debemos estar sometidas a otros, solo usted merece la independencia.

Ahh, mi grupo de Telegram para OruxMaps donde comenté la situación general a un grupo de personas en su mayoría ajena a estos espacios.
Como comenté anteriormente no se debe desviar la atención y a su vez no debemos caer en ataques personales.
Cualquiera puede revisar el mensaje original en Telegram, no pienso editarlo ni borrarlo, por el contrario quienes nos visiten talvez decidan quedarse al encontrarle una utilidad a la app OruxMaps. Así que Bienvenidos.
Nuevamente, y para este caso, no escribí nada que no fuera real, creo que existe una sociedad legalmente constituida donde el administrador al que me refiero y usted son integrantes, por lo cual la palabra socia no está salida de contexto ni pretende dar a entender algo más de lo que significa.
En cuanto al resto del mensaje, una pequeña discusión entre el administrador y mi persona me llevaron a tomar la decisión de abandonar el grupo de OpenStreetMap Colombia, y como el mismo mensaje lo dice, la hipocresía de la situación me dejó perplejo.
Si usted desea puede analizar ese mensaje y desglosarlo punto a punto, y encontrará lo mismo que yo= un comentario basado en la frustración de como se hacen las cosas en OpenStreetMap Colombia donde un ChangeSet con 78 elementos key:wikipedia corregidos son más graves e importantes que otros CS donde se importaron miles de nodos sin ningún tipo de verificación, validación y discusión. También debo añadir que ofrecí al sr administrador los otros ChangeSet de mi autoría donde había realizado ediciones que pudieran ser tomadas como importaciones masivas para su análisis.

Nuevamente reitero mi posición en este foro acerca de que la discusión debe enfocarse en abordar la solución a una importación masiva con datos en su mayoría errados.
Los ataques personales son mal vistos en esta comunidad y ya que mi comentario o mensaje no se hizo en un espacio de comunicación oficial de OpenStreetMap, traerlo a colación es irrelevante. Todos tenemos el derecho a nuestras convicciones y opiniones personales.

Hola Felipe. te se olvidò la opción quizás más sencilla:

  • revertir

por supuesto comentando en cada conjunto de cambio revertido el revert correspondiente.

he visto la cantidad de nodos añadidos, concuerdo en todos puntos de tu análisis. mi único apunto: quizás “ínfima calidad” podría expresarse de otra manera más amigable.

a propósito del paso que faltó:

mi opinión es que no se pueda hacer a posteriori, por los demás maperos interesados en mantener una buena calidad de datos dentro de OSM, por eso quedo de la opinión de revertir y avisar de haber revertido.

has observado, además de errores, también datos repetidos, o sea instituciones educativas ya presentes en OSM y otra vez añadidos en estas importaciones?

1 Like

estás mirando al punto de contacto entre la producción ganadera de los llanos y la distrubición en Boyacá y Santander. :wink:

1 Like

Seré breve para no ser acusado de nada (aunque veo muchos ataques personales y pocas respuestas concretas):

1 - una importación de datos DEBE ser discutida previamente con la comunidad. Punto. No importa si los datos son de buena o mala calidad: Import/Guidelines - OpenStreetMap Wiki
1.1 - por eso solo, la importación ya debería ser revertida.
2 - la persona creadora de los changesets todavía, 6 meses después, aún no ha aclarado cómo ha sido la importación, o sí? Donde están los detalles? De donde han salido eses datos? Se puede usar esos datos en OSM? Por qué los datos son de mala calidad?

Me parece importante el tópico abierto para que la comunidad pueda ayudar con la importación (para eso está la discusión ANTES de la importación). La persona que ha subido los datos puede aprovechar el espacio para no solo aclarar, sino también para discutir con la comunidad como hacer con que sus datos esté en condiciones para OSM. No es un mapero o otro que va a decir que está bien o mal, se nota claramente que, aunque los datos son importantes, ahora mismo están malos en OSM.

Por fin, siempre es bueno recordar que, dada la situación actual (importación de baja calidad y sin discusión previa), basta un correo al Data Working Group y todo será revertido. Así que, antes de escalar el caso, estaría bien que la persona que creó los changesets aclarara la situación para evitar eso.

Nadie aqui saldrá ganando con los ataques personales.

6 Likes

No ha visto explicacion, eso es lo que faltaría responder, pero no creo que sea tanto el tiempo efectivamente, porque aunque hayan pasado 6 meses desde el changeset, el pedido de explicaciones es de ayer. Demos tiempo a responder.

Puedo estar equivocado, pero no veo en el planteo inicial ni sexismo, ni violencia, ni nada que vaya en contra de las pautas y quizas hubo interacciones entre ustedes que no conocemos en esos espacios que mencionas y que puedan haberte llevado a iniciar tu respuesta de esa forma, pero creo que no es por ahi el camino, que es un asunto puramente tecnico el planteado y es en esos terminos que se espera tu respuesta.

En OSM se promueve la participacion sin discriminaciones. Da lo mismo que quien colabora haya nacido hombre, mujer, hermafrodita o asexuado, o cualquier otra característica, pero para las colaboraciones es importante que sigan las pautas para la importación, que no haya dudas sobre la calidad de los datos. Si entiendes que no se está respetando puedes contactar a los moderadores de forma publica o privada. Los encuentras en "arroba"mods-general.

2 Likes