Datos abiertos de edificación de CABA

Buenas, todo bien? Les quería hacer unas consultas sobre un posible hallazgo que hice.

Estaba boludeando con este mapa de la ciudad y encontré jugando con las capas que en el programa de datos abiertos hay un GeoJSON malformado representando todos los terrenos legales (link). Creo que combinar esto con imágenes satelitales nos puede ser útil en el caso que los edificios cubran el 100% del terreno, porque lo único que tenemos que hacer es etiquetar el polígono como un edificio.

Después de haberlo bajado, conseguí arreglar el schema y eliminar todos los atributos innecesarios para quedar con un GeoJSON válido de sólo 750 megas de espacio.

Subo un snippet de referencia.

A esto vienen varias preguntas.

  1. Esto es algo de interés para nosotros?
  2. La licencia CC-BY-2.5-AR, es compatible con la de OSM?
  3. Sería posible distribuir estos polígonos como tareas en MapRoulette, para que podamos marcar cada uno como un match para un edificio o no? Intenté subir el archivo entero pero me colgó el navegador.
  4. Alguien está interesado en ayudarme con esto?

Hola @La_Révacholiere,

En 2021 tuve la intención de adaptar el dataset, aprovechando tanto los datos de los polígonos como la información de altura o cantidad de pisos, pero lamentablemente no pude avanzar debido a la falta de tiempo. En aquel momento, el dataset estaba dividido en distintos archivos por barrio (tal vez sea bueno hacer lo mismo para que los archivos sean de un tamaño manejable) y recuerdo que era necesario corregirlo eliminando el área de la parcela, ya que no estaba relacionada directamente con la estructura del edificio.

Respecto a tu comentario sobre la utilidad en casos donde el edificio ocupa el 100% del terreno, me gustaría entender mejor ese punto, no me quedó claro por qué no se podría aprovechar en otros casos.

Corregir y agregar los edificios en CABA es de interés, dado que muchos de los que están mapeados no reflejan con precisión la realidad.

En cuanto a la licencia, contamos con la aprobación explícita del GCBA para utilizar sus datasets y tiles en OSM (File:Solicitud-de-permiso-para-usar-datos-de-BA-Data-en-OpenStreetMap.png - OpenStreetMap Wiki).

Por lo que observé del snippet, faltarían los datos de altura que también son importantes. Te paso el enlace a la página de la wiki donde se detallan las etiquetas relevantes para los edificios en 3D: Simple 3D Buildings - OpenStreetMap Wiki.

Por último, aunque no lo mencionaste, es importante aclarar que las importaciones masivas no son recomendadas; lo ideal es realizar importaciones manuales combinando datos con los que ya tiene OpenStreetMap.

Espero que esta info sea útil y que podamos mejorar la precisión de los datos en OSM!

PD: Tenemos un grupo de Telegram (Telegram: Contact @osm_ar) con una sección dedicada al AMBA donde podemos chatear sobre estos temas.

1 Like

Buenas @ignaciolep ,

Qué bueno encontrar a alguien que tuvo la misma idea! Es un proyecto complejo así que voy a ir agregando detalles por partes

Estoy de acuerdo, los datos son inmanejables en el formato que está ahora mismo. Lo que estaba pensando era en transformar cada polígono en una pregunta de MapRoulette: “es esto un edificio?” con tres opciones:

  1. Sí → subimos el polígono a OSM como una casa
  2. No → eliminamos el polígono de la lista
  3. Abrir en editor → para refinar la forma.

Esto nos ayudaría a distribuir el trabajo y esquivar una edición masiva sin supervisar. Me creo capaz de poder hacer esa distribución de tareas pero quería preguntar por opiniones de la comunidad, ayuda y esos temas de licencias.

Por lo que yo tengo entendido ese dataset representa terrenos, no edificios. Si un edificio ocupa todo el terreno, tengo entendido que MapRoulette podría convertir ese polígono en un landuse con un solo click. Lo que puede llegar a pasar es que un terreno tenga patio, ahí ese polígono ya no es tan útil. Si tenés sugerencias de cómo podríamos manejar esas situaciones lo puedo tener en cuenta para el proyecto

Mi primera reacción fue proponer un proyecto de dos fases: primero marcar las formas de los landuse, después las alturas. Pero pensándolo dos veces capaz no va a ser tan fácil ligar los landuse de la fase uno con las alturas de estos polígonos. Voy a buscar un dataset que incluya esos datos

Cualquier feedback es apreciado!

Respondo rápido:

Si ya existe el elemento en OSM, aunque sea mal dibujado, habría que realizar un “conflation” para mantener los datos existentes en OSM, como podría ser el nombre del edificio o la dirección, y corregir la forma del área y el dato de altura con los del dataset. No imagino cómo llevarlo adelante con un tasking manager.

El dataset de “Tejido Urbano” representa los volúmenes de edificación con su altura, o sea, los edificios en 3D sin el terreno.

Acá se puede ver que los patios están libres:

El dataset de “Parcelas” es el que representa los polígonos de los terrenos. Aunque existe la etiqueta place=plot, OSM no pretende ser un catastro inmobiliario, por lo tanto ese dataset no nos interesa.

En mi opinión, primero habría que ver de qué manera quedarse con una versión simplificada de cada edificio, para no tener tantas partes. Es decir, que si tenemos un edificio que arriba de todo tiene otro volumen para la sala de máquinas, descartamos ese volumen y nos quedamos con la versión más simple y representativa del edificio.

Una vez logrado eso, se etiqueta cada edificio con “building=yes” y su altura con “height=*”.

Con eso se podría lograr algo como lo que hice en el Barrio Soldati (OSM | F4map):

PD: Si te parece bien, creo que sería mejor cambiar el asunto por “Datos abiertos de edificación de CABA”

Creo que lo mejor va a ser partir el trabajo en dos etapas, puedo comparar contra el dataset de OSM y poner los polígonos conflictuantes en un archivo aparte. Incluso si nunca lo resolvemos la etapa 1 sería una mejora importante.

Gracias por todos los datos! Estoy estudiando la factibilidad con todas estas situaciones que mencionaste. Voy a ver si hay volúmenes que se intersectan en el dataset y cómo comparar contra lo que tenemos en OSM

Me parece bien, pero no encuentro el botón para hacerlo!

1 Like

Buenas tardes Ignacio, todo bien?

Quería actualizarte en mi progreso, ya tengo el código para transformar el dataset de la ciudad en una serie de datasets más fáciles de manejar con volúmenes en formato GeoJSON. También garantiza no tener conflictos con la copia en vivo de la ciudad en OSM. La última vez que checkié tengo 1.2 millones de volúmenes que ahora mismo no existen en el mapa.

Quería hacer dos consultas. Primero, sabrás cuál es el significado de los SMP en el dataset original? Parecen ser un código catastral, números similares tienen proximidad cuando están representados en el mapa, pero no sé cómo identificar si dos volúmenes adyacentes constituyen un edificio del mundo real.

Segundo, estuve experimentando con MapRoulette y no parece tener ninguna manera de ofrecer un flujo tan fluido como el que me habría gustado: que una persona vea un volumen encima de una imagen satelital, aprete un botón de “se ve bien” y eso automáticamente se convierta en un edit a OSM. El plan B podría ser generar miles de changesets, cada uno cubriendo ~4 cuadras, e idear alguna manera de distribuirlos en la comunidad y que verifiquen visualmente que estén bien antes de subirlos. Me parece un buen punto medio entre esto entre crear los edificios a mano levantada y un changeset masivo. Hubo precedentes de esto? Algo que tendría que tener en mente?

Abrazo, y gracias por apoyarme intentando traducir esto

Hola @La_Révacholiere,

SMP es el identificador catastral de Sección-Manzana-Parcela.

Cuando mencionás no tener conflictos con la copia en vivo de la ciudad en OSM, ¿te referís a que descartaste los datos del dataset en las zonas donde ya hay edificios mapeados en OSM? De ser así, no los descartaría. La mayoría de los edificios en OSM fueron mapeados “a ojo” desde imágenes satelitales de baja resolución, así que sería útil corregir su geometría y añadir datos como la altura, preservando etiquetas existentes como nombre, dirección y demás. Por eso antes te comentaba lo del “conflation” (merge), para comparar lo que hay en OSM con la versión depurada del dataset y unificar ambos. Para esto, JOSM tiene el plugin Conflation.

Todavía no termino de ver cómo implementarlo con un tasking manager. Tal vez se podría crear tareas por manzanas para identificar cuáles faltan, aunque eso será fácil de notar a simple vista desde el mapa. Creo que la vez que mejor aprovechamos un tasking manager fue con el Proyecto de mapeo de hospitales por la pandemia de COVID-19.

Me gustaría ver el dataset depurado, si tenés algo de Caballito, sin quitar los edificios ya mapeados en OSM. Así podría probar cómo trabajar con él.