Possível uso dos dados do MapBiomas

Olá pessoal da comunidade BR!

Conforme interesse de alguns, consegui pedir a autorização do uso dos dados do MapBiomas para o OSM.

Ou seja, primeiro passo está resolvido. Agora teríamos de discutir:

1 - os dados são úteis?
2 - os dados são de boa qualidade?
3 - se sim para 1 e 2, como usar esses dados?
3.1 - e as etiquetas?

Há uma preocupação (minha também) de que a resolução dos dados é relativamente baixa, visto que eles são derivados de imagens de satélite de média resolução.

Minha opinião:

De fato a resolução não é excelente, mas acho que os dados de Uso e Cobertura do Solo são bem interessantes em lugares onde não há dado melhor do governo local.

Para usar esses dados, eu sugeriria primeiro fazer uma tabela com equivalência das etiquetas, converter os dados para .osm, e depois fazer um uso bem manual desses dados. Nada de importação automática (ou semi) nem nada, abrir cada pedacinho no JOSM, arrumar, conflatar, e subir ao OSM.

O que vocês pensam?

Links possivelmente úteis: pedro_tharg's Diary | Sugestão de tags para serem utilizadas no mapeamento de vegetação da Caatinga | OpenStreetMap
Atakua's Diary | On Land Cover Import | OpenStreetMap

3 Likes

image

Eu mesmo acho que seria uma ótima maneira pra resolver esses grandes vazios que fazem com que o nosso lindo OSM não represente muito corretamente a situação de várias partes da Amazônia (ainda bem que não tem os buracos que tem no mapa, ainda bem hehe)

Valeuzão por ter arranjado a permissão! Vamos às perguntas:

  1. Acredito que sim, na minha opinião o OSM sempre foi “incremental”, de modo que no começo muita coisa se mapeava com LANDSAT se fosse a única coisa que tivesse disponível, de modo que futuramente possa ser melhorado.

  2. SIM!!! Conheço pessoal da equipe do MAPBIOMAS, fazem amplo controle de qualidade, é coisa finíssima! (lembrar que resolução, ainda que como um fator limitante da qualidade, não significa que os dados sejam de baixa qualidade!)

  3. meio que download massivo seria o começo hehe, aí sim que viria a parte das conversões e da conflação

3.1) acho que a gente poderia iniciar uma tabela no google sheets, ir adicionando e um dia fazer uma reunião pra bater o martelo, obviamente caso a gente decida em usar

ao meu ver seria benéfico sobretudo em regiões com um completo vazio de dados!

1 Like

Eu estou particularmente entusiasmado com esses dados. Se puder ir compartilhando amostras, a gente consegue ter uma opinião mais formada sobre o assunto.

Também acho que uma possível importação deveria ser feita em conjunto por membros da comunidade, cada um inicialmente na sua área de interesse, expandindo para outros locais posteriormente. Com isso, não deixando todo o peso do trabalho nas mão de uma pessoa só.

1 Like

Respondendo as perguntas:

  1. Acho útil (vide projeto no Hub onde usamos ele para definir áreas prioritárias para mapear).
  2. Sigo a resposta do Kauê.
  3. Sigo a sugestão do Matheus. Podemos começar por tipos de feições que costumam ser menores, como silvicultura, palmares ou corpos da água…
1 Like

Olá, @matheusgomesms e demais,

Demorei, mas cheguei… respondendo:

1 - os dados são úteis? com CTZ

2 - os dados são de boa qualidade? SIM, mas vale conferir sobre as geometrias, com um validador qualquer, pode ser do JOSM…

3 - se sim para 1 e 2, como usar esses dados?

Sigo o que você sugeriu, primeiro a equivalência das etiquetas, pra depois converter (já filtrado), conflatar no JOSM e realizar o upload.

Penso que poderia ser dividido por regiões (N, NE, CO, SE, S), pois muitos biomas seguem mais ou menos isso. Prefiro fazer aos poucos como você falou também, mas aqueles que ultrapassam as regiões teriam que receber um tratamento à parte.

Se a região Norte é a “bola da vez”, poderia começar por lá…

Não está tão fragmentado também e tem a questão de ser a região com o maior vazio cartográfico do Brasil (junto com o CO).

A Mata Atlântica já aparece como “pulverizada”, p.ex. daria mais trabalho…

A sugestão de Everton também considero válida (corpos dágua, silvicultura etc)…

Concordo com Santamariense, no quesito dividir as tarefas…o difícil seria engajar, talvez, oferecendo incluir o nome dos mapeadores numa página Wiki do projeto…

3.1 - e as etiquetas?

Sim, esta parte é fundamental para o sucesso da missão!

Finalmente…

  1. a via de criar uma wiki primeiro e documentar este projeto seria ótima, você inclui o link na principal na página do OSM Brasil.
    Nesta Wiki do projeto, documentar este pequeno passo-a-passo que estamos sugerindo (sem os detalhes ainda ou com os detalhes e deixando para opinarem por meio de link para esta entrada na community);

  2. Não posso deixar de ressaltar (já adiantando as etiquetas) - não há etiquetas “oficiais” (= wiki osm) para biomas, mas seria importante sugerir uma nova;

Se optar por mapear os dados do MapBiomas, lembrar que estes são os “remanescentes” dos biomas, é diferente do “bioma oficialmente delimitado”, cujo arquivo estaria disponível nos acervos oficiais (IBGE, MMA) e não, no MapBiomas, que é um projeto de monitoramento.

Assim, penso que temos cinco tipos para “amazônia”

  • Amazônia Internacional - dados oficiais multilaterais (diplomacia, não ONGs…) - valor político-administrativo
  • Amazônia Azul - dados oficiais BRA - valor político-administrativo - zoneamento costeiro e marinho
  • Amazônia Legal - dados oficiais BRA - valor político-administrativo - COMPLETADO
  • Amazônia - Bioma - oficialmente delimitado - dados oficiais BRA (IBGE, MMA) - valor ecológico
  • Remanescentes da Amazônia - Floresta (natural=wood) - dados de monitoramento (ONGs, instituições de pesquisa) - valor ecológico
1 Like

Reparei neste vazio também! Vamos resolver :hugs:

Do jeito que está, parece até que já desmataram quase tudo…

Vou citar o próprio MapBiomas sobre limitações pertinentes. O que estiver em negrito é destaque meu.

Citação de https://brasil.mapbiomas.org/visao-geral-da-metodologia/

Todos os mapas anuais de cobertura e uso da terra do MapBiomas são produzidos a partir da classificação pixel a pixel de imagens das satélites Landsat. Todo processo é feito com extensivos algoritmos de aprendizagem de máquina (machine learning) através da plataforma Google Earth Engine que oferece imensa capacidade de processamento na nuvem.

E

Citação de https://brasil.mapbiomas.org/analise-de-acuracia/

Em cada ano, cada píxel da base de dados de referência foi avaliado por técnicos treinados em interpretação visual de imagens Landsat.

Os dados do MapBiomas para uso de solo são por aprendizagem de máquina. Eles não tem revisão humana, apenas é feito uma amostragem que é usada para ingerir uma acurácia ( https://brasil.mapbiomas.org/estatistica-de-acuracia/colecao-8/), que definitivamente não é próximo de algo que permita traduzir as classes para tags da OpenStreetMap.

E, claro, o arquivo que fornecem é raster, não é vetor, o que quer dizer que converter para .osm (vetor) para tentar otimizar conflação provavelmente vai gerar uploads enormes. E o resultado é baseado em Landsat, que tem uma resolução bem mais baixa do que Bing/ESRI/etc usado na OpenStreetMap, o que explica porque na imagem abaixo o Rio dos Sinos (que é enorme) pode simplesmente desaparecer.

Sobre “sugeriria primeiro fazer uma tabela com equivalência das etiquetas” isso é insuficiente.

Como o dado original não tem revisão humana, se a proposta é organized editing (em especial com gente sem experiência), para cada tag sugerida na importação é preciso documentar identificar as tags adicionadas (sem assumir cegamente que o resultado gerado por aprendizagem de máquina está certo). Ou seja, não basta algo simples como documentar “essa cor no MapBiomas na OpenStreetMap significa `natural=wetland+wetland=swamp, enquanto essa cor significa natural=wood, já essa é outra cor é landuse=meadow (…)” mas documentar como humano que adiciona na OpenStreetMap pode verificar se está correto.

Por exemplo, um mesmo tom de cor (por imagem aérea como Bing/ESRI/etc na data em que foi coletada) pode significar elementos diferentes na OpenStreetMap. Coisas como altitude relativa do solo bem como distância a outros elementos (por exemplo, próximo de um curso ou corpo de água) dão sinais do que aquilo pode ser. Sim, até existe documentação de como identificar edificações genéricas building=yes por imagem aérea, mas não tem para classes de tags do MapBiomas.

Isso de ter que publicar as instruções dadas aos mapeados faz parte do https://osmfoundation.org/wiki/Organised_Editing_Guidelines. O único detalhe que estou adicionado é explicar o que cada cor do MapBiomas significa é insuficiente, pois o MapBiomas não faz verificação humana disso.

Oi @fititnt

Semana passada, na reunião mensal do OSM Brasil, a gente falou justamente sobre isso. A gente está ciente de que:

1 - temos de seguir os passos dos imports/organized editing (criar página wiki, obter permissão da comunidade etc)
2 - a resolução não é excelente. Contudo:
2.1 - essa possível importação seria feita talvez nos mesmos moldes do Corine Land Cover: Corine Land Cover - OpenStreetMap Wiki (resolução de 25m, salvo engano). Se essa importação foi feita, a nossa poderia ser feita também, julgo eu, por motivos de:
2.2 - o MapBiomas tem um arquivo com resolução de 10m, derivados do Sentinel-2 (ao invés do Landsat). Plataforma - MapBiomas Brasil Continua não sendo perfeito, mas é uma resolução bem aceitável!

Também discutimos que:

3 - vai ser interessante a conflação, visto que os arquivos derivados muito provavelmente serão diferentes das imagens de satélite. Nessas áreas menos povoadas, não é incomum achar imagens com 10 anos ou mais de idade… Ou seja, o OSM teria um dado mais recente do que se fosse traçado à mão, utilizando as imagens disponíveis.

Talvez poderíamos brincar com isso: mapbiomas-brazil (mapbiomas-brazil) · GitHub , não sei se é útil em algo.

Isso dos dados raster devemos checar sim, imagino que seja possível baixar os dados vetorizados do GEE, mas não fui atrás ainda.

1 Like

Mesmo alterando de 25m para 10m, o Rio dos Sinos (embora não o mais largo, definitivamente é um dos maiores daqui) além de ser super pixelado/quadrado, não é contínuo.

@matheusgomesms ,

Penso que podemos avaliar também os dados do BDIA, BDIA - Banco de Dados e Informações Ambientais, já estão em formato vetorial, escala de 1:250.000, são providos por órgão oficial (IBGE), estão atualizados (2023) e tem os recortes para os biomas (esqueceram do ‘costeiro-marinho’, as usual… mas, passaram a chamar de “sistema” costeiro-marinho… deve ser por isso).
Daria menos trabalho também…

A nota metodológica está aqui:

Em tempo: tem outro doc. técnico, mas é referente à grade estatística, que não é o foco…

Processando: 1000024448.jpg…

Sim, por isso que uma verificação manual antes do upload é necessária antes do envio. Saberia dizer se o RS tem dados como os do ES? Pela imagem que você mostrou, me parece um resultado bem aceitável nas áreas verdes! Corpos d’água nós temos os dados da ANA/IBGE, que julgo serem melhores (e já estão mapeados no OSM, na grande maioria). Inclusive podem servir de referência para dividir áreas etc.


Profa. @Raquel_Dezidério_Souto , acho importante a gente delimitar o que poderíamos fazer aqui. Temos principalmente 2 produtos diferentes: Uso e Cobertura do Solo / Biomas. Como mapearíamos os biomas? Isso entra no OSM? Relação?


Chequei, não dá. Tem de vetorizar tudo.


Acho que aqui, poderíamos usar a metodologia do Corine, fazendo por estados. Onde os municípios/estados tiverem dados, usamos, se não tiver, usamos os do Mapbiomas. Vi uns dados do IBGE mas a resolução era bem menor do que os do Mapbiomas.

Link importação ES: Espírito Santo (state)/Importação do Uso e Ocupação de Solos - OpenStreetMap Wiki

Seriam 2 feições diferentes, o limite oficial de cada bioma (IBGE) e as poligonais das áreas das classes que estão no BDIA.

A etiqueta para bioma teria que ser proposta (discussão anterior). Para as classes, fazer a equivalência das tags que já existem.

Teremos que pensar sobre as relações, mas, podemos começar abrindo os arquivos vetoriais para comparar com o q já está no OSM.

A parte da hidrografia é na ANA mesmo.

O ideal seria organizar isso em uma wiki page e colocar em discussão os detalhes, fica dificil assim por msg na community, as considerações acabam se perdendo…

Se você quiser escrever, eu (e os demais), poderemos revisar/criticar.

1 Like

E, IMO, este não seria um mapeamento para novatos.

1 Like

No GEE dá para baixar raster apenas, mas dá converter vetorial tranquilamente no QGIS, então não é uma questão problemática.

Acho que para algumas áreas próximas a Porto Alegre tem dados de hidrografia de carta topográficas feitas recentemente (@fititnt pode confirmar). Então podem ser interessante consultar outras fontes de dados para importação de uso de solo enquanto discutimos o uso do MapBiomas.

2 Likes

Quanto as classes no MapBiomas não acho que seja uma questão de eles serem gerado por aprendizado de máquina, mas é a classificação que um profissional ou pesquisador de uso do solo costuma usar.

As classes utilizadas no MapBiomas vão ter uma ou mais correpondências no OSM de fato (eg: Corpos da água podem ser rios ou lagos), mas não serão muitas. Ou seja mais um ponto para considerar na ideia inicial de importação manual →

2 Likes

Algumas observações…

Acho que vale uma checagem estado a estado, quais deles teriam disponíveis esses dados em melhor qualidade para serem importados pro OSM. Não havendo nada melhor, acho que ainda vale a pena importar.

Se as geometrias não forem precisas do jeito que se deseja, vai mudar que o mapeador ao invés de desenhar geometrias novas, vai realinhar ou modificar as existentes após essa importação.

Após gerar as geometrias, poderíamos cortas elas com base num buffer da camada de vias do OSM, ficando até mais fácil lidar e importar elas em quadras/blocos. Também poderiam ser cortadas com base nos corpos de aguas já desenhados. Algo a ser estudado.

Quanto a novatos trabalharem nessa importação, é realmente complicado, mas não necessariamente impossível. Podemos treinar o pessoal para fazer essas importações, e é claro, que um novato se aperfeiçoe antes disso. Também seria preciso ter uma melhor noção dos dados antes. Imagino que essa importação terá níveis de complexidade, existindo desde locais onde será possível importar sem modificar nada, passando por pequenas correções até chegar a locais onde seria necessário grandes correções.

1 Like