Encontro OSM Brasil - junho/2024

Olá, comunidade!

Os primeiros 3 encontros OSM Brasil foram um sucesso, com vários participantes e discussões bem interessantes!

Convidamos a comunidade para o próximo encontro, que ocorrerá em 2024-06-04T22:00:00Z

O evento terá duração prevista de 60 minutos e a pauta será exclusiva dessa vez:

Possível importação dos endereços do IBGE, do censo 2022.

Este evento é organizado por @vgeorge e @matheusgomesms. Para dúvidas ou sugestões, por favor, utilize este tópico ou nos envie uma mensagem diretamente.

Link para o encontro: OSM Brasil - Reunião Mensal

2 Likes

Participantes

Notas:

  • Apresentação do Anderson (@santamariense):
    • Está trabalhando em um script para importação a um bando de dados
    • Os pontos não estão bem alinhados, mas eles tem o ID da face (NUM_FACE), então eles poderiam ser projetados nelas
    • Pretende fazer um comparativo entre os pontos como estão e projetados nas faces
    • As faces estão alinhadas pelo meio-fio
    • O COD_UNICO_ENDERECO poderia ser utilizado como etiqueta, mas parece que é duplicado em endereços
    • Apresentou todos os campos com detalhes, e quais as sugestões para o sistema de etiquetas do OSM.
    • A parte de logradouros é bem complicada, dada a organização dos dados
    • Igualmente complicada a parte dos números de casa, com seus modificadores e complementos
    • Fez uma análise quantitativa dos endereços:
    • Em relação aos níveis de geocodificação, 99% estão com valores altos de confiança (valor 1 e 2).
    • 81% dos endereços são domicílios particulares

Discussão com os participantes:

  • Todos concordam que o trabalho feito até o momento está exemplar
  • Temos de trabalhar em uma wiki para documentar o trabalho
  • Anderson se dispôs a compartilhar o código
  • A princípio, os dados teriam de ser importados manualmente
  • Utilizar o HOT TM, com dados específicos por tarefa, parece ser uma boa opção
  • RapiD também poderia ser uma opção
  • Raphael está preocupado com a questão dos servidores. Matheus disse que comunidade LATAM e OSMF podem fornecer ajuda nisso.

Passos futuros:

  • Foco na limpeza/conversão dos dados
  • Qual a linguagem do código de programação? Decidir.
  • Fazer wiki
  • Fazer projeto piloto para ver as possíveis dificuldades, para ir melhorando o script antes de liberar os dados tratatos para o país inteiro
  • Pilotos (de inserção de dados) em 3-4 cidades de estados distintos para checar possíveis divergências
  • Piloto somente para pessoas experientes
  • Piloto (alfa) rápido, 10-15 dias, e depois se reunir para discutir a versão atual do script

Grata, Matheus. Minhas observações:

  1. Os dados de endereços são organizados desmembrados em colunas por causa dos geocodificadores;

  2. Apoio o uso do tasking manager pra dividir as tarefas;

  3. Posso ajudar a escrever a página Wiki;

  4. Os pilotos podem ser escolhidos segundo os tipos de espaços - pelo menos, uma cidade pequena em área rural e uma cidade pequena em área urbana; por causa das questões levantadas na reunião (fazendas, numeros de portas etc);

  5. O tamanho dos projetos no Tasking Manager (cidade, bairro ?) depende do volume de dados, em áreas muito densamente povoadas - por bairro; em áreas menos urbanizadas - cidade. Teria que avaliar caso a caso;

  6. Próximos passos - tentar fechar a metodologia inicial (de teste) e documentar na wiki;

  7. Os dados do Censo têm duplicatas, que podem ser erros do equipamento/APP, não necessariamente do recenseador;

  8. Concordo em nâo fazer importação em.massa, pois os dados têm erros também de geolocalização (ler a nota técnica que o IBGE publicou, sobre a coleta de coordenadas); Lembrar de incluir na metodologia, a filtragem inicial, para separar os casos mais destoantes (outliers);

  9. Nesta nota técnica, afirmam que estes pontos mais “fora”, dizem respeito a locais, por vezes, inacessíveis;

  10. Nos POIs em que, apenas pelo nome, não seja possível identificar o tipo (farmácia etc), deixaria apenas name=, sem indicar amenity=

Essa lista de passos futuros está no caminho certo.
Limpeza dos dados, construção do código ( @santamariense )

Sugestões:

  1. Criar Wiki e dividir as tarefas para todos que queiram participar das atividades.
  2. Inscrever nas equipes e participar de algum projeto piloto e da limpeza dos dados.
  3. depois que terminar o projeto piloto falar sobre a Impressão dos dados que foi mapeado, se precisa melhorar o código ou não.
  4. discutir em reunião a melhor estratégia e seguir com o projeto de importação.
  5. continuar com a importação dos dados.