[Ask Me Anything] Sou membro do EWG. Pergunte-me qualquer coisa

Abri esse tópico para deixar em a erro perguntas sobre o que eu, em meu nome, posso falar sobre ser membro do Engineering Working Group https://osmfoundation.org/wiki/Engineering_Working_Group.

Explicitamente, qualquer afirmação da data aqui não reflete a posição oficial do EWG, e para tal, seria necessário fazer solicitação (com voto) dos outros. A frequência de reuniões do EWG é a cada duas semanas.

Iniciando com pergunta em Brasil - Revalidação dos moderadores - fevereiro de 2024 - #24 by vgeorge

O deve necessariamente seguir o Working Group Conflict of Interest Policy - OpenStreetMap Foundation . Eu sou membro apenas desde o ano passado, então não acompanhei muitas pessoas novas entrando.

Na entrada de membros novos, o padrão é ter uma descrição curta (que fica registrada ata com acesso público) sobre cada membro. Uma das perguntas é sobre o que a pessoa trabalha e isso é colocado na ata.

Na mesma reunião que eu entrei, também entrou outro novo membro que trabalhava na TomTom. Creio que houve mais atenção a deixar anotado a filiação dele do que a minha

(Caso queiram saber sobre mim, podem ver no LinkedIn https://www.linkedin.com/in/fititnt/; eu não ganho dinheiro profissionalmente com OSM, e estou livre para explicar).

Curiosidade relacionada

O EWG é um caso curioso, porque depois do próprio OSMF Board, (que gerencia maior parte do dinheiro da OpenStreetMap Foundation) seria o EWG que tem que lidar com pequenos contratos. Então é super pertinente essa questão de conflito de interesse, e por padrão as pessoas evitam decisões em algo que possa gerar conflito.

Depois falo mais.

Nota: tem uma reunião daqui alguns minutos em OSMF Engineering Working Group meeting | OpenStreetMap Calendar então devo demorar um pouco para ler aqui

Interessante ter um membro BR no EWG. Poderia esclarecer 2 coisas?

1 - qual o papel exato dos membros do EWG (Sei que tem no site, mas lá dentro, o que você sente qual é a função exata de vocês)?

2 - como é feita a seleção dos membros? Você mencionou uma descrição da pessoa e que isso fica nas atas. Teria o teu exemplo de seleção, por gentileza? Eu procurei nas atas e não achei, mas deve ter em algum lugar mais fácil de se encontrar eu imagino.

Vamos por partes. Vou quebrar em mais de uma resposta.

Timeline

  • 2023-05-24: Meu primeiro contato foi como sugerido na página do EWG, enviar e-mail. Fiz isso em 2023-05-24. Meu e-mail foi longo. Fui convidado pra participar da próxima reunião
  • 2023-06-28: Essa foi primeira reunião que participei (como visitante). Não foi decidido sobre minha entrada ainda. Working Group Minutes/EWG 2023-06-28 - OpenStreetMap Foundation . Um dos topicos dessa reunião era ver se alguns membros inativos ainda tinham interesse de continuar.
  • 2023-07–12 Aqui foi quando fui aprovado Working Group Minutes/EWG 2023-07-12 - OpenStreetMap Foundation
    • The existing members voted unanimously to admit Emerson Rocha and Salim Baidoun to the Engineering Working Group. foi o texto.
      • Vou falar mais sobre isso depois, pois no meu caso não teve tanta descrição pública. E mesmo se tivesse, talvez não é algo de fácil acesso.

Texto do meu e-mail de pedido para ser membro do EWG

Hi, I'm Emerson Rocha, and would like to join the OSMF Engineering Working Group! I'm relatively new to OpenStreetMap compared to the average contributor, but in addition to my previous expertise, I've been heavily active since I joined and focused in particular on semantics and data interoperability. There are some of my accounts:

* https://github.com/fititnt
* https://www.openstreetmap.org/user/fititnt
* https://wiki.openstreetmap.org/wiki/User:EmericusPetro

Beyond obviously be willing to be focused on help do code and infra (even if as proof of concept for ideas you all know is possible but cannot bootstrap) I'm especially interested in help to write drafts of technical specifications (such as IETF, but I would recommend the https://github.com/w3c/respec formating, which is used by W3C et al, but is fantastic to work with citations of other works, and also is friendly to receive more hands editing) from what already exist today. I actually have some work to do data mining on the OSM Wiki as structured data (or at least anyone export tables and code snippets) which could be used to stimulate users beyond the infoboxes.

I read the past minutes of EWG, and on the coding part, I think I will try to seek more the intersection between specifications and proof of concepts or usable tools, not what typically would be outsourced to a dedicated project which requires some PR. Some things I worked on (in part influenced by the discussions related to Wikibase potential deprecarion and move the vocabulary "inside" the database):

1. I created a rudimentar python script to concert part (not all) OpenStreetMap XML in RDF, which can be used both as command line with local cache and as online proxy. Not tested for performance (because the idea was made flexible to think the schema, and strict RDF this can take time) but unless it overcomplicates, it is mostly a file conversion from output already created by the backend.
2. I created a command line tool (which also can be used as a proxy with local cache) to use any MediaWiki as file storage . It don't scrape page by page (but uses WikiMedia API) so up to 50 pages (500 if super admin) can be taken and then the tool either generate an JSON-LD with a friendly result of all pages or (for people just want files) simply a zip file with "extracted files". Things like tables are conveyed to CSV, inspired by the complaints that "Infovoxes could be parsed" as replacements of Wikibase, the tool also exposes them. Since OpenStreetMap is heavy recommended use the Wiki for document things, maybe with some extra edit (such as hint for filename of code snippets, of fix some syntaxhighlight blocks), this could allow (for example) save an entire page with code examples as files in a zip. The python package is wiki-as-base (see https://github.com/fititnt/wiki_as_base-py) (but might change the name if get serious; but Wikibase actually stores RDF like normal Wiki Pages, so this is just a bit generic use and without need to install as extension)
3. Despite quite new, I do have several code and schema-related repository related to OpenStreetMap. One of them is a Function As A Service with OpenFaaS (open code at https://github.com/fititnt/openstreetmap-serverless-functions and the one with Ansible to set up the host). The home page is at [https://osm-faas.etica.ai](https://osm-faas.etica.ai/) (not really open to the public yet). For example the wiki-as-base package beyond command can extract this Wiki page https://wiki.openstreetmap.org/wiki/User:EmericusPetro/sandbox/Wiki-as-base as parsed zip file at https://osm-faas.etica.ai/wiki-as-base/User:EmericusPetro/sandbox/Wiki-as-base.zip and it also allows get get all files from pages with a specific category (no pagination yet, so just fetch the first 50 pages and cache before serve to user)
4. (Using 2 to concert OSM Wiki to file exports) I believe is viable to even check syntax and validation for documentation on the OSM Wiki in a more generic way. For example, tag info parses Infoboxes, but my initial use case for it was XML Schema of OSM files and other RDF things which could strictly validate (or explain semantically) typical output of the API. In theory, this could allow users to write rules on Wikipedia (such as more complex checks, like allowed speed in a country) and compare with one output in production. But I think if this starts to get used, it would by a considerable time just be used to *validate rules that would validate rules*. Anyway, just assume that after Wiki is congested to files on disk, anything that could be the result of command line external tool (maybe even compiling) could be used as a pipeline, and we could even only update/publish a parsed version of data initially on Wiki if they're strictly validated.

I'm likely missing some things I have already done, but I'm general either my github in last 6 months or my OSM Wiki might give a hint, In addition to containers/virtualization, continuous integration etc, I'm mostly accostuned with Ansible, but could use Chief if friendly to others already running the OSM infra and then plan ahead the health checks.

I do have any kind conflicts of interest as my day job is not related at all with OSM ecosystem (mostly is keep servers online from few clients with significant number of users and also do PHP/CMS Joomla/Moodle code for them when need, so I'm mostly free to use rest of my time focus i projects that help others). And a trivia: my initial attention to OpenStreetMap was because I discovered it was used heavily in the humanitarian sector (often without explicitly acknowledging) and also it's query language is more flexible than SPARQL and all the tooling is very memory efficient. I was already perceiving that from an ontological point of view, both spatial and temporal are close to universal reference points compared to other forms of organized knowledge. On my last diary post comparing OSM to Wikidata/RDF didn't consider for example that "primary key" used on OpenStreetMap (location) and it's very realist approach of visualize knowledge (visually in a canvas) is easier for non-experts cooperate, while Wikidata still require high levels of knowledge and even then, it have clusters of how to taxonomize. I mean, several criticisms of Matheuz against Wikidata ontology organization are true, and it is only "easy" to import data on Wikidata because there's poor support for validation! Also, the density of knowledge inside OpenStreetMap dumps are far higher than Wikidata, so an hypothetical RDF version of OSM data expanded with full meaning explained by an structured version we could get from a subset of what's on the Wiki today would not fit any RDF triplestore or at least take weeks or months on initial import. It's not a random act from me starting as how to generalize extract information from the wiki in a way that others could see if is working or not, because even if not OWL (likely SCHACL is the side more useful from RDF world, not open-world assumption) would either by improving existing Infoboxes or, by documenting top level constraints (like maximum allowed maxspeed at world level, then overload by country, then explain the concept of types of vehicles, external variables like weather, etc) the wiki itself could allow validate concepts when compared to output of OSM data from API (or extracts of data dumps) such as better context that 200 (km/h) is not an allowed value for maxspeed. But if using maxspeed, sometimes it might appear as a zone:maxspeed=*, so it expands the value of maxspeed=* which might be just a literal value or vary depending on context.

If I need more context about me, I'm totally open to see how I could fit on EWG. To make it clear, I'm interested in doing all this pro bono publico, and I'm excited that EWG is attempting standardization between developers, and some things really are complicated to be paid, and I could do a lot of these side tasks. For example, there's some things like document/fix XML DTD (which today just exist on the wiki) , so existing tools could actually use these to validate output formats and also bring to the group suggestions to formalize (as in IANA Media Types, like Paul Norman done with vnd.openstreetmap.data+xml) initiatives like this one https://wiki.openstreetmap.org/wiki/Talk:Overpass_API/Overpass_QL#Recommended_file_extension? . That's it! Thanks!

Wainting,

Rocha

Olá, Emerson. Gostaria de entender melhor a discrepância entre a política sobre a descrição pública dos membros novos e a aplicação prática dela, especialmente no seu caso. É possível explicar por que isso aconteceu? Existe algum motivo específico para essa diferença? Além disso, seria interessante discutir se há planos para garantir uma aplicação mais consistente da política no futuro. A transparência e o acesso público às informações sobre os membros da nossa organização são aspectos importantes, e acredito que é fundamental garantir que todos estejam alinhados com esses princípios. Aguardo ansiosamente a sua resposta. Obrigado.

Sobre sugestões de adicionar mais informação sobre membro (descoberto por acaso ao perguntarem sobre mim)

Pronto. Sobre a questão de ter mais informações sobre mim no EWG, tem algo que em vez de tentar explicar, é mais fácil resolver. Enviei email interno no EWG propondo como ponto de pauta para próxima reunião o “Working Group Members should list employers, directorships, and other similar affiliations on the WG membership page if their organisation does business related to OpenStreetMap.” de https://osmfoundation.org/wiki/Working_Group_Conflict_of_Interest_Policy.

Eu não posso falar em nome do EWG, então nesse ponto melhor esperar até ata ser aprovada. Outra alternativa é quem tiver interesse aparecer na reunião ao vivo.

Quando o Matheus perguntou, eu já tinha reparado que nem a lista de nomes lista filiação (isso seria fácil achar, fica na página principal) nem na minha ata detalhava melhor sobre mim ou sobre o colega que entrou. Então já estava pensando em por como ponto de pauta.

Sobre a questão de porque minha ata (que teve duas entradas) ficou assim, creio que me lembro motivo: a pessoa voluntária que tipicamente escrevia as atas EWG estava de saída. Então ficou trocando as pessoas que faziam a ata, e demorou até ser eleito novo. E dependendo de quem faz as anotações, o nível de detalhe é diferente.

Não tem como alterar ata passada

Algo que eu não vou nem sugerir no EWG seria editar ata passada para adicionar informação faltando. O período para fazer isso é tipicamente até data de aprovação de atas (que costuma ser registrada também em ata que anterior foi aprovada).

PS.: Sobre outras perguntas (tenho que parar para responder com calma): Vou demorar um tempo para responder elas com calma. Por exemplo, a 1. do Matheus é bem filosófica, e a segunda eu não tenho tanta certeza se tenho informações relevantes além do que está em público.

Olá Emerson! A aprovação da ata apenas na reunião seguinte não permitiu que fosse fornecido o detalhamento adequado?