Veja como o movimento AzMina utiliza dados governamentais abertos para monitorar projetos de lei relacionados com violência de gênero
Talvez você já tenha se deparado com uma notícia em um grande jornal dizendo que “hoje” ou “nesta semana” será votado no Congresso Nacional um projeto de lei superimportante que é um grande retrocesso ou um enorme avanço em um tema que é do seu interesse. A notícia é urgente, mas justamente por isso, agora você tem pouco a fazer a não ser esperar o resultado – sobrou pouco tempo para mobilizar parlamentares ou a opinião pública. Isso aconteceu com a gente muitas vezes antes de, enfim, quebrarmos a cabeça para pensar em como tornar o monitoramento legislativo mais acessível. E a resposta foi: com tecnologia aberta, é claro.
AzMina é uma organização não-governamental que, desde 2015, une jornalismo, tecnologia e advocacy para combater os diferentes tipos de violência de gênero. E muitas dessas violências, sabemos, são estruturais e já começam na legislação – aquela que é feita majoritariamente por homens brancos, cis, héteros etc. Estar ciente do que está tramitando no Congresso e sobre quem está agindo contra ou a favor dos nossos interesses é primordial para garantir nossa capacidade de incidência e mobilização no debate. Em resumo, para que não legislem sobre a gente sem a gente.
Esse monitoramento, no entanto, não é banal. São dezenas de projetos de lei protocolados todos os dias sobre os mais diversos temas, fora aqueles que estão tramitando há tempos e se movimentam entre comissões, relatórios, diferentes plenários etc. É humanamente impossível, ou ao menos muito custoso, tentar fazer esse levantamento manualmente. Mas, em 2019, começamos a pensar em como o acesso aos dados abertos da Câmara dos Deputados e do Senado Federal poderiam ajudar a automatizar esse processo, e assim surgiu o Elas no Congresso, plataforma de monitoramento legislativo sobre gênero do Instituto AzMina[1].
Criando nosso monitoramento diário
Tanto a Câmara quanto o Senado possuem um robusto serviço de dados abertos. Como o próprio site da Câmara dos Deputados diz, esses serviços “permitem que o cidadão possa obter informações mesmo sem se identificar, sem apresentar um requerimento formal de acesso a elas, e sem precisar ir pessoalmente ao órgão público”. Na prática, você consegue acessar dados sobre projetos de leis, parlamentares, votações etc., de maneira bem simples.
As casas legislativas disponibilizam APIs, aplicações que permitem que, com o preenchimento de determinados parâmetros, você peça a elas os dados que te interessam. Hoje, nos sites da Câmara e do Senado, há conjuntos de APIs com informações sobre os blocos parlamentares; os dados e histórico de deputadas e deputados; dados sobre eventos específicos; frentes parlamentares; legislaturas anteriores; votações; partidos; lideranças da Casa; e, dentre outros, o que mais nos interessa neste artigo: proposições. Esse conjunto compila uma série de dados sobre projetos de leis, requerimentos e outros tipos de propostas que podem ser apresentadas por agentes do poder público: autoria, temas, ementas, tramitações etc. Neste artigo, usaremos como exemplo a API da Câmara dos Deputados.
Imagem da API de proposições dos Dados Abertos da Câmara dos Deputados. Fonte: Dados Abertos da Câmara dos Deputados
Para nosso monitoramento diário do Congresso, o primeiro passo do código do Elas no Congresso foi buscar informações sobre projetos de lei que tratam de temas de gênero e estão tramitando no legislativo. Esse é um exemplo das respostas que essa API pode nos dar se preenchermos corretamente os parâmetros que nos interessam:
<xml>
<dados>
<proposicao_>
<id>15876</id>
<uri>https://dadosabertos.camara.leg.br/api/v2/proposicoes/15876</uri>
<siglaTipo>PL</siglaTipo>
<codTipo>139</codTipo>
<numero>795</numero>
<ano>1999</ano>
<ementa>Estabelece norma para o envio de acordos internacionais sujeitos a referendo do Congresso Nacional.</ementa>
</proposicao_>
<proposicao_>
<id>106587</id>
<uri>https://dadosabertos.camara.leg.br/api/v2/proposicoes/106587</uri>
<siglaTipo>PL</siglaTipo>
<codTipo>139</codTipo>
<numero>342</numero>
<ano>2003</ano>
<ementa>Altera a redação do Capítulo II do Título II, arts. 57 a 73, da Consolidação das Leis do Trabalho.</ementa>
</proposicao_>
<href>https://dadosabertos.camara.leg.br/api/v2/proposicoes?ordem=ASC&ordenarPor=id</href>
</link>
<link>
<rel>next</rel>
<href>https://dadosabertos.camara.leg.br/api/v2/proposicoes?ordem=ASC&ordenarPor=id&pagina=2&itens=15</href>
</link>
<link>
<rel>first</rel>
<href>https://dadosabertos.camara.leg.br/api/v2/proposicoes?ordem=ASC&ordenarPor=id&pagina=1&itens=15</href>
</link>
<link>
<rel>last</rel>
<href>https://dadosabertos.camara.leg.br/api/v2/proposicoes?ordem=ASC&ordenarPor=id&pagina=704&itens=15</href>
</link>
</links>
</xml>
O primeiro parâmetro que preenchemos é o da data. No nosso monitoramento diário e em tempo real, interessam essencialmente projetos que tiveram tramitação entre ontem (dataInicio) e hoje (dataFim). Com esse parâmetro preenchido, fazemos a requisição via requests em Python e recebemos como respostas os dados de todas as proposições que tramitaram no último dia, mas são apenas aquelas que tratam de gênero as que nos interessa. Isso posto, buscamos na <ementa> dessas proposições uma série de palavras-chave, termos e expressões previamente estabelecidos. São palavras como “feminicídio”, “aborto”, “violência doméstica”, “creches”, “mulheres negras”, dentre outras dezenas, que se referem a propostas com potencial impacto na vida das mulheres, meninas e pessoas LGBTQIAP+.
Depois, colhemos dados específicos dessas propostas: o tipo de projeto de lei, número e ano, nos campos <siglaTipo>, <numero> e <ano>; <autor>, ou de quem é a autoria do projeto; qual o link de acesso ao inteiro-teor do projeto no campo <uri>, e de quando e qual é o seu último status de tramitação e situação – em que etapa do processo legislativo ele se encontra -, nos campos <‘descricaoTramitacao’> e <‘descricaoSituacao’>. Também agrupamos as palavras-chave do nosso interesse em temas. Com essas informações, criamos textos como esse: “CÂMARA: PL 853/2019, de autoria de Sâmia Bomfim, fala sobre gravidez e sofreu alterações em sua tramitação. Tramitação: Designação de Relator. Situação: Aguardando Parecer.”
Já seria incrível se esses textos chegassem aos olhos da equipe de jornalistas que produz informações sobre esses temas na Revista AzMina. Mas a intenção do Elas no Congresso é justamente democratizar o acesso a esse monitoramento. Por isso, desde 2020, a última parte do nosso código utiliza a API do Twitter para postar esses textos no perfil @elasnocongresso.
Imagem dos tuítes no perfil do Elas no Congresso. Fonte: Twitter @elasnocongresso
Isso era ótimo, porque bastava você seguir nossa robô para receber esses alertas. Mas, infelizmente, com as atuais mudanças na plataforma, a automatização dos tuítes ficou impossível e abandonamos essa publicação no final de junho de 2023. O monitoramento continua acontecendo, e é o que dá embasamento à newsletter semanal que enviamos aos assinantes com os bastidores do Congresso, mas estamos construindo outra ferramenta que o deixe público e acessível a todes.
Criando um ranking de parlamentares
Mas esse não é o único monitoramento que o Elas no Congresso faz. Para mapear de fato quem trabalha a favor ou contra os temas de gênero, fazemos uma análise qualitativa dos projetos sobre o tema criados em certo espaço de tempo, a fim de ranquear os parlamentares de acordo com a qualidade das propostas apresentadas. Atualmente, estão disponíveis em nosso site as avaliações dos projetos criados entre 2019 e 2022, na última legislatura completa do Congresso Nacional. Para isso, mais uma vez procuramos palavras-chave nas ementas dos projetos, mas dessa vez, olhamos a data de criação dos projetos (<dataApresentacao>), filtrando apenas aqueles que estão dentro do período que nos interessa.
Depois, pedimos à API informações sobre autoria, ementa e outros dados biográficos desses projetos de lei. São essas informações que disponibilizamos às 19 organizações que avaliam as proposições em duas escalas binárias: se eles são favoráveis ou desfavoráveis aos direitos das mulheres, e se são muito ou pouco relevantes na agenda de gênero. Essa análise é primordial para o processo de atribuição de notas ao projeto e aos seus autores que veremos adiante. Também utilizamos as APIs para colher dados sobre os parlamentares do Congresso: a que partidos são filiados, qual estado representam, se são homens ou mulheres etc.
Na prática, a nota de cada parlamentar depende da pontuação dos projetos com os quais ela/ele e seu partido estiveram envolvidos e da pontuação geral da legenda. Essas pontuações podem ser por autoria ou por votação em projetos propostos por outros parlamentares, mas, como nos últimos anos as votações nominais sobre gênero foram poucas, apenas as notas de autoria compõem o ranking atual.
Cada proposta recebe uma pontuação, que vai de -2 a 2, de acordo com sua relevância e seu posicionamento em relação aos direitos das mulheres, como explicamos acima. A nota parcial de cada parlamentar considera a soma das pontuações dos projetos de sua autoria e a pontuação média do seu partido (a média aritmética de todos os parlamentares do partido).
Supondo que não haja informação sobre a nota do parlamentar, assume-se que sua nota é equivalente à média do seu partido. Chegamos à pontuação parcial ajustando essa estimativa após verificar sua nota real e considerando, além da média e variância dentro do partido, a quantidade de proposições que compõem a nota do parlamentar.
Veja aqui dois exemplos:
Como se trata de um ranking, as notas precisam ser comparáveis. Por isso, padronizamos a pontuação parcial considerando a pontuação máxima e mínima de todos os parlamentares, em uma escala de -100 a +100. Essa nota é uma proporção sobre o valor máximo (no caso de pontuações positivas) ou sobre o valor mínimo (no caso de pontuações negativas) entre as pontuações parciais de todos os parlamentares. Ou seja, as referências são sempre a pontuação máxima (a/o parlamentar que acumulou mais pontos positivos) e a pontuação mínima (a/o parlamentar que acumulou mais pontos negativos).
Veja aqui os exemplos:
É importante pontuar que esse cálculo mudou do longo do tempo. Em determinado momento percebemos, por exemplo, que a média do partido do parlamentar é importante para a composição de sua nota, assim como a variância da atuação da sigla. Mesmo que ele tenha um bom posicionamento em relação aos direitos das mulheres, estar em uma legenda que não trabalha por nós diz bastante sobre seus interesses políticos e atuação.
Notas calculadas, temos então nosso ranking de parlamentares – dos maiores aliados aos maiores inimigos dos direitos das mulheres. Em nosso site, é possível visualizá-lo de diferentes maneiras e utilizar distintos filtros para isso.
Imagem do ranking do Elas no Congresso. Fonte: Elas no Congresso
Todas essas análises embasaram dezenas de reportagens que estão disponíveis no site elasnocongresso.com.br e contam a história de como o legislativo brasileiro trata os direitos das mulheres. Descobrimos, por exemplo, que 1 em cada 4 projetos de lei sobre gênero criados entre 2019 e 2022 é desfavorável às mulheres e que são as parlamentares as principais responsáveis por pautar nossos interesses e de maneira favorável – a maioria dos homens não está interessada nessa luta.
Além disso, nosso monitoramento diário e nossa newsletter semanal subsidiam estratégias de advocacy, incidência e mobilização de diferentes organizações da sociedade civil, além da imprensa e da opinião pública.
Dados abertos
Como é possível perceber, nada disso seria possível se os dados públicos do processo legislativo não fossem abertos. E quando dizemos “dados governamentais abertos“, estamos falando daqueles conceituados como completos, primários, atuais, com acesso não discriminatório, acessíveis, em formatos não-proprietários, processáveis por máquina e livres de licenças.
Seria inconcebível para nós, portanto, que essa base de dados que construímos com tanto cuidado também não fosse aberta e acessível. Por isso, em nosso site é possível fazer o download da base de dados de projetos de lei utilizada na construção do ranking.
O código-fonte do nosso monitoramento também está disponível no Github do Instituto AzMina e já deu origem a outros projetos: o Núcleo Jornalismo, por exemplo, hoje monitora projetos de lei sobre regulação de plataformas; enquanto a Associação Brasileira de Jornalismo Investigativo (Abraji) monitorou por um tempo os projetos de lei que tratavam de jornalismo. Foi esse poder de replicabilidade que saltou aos olhos do júri quando fomos agraciadas com o Prêmio Cláudio Weber Abramo de Jornalismo de Dados em 2020. O Elas no Congresso também foi um dos indicados na categoria Inovação do Prêmio de Jornalismo Gabriel García Márquez, o Gabo.
Mas nossa grande vitória é ter conseguido traduzir nesses últimos quatro anos o processo legislativo e seu impacto no dia a dia das mulheres. Esperamos que esse monitoramento, que une ciência de dados, estatística, design e jornalismo, permita que diferentes atores da sociedade possam se mobilizar e se fazerem ouvidos pelos representantes do poder público quando o tema é a vida das mulheres.
Notas de rodapé
[1] Desde 2015 o Instituto AzMina tem a missão de promover a equidade de gênero por meio da informação e da educação, considerando especificidades de raça, classe e orientação sexual. Fazemos isso usando comunicação, tecnologia e educação para lutar pelos direitos das mulheres.
Autora Bárbara Libório, diretora de conteúdo do Instituto AzMina Jornalista especializada em investigação e dados. É diretora de conteúdo do Instituto AzMina, coordenadora do MBA em Jornalismo de Dados do IDP (Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa) e fundadora da Épicos Data. Foi editora do Aos Fatos, da Época e do Canal Meio. Como repórter, passou por IstoÉ, iG e Folha de S.Paulo. É mestre pelo Programa de Pós-Graduação em Mídias Criativas da Universidade Federal do Rio de Janeiro e doutoranda em Comunicação na Universidade Metodista de São Paulo. Ganhou prêmios internacionais como o Prêmio de Jornalismo Gabriel García Márquez e nacionais como o Cláudio Weber Abramo de Jornalismo de Dados. Renata Hirota, estatística e jornalista de dados Estatística e jornalista de dados, formada na ECA-USP e no IME-USP. Lida com dados desde 2017 e atualmente trabalha na Associação Brasileira de Jurimetria, onde faz pesquisas quantitativas na área do Direito. Colabora também com o Núcleo Jornalismo, onde trabalha com análises de dados e desenvolvimento de ferramentas para jornalistas, além de outros projetos jornalísticos. Faz parte da comunidade R-Ladies São Paulo, que promove a diversidade de gênero na comunidade da linguagem de programação R. Revisora Luciana Fleury, jornalista
Este conteúdo faz parte da PrograMaria Sprint Dados: ampliando as fronteiras.
Gratidão por tanta informação