Os acórdãos do Tribunal de Contas da União (TCU) são as decisões do órgão colegiado do tribunal. Assim, devido a repercusão geral desses acórdãos, decidi programar um crawler para coletar esses dados a partir do portal do TCU. O conteúdo do dataset diz respeito aos acórdãos entre os anos de 1992 até 30/08/2019.

Ao contrário da base original onde são apresentados os números de CPF em sua íntegra, o presente trabalho decidiu inserir uma máscara em toda ocorrência de CPF. Assim, estes possuem os 3 primeiros e os dois últimos dígitos mascarados, tratamento idêntico ao adotado pelo Portal da Transparência do Executivo Federal.

O dataset está publicado no kaggle :

Além disso, caso tenham interesse no código de coleta dos dados o repositório é o:

E aí gostaram? Comente aí ou deixe alguma sugestão!