ITD - Dataset de Acordãos do STF de 2010 a 2018
Text CorporaPortuguese
The ITD - Dataset de Acordãos do STF de 2010 a 2018 dataset is a Portuguese text corpora resource.
About ITD - Dataset de Acordãos do STF de 2010 a 2018
A base Iudicium Textum Dataset (ITD), contêm os textos extraídos dos Acórdãos do Supremo Tribunal Federal de 2010 a 2018. Os textos estão separados por seção, com os votos e os relatórios identificados por autor (ministro). O texto original também foi mantido de forma integral e as partes envolvidas, em grande parte, estão identificadas. Os dados estão organizados em um arquivo json, podendo ser importado para um banco MongoDB. Junto com a base, estão disponíveis também os arquivos pdfs originais, bem como as ferramentas e os códigos que foram utilizados para download, extração e conversão dos dados que compõem o dataset
Details
- Task
- Text Corpora
- Language
- Portuguese
- Format
- Text
- Rows / instances
- n/a