MU-NLPC/czech_korpus_kala
Text ClassificationCS
Created by MU-NLPC at 2026, the MU-NLPC/czech_korpus_kala is a text classification dataset in CS in Parquet format.
About MU-NLPC/czech_korpus_kala
Czech Authorship Recognition Corpus (Kala)
Popis datasetu
Tento dataset byl vytvořen v rámci diplomové práce zaměřené na automatické rozpoznání autorství českých textů. Obsahuje české publicistické texty získané z veřejně dostupn...
Details
- Task
- Text Classification
- Language
- CS
- Format
- Parquet
- Rows / instances
- N/A
- Creator
- MU-NLPC
- Year
- 2026