kunishou/J-ResearchCorpus
General NLPJABenchmark
The kunishou/J-ResearchCorpus dataset is a JA General NLP resource from kunishou at 2024.
📊 This dataset is used as an LLM benchmark. See model leaderboards →
About kunishou/J-ResearchCorpus
J-ResearchCorpus
Update:
2024/3/16言語処理学会第30回年次大会(NLP2024)を含む、論文 1,343 本のデータを追加
2024/2/25言語処理学会誌「自然言語処理」のうち CC-BY-4.0 で公開されている論文 360 本のデータを追加
概要
CC-BY-* ライセンスで公開されている日本語論文や学会誌等から抜粋した高品質なテキストのデータセットです。言語モデルの事前学習や RAG 等でご活用下さい。
今後も...
Details
- Task
- General NLP
- Language
- JA
- Format
- Parquet
- Rows / instances
- N/A
- Creator
- kunishou
- Year
- 2024