Skip to content

kunishou/J-ResearchCorpus

General NLPJABenchmark

The kunishou/J-ResearchCorpus dataset is a JA General NLP resource from kunishou at 2024.

📊 This dataset is used as an LLM benchmark. See model leaderboards →

About kunishou/J-ResearchCorpus

J-ResearchCorpus Update: 2024/3/16言語処理学会第30回年次大会(NLP2024)を含む、論文 1,343 本のデータを追加 2024/2/25言語処理学会誌「自然言語処理」のうち CC-BY-4.0 で公開されている論文 360 本のデータを追加 概要 CC-BY-* ライセンスで公開されている日本語論文や学会誌等から抜粋した高品質なテキストのデータセットです。言語モデルの事前学習や RAG 等でご活用下さい。 今後も...

Details

Task
General NLP
Language
JA
Format
Parquet
Rows / instances
N/A
Creator
kunishou
Year
2024
Download

Related General NLP datasets

FAQ