Skip to content

izumi-lab/llm-japanese-dataset-vanilla

General NLPJAcc-by-sa-4.0

Created by izumi-lab at 2023, the izumi-lab/llm-japanese-dataset-vanilla is a General NLP dataset in JA in Parquet format. With 159 downloads and 33 likes, it is actively used by the community. It is released under the cc-by-sa-4.0 license and is a 1M<n<10M-scale dataset.

About izumi-lab/llm-japanese-dataset-vanilla

llm-japanese-dataset-vanilla LLM構築用の日本語チャットデータセット izumi-lab/llm-japanese-dataset から,日英翻訳のデータセット等を抜いたものです. 主に,日本語LLMモデルなどに対して,チャット(Instruction)応答タスクに関してLoRAなどでチューニングするために使用できます. ※様々な公開言語資源を利用させていただきました.関係各位にはこの場を借りて御礼申し上げます. データの詳細 デー...

Details

Task
General NLP
Language
JA
Format
Parquet
Rows / instances
N/A
Size
1M<n<10M
Creator
izumi-lab
Year
2023
License
cc-by-sa-4.0
Downloads
159
Likes
33
Download Homepage

Related General NLP datasets

FAQ