izumi-lab/llm-japanese-dataset
General NLPJAcc-by-sa-4.0
Created by izumi-lab at 2023, the izumi-lab/llm-japanese-dataset is a General NLP dataset in JA in Parquet format. With 483 downloads and 142 likes, it is actively used by the community. It is released under the cc-by-sa-4.0 license and is a 1M<n<10M-scale dataset.
About izumi-lab/llm-japanese-dataset
llm-japanese-dataset
LLM構築用の日本語インストラクション(チャット)データセット
主に,英語で構築されたLLMモデルなどに対して,チャット(Instruction)応答タスクに関してLoRAなどでチューニングするために使用できます.
※様々な公開言語資源を利用させていただきました.関係各位にはこの場を借りて御礼申し上げます.
updates
2023/5/15にAlpaca datasetがNCにライセンス変更されたことに対応し,安心して...
Details
- Task
- General NLP
- Language
- JA
- Format
- Parquet
- Rows / instances
- N/A
- Size
- 1M<n<10M
- Creator
- izumi-lab
- Year
- 2023
- License
- cc-by-sa-4.0
- Downloads
- 483
- Likes
- 142