YeungNLP/moss-003-sft-data
General NLPEnglish
YeungNLP/moss-003-sft-data is a General NLP-focused dataset in English distributed in Parquet format.
About YeungNLP/moss-003-sft-data
moss-003-sft-data
本数据集可用于中文多轮对话指令微调,包含110万中英文多轮对话数据。该数据集来自MOSS项目 中的moss-003-sft-data数据集。
在原数据集的基础上,我们去除了冗余信息,仅提取出有效的对话信息,并且调整数据格式,以便在训练中更加灵活地组织数据格式。更多详细信息,可参考MOSS项目介绍。
本数据集为jsonl格式,每行为一个多轮对话数据,格式如下:
{
"conversation_id":1,
"category":"Br...
Details
- Task
- General NLP
- Language
- English
- Format
- Parquet
- Rows / instances
- N/A
- Creator
- YeungNLP
- Year
- 2023