Skip to content

YeungNLP/moss-003-sft-data

General NLPEnglish

YeungNLP/moss-003-sft-data is a General NLP-focused dataset in English distributed in Parquet format.

About YeungNLP/moss-003-sft-data

moss-003-sft-data 本数据集可用于中文多轮对话指令微调,包含110万中英文多轮对话数据。该数据集来自MOSS项目 中的moss-003-sft-data数据集。 在原数据集的基础上,我们去除了冗余信息,仅提取出有效的对话信息,并且调整数据格式,以便在训练中更加灵活地组织数据格式。更多详细信息,可参考MOSS项目介绍。 本数据集为jsonl格式,每行为一个多轮对话数据,格式如下: { "conversation_id":1, "category":"Br...

Details

Task
General NLP
Language
English
Format
Parquet
Rows / instances
N/A
Creator
YeungNLP
Year
2023
Download

Related General NLP datasets

FAQ