Skip to content

YeungNLP/firefly-train-1.1M

General NLPEnglish

The YeungNLP/firefly-train-1.1M dataset is a English General NLP resource from YeungNLP at 2023.

About YeungNLP/firefly-train-1.1M

本数据应用于项目:Firefly(流萤): 中文对话式大语言模型 ,训练后得到的模型firefly-1b4 如果您觉得此数据集对您有帮助,请like此数据集并在Github项目中star我们。 我们收集了23个常见的中文数据集,对于每个任务,由人工书写若干种指令模板,保证数据的高质量与丰富度,数据量为115万 。数据分布如下图所示: 每条数据的格式如下,包含任务类型、输入、目标输出: { "kind": "ClassicalChinese", "input": "将下面句子翻译...

Details

Task
General NLP
Language
English
Format
Parquet
Rows / instances
N/A
Creator
YeungNLP
Year
2023
Download

Related General NLP datasets

FAQ