Skip to content

zxbsmk/webnovel_cn

General NLPZH

Zxbsmk/webnovel_cn is a General NLP dataset in ZH from zxbsmk in Parquet format.

About zxbsmk/webnovel_cn

内容 包含从12560本网文提取的约21.7M条可用于训练小说生成的中文指令数据(novel_json_tokens512.zip)。下载链接:https://pan.baidu.com/s/1TorBMbrqxrn6odRF0PJBVw 提取码:jlh3 以及从中提取出的包含50k条数据的子集(novel_cn_token512_50k.json)。其中输入和输出都不多于 512 tokens。 样例 在原有小说文本基础上,依据下列五种指令生成数据。 其中,...

Details

Task
General NLP
Language
ZH
Format
Parquet
Rows / instances
N/A
Creator
zxbsmk
Year
2023
Download

Related General NLP datasets

FAQ