zxbsmk/webnovel_cn
General NLPZH
Zxbsmk/webnovel_cn is a General NLP dataset in ZH from zxbsmk in Parquet format.
About zxbsmk/webnovel_cn
内容
包含从12560本网文提取的约21.7M条可用于训练小说生成的中文指令数据(novel_json_tokens512.zip)。下载链接:https://pan.baidu.com/s/1TorBMbrqxrn6odRF0PJBVw
提取码:jlh3
以及从中提取出的包含50k条数据的子集(novel_cn_token512_50k.json)。其中输入和输出都不多于 512 tokens。
样例
在原有小说文本基础上,依据下列五种指令生成数据。
其中,...
Details
- Task
- General NLP
- Language
- ZH
- Format
- Parquet
- Rows / instances
- N/A
- Creator
- zxbsmk
- Year
- 2023