wdndev/webnovel-chinese
Text GenerationZH
The wdndev/webnovel-chinese dataset is a ZH text generation resource from wdndev at 2024.
About wdndev/webnovel-chinese
简介
搜集网络上的网文小说,清洗,分割后,用于训练大语言模型,共计9000本左右,大约9B左右token。
使用
格式说明
采用jsonl格式存储,分为三个字段:
title :小说名称
chapter:章节
text:正文内容
示例:
{"title": "斗破苍穹", "chapter": " 第一章 陨落的天才", "text": "“斗之力,三段!”\n望着测验魔石碑上面闪亮得甚至有些刺眼的五个大字,少年面无表情,唇角有着一抹自...
Details
- Task
- Text Generation
- Language
- ZH
- Format
- Parquet
- Rows / instances
- N/A
- Creator
- wdndev
- Year
- 2024