jojo0217/korean_safe_conversation
Text GenerationKOapache-2.0
Created by jojo0217 at 2024, the jojo0217/korean_safe_conversation is a text generation dataset in KO in Parquet format. With 254 downloads and 58 likes, it is actively used by the community. It is released under the apache-2.0 license and is a 10K<n<100K-scale dataset.
About jojo0217/korean_safe_conversation
개요
성균관대 - VAIV COMPANY 산학협력을 위해 구축한 일상대화 데이터입니다.
자연스럽고 윤리적인 챗봇 구축을 위한 데이터셋 입니다.
고품질을 위해 대부분의 과정에서 사람이 직접 검수하였으며생성 번역 등의 과정에서는 GPT3.5-turbo, GPT4를 사용하였습니다.
일상대화에 중점을 두면서혐오표현, 편향적인 대답을 지양하면서 일상대화를 하는 것에 중점을 두었습니다.
데이터 구축 과정
...
Details
- Task
- Text Generation
- Language
- KO
- Format
- Parquet
- Rows / instances
- N/A
- Size
- 10K<n<100K
- Creator
- jojo0217
- Year
- 2024
- License
- apache-2.0
- Downloads
- 254
- Likes
- 58