MarkrAI/KoCommercial-Dataset
General NLPKO
Created by MarkrAI at 2024, the MarkrAI/KoCommercial-Dataset is a General NLP dataset in KO in Parquet format.
About MarkrAI/KoCommercial-Dataset
SSL 데이터 생성을 위한 코드 공개
SSL 데이터 생성용 Github Repo
NIA와 AI-Hub와의 저작권 협의 하에, 조금 혼선이 생긴것 죄송합니다.
이에 기존에 저희가 code베이스로 SSL 데이터를 생성했던 코드를 그대로 공개드립니다.
다만, 이 과정에서는 저희 이후 파이프라인인, 자체 로컬 모델을 가지고 필터링하거나 수정하는 과정이 없어, 어느정도 감안을 해주시면 감사하겠습니다.
코드는 누구나 사용하실 수 있고 ...
Details
- Task
- General NLP
- Language
- KO
- Format
- Parquet
- Rows / instances
- N/A
- Creator
- MarkrAI
- Year
- 2024