Skip to content

MarkrAI/KoCommercial-Dataset

General NLPKO

Created by MarkrAI at 2024, the MarkrAI/KoCommercial-Dataset is a General NLP dataset in KO in Parquet format.

About MarkrAI/KoCommercial-Dataset

SSL 데이터 생성을 위한 코드 공개 SSL 데이터 생성용 Github Repo NIA와 AI-Hub와의 저작권 협의 하에, 조금 혼선이 생긴것 죄송합니다. 이에 기존에 저희가 code베이스로 SSL 데이터를 생성했던 코드를 그대로 공개드립니다. 다만, 이 과정에서는 저희 이후 파이프라인인, 자체 로컬 모델을 가지고 필터링하거나 수정하는 과정이 없어, 어느정도 감안을 해주시면 감사하겠습니다. 코드는 누구나 사용하실 수 있고 ...

Details

Task
General NLP
Language
KO
Format
Parquet
Rows / instances
N/A
Creator
MarkrAI
Year
2024
Download

Related General NLP datasets

FAQ