Question 1

What is the nvidia/OCR-Synthetic-Multilingual-v1 dataset?

Accepted Answer

OCR-Synthetic-Multilingual-v1

Dataset Description

Large-scale synthetically generated OCR training dataset for multilingual text detection and recognition. The data was produced using a heavily modified and extended version o...

Question 2

Is nvidia/OCR-Synthetic-Multilingual-v1 a benchmark?

Accepted Answer

nvidia/OCR-Synthetic-Multilingual-v1 is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download nvidia/OCR-Synthetic-Multilingual-v1?

Accepted Answer

nvidia/OCR-Synthetic-Multilingual-v1 is available at its source: https://huggingface.co/datasets/nvidia/OCR-Synthetic-Multilingual-v1.

nvidia/OCR-Synthetic-Multilingual-v1

About nvidia/OCR-Synthetic-Multilingual-v1

Details

Related Object Detection, Image To Text datasets

FAQ