Question 1

What is the vidore/colpali_train_set dataset?

Accepted Answer

Dataset Description

This dataset is the training set of ColPali it includes 127,460 query-image pairs from both openly available academic datasets (63%) and a synthetic dataset made up 
of pages from web-crawled PDF documents and augmented with...

Question 2

Is vidore/colpali_train_set a benchmark?

Accepted Answer

vidore/colpali_train_set is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download vidore/colpali_train_set?

Accepted Answer

vidore/colpali_train_set is available at its source: https://huggingface.co/datasets/vidore/colpali_train_set.

vidore/colpali_train_set

About vidore/colpali_train_set

Details

FAQ