Question 1

What is the mlfoundations/MINT-1T-HTML dataset?

Accepted Answer

🍃 MINT-1T:Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset with One Trillion Tokens

🍃 MINT-1T is an open-source Multimodal INTerleaved dataset with 1 trillion text tokens and 3.4 billion images, a 10x scale-up from existing op...

Question 2

Is mlfoundations/MINT-1T-HTML a benchmark?

Accepted Answer

mlfoundations/MINT-1T-HTML is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download mlfoundations/MINT-1T-HTML?

Accepted Answer

mlfoundations/MINT-1T-HTML is available at its source: https://huggingface.co/datasets/mlfoundations/MINT-1T-HTML.

mlfoundations/MINT-1T-HTML

About mlfoundations/MINT-1T-HTML