Question 1

What is the deepcs233/Visual-CoT dataset?

Accepted Answer

VisCoT Dataset Card

There is a shortage of multimodal datasets for training multi-modal large language models (MLLMs) that require to identify specific regions in an image for additional attention to improve response performance. This type of...

Question 2

Is deepcs233/Visual-CoT a benchmark?

Accepted Answer

deepcs233/Visual-CoT is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download deepcs233/Visual-CoT?

Accepted Answer

deepcs233/Visual-CoT is available at its source: https://huggingface.co/datasets/deepcs233/Visual-CoT.

Question 4

What license is deepcs233/Visual-CoT released under?

Accepted Answer

deepcs233/Visual-CoT is distributed under the apache-2.0 license.

deepcs233/Visual-CoT

About deepcs233/Visual-CoT

Details

Related Image Text To Text datasets

FAQ