Vidore

company

https://github.com/illuin-tech/colpali

Activity Feed

AI & ML interests

Retrieval, Computer Vision, LLM

Recent Activity

paultltc authored a paper 8 days ago

LLaMa-SciQ: An Educational Chatbot for Answering Science MCQ

paultltc authored a paper 8 days ago

Enhancing Inflation Nowcasting with LLM: Sentiment Analysis on News

paultltc authored a paper 8 days ago

Apertus: Democratizing Open and Compliant LLMs for Global Language Environments

View all activity

vidore 's collections 11

ViDoRe Benchmark V3

ViDoRe V3 is our latest benchmark, engineered to set a new industry gold standard for multi-modal, enterprise document retrieval evaluation.

vidore/vidore_v3_hr

Viewer • Updated 17 days ago • 13.4k • 13k • 6
vidore/vidore_v3_finance_en

Viewer • Updated 17 days ago • 13.6k • 13.5k • 4
vidore/vidore_v3_industrial

Viewer • Updated 17 days ago • 16.7k • 13.2k • 3
vidore/vidore_v3_pharmaceuticals

Viewer • Updated 17 days ago • 14.9k • 13k • 1

ColPali Models

Pre-trained checkpoints for the ColPali model.

vidore/colpali-v1.3-merged

3B • Updated Aug 4, 2025 • 8
vidore/colpali-v1.3

Visual Document Retrieval • Updated Mar 14, 2025 • 34k • 84
vidore/colpali-v1.2-merged

Visual Document Retrieval • 3B • Updated Feb 5, 2025 • 7
vidore/colpali-v1.2

Visual Document Retrieval • Updated Mar 14, 2025 • 331k • 112

ColSmolVLM

Pre-trained checkpoints for the ColVision models with a ColSmolVLM backbone.

vidore/colSmol-500M

Visual Document Retrieval • Updated Mar 14, 2025 • 1.7k • 20
vidore/colSmol-256M

Visual Document Retrieval • Updated Mar 14, 2025 • 2.52k • 17

ViDoRe Benchmark

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the QA format.

vidore/arxivqa_test_subsampled

Viewer • Updated Jun 20, 2025 • 500 • 693 • 4
vidore/docvqa_test_subsampled

Viewer • Updated Jun 20, 2025 • 500 • 792 • 4
vidore/infovqa_test_subsampled

Viewer • Updated Jun 20, 2025 • 500 • 763 • 3
vidore/tabfquad_test_subsampled

Viewer • Updated Jun 20, 2025 • 280 • 756

ViDoRe Chunk OCR (baseline)

The ViDoRe benchmark was passed to Unstructured to partition each page into text chunks. Detected figures/tables were captioned with Claude 3-Sonnet.

vidore/arxivqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.44k • 43
vidore/docvqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.24k • 53
vidore/infovqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 2.78k • 44
vidore/tabfquad_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 636 • 35

ViDoRe Page OCR (artifact)

ViDoRe benchmark with the full OCR text of each page. ⚠️ This dataset serves a intermediate step → use "ViDoRe Chunk OCR (baseline)" for evaluation!

vidore/arxivqa_test_subsampled_tesseract

Viewer • Updated Jun 20, 2025 • 500 • 48
vidore/docvqa_test_subsampled_tesseract

Viewer • Updated Jun 20, 2025 • 500 • 40
vidore/infovqa_test_subsampled_tesseract

Viewer • Updated Jun 20, 2025 • 500 • 108
vidore/tabfquad_test_subsampled_tesseract

Viewer • Updated Jun 20, 2025 • 280 • 33

ViDoRe Benchmark v2

vidore/esg_reports_v2

Viewer • Updated Jul 2, 2025 • 2.91k • 18.5k • 1
vidore/biomedical_lectures_v2

Viewer • Updated Jul 2, 2025 • 3.74k • 17.6k
vidore/economics_reports_v2

Viewer • Updated Jul 2, 2025 • 4.32k • 17.4k
vidore/esg_reports_human_labeled_v2

Viewer • Updated Jul 2, 2025 • 1.72k • 17.5k

ColQwen2 Models

Pre-trained checkpoints for the ColQwen2 model.

vidore/colqwen2-v1.0-merged

Visual Document Retrieval • 2B • Updated Apr 16, 2025 • 18
vidore/colqwen2-v1.0

Visual Document Retrieval • Updated Jun 5, 2025 • 57.3k • 116
vidore/colqwen2-v0.1-merged

2B • Updated Mar 8, 2025 • 2
vidore/colqwen2-v0.1

Visual Document Retrieval • Updated Mar 21, 2025 • 80.2k • 193

Hf-native ColVision Models

Models that can be used with the native transformers 🤗 implementation instead of colpali-engine.

vidore/colqwen2-v1.0-hf

Visual Document Retrieval • 2B • Updated Jun 2, 2025 • 3.44k • 21
vidore/colpali-v1.3-hf

Visual Document Retrieval • 3B • Updated Apr 16, 2025 • 1.74k • 26
vidore/colpali-v1.2-hf

Visual Document Retrieval • 3B • Updated Apr 16, 2025 • 1.35k • 8
Sahil-Kabir/colqwen2.5-v0.2-hf

4B • Updated Sep 13, 2025 • 877

ViDoRe Benchmark (BEIR)

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the BEIR format.

vidore/arxivqa_test_subsampled_beir

Viewer • Updated Jun 20, 2025 • 1.5k • 7.84k • 1
vidore/docvqa_test_subsampled_beir

Viewer • Updated Jun 20, 2025 • 1.45k • 6.92k
vidore/infovqa_test_subsampled_beir

Viewer • Updated Jun 20, 2025 • 1.49k • 6.16k
vidore/tabfquad_test_subsampled_beir

Viewer • Updated Jun 20, 2025 • 630 • 5.72k

ColPali Paper Resources

Main resources for the paper: "ColPali: Efficient Document Retrieval with Vision Language Models"

ColPali: Efficient Document Retrieval with Vision Language Models

Paper • 2407.01449 • Published Jun 27, 2024 • 50
vidore/colpali

Visual Document Retrieval • Updated Nov 24, 2025 • 5.85k • 467
vidore/colpali_train_set

Viewer • Updated Jun 20, 2025 • 119k • 4.86k • 88
Running

192

Vidore Leaderboard

🥇

192

Browse and compare visual document retrieval models

ViDoRe Benchmark V3

ViDoRe V3 is our latest benchmark, engineered to set a new industry gold standard for multi-modal, enterprise document retrieval evaluation.

vidore/vidore_v3_hr

Viewer • Updated 17 days ago • 13.4k • 13k • 6
vidore/vidore_v3_finance_en

Viewer • Updated 17 days ago • 13.6k • 13.5k • 4
vidore/vidore_v3_industrial

Viewer • Updated 17 days ago • 16.7k • 13.2k • 3
vidore/vidore_v3_pharmaceuticals

Viewer • Updated 17 days ago • 14.9k • 13k • 1

ViDoRe Benchmark v2

vidore/esg_reports_v2

Viewer • Updated Jul 2, 2025 • 2.91k • 18.5k • 1
vidore/biomedical_lectures_v2

Viewer • Updated Jul 2, 2025 • 3.74k • 17.6k
vidore/economics_reports_v2

Viewer • Updated Jul 2, 2025 • 4.32k • 17.4k
vidore/esg_reports_human_labeled_v2

Viewer • Updated Jul 2, 2025 • 1.72k • 17.5k

ColPali Models

Pre-trained checkpoints for the ColPali model.

vidore/colpali-v1.3-merged

3B • Updated Aug 4, 2025 • 8
vidore/colpali-v1.3

Visual Document Retrieval • Updated Mar 14, 2025 • 34k • 84
vidore/colpali-v1.2-merged

Visual Document Retrieval • 3B • Updated Feb 5, 2025 • 7
vidore/colpali-v1.2

Visual Document Retrieval • Updated Mar 14, 2025 • 331k • 112

ColQwen2 Models

Pre-trained checkpoints for the ColQwen2 model.

vidore/colqwen2-v1.0-merged

Visual Document Retrieval • 2B • Updated Apr 16, 2025 • 18
vidore/colqwen2-v1.0

Visual Document Retrieval • Updated Jun 5, 2025 • 57.3k • 116
vidore/colqwen2-v0.1-merged

2B • Updated Mar 8, 2025 • 2
vidore/colqwen2-v0.1

Visual Document Retrieval • Updated Mar 21, 2025 • 80.2k • 193

ColSmolVLM

Pre-trained checkpoints for the ColVision models with a ColSmolVLM backbone.

vidore/colSmol-500M

Visual Document Retrieval • Updated Mar 14, 2025 • 1.7k • 20
vidore/colSmol-256M

Visual Document Retrieval • Updated Mar 14, 2025 • 2.52k • 17

Hf-native ColVision Models

Models that can be used with the native transformers 🤗 implementation instead of colpali-engine.

vidore/colqwen2-v1.0-hf

Visual Document Retrieval • 2B • Updated Jun 2, 2025 • 3.44k • 21
vidore/colpali-v1.3-hf

Visual Document Retrieval • 3B • Updated Apr 16, 2025 • 1.74k • 26
vidore/colpali-v1.2-hf

Visual Document Retrieval • 3B • Updated Apr 16, 2025 • 1.35k • 8
Sahil-Kabir/colqwen2.5-v0.2-hf

4B • Updated Sep 13, 2025 • 877

ViDoRe Benchmark

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the QA format.

vidore/arxivqa_test_subsampled

Viewer • Updated Jun 20, 2025 • 500 • 693 • 4
vidore/docvqa_test_subsampled

Viewer • Updated Jun 20, 2025 • 500 • 792 • 4
vidore/infovqa_test_subsampled

Viewer • Updated Jun 20, 2025 • 500 • 763 • 3
vidore/tabfquad_test_subsampled

Viewer • Updated Jun 20, 2025 • 280 • 756

ViDoRe Benchmark (BEIR)

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the BEIR format.

vidore/arxivqa_test_subsampled_beir

Viewer • Updated Jun 20, 2025 • 1.5k • 7.84k • 1
vidore/docvqa_test_subsampled_beir

Viewer • Updated Jun 20, 2025 • 1.45k • 6.92k
vidore/infovqa_test_subsampled_beir

Viewer • Updated Jun 20, 2025 • 1.49k • 6.16k
vidore/tabfquad_test_subsampled_beir

Viewer • Updated Jun 20, 2025 • 630 • 5.72k

ViDoRe Chunk OCR (baseline)

The ViDoRe benchmark was passed to Unstructured to partition each page into text chunks. Detected figures/tables were captioned with Claude 3-Sonnet.

vidore/arxivqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.44k • 43
vidore/docvqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.24k • 53
vidore/infovqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 2.78k • 44
vidore/tabfquad_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 636 • 35

ColPali Paper Resources

Main resources for the paper: "ColPali: Efficient Document Retrieval with Vision Language Models"

ColPali: Efficient Document Retrieval with Vision Language Models

Paper • 2407.01449 • Published Jun 27, 2024 • 50
vidore/colpali

Visual Document Retrieval • Updated Nov 24, 2025 • 5.85k • 467
vidore/colpali_train_set

Viewer • Updated Jun 20, 2025 • 119k • 4.86k • 88
Running

192

Vidore Leaderboard

🥇

192

Browse and compare visual document retrieval models

ViDoRe Page OCR (artifact)

ViDoRe benchmark with the full OCR text of each page. ⚠️ This dataset serves a intermediate step → use "ViDoRe Chunk OCR (baseline)" for evaluation!

vidore/arxivqa_test_subsampled_tesseract

Viewer • Updated Jun 20, 2025 • 500 • 48
vidore/docvqa_test_subsampled_tesseract

Viewer • Updated Jun 20, 2025 • 500 • 40
vidore/infovqa_test_subsampled_tesseract

Viewer • Updated Jun 20, 2025 • 500 • 108
vidore/tabfquad_test_subsampled_tesseract

Viewer • Updated Jun 20, 2025 • 280 • 33

AI & ML interests

Recent Activity

Team members 9

vidore 's collections 11

Vidore Leaderboard

Vidore Leaderboard

🎉 Free Image Generator Now Available!