1 8 33

Qing-Guo Chen

cqgwin

AI & ML interests

None yet

Recent Activity

upvoted a collection about 1 month ago

Ovis2.6

updated a collection about 1 month ago

Ovis2.6

updated a model about 2 months ago

AIDC-AI/Ovis2.6-30B-A3B

View all activity

Organizations

upvoted a collection about 1 month ago

Ovis2.6

Collection

1 item • Updated Feb 13 • 4

updated a collection about 1 month ago

Ovis2.6

Collection

1 item • Updated Feb 13 • 4

updated a model about 2 months ago

AIDC-AI/Ovis2.6-30B-A3B

Image-Text-to-Text • 31B • Updated Feb 24 • 60.9k • 141

liked a model about 2 months ago

AIDC-AI/Ovis2.6-30B-A3B

Image-Text-to-Text • 31B • Updated Feb 24 • 60.9k • 141

liked a Space 4 months ago

Ovis Image 7B

🖼

Official demo for Ovis-Image

liked a model 4 months ago

AIDC-AI/Ovis-Image-7B

Text-to-Image • Updated Dec 10, 2025 • 600 • • 205

authored 14 papers 7 months ago

Ovis: Structural Embedding Alignment for Multimodal Large Language Model

Paper • 2405.20797 • Published May 31, 2024 • 32

Parrot: Multilingual Visual Instruction Tuning

Paper • 2406.02539 • Published Jun 4, 2024 • 36

Advancing Tool-Augmented Large Language Models: Integrating Insights from Errors in Inference Trees

Paper • 2406.07115 • Published Jun 11, 2024

Wings: Learning Multimodal LLMs without Text-only Forgetting

Paper • 2406.03496 • Published Jun 5, 2024

Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis

Paper • 2410.08261 • Published Oct 10, 2024 • 52

UNIC-Adapter: Unified Image-instruction Adapter with Multi-modal Transformer for Image Generation

Paper • 2412.18928 • Published Dec 25, 2024 • 1

PEMF-VVTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm

Paper • 2412.03021 • Published Dec 4, 2024 • 1

Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities

Paper • 2505.02567 • Published May 5, 2025 • 82

CHATS: Combining Human-Aligned Optimization and Test-Time Sampling for Text-to-Image Generation

Paper • 2502.12579 • Published Feb 18, 2025 • 1

MMCR: Advancing Visual Language Model in Multimodal Multi-Turn Contextual Reasoning

Paper • 2503.18533 • Published Mar 24, 2025

LPO: Towards Accurate GUI Agent Interaction via Location Preference Optimization

Paper • 2506.09373 • Published Jun 11, 2025

Qing-Guo Chen

AI & ML interests

Recent Activity

Organizations

cqgwin's activity

Ovis Image 7B