Jingkang Yang's picture

Jingkang Yang

Jingkang

·

https://jingkang50.github.io/

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

Sparse Mixture-of-Experts are Domain Generalizable Learners

authored a paper 1 day ago

Unsolvable Problem Detection: Evaluating Trustworthiness of Vision Language Models

authored a paper 1 day ago

LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models

View all activity

Organizations

authored 16 papers 1 day ago

Sparse Mixture-of-Experts are Domain Generalizable Learners

Paper • 2206.04046 • Published Jun 8, 2022 • 1

Unsolvable Problem Detection: Evaluating Trustworthiness of Vision Language Models

Paper • 2403.20331 • Published Mar 29, 2024 • 16

LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models

Paper • 2407.12772 • Published Jul 17, 2024 • 35

Generalized Out-of-Distribution Detection and Beyond in Vision Language Model Era: A Survey

Paper • 2407.21794 • Published Jul 31, 2024 • 6

Panoptic Scene Graph Generation

Paper • 2207.11247 • Published Jul 22, 2022

Ego-R1: Chain-of-Tool-Thought for Ultra-Long Egocentric Video Reasoning

Paper • 2506.13654 • Published Jun 16, 2025 • 43

VideoLucy: Deep Memory Backtracking for Long Video Understanding

Paper • 2510.12422 • Published Oct 14, 2025 • 1

HippoCamp: Benchmarking Contextual Agents on Personal Computers

Paper • 2604.01221 • Published 7 days ago • 27

A Simple Baseline for Streaming Video Understanding

Paper • 2604.02317 • Published 6 days ago • 65

Conditional Prompt Learning for Vision-Language Models

Paper • 2203.05557 • Published Mar 10, 2022

Towards Language-Driven Video Inpainting via Multimodal Large Language Models

Paper • 2401.10226 • Published Jan 18, 2024 • 2

Learning to Prompt for Vision-Language Models

Paper • 2109.01134 • Published Sep 2, 2021

FunQA: Towards Surprising Video Comprehension

Paper • 2306.14899 • Published Jun 26, 2023 • 1

OpenOOD v1.5: Enhanced Benchmark for Out-of-Distribution Detection

Paper • 2306.09301 • Published Jun 15, 2023 • 1

Panoptic Video Scene Graph Generation

Paper • 2311.17058 • Published Nov 28, 2023 • 2

Large Language Models are Visual Reasoning Coordinators

Paper • 2310.15166 • Published Oct 23, 2023 • 2

authored a paper about 1 year ago

EgoLife: Towards Egocentric Life Assistant

Paper • 2503.03803 • Published Mar 5, 2025 • 46

authored a paper over 1 year ago

Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models

Paper • 2411.14432 • Published Nov 21, 2024 • 25

authored a paper almost 2 years ago

Long Context Transfer from Language to Vision

Paper • 2406.16852 • Published Jun 24, 2024 • 33

authored a paper over 2 years ago

OtterHD: A High-Resolution Multi-modality Model

Paper • 2311.04219 • Published Nov 7, 2023 • 34