2 441 91

oh sehun

sehun

AI & ML interests

None yet

Recent Activity

upvoted a paper about 2 hours ago

Self-Hinting Language Models Enhance Reinforcement Learning

upvoted a paper about 5 hours ago

HySparse: A Hybrid Sparse Attention Architecture with Oracle Token Selection and KV Cache Sharing

upvoted a paper about 5 hours ago

OmniSIFT: Modality-Asymmetric Token Compression for Efficient Omni-modal Large Language Models

View all activity

Organizations

upvoted a paper about 2 hours ago

Self-Hinting Language Models Enhance Reinforcement Learning

Paper • 2602.03143 • Published 3 days ago • 19

upvoted 5 papers about 5 hours ago

HySparse: A Hybrid Sparse Attention Architecture with Oracle Token Selection and KV Cache Sharing

Paper • 2602.03560 • Published 2 days ago • 33

OmniSIFT: Modality-Asymmetric Token Compression for Efficient Omni-modal Large Language Models

Paper • 2602.04804 • Published 1 day ago • 40

WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning

Paper • 2602.04634 • Published 1 day ago • 69

Training Data Efficiency in Multimodal Process Reward Models

Paper • 2602.04145 • Published 1 day ago • 62

FASA: Frequency-aware Sparse Attention

Paper • 2602.03152 • Published 3 days ago • 99

upvoted a paper about 8 hours ago

ERNIE 5.0 Technical Report

Paper • 2602.04705 • Published 1 day ago • 193

upvoted 7 papers about 24 hours ago

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published 7 days ago • 144

ReGuLaR: Variational Latent Reasoning Guided by Rendered Chain-of-Thought

Paper • 2601.23184 • Published 6 days ago • 32

RLAnything: Forge Environment, Policy, and Reward Model in Completely Dynamic RL System

Paper • 2602.02488 • Published 3 days ago • 29

upvoted 6 papers 1 day ago

Balancing Understanding and Generation in Discrete Diffusion Models

Paper • 2602.01362 • Published 4 days ago • 13

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

Paper • 2602.01566 • Published 4 days ago • 43

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published 3 days ago • 122

DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation

Paper • 2601.22904 • Published 6 days ago • 13

Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning

Paper • 2602.01058 • Published 5 days ago • 38

PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Paper • 2602.02493 • Published 3 days ago • 38

oh sehun

AI & ML interests

Recent Activity

Organizations

sehun's activity

🎉 Free Image Generator Now Available!