Research

Dual Latent Memory for Visual Multi-agent System

Xinlei Yu, Chengming Xu, Zhangquan Chen, Bo Yin, Cheng Yang, Yongbo He, Yihao Hu, Jiangning Zhang, Cheng Tan, Xiaobin Hu, Shuicheng Yan

ICML 2026

FFP-300K: Scaling First-Frame Propagation for Generalizable Video Editing

Xijie Huang*, Chengming Xu*, Donghao Luo, Xiaobin Hu, Peng Tang, Jiangning Zhang, Chengjie Wang, Yanwei Fu

CVPR 2026

VisMem: Latent Vision Memory Unlocks Potential of Vision-Language Models

Xinlei Yu, Chengming Xu, Guibin Zhang, Zhangquan Chen, Yudong Zhang, Yongbo He, Peng-Tao Jiang, Jiangning Zhang, Xiaobin Hu, Shuicheng Yan

CVPR 2026

Visual Document Understanding and Reasoning: A Multi-Agent Collaboration Framework with Agent-Wise Adaptive Test-Time Scaling

Xinlei Yu, Chengming Xu, Zhangquan Chen, Yudong Zhang, Shilin Lu, Cheng Yang, Jiangning Zhang, Shuicheng Yan, Xiaobin Hu

CVPR 2026

Omni-Attack: Adversarial Attacks on Open-Ended VQA in Black-Box Multimodal LLMs

Kai Hu, Weichen Yu, Li Zhang, Alexander Robey, Andy Zou, Haoqi Hu, Chengming Xu, Matt Fredrikson

CVPR 2026

Visual Multi-Agent System: Mitigating Hallucination Snowballing via Visual Flow

Xinlei Yu, Chengming Xu, Guibin Zhang, Yongbo He, Zhangquan Chen, Zhucun Xue, Jiangning Zhang, Yue Liao, Xiaobin Hu, Yu-Gang Jiang, Shuicheng Yan

ICLR 2026

Swiftvideo: A Unified Framework for Few-Step Video Generation through Trajectory-Distribution Alignment

Yanxiao Sun, Jiafu Wu, Yun Cao, Chengming Xu, Yabiao Wang, Weijian Cao, Donghao Luo, Chengjie Wang, Yanwei Fu

AAAI 2026

2025

Towards Reliable and Holistic Visual In-Context Learning Prompt Selection

Wenxiao Wu, Jing-Hao Xue, Chengming Xu†, Chen Liu, Xinwei Sun, Changxin Gao, Nong Sang, Yanwei Fu

NeurIPS 2025

Disentangle Identity, Cooperate Emotion: Correlation-Aware Emotional Talking Portrait Generation

Weipeng Tan*, Chuming Lin*, Chengming Xu†, Feifan Xu, Xiaobin Hu, Xiaozhong Ji, Junwei Zhu, Chengjie Wang, Yanwei Fu

ACM MM 2025

StrandDesigner: Towards Practical Strand Generation with Sketch Guidance

Na Zhang*, Moran Li*, Chengming Xu†, Han Feng, Xiaobin Hu, Jiangning Zhang, Weijian Cao, Chengjie Wang, Yanwei Fu

ACM MM 2025

AnyMaker: Zero-shot General Object Customization via Decoupled Dual-Level ID Injection

Lingjie Kong*, Kai Wu*, Chengming Xu†, Xiaobin Hu, Wenhui Han, Jinlong Peng, Donghao Luo, Jiangning Zhang, Chengjie Wang, Yanwei Fu

CVPR 2025

SVFR: A Unified Framework for Generalized Video Face Restoration

Zhiyao Wang, Xu Chen, Chengming Xu, Junwei Zhu, Xiaobin Hu, Jiangning Zhang, Chengjie Wang, Yuqi Liu, Yiyi Zhou, Rongrong Ji

CVPR 2025

2024-2019

Towards Global Optimal Visual In-Context Learning Prompt Selection

Chengming Xu*, Chen Liu*, Yikai Wang, Yuan Yao, Yanwei Fu

NeurIPS 2024

Faster OreFSDet: A Lightweight and Effective Few-Shot Object Detector for Ore Images

Yang Zhang, Le Cheng, Yuting Peng, Chengming Xu, Yanwei Fu, Bo Wu, Guodong Sun

Pattern Recognition (PR), 2023

PatchMix Augmentation to Identify Causal Features in Few-shot Learning

Chengming Xu*, Chen Liu*, Xinwei Sun, Siqian Yang, Yabiao Wang, Chengjie Wang, Yanwei Fu

IEEE TPAMI, 2022

Exploring Efficient Few-shot Adaptation for Vision Transformers

Chengming Xu, Siqian Yang, Yabiao Wang, Zhanxiong Wang, Yanwei Fu, Xiangyang Xue

TMLR, 2022

Split-PU: Hardness-aware Training Strategy for Positive-Unlabeled Learning

Chengming Xu, Chen Liu, Siqian Yang, Yabiao Wang, Shijie Zhang, Lijie Jia, Yanwei Fu

ACM MM, 2022

The Image Local Autoregressive Transformer

Chenjie Cao, Yuxin Hong, Xiang Li, Chengrong Wang, Chengming Xu, Yanwei Fu, Xiangyang Xue

NeurIPS, 2021

Learning Salient Boundary Feature for Anchor-free Temporal Action Localization

Chuming Lin*, Chengming Xu*, Donghao Luo, Yabiao Wang, Ying Tai, Chengjie Wang, Jilin Li, Feiyue Huang, Yanwei Fu

CVPR, 2021

Learning Dynamic Alignment via Meta-filter for Few-shot Learning

Chengming Xu, Chen Liu, Li Zhang, Jilin Li, Feiyue Huang, Changjie Wang, Yanwei Fu, Xiangyang Xue

CVPR, 2021

Learning a Few-shot Embedding Model by Contrastive Learning

Chen Liu*, Li Zhang*, Chengming Xu, Siqian Yang, Yanwei Fu, Jilin Li, Chengjie Wang

AAAI, 2021

Pose-Guided Person Image Synthesis in the Non-Iconic Views

Chengming Xu, Yanwei Fu, Chao Wen, Ye Pan, Yu-Gang Jiang, Xiangyang Xue

IEEE TIP, 2020

An Embarrassingly Simple Baseline to One-Shot Learning

Chen Liu*, Chengming Xu*, Yikai Wang, Li Zhang, Yanwei Fu

CVPRW, 2020

Instance Credibility Inference for Few-Shot Learning

Yikai Wang, Chengming Xu, Chen Liu, Li Zhang, Yanwei Fu

CVPR, 2020

Learning to Score Figure Skating Sport Videos

Chengming Xu, Yanwei Fu, Bing Zhang, Zitian Chen, Yu-Gang Jiang, Xiangyang Xue

IEEE TCSVT, 2019

Recent Preprints and Manuscripts

* Equal contribution / core contributor. † Corresponding author.

2026

JAVEDIT: Joint Audio-Visual Instruction-Guided Video Editing with Agentic Data Curation

Yinan Chen, Chuming Lin, Xijie Huang, Chengming Xu, et al.

arXiv preprint, 2026

Paper Project Code

What Semantics Survive the Connector? Diagnosing VLM-to-DiT Alignment in Video Editing

Hangyu Lin*, Chao Wen*, Chengming Xu†, Jianxiong Gao, Jiangning Zhang, Xiaobin Hu, Yanwei Fu

arXiv preprint, 2026

PixVerve: Advancing Native UHR Image Generation to 100MP with a Large-Scale High-Quality Dataset

Haojun Chen*, Haoyang He*, Chengming Xu*, et al.

arXiv preprint, 2026

Evolution of Optimization Methods: Algorithms, Scenarios, and Evaluations

Tong Zhang, Jiangning Zhang, Zhucun Xue, Chengming Xu, et al.

arXiv preprint, 2026

The Latent Space: Foundation, Evolution, Mechanism, Ability, and Outlook

Xinlei Yu*, Zhangquan Chen*, Yongbo He*, Chengming Xu*, et al.

arXiv preprint, 2026

2025

LongVie 2: Multimodal Controllable Ultra-Long Video World Model

Jianxiong Gao, Zhaoxi Chen, Xian Liu, Chengming Xu, et al.

arXiv preprint, 2025

Collaborative Face Experts Fusion in Video Generation: Boosting Identity Consistency Across Large Face Poses

Yuji Wang, Moran Li, Xiaobin Hu, Chengming Xu, et al.

arXiv preprint, 2025

Transferable Adversarial Attacks on Black-Box Vision-Language Models

Kai Hu, Weichen Yu, Li Zhang, Alexander Robey, Andy Zou, Chengming Xu, Haoqi Hu, Matt Fredrikson

arXiv preprint, 2025

When Preferences Diverge: Aligning Diffusion Models with Minority-Aware Adaptive DPO

Lingfan Zhang, Chen Liu, Chengming Xu, Kai Hu, Donghao Luo, Chengjie Wang, Yanwei Fu, Yuan Yao

arXiv preprint, 2025