STRUCT

Spatial and Temporal Restoration, Understanding and Compression Team

Tutorials

New Era of Artificial Intelligence: Unleashing the Power of Large Models in Visual Applications @IEEE ISCAS-2024
智能媒体计算专题论坛 @ WAIC-2023
Intelligent Image Enhancement and Restoration - from Prior Driven Model to Advanced Deep Learning @IEEE ICME-2019

Talks

Enhanced Video Compression with Context-Aware Dynamic Neural Adapter 2026-05 by Shaofan Sun @ ICASSP-2026
恶劣场景下视觉感知与理解 2024-05 by Jiaying Liu @ CCIG-2024
Similarity Min-Max: Zero-Shot Day-Night Domain Adaptation 2023-10 by Rundong Luo @ ICCV-2023
Dual Prompt Learning for Continual Rain Removal from Single Images 2023-08 by Minghao Liu @ IJCAI-2023
Actionlet-Dependent Contrastive Learning for Unsupervised Skeleton-Based Action Recognition 2023-06 by Lilang Lin @ CVPR-2023
Hierarchical Consistent Contrastive Learning for Skeleton-Based Action Recognition with Growing Augmentations 2023-02 by Jiahang
Zhang @ AAAI-2023
AI Illustrator: Translating Raw Descriptions into Images by Prompt-based Cross-Modal Generation 2022-10 by Yiyang Ma @ ACM MM-2022
Controllable Artistic Text Style Transfer via Shape-Matching GAN 2019-10 by Shuai Yang @ ICCV-2019
Unsupervised Person Image Generation with Semantic Parsing Transformation 2019-06 by Sijie Song @ CVPR-2019

Group Seminar

Current Semester

Date	Presenter	Conference	Title	Links
26/06/07	Fan Zejia	CVPR 2025	Reconciling Stochastic and Deterministic Strategies for Zero-shot Image Restoration using Diffusion Model in Dual	PDF
26/05/24	Yang Jiaming	CVPR 2026	Understanding and Enforcing Weight Disentanglement in Task Arithmetic	PDF
26/05/10	Xicheng Lan	arXiv	Generative Visual Chain-of-Thought for Image Editing	PDF
26/04/26	Lilang Lin	arXiv	From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence	PDF
26/04/19	Jiangyue Zeng	SIGGRAPH 2026	Abstraction in Style: Beyond Texture and Color	PDF
26/04/12	Yu Cao	NeurIPS 2025	4KAgent: Agentic Any Image to 4K Super-Resolution	PDF
26/03/29	Jinyi Luo	CVPR 2026	GDPO-SR: Group Direct Preference Optimization for One-Step Generative Image Super-Resolution	PDF
26/03/22	Yufei Zhang	arXiv	Forging and Removing Latent-Noise Diffusion Watermarks Using a Single Image	PDF
26/03/15	Yixuan Zou	CVPR 2025	CleanDIFT: Diffusion Features without Noise	PDF
26/02/02	Jiahang Zhang, Haowei Kuang, Wenshuo Gao	Tutorial	An Introduction to World Model and Beyond(Part 2)	PDF
26/01/27	Jiahang Zhang, Haowei Kuang	Tutorial	An Introduction to World Model and Beyond(Part 1)	PDF
26/01/19	Xicheng Lan	CVPR 2025, ICCV 2025	Stable Flow: Vital Layers for Training-Free Image Editing, FreeFlux: Understanding and Exploiting Layer-Specific Roles in RoPE-Based MMDiT for Versatile Image Editing	PDF
26/01/11	Yu Cao	arXiv	VLIC: Vision-Language Models As Perceptual Judges for Human-Aligned Image Compression	PDF
25/12/21	Yufei Zhang	CVPR 2025	UniRestore: Unified Perceptual and Task-Oriented Image Restoration Model Using Diffusion Prior	PDF
25/12/14	Jiangyue Zeng	ICCV 2025	LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer	PDF
25/11/30	Yixuan Zou	ICCV 2025	UnZipLoRA: Separating Content and Style from a Single Image	PDF
25/11/23	Junyi Fan	arXiv	Taming Flow-based I2V Models for Creative Video Editing	PDF
25/11/16	Wen Si	arXiv	PerCoV2: Improved Ultra-Low Bit-Rate Perceptual Image Compression with Implicit Hierarchical Masked Image Modeling	PDF
25/11/02	Haofeng Huang	Tutorial	A Quick Start Guide for RL in LLMs and Diffusion	PDF
25/10/19	Shenghan Xu	ICCV 2025	LOTS of Fashion! Multi-Conditioning for Image Generation via Sketch-Text Pairing	PDF
25/10/12	Zejia Fan	CVPR 2025	The Power of Context: How Multimodality Improves Image Super-Resolution	PDF
25/09/21	Chenyu Niu	CVPR 2025	HyperLoRA: Parameter-Efficient Adaptive Generation for Portrait Synthesis	PDF
25/07/28	Jinyi Luo	ICML 2025	ConceptAttention: Diffusion Transformers Learn Highly Interpretable Features	PDF
25/07/21	Shaofan Sun	arXiv	Perceive Anything: Recognize, Explain, Caption, and Segment Anything in Images and Videos	PDF
25/07/14	Wenshuo Gao	arXiv	FlowDirector: Training-Free Flow Steering for Precise Text-to-Video Editing	PDF
25/07/07	Yifan Li	SIGGRAPH 2025	TokenVerse: Versatile Multi-concept Personalization in Token Modulation Space	PDF
25/06/30	Minghao Liu	arXiv	Mean Flows for One-step Generative Modeling	PDF
25/05/25	Guo Tang	arXiv	REPA-E: Unlocking VAE for End-to-End Tuning with Latent Diffusion Transformers	PDF
25/04/27	Zejia Fan	ACMMM24	Learning A Low-Level Vision Generalist via Visual Task Prompt	PDF
25/04/27	Lilang Lin	ICLR25	Learning Dynamics of LLM Finetuning	PDF
25/04/20	Haofeng Huang	arXiv	Flow to the Mode: Mode-Seeking Diffusion Autoencoders for State-of-the-Art Image Tokenization	PDF
25/03/30	Yiyang Ma	CVPR25	JanusFlow: Harmonizing Autoregression and Rectified Flow for Unified Multimodal Understanding and Generation	PDF
25/03/23	Shenghan Xu	CVPR25	Generative Photomontage	PDF
25/03/16	Junxin Lin	CVPR24	FlowIE: Efficient Image Enhancement via Rectified Flow	PDF
25/03/09	Wen Si	arXiv	Fractal Generative Models	PDF
25/03/02	Chenyu Niu	CVPR24	EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything	PDF
25/02/23	Jinyi Luo	ICLR25	Differential Transformer	PDF
25/02/14	Shaofan Sun	arXiv	π_0: A Vision-Language-Action Flow Model for General Robot Control	PDF
25/01/19	Yifan Li	arXiv	Perception-as-Control: Fine-grained Controllable Image Animation with 3D-aware Motion Representation	PDF
25/01/13	Minghao Liu	ICLR25	Compositional Entailment Learning for Hyperbolic Vision-Language Models	PDF
24/12/08	Haowei Kuang	NeurIPS24	Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction	PDF
24/12/01	Yiyang Ma	arXiv	Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think	PDF
24/11/24	Xicheng Lan	CVPR24	DemoFusion: Democratising High-Resolution Image Generation With No $$$	PDF
24/10/27	Zejia Fan	ICLR23	Flow straight and fast: Learning to generate and transfer data with rectified flow	PDF
24/10/20	Xiang Gao	CVPR24	InstanceDiffusion: Instance-level Control for Image Generation	PDF
24/10/13	Lilang Lin	ECCV24	Minimalist Vision with Freeform Pixels	PDF
24/09/21	Haofeng Huang	CVPR24	Residual Denoising Diffusion Models	PDF
24/09/14	Xicheng Lan	CVPR24	Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models	PDF
24/09/03	Wenshuo Gao	CVPR24	Generative Image Dynamics	PDF
24/07/20	Yifan Li	ECCV24	ScaleDreamer: Scalable Text-to-3D Synthesis with Asynchronous Score Distillation	PDF
24/07/08	Shaofan Sun	SIGGRAPH23	3D Gaussian Splatting for Real-Time Radiance Field Rendering	PDF
24/06/30	Jingyi Luo	CVPR24	Genuine Knowledge from Practice: Diffusion Test-Time Adaptation for Video Adverse Weather Removal	PDF
24/06/02	Zejia Fan	arXiv	LM4LV: AFrozen Large Language Model for Low-level Vision Tasks	PDF
24/05/26	Guo Tang	arXiv	DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations	PDF
24/05/19	Xiang Gao	arXiv	MoMA: Multimodal LLM Adapter for Fast Personalized Image Generation	PDF
24/04/14	Minghao Liu	arXiv	Mamba: Linear-Time Sequence Modeling with Selective State Spaces	PDF
24/03/31	Jiahang Zhang	CVPR24	CG-HOI: Contact-Guided 3D Human-Object Interaction Generation	PDF
24/03/17	Lilang Lin	arXiv	Learning by Reconstruction Produces Uninformative Features For Perception	PDF
24/03/10	Yiyang Ma	ICCV23	DiffIR: Efficient Diffusion Model for Image Restoration	PDF
24/03/03	Haowei Kuang	NeurIPS23	Towards Efficient Image Compression Without Autoregressive Models	PDF
24/02/25	Wenjing Wang	ICLR24	SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis	PDF
24/01/28	Lehong Wu	ICLR24	Interpreting CLIP's Image Representation via Text-Based Decomposition	PDF
24/01/21	Yifan Li	CVPR23	Generative Diffusion Prior for Unified Image Restoration and Enhancement	PDF
24/01/14	Shaofan Sun	NeurIPS23	Siamese Masked Autoencoders	PDF
23/12/24	Jiaxuan Xie	ICCV23	Tracking Anything with Decoupled Video Segmentation	PDF
23/12/10	Rundong Luo	arXiv	DMV3D: Denoising Multi-view Diffusion Using 3D Large Reconstruction Model	PDF
23/12/03	Minghao Liu	NeurIPS23	Rotating Features for Object Discovery	PDF
23/11/19	Haowei Kuang	arXiv	Idempotent Generative Network	PDF
23/11/05	Zhengbo Xu	CVPR23	Null-text Inversion for Editing Real Images using Guided Diffusion Models	PDF
23/10/24	Jiahang Zhang	ICCV23	Rosetta Neurons: Mining the Common Units in a Model Zoo	PDF
23/10/15	Zejia Fan	CVPR23	All-in-one Image Restoration for Unknown Degradations Using Adaptive Discriminative Filters for Specific Degradations	PDF
23/10/08	Yiyang Ma	ICLR21	Denoising Diffusion Implicit Models	PDF
23/09/10	Haofeng Huang	CVPR23	EDICT: Exact Diffusion Inversion via Coupled Transformations	PDF
23/09/10	Xiang Gao	arXiv	Inversion-based Style Transfer with Diffusion Models	PDF
23/07/31	Minghao Liu	arXiv	BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models	PDF
23/07/15	Minghao Liu	arXiv	Towards Language Models That Can See: Computer Vision Through the LENS of Natural Language	PDF
23/06/04	Jiahang Zhang	CVPR23	Augmentation Matters: A Simple-yet-Effective Approach to Semi-supervised Semantic Segmentation	PDF
23/05/28	Minghao Liu	CVPR23	Progressive Transformation Learning for Leveraging Virtual Images in Training	PDF
23/05/14	Lilang Lin	CVPR23	VideoMAE V2: Scaling Video Masked Autoencoders with Dual Masking	PDF
23/05/07	Haowei Kuang	CVPR23	Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models	PDF
23/04/16	Yexiang Cheng	arXiv	Segment Anything	PDF
23/04/02	Zhengbo Xu	arXiv	Your Diffusion Model is Secretly a Zero-Shot Classifier	PDF
23/03/26	Yiyang Ma	arXiv	Adding Conditional Control to Text-to-Image Diffusion Models	PDF
23/03/19	Rundong Luo	arXiv	Invariant Slot Attention: Object Discovery with Slot-Centric Reference Frames	PDF
23/03/05	Wenjing Wang	arXiv	DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation	PDF
23/02/26	Yuzhang Hu	CVPR22	Dataset Distillation by Matching Training Trajectories	PDF
23/02/19	Zejia Fan	ICLR23	Image as Set of Points	PDF
23/02/19	Yueru Jia	ECCV22	Pose-NDF: Modeling Human Pose Manifolds with Neural Distance Fields	PDF
23/02/19	Dezhao Wang	NeurIPS22	Visual Prompting via Image Inpainting	PDF
23/02/12	Lilang Lin	ECCV22	On the Versatile Uses of Partial Distance Correlation in Deep Learning	PDF
23/02/12	Minghao Liu	CVPR22	Text2Mesh: Text-Driven Neural Stylization for Meshes	PDF
23/02/12	Jiahang Zhang	ECCV22	AutoMix: Unveiling the Power of Mixup for Stronger Classifiers	PDF
23/02/05	Haofeng Huang	AAAI23	GAN Prior based Null-Space Learning for Consistent Super-Resolution	PDF
23/02/05	Haowei Kuang	AAAI23	Robust Image Denoising of No-Flash Images Guided by Consistent Flash Images	PDF
23/02/05	Shujia Li	CVPR22	Diffusion Autoencoders: Toward a Meaningful and Decodable Representation	PDF
23/01/29	Zhengbo Xu	AAAI23	MicroAST: Towards Super-Fast Ultra-Resolution Arbitrary Style Transfer	PDF
23/01/29	Yexiang Cheng	AAAI23	Target-Free Text-guided Image Manipulation	PDF
23/01/29	Yiyang Ma	NeurIPS22	DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps	PDF
23/01/15	Wenjing Wang	arXiv	Tune-A-Video: One-Shot Tuning of Image Diffusion Models For Text-to-Video Generation	PDF
23/01/15	Rundong Luo	ECCV22	SinNeRF: Training Neural Radiance Fields on Complex Scenes from a Single Image	PDF
23/01/15	Yuzhang Hu	AAAI23	Curriculum Temperature for Knowledge Distillation	PDF
22/10/30	Wenjing Wang	NeurIPS22	Poisson Flow Generative Models	PDF
22/10/16	Yilun Xu	CVPR22	HDR-NeRF: High Dynamic Range Neural Radiance Fields	PDF
22/10/16	Yilun Xu	CVPR22	NeRF in the Dark: High Dynamic Range View Synthesis from Noisy Raw Images	PDF
22/10/09	Lilang Lin	ECCV22	Prompting Visual-Language Models for Efficient Video Understanding	PDF
22/09/18	Yiyang Ma	ACM MM22	AI Illustrator: Translating Raw Descriptions into Images by Prompt-based Cross-Modal Generation	PDF
21/12/19	Yuzhang Hu	ICCV21	SimROD: A Simple Adaptation Method for Robust Object Detection	PDF
21/12/12	Haofeng Huang	NeurIPS21	Pragmatic Image Compression for Human-in-the-Loop Decision-Making	PDF
21/12/05	Dezhao Wang	arXiv	Masked Autoencoders Are Scalable Vision Learners	PDF
21/10/24	Zejia Fan	ICML21	How Much Position Information Do Convolutional Neural Networks Encode?	PDF
21/10/15	Wenjing Wang	ICCV21	Improving Contrastive Learning by Visualizing Feature Transformation	PDF
21/09/24	Lilang Lin	ICML21	Understanding self-supervised learning dynamics without contrastive pairs	PDF
21/09/12	Haofeng Huang	CVPR21	Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation	PDF
21/08/18	Shuhong Zheng	CVPR21	NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections	PDF
21/07/26	Zejia Fan	arXiv	Demystifying Local Vision Transformer: Sparse Connectivity, Weight Sharing, and Dynamic Weight	PDF
21/07/13	Haofeng Huang	IJCV	Semantics-to-Signal Scalable Image Compression with Learned Revertible Representations	PDF
21/07/13	Wenjing Wang	CVPR21	GIRAFFE: Representing Scenes as Compositional Generative Neural Feature Fields	PDF
21/05/30	Haofeng Huang	CVPR21	Image-to-image Translation via Hierarchical Style Disentanglement	PDF
21/05/30	Xinhao Wang	CVPR21	Style-Aware Normalized Loss for Improving Arbitrary Style Transfer	PDF
21/05/23	Shixing Yu	arXiv	MLP-Mixer: An all-MLP Architecture for Vision	PDF
21/05/23	Hao Liang	CVPR21	RepVGG: Making VGG-style ConvNets Great Again	PDF
21/05/16	Shuhong Zheng	ECCV20	In-Domain GAN Inversion for Real Image Editing	PDF
21/04/25	Lilang Lin	arXiv	Barlow Twins: Self-Supervised Learning via Redundancy Reduction	PDF
21/04/25	Yueyu Hu	NeuIPS20	Improving Inference for Neural Image Compression	PDF
21/04/18	Yu Han	ICML21	Generative Pretraining from Pixels	PDF
21/04/18	Zejia Fan	CVPR21	Scaling Local Self-Attention for Parameter Efficient Visual Backbones	PDF
21/03/28	Yuzhang Hu	CVPR21	Learning Continuous Image Representation with Local Implicit Image Function	PDF
21/03/28	Dezhao Wang	CVPR21	Soft-IntroVAE: Analyzing and Improving the Introspective Variational Autoencoder	PDF
21/03/21	Wenjing Wang	CVPR21	Generative Hierarchical Features from Synthesizing Images	PDF
21/03/21	Shixing Yu	ICLR21	An image is worth 16x16 words:Transformers for image recognition at scale	PDF
21/03/14	Wenjing Wang	CVPR21	Closed-Form Factorization of Latent Semantics in GANs	PDF
21/02/09	Zejia Fan	arXiv	Fast Convergence of DETR with Spatially Modulated Co-Attention	PDF
21/02/09	Qiyu Dai	ECCV20	SESAME: Semantic Editing of Scenes by Adding, Manipulating or Erasing Objects	PDF