Ruoyu Feng (冯若愚)

Biography

This is Ruoyu Feng, a Ph.D. Candidate in MOE-Microsoft Key Laboratory of Multimedia Computing and Communication, University of Science and Technology of China (USTC), supervised by Zhibo Chen. I am expected to receive my PhD degree in June 2025. Before that, I spent my undergraduate years in the Automation Department of Southeast University, from 2016 to 2020, and received the National Scholarship in 2019. From March 2023 till now, I am a research intern at Intelligence Media Group of MSRA under the supervision of Chong Luo. My research interests mainly focus on video generation, AIGC, and image coding for machines.

I am actively looking for a position in AI research about video generation and AIGC starting in the summer of 2025. Feel free to email me if you are interested in my research.

Quick links: Email: ustcfry@mail.ustc.edu.cn, Google scholar, Github.

Experience

Mar. 2023 - Present Research Intern, Intelligence Media Group, Microsoft Research Asia

Mar. 2020 - Present Ph.D. Candidate, University of Science and Technology of China

Sep. 2016 - Jun. 2020 Southeast University, Bachelor of Engineering

Research

TOP CONFERENCE PAPERS

CCEdit: Creative and controllable video editing via diffusion models
Ruoyu Feng, Wenming Weng, Yanhui Wang, Yuhui Yuan, Jianmin Bao, Chong Luo, Zhibo Chen, Baining Guo
IEEE/CVF Computer Vision and Pattern Recognition (CVPR), 2024
[pdf] [project]

MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation
Yanhui Wang, Jianmin Bao, Wenming Weng, Ruoyu Feng, Dacheng Yin, Tao Yang, Jingxu Zhang, Qi Dai Zhiyuan Zhao, Chunyu Wang, Kai Qiu, Yuhui Yuan, Xiaoyan Sun, Chong Luo, Baining Guo
IEEE/CVF Computer Vision and Pattern Recognition (CVPR Highlight), 2024
[pdf] [project]

SeD: Semantic-Aware Discriminator for Image Super-Resolution
Bingchen Li, Xin Li, Hanxin Zhu, Yeying Jin, Ruoyu Feng, Zhizheng Zhang, Zhibo Chen
IEEE/CVF Computer Vision and Pattern Recognition (CVPR), 2024
[pdf]

Semantically Structured Image Compression via Irregular Group-Based Decoupling
Ruoyu Feng*, Yixin Gao*, Xin Jin, Runsen Feng, Zhibo Chen.(* Equal Contribution)
International Conference on Computer Vision (ICCV), 2023
[pdf]

Image coding for machines with omnipotent feature learning
Ruoyu Feng*, Xin Jin*, Zongyu Guo, Runsen Feng, Yixin Gao, Tianyu He, Zhizheng Zhang, Simeng Sun, Zhibo Chen.(* Equal Contribution)
European Conference on Computer Vision (ECCV), 2022
[pdf]

Cloth-changing person re-identification from a single image with gait prediction and regularization
Xin Jin, Tianyu He, Kecheng Zheng, Zhiheng Yin, Xu Shen, Zhen Huang, Ruoyu Feng, Jianqiang Huang, Zhibgo Chen, Xian-Sheng Hua
IEEE/CVF Computer Vision and Pattern Recognition (CVPR), 2022
[pdf]

OTHERS

ART·V: Auto-Regressive Text-to-Video Generation with Diffusion Models
Wenming Weng, Ruoyu Feng, Yanhui Wang, Qi Dai, Chunyu Wang, Dacheng Yin, Zhiyuan Zhao, Kai Qiu, Jianmin Bao, Yuhui Yuan, Chong Luo, Yueyi Zhang, Zhiwei Xiong
[pdf] [project]

Prompt-ICM: A Unified Framework towards Image Coding for Machines with Task-driven Prompts
Ruoyu Feng*, Jinming Liu*, Xin Jin, Xiaohan Pan, Heming Sun, Zhibo Chen.(* Equal Contribution)
[pdf]

Image Coding for Machines based on Non-Uniform Importance Allocation
Yunpeng Qi, Ruoyu Feng, Zhizheng Zhang, Zhibo Chen
2023 IEEE International Conference on Visual Communications and Image Processing (VCIP)
[pdf]

Composable Image Coding for Machine via Task-oriented Internal Adaptor and External Prior
Jinming Liu, Xin Jin, Ruoyu Feng, Zhibo Chen, Wenjun Zeng
2023 IEEE International Conference on Visual Communications and Image Processing (VCIP)
[pdf]

Local patch autoaugment with multi-agent collaboration
Shiqi Lin, Tao Yu, Ruoyu Feng, Xin Li, Xiaoyuan Yu, Lei Xiao, Zhibo Chen
IEEE Transactions on Multimedia (IEEE TMM)
[pdf]

Semantical video coding: Instill static-dynamic clues into structured bitstream for AI tasks Xin Jin*, Ruoyu Feng*, Simeng Sun*, Runsen Feng, Tianyu He, Zhibo Chen.(* Equal Contribution)
Journal of Visual Communication and Image Representation (JVCIR) [pdf]

Inpaint anything: Segment anything meets image inpainting
Tao Yu, Runseng Feng, Ruoyu Feng, Jinming Liu, Xin Jin, Wenjun Zeng, Zhibo Chen
[pdf] [code]

HST: Hierarchical Swin Transformer for Compressed Image Super-Resolution
Bingchen Li, Xin Li, Yiting Lu, Sen Liu, Ruoyu Feng, Zhibo Chen
European Conference on Computer Vision (ECCV Workshop), 2022
[pdf]

Academic Services

Invited Reviewer for IEEE TCSVT, TNNLS, TIP, etc.

Invited Reviewer for ECCV, ICCV, CVPR, ACM MM, etc.