导师简介-毛琪

作者：发布时间：2023-08-29

姓名：毛琪

职称 / 硕（博）导：教授 / 硕导

学硕招生专业 / 方向：信息与通信工程 / 智能视频处理

专硕招生专业 / 方向：人工智能 / 智能视听技术

主要研究领域：AIGC，图像视频生成, 智能图像视频编码

电子邮箱Email：qimao@cuc.edu.cn

个人简介

中国传媒大学教授，博士毕业于北京大学高文院士马思伟教授(国家杰青）团队，加州大学默塞德分校联合培养博士，师从Prof.Ming-Hsuan Yang (IEEE/ACM Fellow)，新加坡国立大学Show-Lab访问学者(合作导师：Mike Z. SHOU)，主要研究方向为智能媒体内容的生成与编码。获得2023年北京市图象图形学学会优秀博士论文奖，2023年全国广播电视和网络视听行业青年创新人才，2024年微软亚洲研究院铸星学者。主持国家自然科学青年基金项目、面上项目，作为骨干成员参与国家重点研发计划等。近年来发表包括IJCV、CVPR、TIP、SIGCOMM、ACM MM等CCF-A类顶级国际期刊会议论文二十余篇，其中ESI高被引论文一篇，谷歌学术引用量超3000；授权国家发明专利8项，接收AVS技术提案多项。担任中国图象图形学学会多媒体专委会委员，女工委委员，北京图象图形学学会青工委委员。已与加州大学默塞德分校、新加坡国立大学、北京大学、上海交通大学、中科院大学、厦门大学、香港城市大学、北大深研院等国内外知名高校和研究机构建立稳定合作，并与微软、百度、咪咕等企业保持深度产学研协作。长期欢迎对AIGC、图像视频生成与智能编码等方向感兴趣的本科生、研究生加入团队，联系邮箱qimao@cuc.edu.cn。

承担的主要科研项目

[1] 国家自然科学基金面上项目，62471445，基于离散特征表示与生成式模型的极限编码理论与方法研究，在研，主持，49万。

[2] 国家自然科学青年基金项目，62201526，基于分层特征表示的人-机协同视频编码研究，在研，主持，30万。

[3] 国家重点研发计划，2022YFF0902402，沉浸式文旅体验技术集成与场景创新，在研，骨干成员，254万。

[4] 多媒体信息处理全国重点实验室开放课题，SKLMIP-KF-2025-04，融合时空语义控制的文本驱动扩散视频编辑方法，在研，主持，40万

[5] 中国传媒大学“三国”专项项目，CUC25SG008，高流行度短视频特征解析及生成技术研究，在研，8万

[6] 百度NLP学术合作，HG23056，结题，主持，50万

[7] 中国传媒大学“三国”专项项目，CUC24SG015，基于情感引导的智能媒体内容可控生成，结题，8万

[8] 媒体融合与传播国家重点实验室专项科研项目，CUC22GZ035，深度学习人脸生成与鉴伪方法研究，音视频鉴伪系统，结题，主持，20万。

[9] 媒体融合与传播国家重点实验室专项科研项目，CUC23GZ007，基于 AIGC 的对话多媒体内容生成，结题，主持，16万。

代表性学术成果

[1] Junlong Gao, Zhimeng Huang, Qi Mao(*), Siwei Ma, Chuanmin Jia, Exploring Multimodal Knowledge for Image Compression via Large Foundation Models. IEEE Transactions on Image Processing (2025).(CCF-A, SCI-T2)

[2] Yuanhang Li, Qi Mao(*), Lan Chen, Zhen Fang, Lei Tian, Xinyan Xiao, Libiao Jin, Hua Wu. StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusing. IEEE Transactions on Multimedia (2025). (SCI-T3) (Accepted)

[3] Qi Mao, Lan Chen, Yuchao Gu, Zhen Fang, and Mike Zheng Shou. MAG-Edit: Localized Image Editing in Complex Scenarios via Mask-Based Attention-Adjusted Guidance. In Proceedings of the 32nd ACM International Conference on Multimedia(2024). (CCF-A)

[4] Qi Mao, Chongyu Wang, Meng Wang, Shiqi Wang, Ruijie Chen, Libiao Jin, Siwei Ma. Scalable Face Image Coding via StyleGAN Prior. Towards Compression for Human-Machine Collaborative Vision. IEEE Transactions on Image Processing (2023).(CCF-A, SCI-T2)

[5] Qi Mao, Hung-Yu Tseng, Hsin-Ying Lee, Jia-Bin Huang, Siwei Ma, Ming-Hsuan Yang. Continuous and Diverse Image-to-Image Translation via Signed Attribute Vectors. International Journal of Computer Vision (2022). (CCF-A, SCI-T2)

[6] Qi Mao(*), Siwei Ma. Enhancing Style-Guided Image-to-Image Translation via Self-Supervised Metric Learning. IEEE Transactions on Multimedia (2023). (SCI-T3)

[7] Qi Mao, Hsin-Ying Lee, Hung-Yu Tseng, Siwei Ma, Ming-Hsuan Yang: Mode-Seeking Generative Adversarial Networks for Diverse Image Synthesis. Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (2019). (CCF-A)

[8] Hsin-Ying Lee, Hung-Yu Tseng, Qi Mao (*共同一作), Jia-Bin Huang, Yu-Ding Lu, Maneesh Singh, Ming-Hsuan Yang: DRIT++: Diverse Image-to-Image Translation via Disentangled Representations. International Journal of Computer Vision (2020). (CCF-A, SCI-T2，高被引论文)

[9] Jiangkai Wu, Yu Guan, Qi Mao, Yong Cui, Zongming Guo, Xinggong Zhang. ZGaming. Zero-latency 3D cloud gaming by image prediction. ACM SIGCOMM23(2023). (CCF-A -计算机网络传输领域顶会)

[10] Jianhui Chang, Zhenghui Zhao, Chuanmin Jia, Shiqi Wang, Lingbo Yang, Qi Mao, Jian Zhang, Siwei Ma. Conceptual Compression via Deep Structure and Texture Synthesis. IEEE Transactions on Image Processing (2022). (CCF-A，SCI-T2)

[11] Jianhui Chang, Jian Zhang, Jiguo Li, Shiqi Wang, Qi Mao, Chuanmin Jia, Siwei Ma, Wen Gao . Semantic-Aware Visual Decomposition for Image Coding. International Journal of Computer Vision (2023). (CCF-A ，SCI-T2)

[12] Lingyu Zhu, Wenhan Yang, Baoliang Chen, Hanwei Zhu, Zhangkai Ni, Qi Mao, and Shiqi Wang. Unrolled decomposed unpaired learning for controllable low-light video enhancement. European Conference on Computer Vision 2024(CCF-B 计算机视觉顶级会议ECCV).

[13] Qi Mao(*), Tinghan Yang, Yinuo Zhang, Zijian Wang, Meng Wang, Shiqi Wang, Libiao Jin, Siwei Ma: Extreme Image Compression Using Fine-tuned VQGANs. Data Compression Conference (2024). (CCF-B - 数据压缩领域顶会)

[14] Naifu Xue, Qi Mao(*), Zijian Wang, Yuan Zhang, Siwei Ma : Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer. IEEE International Conference on Multimedia and Expo (2024). (CCF-B - 计算机多媒体旗舰会议)

[15] 毛琪等，基于矢量量化索引和生成模型的极限图像压缩方法及系统，发明专利（授权）

[16] 毛琪等，面向人机混合视觉的可伸缩人脸图像编码方法、系统，发明专利（授权）

[17] 毛琪等，基于生成模型的人体视频压缩方法、系统，发明专利（授权）

[18] 毛琪等，生成-熵估计联合的极限图像压缩、解压缩方法及系统，发明专利（授权）

[19] 毛琪等，基于大规模文生视频模型的视频生成方法及系统，发明专利（授权）

指导学生

1、协助指导毕业的硕士研究生：22级王崇宇（中国电信）、23级晁润东（北京天润融通科技股份有限公司）；

2、指导毕业的本科生：18级何玉洁（中国传媒大学），19杨婷涵（中国传媒大学）、20级马扬智（中国科学技术大学），20级陈睿捷（密歇根大学安娜堡分校），21级田泽杰（中国科学院大学），21级曹扬毅（中国传媒大学）， 21级程昊（中国传媒大学）， 21级方镇（中国科学技术大学），21级魏文亮（北京航空航天大学）， 21级王子健（中国传媒大学）；

3、指导在读：博士生2人，硕士生7人，本科生6名