姓名:毛琪
职称 / 硕(博)导:教授 / 硕导
学硕招生专业 / 方向:信息与通信工程 / 智能视频处理
专硕招生专业 / 方向:人工智能 / 智能视听技术
主要研究领域:AIGC,图像视频生成, 智能图像视频编码
电子邮箱Email:qimao@cuc.edu.cn
个人简介
中国传媒大学教授,博士毕业于北京大学高文院士马思伟教授(国家杰青)团队,加州大学默塞德分校联合培养博士,师从Prof.Ming-Hsuan Yang (IEEE/ACM Fellow),新加坡国立大学Show-Lab访问学者(合作导师:Mike Z. SHOU),主要研究方向为智能媒体内容的生成与编码。获得2023年北京市图象图形学学会优秀博士论文奖,2023年全国广播电视和网络视听行业青年创新人才,2024年微软亚洲研究院铸星学者。主持国家自然科学青年基金项目、面上项目、作为骨干成员参与国家重点研发计划等。近年来发表包括IJCV、CVPR、TIP、SIGCOMM、ACM MM等CCF-A类顶级国际期刊会议论文二十余篇,其中ESI高被引论文一篇,谷歌学术引用量超3000;授权国家发明专利7项,接收AVS技术提案多项。担任中国图象图形学学会多媒体专委会委员,女工委委员,北京图象图形学学会青工委委员。
承担的主要科研项目
[1]国家自然科学基金面上项目,62471445,基于离散特征表示与生成式模型的极限编码理论与方法研究,在研,主持,49万。
[2] 国家自然科学青年基金项目,62201526,基于分层特征表示的人-机协同视频编码研究,在研,主持,30万。
[3] 国家重点研发计划,2022YFF0902402,沉浸式文旅体验技术集成与场景创新,在研,骨干成员,254万。
[4] 中国传媒大学“三国”专项项目,CUC25SG008,高流行度短视频特征解析及生成技术研究,在研,8万
[5] 百度NLP学术合作,HG23056,结题,主持,50万
[6]中国传媒大学“三国”专项项目,CUC24SG015,基于情感引导的智能媒体内容可控生成,结题,8万
[7] 媒体融合与传播国家重点实验室专项科研项目,CUC22GZ035,深度学习人脸生成与鉴伪方法研究,音视频鉴伪系统,结题,主持,20万。
[8] 媒体融合与传播国家重点实验室专项科研项目,CUC23GZ007,基于 AIGC 的对话多媒体内容生成,结题,主持,16万。
代表性学术成果
[1] Qi Mao, Lan Chen, Yuchao Gu, Zhen Fang, and Mike Zheng Shou. MAG-Edit: Localized Image Editing in Complex Scenarios via Mask-Based Attention-Adjusted Guidance. In Proceedings of the 32nd ACM International Conference on Multimedia(2024). (CCF-A)
[2]Qi Mao, Chongyu Wang, Meng Wang, Shiqi Wang, Ruijie Chen, Libiao Jin, Siwei Ma. Scalable Face Image Coding via StyleGAN Prior. Towards Compression for Human-Machine Collaborative Vision. IEEE Transactions on Image Processing (2023).(CCF-A, SCI-T2)
[3]Qi Mao, Hung-Yu Tseng, Hsin-Ying Lee, Jia-Bin Huang, Siwei Ma, Ming-Hsuan Yang. Continuous and Diverse Image-to-Image Translation via Signed Attribute Vectors. International Journal of Computer Vision (2022). (CCF-A, SCI-T2)
[4]Qi Mao(*), Siwei Ma. Enhancing Style-Guided Image-to-Image Translation via Self-Supervised Metric Learning. IEEE Transcations on Multimedia (2023). (SCI-T3)
[5]Qi Mao, Hsin-Ying Lee, Hung-Yu Tseng, Siwei Ma, Ming-Hsuan Yang: Mode-Seeking Generative Adversarial Networks for Diverse Image Synthesis. Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (2019). (CCF-A)
[6]Hsin-Ying Lee, Hung-Yu Tseng, Qi Mao (*共同一作), Jia-Bin Huang, Yu-Ding Lu, Maneesh Singh, Ming-Hsuan Yang: DRIT++: Diverse Image-to-Image Translation via Disentangled Representations. International Journal of Computer Vision (2020). (CCF-A, SCI-T2,高被引论文)
[7]Jiangkai Wu, Yu Guan, Qi Mao, Yong Cui, Zongming Guo, Xinggong Zhang. ZGaming. Zero-latency 3D cloud gaming by image prediction. ACM SIGCOMM23(2023). (CCF-A -计算机网络传输领域顶会)
[8]Jianhui Chang, Zhenghui Zhao, Chuanmin Jia, Shiqi Wang, Lingbo Yang, Qi Mao, Jian Zhang, Siwei Ma. Conceptual Compression via Deep Structure and Texture Synthesis. IEEE Transactions on Image Processing (2022). (CCF-A,SCI-T2)
[9]Jianhui Chang, Jian Zhang, Jiguo Li, Shiqi Wang, Qi Mao, Chuanmin Jia, Siwei Ma, Wen Gao . Semantic-Aware Visual Decomposition for Image Coding. International Journal of Computer Vision (2023). (CCF-A ,SCI-T2)
[10]Lingyu Zhu, Wenhan Yang, Baoliang Chen, Hanwei Zhu, Zhangkai Ni, Qi Mao, and Shiqi Wang. Unrolled decomposed unpaired learning for controllable low-light video enhancement. European Conference on Computer Vision 2024(CCF-B 计算机视觉顶级会议ECCV).
[11]Qi Mao(*), Tinghan Yang, Yinuo Zhang, Zijian Wang, Meng Wang, Shiqi Wang, Libiao Jin, Siwei Ma: Extreme Image Compression Using Fine-tuned VQGANs. Data Compression Conference (2024). (CCF-B - 数据压缩领域顶会)
[12]Naifu Xue, Qi Mao(*), Zijian Wang, Yuan Zhang, Siwei Ma : Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer. IEEE International Conference on Multimedia and Expo (2024). (CCF-B - 计算机多媒体旗舰会议)
[13]毛琪等,基于矢量量化索引和生成模型的极限图像压缩方法及系统,发明专利(授权)
[14]毛琪等,面向人机混合视觉的可伸缩人脸图像编码方法、系统,发明专利(授权)
[15]毛琪等,基于生成模型的人体视频压缩方法、系统,发明专利(授权)
[16]毛琪等,生成-熵估计联合的极限图像压缩、解压缩方法及系统,发明专利(授权)