欢迎访问视觉与智能学习实验室网站!

通知公告

祝贺:实验室团队硕士生金煜峰一篇论文”Cross-Modal Distillation for Speaker Recognition” 被AAAI 2023录用

作者: 时间:2022-11-20 点击数:

  祝贺实验室团队硕士生金煜峰一篇论文”Cross-Modal Distillation for Speaker Recognition” 被Thirty-Seventh AAAI Conference on Artificial Intelligence录用。文章针对说话人识别问题,提出了一种跨模态蒸馏框架。针对不同模态间隙大,容易过拟合不相关特征的问题,设计了一种蒸馏策略,在两个模态间设置了一个松散的约束,避免过拟合,且能够将多种现有的蒸馏方法适应到跨模态场景中。同时,可以根据输入数据的质量自适应的调整样本权重,避免低质量数据干扰蒸馏训练。实验结果表明本文提出的方法有效的提高了说话人识别的性能和对于噪声的鲁棒性。



版权所有:同济大学 视觉与智能学习实验室

地址:上海市嘉定区曹安公路4800号同济大学嘉定校区智信馆4楼
Email:zhaocairong@tongji.edu.cn