祝贺实验室团队硕士生金煜峰一篇论文”Cross-Modal Distillation for Speaker Recognition” 被Thirty-Seventh AAAI Conference on Artificial Intelligence录用。文章针对说话人识别问题,提出了一种跨模态蒸馏框架。针对不同模态间隙大,容易过拟合不相关特征的问题,设计了一种蒸馏策略,在两个模态间设置了一个松散的约束,避免过拟合,且能够将多种现有的蒸馏方法适应到跨模态场景中。同时,可以根据输入数据的质量自适应的调整样本权重,避免低质量数据干扰蒸馏训练。实验结果表明本文提出的方法有效的提高了说话人识别的性能和对于噪声的鲁棒性。