祝贺实验室团队博士生齐鼎一篇论文 “Fetch and Forge: Efficient Dataset Condensation for Object Detection” 被The Thirty-eighth Annual Conference on Neural Information Processing Systems录用。
数据集浓缩(DC)是一种新兴技术,能够从大型原始数据集中创建紧凑的合成数据集,同时保持相当的性能。这对加速网络训练和减少数据存储需求至关重要。然而,目前关于DC的研究主要集中在图像分类上,而对目标检测的探索较少。这主要是由于两个挑战:(i)目标检测的多任务特性使浓缩过程变得复杂;(ii)目标检测数据集的规模大、分辨率高,使现有的DC方法难以处理。
为此,我们提出了DCOD,这是第一个针对目标检测的数据集浓缩框架。它分为两个阶段:获取(Fetch)和构建(Forge),最初将关键的定位和分类信息存储到模型参数中,然后通过模型反演重建合成图像。针对图像中多个对象的复杂性,我们提出了前景背景解耦,以集中更新多个实例的前景,并提出增量补丁扩展,进一步增强前景的多样性。
在多个检测数据集上进行的广泛实验表明DCOD的优越性。即使在极低的压缩率1%下,我们在VOC和COCO上分别实现了46.4%和24.7%的AP@50,显著减少了检测器的训练时间。