
祝贺实验室团队博士生窦曙光一篇论文“Hierarchical Recognizing Vector Graphics and A New Chart-based Vector Graphics Dataset”被IEEE Transactions on Pattern Analysis and Machine Intelligence录用。如上图所示,将矢量图形渲染为像素阵列会导致大量内存消耗或信息丢失。此外,这一过程还会丢弃基元中的高级结构信息,而这些信息对于识别边角和轮廓等识别任务至关重要。综上所述,我们提出了"You Only Look at Text (YOLaT)"方案,通过将矢量图形的文本文档作为输入来解决光栅图形的问题。YOLaT++是一种针对矢量图形(VGs)设计的层次化结构,包括三个级别:基元、曲线和点。此外,YOLaT++采用了一种位置感知增强策略,以有效区分相似的基元。这种多级抽象提高了模型在不同任务和场景中的适应性和性能,通过提供全面的、多级的特征表示。与最新的Yolo系列和基于Transformer的方法DETR和DINO相比,我们的方法在更高效率的同时性能更好。
