欢迎访问视觉与智能学习实验室网站!

通知公告

祝贺:实验室团队硕士生王雨滨一篇论文“Learning Hierarchical Prompt with Structured Linguistic Knowledge for Vision-Language Models”被AAAI 2024录用

作者: 时间:2023-12-09 点击数:

  祝贺实验室团队硕士生王雨滨一篇论文“Learning Hierarchical Prompt with Structured Linguistic Knowledge for Vision-Language Models”被The 38th Annual AAAI Conference on Artificial Intelligence录用。本文提出了一种利用结构化知识进行分层提示学习的方法。本文认为,利用描述中的结构关系来辅助学习提示是至关重要的。具体来说,对类别的描述由定义类别的若干实体和属性组成。例如,在一段和"睡莲"相关的描述中,该类别是由 "叶子""花苞""花朵 "等实体定义的,每个实体都与特定类别的属性相关联,共同构成了描述中的结构关系,这些结构信息往往是识别图像中物体所属类别的关键。因此,本文考虑利用语言模型生成了与人类相似的描述,并附带相应的结构关系。在方法部分,本文提出了分层提示调整,这是一种同时对结构化知识和传统语言知识进行建模的方法,可大大提高提示的有效性。具体来说,为了给复杂的结构化信息建模,模型学习不同语义层次的分层提示,包含代表实体和属性的低层提示、从描述中提取的类别相关信息的高层提示,以及跨类别共享的类别无关知识的全局提示。得益于对结构化知识所提供的类别相关信息,本文所提方法在基类到新类泛化任务、域泛化任务以及跨数据集泛化任务相关的十余个图像分类识别数据集上均取得了强大性能。


版权所有:同济大学 视觉与智能学习实验室

地址:上海市嘉定区曹安公路4800号同济大学嘉定校区智信馆4楼
Email:zhaocairong@tongji.edu.cn