一种基于视觉大模型增强的开放世界目标检测方法

2025年6月20日

数园网络

440

申请号：CN202410301193.8

申请人：华南理工大学 | 人工智能与数字经济广东省实验室(广州)

专利权人：华南理工大学 | 人工智能与数字经济广东省实验室(广州)

申请日：2024-03-15

授权日：2024-09-20

专利类型：发明

法律状态：授权

发明人：黄阳阳 | 罗荣华

摘要：本发明公开了一种基于视觉大模型增强的开放世界目标检测方法。所述方法利用视觉大模型对输入图像预处理，无监督的方式获取未知对象的原始伪标签，然后利用提出的基于对象重构的韦布尔模型对未知对象进行建模，实现了开放环境下对已知和未知类别的检测，减少了人工标注的成本，提高了开放世界下目标检测精度。

摘要附图：

3-CN202410301193.8-一种基于视觉大模型增强的开放世界目标检测方法.pdf