一种基于视觉大模型增强的开放世界目标检测方法

2025年6月20日
数园网络
54

申请号:CN202410301193.8

申请人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

专利权人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

申请日:2024-03-15

授权日:2024-09-20

专利类型:发明

法律状态:授权

发明人:黄阳阳 | 罗荣华

摘要:本发明公开了一种基于视觉大模型增强的开放世界目标检测方法。所述方法利用视觉大模型对输入图像预处理,无监督的方式获取未知对象的原始伪标签,然后利用提出的基于对象重构的韦布尔模型对未知对象进行建模,实现了开放环境下对已知和未知类别的检测,减少了人工标注的成本,提高了开放世界下目标检测精度。

摘要附图: