在计算机视觉的浩瀚海洋中,百度再度扬帆起航。根据金融界2024年12月9日的消息,国家知识产权局已收到北京百度网讯科技有限公司提交的一项具有革命性潜力的专利申请,专利名为“目标检测方法、目标检测模型及目标检测装置”。这款创新技术的公开号为CN119091121A,注册时间为2024年8月。在这一专利中,百度不仅从纯文本的传统提示中寻求突破,还通过引入视觉提示,开创了多模态查询的新局面!
该专利的摘要展示了一幅关于目标检测的全新图景:首先,通过对待检测的图像进行深入剖析,提取出第一图像特征。然后,从同一图像中获取提示图像,并将其进行特征提取,形成第二图像特征。此外,百度还从提示文本中提取出文本特征。通过将这些特征进行了巧妙的融合,创造出一种多模态特征。这一新方法让文本特征与图像特征进行相似度匹配,从而在获得的匹配结果中高效输出目标检测的结果。
更具亮点的是,专利中提到的第二图像特征是从待检测图像中提取出的更具代表性的区域,这使得目标对象的视觉信息获得了更为精准的挖掘,极大地提升了查询的准确度。简而言之,百度的这个新专利正是对目标检测领域的一个重要补充,打破了纯文本提示的信息局限,推动着计算机视觉技术不断向前迈进。此项技术的推出,无疑将进一步改变我们与机器之间的信息交互方式,期待这一创新能够在未来带来更广泛的应用价值。