金融界2024年3月6日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“基于人工智能的视觉关系识别方法、装置及电子设备“,授权公告号CN112149692B,申请日期为2020年10月。
专利摘要显示,本申请提供了一种基于人工智能的视觉关系识别方法、装置、电子设备及计算机可读存储介质;涉及人工智能的图像识别技术;方法包括:确定待识别图像中包括多个对象的联合包围框;提取联合包围框的视觉特征,将视觉特征转化为与多个视觉关系标签一一对应的多个视觉特征高斯分布;提取每个视觉关系标签的语义特征,将语义特征转化为对应视觉关系标签的语义特征高斯分布;在与多个视觉关系标签一一对应的多个语义特征高斯分布中,确定与视觉特征高斯分布匹配的语义特征高斯分布;将匹配的语义特征高斯分布对应的视觉关系标签所对应的视觉关系,确定为多个对象之间的视觉关系。通过本申请,能够提升视觉关系的检测准确率。
本文源自金融界
评论留言