金融界2024年12月5日消息,国家知识产权局信息显示,咪咕文化科技有限公司申请一项名为“一种文本生成方法、装置及相关设备”的专利,公开号 CN 119067178 A,申请日期为2024年8月。
专利摘要显示,本申请提供一种文本生成方法、装置及相关设备,涉及人工智能的技术领域,所述方法包括:对待预测图像进行编码,得到图像特征;根据所述图像特征对关联所述待预测图像的非图像特征进行计算,得到第一注意力信息,以及根据所述非图像特征对所述图像特征进行计算,得到第二注意力信息,所述非图像特征用于表示所述待预测图像的上下文语境;对所述第一注意力信息和所述第二注意力信息进行融合,得到目标注意力信息;对所述目标注意力信息进行解码,得到预测文本。本申请通过图像特征和用于描述图像上下文语境的非图像特征的双向交互,可获得更加准确的注意力信息,进而得以输出贴合待预测图像的图像内容的预测文本。
本文源自:金融界