基于知识图谱的视觉问答处理方法、设备及存储介质技术

技术编号：35760987 阅读：17 留言：0更新日期：2022-11-26 19:11

本申请公开了一种基于知识图谱的视觉问答处理方法、设备及存储介质，属于视觉问答技术领域，本申请提供的一种基于知识图谱的视觉问答处理方法，通过知识图谱构建对象物之间的关系，通过预训练的预训练的TransH模型获取对于的知识图谱特征，将视觉特征、文本问题特征和知识图谱特征融合，基于融合特征获取概率最高的候选答案，实现高效准确的视觉问答处理。实现高效准确的视觉问答处理。实现高效准确的视觉问答处理。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识图谱的视觉问答处理方法、设备及存储介质

[0001]本专利技术属于视觉问答
，具体来说是一种基于知识图谱的视觉问答处理方法、设备及存储介质。

技术介绍

[0002]文旅客服领域存在大量提问频次高、流程固定繁琐、重复性高的问题，人工客服服务过程不仅会感到枯燥而且学习和回复的时间成本高，使用智能问答代替人工客服完成一部分重复工作，可以帮助企业在节省人力成本的同时提高服务效率。然而对于图片和文本结合的视觉问答形式智能客服目前难以有效的进行回复，依旧依赖于人工客服的处理。
[0003]基于图片和文本结合的视觉问答难以实现智能客服的原因，很大一部分来自于人工智能无法有效的识别文本与图像中对象物的关系。

技术实现思路

[0004]为解决或部分解决上述技术问题，本专利技术提供一种于知识图谱的视觉问答处理方法、设备及存储介质，本专利技术方案在视觉特征和文本问题特征获取后，通过知识图谱构建对象物之间的关系，通过预训练的预训练的TransH模型获取对于的知识图谱特征，将视觉特征、文本问题特征和知识图谱特征融合，基于融合特征获取概率最高的候选答案，实现视觉问答，具体技术方案如下：一种基于知识图谱的视觉问答处理方法，包括如下步骤：获取待处理图像和待处理文本；将待处理图像输入Faster R
‑
CNN网络进行特性提取，获取所述待处理图像的第一图像特征集合，所述第一图像特征集合为所述待处理图像所有图像特征的集合，将第一图像特征中的图像特征对应嵌入待处理图像中，输出第一图像特征向量；其中，所...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的视觉问答处理方法，其特征在于，包括如下步骤：获取待处理图像和待处理文本；将待处理图像输入Faster R
‑
CNN网络进行特性提取，获取所述待处理图像的第一图像特征集合，所述第一图像特征集合为所述待处理图像所有图像特征的集合，将第一图像特征中的图像特征对应嵌入待处理图像中，输出第一图像特征向量；其中，所述图像特征包括待处理图像中对象物相应的类别标签、对象物空间位置关系和对象属性；将待处理文本序列化并通过GloVe词嵌入模型进行特征向量提取得到文本向量集合；所述文本向量集合为待处理文本每个单词对应的词向量组成的集合；基于GRU处理所述文本向量集合中每个单词对应的词向量的嵌入序列以得到第一文本特征向量；将第一图像特征向量基于图像空间注意力机制进行处理，得到第二图像特征向量，将第一文本特征进行注意力机制处理得到第二文本特征向量；根据第一图像特征集合及第一文本特征构建待处理图像对应的关联知识图谱，将处理图像对应的关联知识图谱输入预训练的TransH知识表示模型得到第一知识图谱特征；将第二图像特征向量、第二文本特征向量机第一知识图谱特征进行特征融合得到图像问答特征，将图像问答特征输入预训练的答案分类器获取概率最高的类别作为输出候选答案。2.根据权利要求1所述的一种基于知识图谱的视觉问答处理方法，其特征在于，所述处理图像对应的关联知识图谱的构建步骤包括：获取第一图像特征集合中对象物的类别标签和对象属性，根据对象属性和类别标签并基于第一文本特征向量获取主体对象和背景对象，以主体对象为中心节点、背景对象...

【专利技术属性】
技术研发人员：吴倩文，陈海江，张良友，
申请(专利权)人：浙江力石科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人