一种基于强化学习的实体语义关联推理方法及系统技术方案

技术编号:36950129 阅读:34 留言:0更新日期:2023-03-22 19:10
本发明专利技术公开了一种基于强化学习的实体语义关联推理方法及系统,其中方法包括获取标准信息文档和待推理实体;对标准信息文档进行自然语言处理,确定标准信息文档中的实体、关联信息以及可度量数量信息四元组;对实体和关联信息进行实体关联处理,确定实体联系数据集;根据可度量数量信息四元组构建多边形结构网络;将多边形结构网络作为强化学习环境,并结合基于强化学习环境设置的奖励函数,确定强化学习模型;根据实体联系数据集,将待推理实体输入强化学习模型进行关联推理处理,确定目标实体集合。本发明专利技术实施例可以更好地处理实体和其对应的可度量数量信息的语义信息,减少强化学习智能体的学习成本,可广泛应用于人工智能技术领域。技术领域。技术领域。

【技术实现步骤摘要】
一种基于强化学习的实体语义关联推理方法及系统


[0001]本专利技术涉及人工智能
,尤其是一种基于强化学习的实体语义关联推理方法及系统。

技术介绍

[0002]相关技术中,通常会使用知识图谱技术结合强化学习来处理文本中的实体,从而进行实体关联的推理。但是对于标准信息文档,不仅要处理文档中的实体信息,还要处理某个实体所对应的可度量数量信息,以及怎么把实体的语义和实体对应的数量信息的语义融合在一起进行处理。但是,知识图谱在处理实体和可度量数量信息的时候没有办法很好的将两者的语义信息融合在一起进行处理,在一定程度上使得强化学习的智能体没有办法很好的学习到正确的推理方式,从而提高了强化学习智能体的学习成本。综合上述,相关技术中存在的技术问题亟需得到解决。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供一种基于强化学习的实体语义关联推理方法及系统,以实现更好地处理实体和其对应的可度量数量信息的语义信息,减少强化学习智能体的学习成本。
[0004]一方面,本专利技术提供了一种基于强化学习的实体语义关联推理方法,所述方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的实体语义关联推理方法,其特征在于,所述方法包括:获取标准信息文档和待推理实体;对所述标准信息文档进行自然语言处理,确定所述标准信息文档中的实体、关联信息以及可度量数量信息四元组;对所述实体和所述关联信息进行实体关联处理,确定实体联系数据集;根据所述可度量数量信息四元组构建多边形结构网络;将所述多边形结构网络作为强化学习环境,并结合基于所述强化学习环境设置的奖励函数,确定强化学习模型;根据所述实体联系数据集,将所述待推理实体输入所述强化学习模型进行关联推理处理,确定目标实体集合。2.根据权利要求1所述的方法,其特征在于,所述对所述实体和所述关联信息进行实体关联处理,确定实体联系数据集,包括:将所述实体和所述关联信息输入中文语料库进行词嵌入处理,确定实体语义信息和关联语义信息;对所述实体语义信息和所述关联语义信息进行三维映射处理,确定实体联系数据集。3.根据权利要求1所述的方法,其特征在于,所述根据所述可度量数量信息四元组构建多边形结构网络,包括:结合第一语义公式对所述可度量数量信息四元组进行映射填充处理,确定网络节点的语义信息;对所述网络节点的语义信息进行语义距离计算处理,确定相似数据集;从所述相似数据集中选取k个网络节点构建网络层,所述k为大于等于3的整数;根据所述网络节点的语义信息结合第二语义公式,确定相连边的语义信息;根据所述网络节点的语义信息、所述相连边的语义信息和所述网络层,确定多边形结构网络。4.根据权利要求1所述的方法,其特征在于,所述将所述多边形结构网络作为强化学习环境,并结合基于所述强化学习环境设置的奖励函数,确定强化学习模型,包括:将所述多边形结构网络作为强化学习模型环境;根据智能体在所述强化学习模型环境的交互,确定奖励函数;根据所述智能体在所述强化学习模型环境中当前节点的节点语义信息、所述当前节点在网络中的层数、和已经行走过的距离,确定所述智能体的状态定义;根据所述智能体在所述强化学习模型环境选择下一步从所述当前节点跳转到其他节点,确定所述智能体的动作定义;根据所述强化学习模型环境、所述奖励函数、所述智能体的状态定义,所述智能体的动作定义,确定强化学习模型。5.根据权利要求1所述的方法,其特征在于,所述基于所述强化学习环境设置的奖励函数,包括:所述奖励函数Reward的定义公式为:
其中,下...

【专利技术属性】
技术研发人员:郝天永黄邦锐莫迪
申请(专利权)人:华南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1