篇章因果关系判断方法、系统、装置制造方法及图纸

技术编号:21432451 阅读:51 留言:0更新日期:2019-06-22 11:59
本发明专利技术属于自然语言处理技术领域,具体涉及一种篇章因果关系判断方法、系统、装置,旨在为了解决机器人交互中的篇章因果关系判断问题。本发明专利技术方法包括:基于语言激活模型,对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件;基于每条目标文本对应的注册事件,依据所存储的各场景中注册事件序列,计算两个注册事件的相关性;基于所述目标文本对、两个注册事件的相关性,计算所述目标文本对的因果关系。本发明专利技术可以对输入的目标文本对进行因果关系的准确判断。

【技术实现步骤摘要】
篇章因果关系判断方法、系统、装置
本专利技术属于自然语言处理
,具体涉及一种篇章因果关系判断方法、系统、装置。
技术介绍
篇章与人们的日常交流几乎是密不可分的。人们更是会频繁使用篇章关系来表述和传达上下文之间的语义关系(例如:因果关系,递进关系,转折关系等)。同时,随着机器人逐步在人们的日常生活中扮演一个越来越重要的角色,如何让机器人理解人们的日常表达中的篇章关系成为了一个不可回避的问题。但是,这个问题的难点在于并没有一个很好的理论以及模型框架,而现有的方法又局限在文本层面并且很难获取文本内在的语义这导致现有的方法依然存在很多问题。最近,在人工智能领域有研究人员提出了一种成为情景化语言学习的思路,这种思路认为“语言的语义主要来自于环境”,根据这种思路若希望机器能够理解语言,这台机器应该是可感知的,具有交互能力的,其中篇章因果关系的判断在机器人的交互中具有重要作用。
技术实现思路
为了解决现有技术中的上述问题,即为了解决机器人交互中的篇章因果关系判断问题,本专利技术的第一方面,提出了一种篇章因果关系判断方法,该方法包括:步骤S10,基于语言激活模型,对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件;所述目标文本对为输入两条目标文本;步骤S20,基于每条目标文本对应的注册事件,依据所存储的各场景中注册事件序列,计算两个注册事件的相关性;所述场景中注册事件序列为基于场景结构化的经验信息构建的具有布尔时序特征的注册事件序列;步骤S30,基于所述目标文本对、步骤S20得到的两个注册事件的相关性,计算所述目标文本对的因果关系;其中,所述语言激活模型通过经验-语言激活训练语料对机器翻译模型进行训练得到;所述经验-语言激活训练语料基于机器人经验中的注册事件构建。在一些优选实施方式中,步骤S30中“计算所述目标文本对的因果关系”,其方法为:fr=softmax(tanh(Wc*[s1;s2]+Wt*feat+b))其中,fr为因果关系概率值,包括因果关系概率、非因果关系概率;s1、s2是目标文本对中两个目标文本通过文本编码模型获得的句子向量;Wc为预设的文本向量的参数矩阵;Wt为预设的布尔时序特征的参数矩阵;b为预设的偏置量。在一些优选实施方式中,步骤S20“计算两个注册事件的相关性”,其方法为:其中,feat为所计算的相关性;e1、e2分别为目标文本对中第一目标文本、第二目标文本匹配到的注册事件;P(e1)为所存储全部场景结构化的经验信息中e1出现的概率;P(e2|e1)为出现e1的结构化的经验信息中e2的出现概率。在一些优选实施方式中,所述注册事件,ei={obji},i∈Ri其中,ei为第i个注册事件;obji为该注册事件中处于激活状态的对象;Ri为该注册事件中的对象符号在语言激活模型全部对象的编号。在一些优选实施方式中,所述经验-语言激活训练语料,其表达式为Ej={obji}:{LSi},i∈Ri其中,Ej为第j个经验-语言激活训练语料;LSi为对象obji对应的语言字符。在一些优选实施方式中,步骤S20所述各场景中注册事件序列,其获取方法包括:步骤A10,在机器人的工作环境中,通过机器人自身的感知装置获取的机器人与对象交互得到的对象信息;所述对象信息包括机器人与对象交互得到的对象属性、对象状态信息;步骤A20,对步骤A10中获取的对象信息进行结构化处理,并按照时间顺序进行组织和存储,作为机器人的运行工作环境得到的结构化的经验信息。步骤A30,去除所述结构化的经验信息中处于未激活状态的对象,得到对应场景中注册事件序列。在一些优选实施方式中,所述结构化的经验信息,其表达式为E0-t={f0,f1,f2,…,ft}ft={obj1:a1;…obji:ai;…objn:an;}其中,E0-t为从0时刻到t时刻的所有经验;ft为第t时刻输入的所有对象信息;obji为第i个对象,ai为对象obji的激活状态,ai=1时表示第i个对象被激活,ai=0时表示第i个对象未被激活,i∈[1,n]。本专利技术的第二方面,提出了一种篇章因果关系判断系统,该系统包括注册事件匹配模块、相关性计算模块、因果关系计算模块;所述注册事件匹配模块,配置为基于语言激活模型,对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件;所述目标文本对为输入两条目标文本;所述相关性计算模块,配置为基于每条目标文本对应的注册事件,依据所存储的各场景中注册事件序列,计算两个注册事件的相关性;所述场景中注册事件序列为基于场景结构化的经验信息构建的具有布尔时序特征的注册事件序列;所述因果关系计算模块,配置为基于所述目标文本对、步骤S20得到的两个注册事件的相关性,计算所述目标文本对的因果关系;其中,所述语言激活模型通过经验-语言激活训练语料对机器翻译模型进行训练得到;所述经验-语言激活训练语料基于机器人经验中的注册事件构建。本专利技术第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述篇章因果关系判断方法。本专利技术的第四方面,提出了一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述篇章因果关系判断方法。本专利技术的有益效果:通过本专利技术中场景的注册事件序列进行相关性计算,并进一步结合目标文本对的注册事件,进行目标文本对的因果关系计算,可以得到准确的因果关系判断结果。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本专利技术一种实施例的篇章因果关系判断方法流程示意图;图2是本专利技术一种实施例的篇章因果关系判断示例。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术的基本思想是利用机器人工作平台的信号输入,针对机器人构建固化网络,再利用深度神经网络技术实现对文本语义更好地建模以达到最后因果关系判断的目的。本专利技术的一种篇章因果关系判断方法,如图1所示,该方法包括:步骤S10,基于语言激活模型,对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件;所述目标文本对为输入两条目标文本;步骤S20,基于每条目标文本对应的注册事件,依据所存储的各场景中注册事件序列,计算两个注册事件的相关性;所述场景中注册事件序列为基于场景结构化的经验信息构建的具有布尔时序特征的注册事件序列;步骤S30,基于所述目标文本对、步骤S20得到的两个注册事件的相关性,计算所述目标文本对的因果关系;其中,所述语言激活模型通过经验-语言激活训练语料对机器翻译模型进行训练得到;所述经验-语言激活训练语料本文档来自技高网...

【技术保护点】
1.一种篇章因果关系判断方法,其特征在于,该方法包括:步骤S10,基于语言激活模型,对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件;所述目标文本对为输入两条目标文本;步骤S20,基于每条目标文本对应的注册事件,依据所存储的各场景中注册事件序列,计算两个注册事件的相关性;所述场景中注册事件序列为基于场景结构化的经验信息构建的具有布尔时序特征的注册事件序列;步骤S30,基于所述目标文本对、步骤S20得到的两个注册事件的相关性,计算所述目标文本对的因果关系;其中,所述语言激活模型通过经验‑语言激活训练语料对机器翻译模型进行训练得到;所述经验‑语言激活训练语料基于机器人经验中的注册事件构建。

【技术特征摘要】
1.一种篇章因果关系判断方法,其特征在于,该方法包括:步骤S10,基于语言激活模型,对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件;所述目标文本对为输入两条目标文本;步骤S20,基于每条目标文本对应的注册事件,依据所存储的各场景中注册事件序列,计算两个注册事件的相关性;所述场景中注册事件序列为基于场景结构化的经验信息构建的具有布尔时序特征的注册事件序列;步骤S30,基于所述目标文本对、步骤S20得到的两个注册事件的相关性,计算所述目标文本对的因果关系;其中,所述语言激活模型通过经验-语言激活训练语料对机器翻译模型进行训练得到;所述经验-语言激活训练语料基于机器人经验中的注册事件构建。2.根据权利要求1所述的篇章因果关系判断方法,其特征在于,步骤S30中“计算所述目标文本对的因果关系”,其方法为:fr=softmax(tanh(Wc*[s1;s2]+Wt*feat+b))其中,fr为因果关系概率值,包括因果关系概率、非因果关系概率;s1、s2是目标文本对中两个目标文本通过文本编码模型获得的句子向量;Wc为预设的文本向量的参数矩阵;Wt为预设的布尔时序特征的参数矩阵;b为预设的偏置量。3.根据权利要求1所述的篇章因果关系判断方法,其特征在于,步骤S20“计算两个注册事件的相关性”,其方法为:其中,feat为所计算的相关性;e1、e2分别为目标文本对中第一目标文本、第二目标文本匹配到的注册事件;P(e1)为所存储全部场景结构化的经验信息中e1出现的概率;P(e2|e1)为出现e1的结构化的经验信息中e2的出现概率。4.根据权利要求1所述的篇章因果关系判断方法,其特征在于,所述注册事件,ei={obji},i∈Ri其中,ei为第i个注册事件;obji为该注册事件中处于激活状态的对象;Ri为该注册事件中的对象符号在语言激活模型全部对象的编号。5.根据权利要求4所述的篇章因果关系判断方法,其特征在于,所述经验-语言激活训练语料,其表达式为Ej={obji}:{LSi},i∈Ri其中,Ej为第j个经验-语言激活训练语料;LSi为对象obji对应的语言字符。6.根据权利要求1所述的篇章因果关系判断方法,其特征在于,步骤S...

【专利技术属性】
技术研发人员:向露刘洋张家俊周玉宗成庆
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1