篇章因果关系判断方法、系统、装置制造方法及图纸

技术编号：21432451 阅读：51 留言：0更新日期：2019-06-22 11:59

本发明专利技术属于自然语言处理技术领域，具体涉及一种篇章因果关系判断方法、系统、装置，旨在为了解决机器人交互中的篇章因果关系判断问题。本发明专利技术方法包括：基于语言激活模型，对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件；基于每条目标文本对应的注册事件，依据所存储的各场景中注册事件序列，计算两个注册事件的相关性；基于所述目标文本对、两个注册事件的相关性，计算所述目标文本对的因果关系。本发明专利技术可以对输入的目标文本对进行因果关系的准确判断。

全部详细技术资料下载

【技术实现步骤摘要】
篇章因果关系判断方法、系统、装置
本专利技术属于自然语言处理
，具体涉及一种篇章因果关系判断方法、系统、装置。
技术介绍
篇章与人们的日常交流几乎是密不可分的。人们更是会频繁使用篇章关系来表述和传达上下文之间的语义关系(例如：因果关系，递进关系，转折关系等)。同时，随着机器人逐步在人们的日常生活中扮演一个越来越重要的角色，如何让机器人理解人们的日常表达中的篇章关系成为了一个不可回避的问题。但是，这个问题的难点在于并没有一个很好的理论以及模型框架，而现有的方法又局限在文本层面并且很难获取文本内在的语义这导致现有的方法依然存在很多问题。最近，在人工智能领域有研究人员提出了一种成为情景化语言学习的思路，这种思路认为“语言的语义主要来自于环境”，根据这种思路若希望机器能够理解语言，这台机器应该是可感知的，具有交互能力的，其中篇章因果关系的判断在机器人的交互中具有重要作用。
技术实现思路
为了解决现有技术中的上述问题，即为了解决机器人交互中的篇章因果关系判断问题，本专利技术的第一方面，提出了一种篇章因果关系判断方法，该方法包括：步骤S10，基于语言激活模型，对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件；所述目标文本对为输入两条目标文本；步骤S20，基于每条目标文本对应的注册事件，依据所存储的各场景中注册事件序列，计算两个注册事件的相关性；所述场景中注册事件序列为基于场景结构化的经验信息构建的具有布尔时序特征的注册事件序列；步骤S30，基于所述目标文本对、步骤S20得到的两个注册事件的相关性，计算所述目标文本对的因果关系；其中，所述语言激活模型通过经...

【技术保护点】
1.一种篇章因果关系判断方法，其特征在于，该方法包括：步骤S10，基于语言激活模型，对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件；所述目标文本对为输入两条目标文本；步骤S20，基于每条目标文本对应的注册事件，依据所存储的各场景中注册事件序列，计算两个注册事件的相关性；所述场景中注册事件序列为基于场景结构化的经验信息构建的具有布尔时序特征的注册事件序列；步骤S30，基于所述目标文本对、步骤S20得到的两个注册事件的相关性，计算所述目标文本对的因果关系；其中，所述语言激活模型通过经验‑语言激活训练语料对机器翻译模型进行训练得到；所述经验‑语言激活训练语料基于机器人经验中的注册事件构建。

【技术特征摘要】
1.一种篇章因果关系判断方法，其特征在于，该方法包括：步骤S10，基于语言激活模型，对输入的目标文本对中每条目标文本分别获取匹配度最高的注册事件；所述目标文本对为输入两条目标文本；步骤S20，基于每条目标文本对应的注册事件，依据所存储的各场景中注册事件序列，计算两个注册事件的相关性；所述场景中注册事件序列为基于场景结构化的经验信息构建的具有布尔时序特征的注册事件序列；步骤S30，基于所述目标文本对、步骤S20得到的两个注册事件的相关性，计算所述目标文本对的因果关系；其中，所述语言激活模型通过经验-语言激活训练语料对机器翻译模型进行训练得到；所述经验-语言激活训练语料基于机器人经验中的注册事件构建。2.根据权利要求1所述的篇章因果关系判断方法，其特征在于，步骤S30中“计算所述目标文本对的因果关系”，其方法为：fr＝softmax(tanh(Wc*[s1；s2]+Wt*feat+b))其中，fr为因果关系概率值，包括因果关系概率、非因果关系概率；s1、s2是目标文本对中两个目标文本通过文本编码模型获得的句子向量；Wc为预设的文本向量的参数矩阵；Wt为预设的布尔时序特征的参数矩阵；b为预设的偏置量。3.根据权利要求1所述的篇章因果关系判断方法，其特征在于，步骤S20“计算两个注册事件的相关性”，其方法为：其中，feat为所计算的相关性；e1、e2分别为目标文本对中第一目标文本、第二目标文本匹配到的注册事件；P(e1)为所存储全部场景结构化的经验信息中e1出现的概率；P(e2|e1)为出现e1的结构化的经验信息中e2的出现概率。4.根据权利要求1所述的篇章因果关系判断方法，其特征在于，所述注册事件，ei＝{obji}，i∈Ri其中，ei为第i个注册事件；obji为该注册事件中处于激活状态的对象；Ri为该注册事件中的对象符号在语言激活模型全部对象的编号。5.根据权利要求4所述的篇章因果关系判断方法，其特征在于，所述经验-语言激活训练语料，其表达式为Ej＝{obji}：{LSi}，i∈Ri其中，Ej为第j个经验-语言激活训练语料；LSi为对象obji对应的语言字符。6.根据权利要求1所述的篇章因果关系判断方法，其特征在于，步骤S...

【专利技术属性】
技术研发人员：向露，刘洋，张家俊，周玉，宗成庆，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人