一种基于语义解析和SMT求解的阅读理解题求解方法技术

技术编号：19479928 阅读：42 留言：0更新日期：2018-11-17 10:31

本发明专利技术提出一种基于语义解析和SMT求解的阅读理解题求解方法。该方法首先对阅读理解题进行语义解析，继而生成与阅读理解题对应的一阶逻辑公式，再引入四个假设——唯一名称假设、封闭世界假设、封闭原因假设和唯一答案假设来生成额外的一阶逻辑公式。这两部分一阶逻辑公式构成了表达阅读理解题所包含信息的知识库。再根据阅读理解题中的问句来生成候选答案对应的一阶逻辑公式。最后，该方法使用SMT求解器来验证知识库是否蕴涵候选答案对应的一阶逻辑公式，继而求出答案。相比已有的使用神经网络模型和词向量来表达文本的方式，本发明专利技术能更好地建立起阅读理解题中所描述的事件之间的关系，从而赋予了阅读理解系统更强的表达能力和推理能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语义解析和SMT求解的阅读理解题求解方法
本专利技术涉及计算机领域，具体涉及一种基于语义解析和SMT(SatisfiabilityModuloTheories)求解的阅读理解题求解方法。
技术介绍
对于机器来说，阅读一段文本然后回答与该文本相关的问题，是一项具有挑战性的任务。一个机器只有具有了对文本进行阅读理解和推理求解的能力，它才能完成该任务。为了检验机器阅读理解和推理求解能力的强弱，学者们提出了多种数据集，其中包括MCTest,WikiQA，SQuAD，MSMARCO等。这些数据集中的阅读理解题都是由一段长文本和相关的问题组成的。它们的特点是：1、文本较长，机器需要排除文本中与问题不相关的信息的干扰；2、大多数问题的答案直接出现在长文本中的某一句话，机器只需对这句话进行分析即可得到答案；3、句式丰富，语法复杂，机器需要对不同的句式和语法进行分析。但是这些数据集没有强调阅读理解题中事件之间的关系，也就没有要求机器对这些关系进行表达和推理。WinogradSchemaChallenge(WSC)由HectorLevesque等人提出，它可用于评估机器的常识...

【技术保护点】
1.一种基于语义解析和SMT求解的阅读理解题求解方法，其特征在于，所述方法先使用语义解析工具对阅读理解题进行语义解析，然后根据语义解析结果生成表示阅读理解题文本信息的一阶逻辑公式φ；再生成候选答案所对应的一阶逻辑公式

【技术特征摘要】
1.一种基于语义解析和SMT求解的阅读理解题求解方法，其特征在于，所述方法先使用语义解析工具对阅读理解题进行语义解析，然后根据语义解析结果生成表示阅读理解题文本信息的一阶逻辑公式φ；再生成候选答案所对应的一阶逻辑公式最后，该方法对取非并与φ进行合取而得到公式并调用SMT求解器去求解的可满足性；若是不可满足的，那么所对应的候选答案就是该方法所求解出来的阅读理解题的答案。该方法包括以下步骤：S1.输入阅读理解题文本，使用SEMPRE语义解析工具对阅读理解题文本进行解析，获取阅读理解题文本中单词的词元、词性以及词与词之间的依赖关系；S2.对单词的词元和词性执行判断来获得谓词符号以及常元；S3.根据谓词符号及其相关参数来构造原子公式；S4.根据文本中的句子之间的连接关系来构造复杂公式；S5.在复杂公式中添加量词以获得完整的一阶逻辑公式S6.引入四个假设来生成额外的一阶逻辑公式S7.对进行合取来得到新的公式φ；S8.对阅读理解题中的问句进行语义解析并求解出答案。2.根据权利要求1所述基于语义解析和SMT求解的阅读理解题求解方法，其特征在于，所述对单词的词元和词性进行判断包括：若单词为动词、形容词或者普通名词，将该单词声明为一阶逻辑语言中的谓词符号；若单词为专有名词或者特指名词，将该单词声明为一阶逻辑语言中的常元，其中特指名词是指由定冠词“the”、形容词“this”或者形容词“that”形容的名词；若单词为代词，则将...

【专利技术属性】
技术研发人员：刘咏梅，杨宇灏，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人