【技术实现步骤摘要】
一种文本语义解析方法及装置
本申请涉及自然语言处理
,尤其涉及一种文本语义解析方法及装置。
技术介绍
机器阅读理解是当前人工智能热点研究方向,机器阅读理解任务,指的是给定一段篇章语句(context)和一个对应的查询语句(query),然后机器通过阅读篇章语句和查询语句,解析出对应的答案。现有技术中,通过解析篇章语句和查询语句的语义来确定查询语句对应的答案。其中,所述答案需是能够在篇章语句中找到的一段话(也可以理解为连续的几个单词),而阅读理解的最终目标是确定两个下标,分别对应于答案在篇章语句中的开始位置和结束位置。解析语义以确定相应的答案的阅读理解任务,通常由基于深度学习的机器阅读理解模型实现。这一类模型的框架基本相同,主要包括:嵌入编码模块、context-query交互模块和输出预测模块。其中,嵌入编码模块用于将给定文本表示为模型可接受的词向量,context-query交互模块用于给定文本的语义特征,输出预测模块用于输出答案在文本中的位置。然而,现有的语义解析方法准确度较低、计算过程收敛速度较慢,这同时也使得基于上述框架的阅读理解模型所显现的性能也仍 ...
【技术保护点】
1.一种文本语义解析方法,其特征在于,所述方法包括:获取给定文本的向量表示,根据所述向量表示生成所述给定文本的编码向量;所述给定文本包括第一文本和第二文本;所述编码向量包括第一文本对应的第一编码向量和第二文本对应的第二编码向量;根据所述第一编码向量和第二编码向量生成第一注意力和第二注意力,并根据所述第一注意力和第二注意力生成全局信息向量;从所述全局信息向量中获取语义增强向量;根据所述语义增强向量,解析出所述第一文本中的与所述第二文本对应的目标文本。
【技术特征摘要】
1.一种文本语义解析方法,其特征在于,所述方法包括:获取给定文本的向量表示,根据所述向量表示生成所述给定文本的编码向量;所述给定文本包括第一文本和第二文本;所述编码向量包括第一文本对应的第一编码向量和第二文本对应的第二编码向量;根据所述第一编码向量和第二编码向量生成第一注意力和第二注意力,并根据所述第一注意力和第二注意力生成全局信息向量;从所述全局信息向量中获取语义增强向量;根据所述语义增强向量,解析出所述第一文本中的与所述第二文本对应的目标文本。2.根据权利要求1所述的方法,其特征在于,所述从全局信息向量中获取语义增强向量,包括:对所述全局信息向量进行卷积计算;对卷积计算结果进行转置卷积计算,得到与所述全局信息向量结构相同的语义增强向量。3.根据权利要求1所述的方法,其特征在于,所述从全局信息向量中获取语义增强向量,包括:对所述全局信息向量进行卷积计算;对卷积计算结果进行转置卷积计算,得到与所述全局信息向量结构相同的中间向量;将卷积计算结果与所述中间向量拼接,形成所述语义增强向量。4.根据权利要求1-3任一项所述的方法,其特征在于,所述获取给定文本的向量表示,根据所述向量表示生成所述给定文本的编码向量,包括:处理所述给定文本,得到给定文本的向量表示;对所述向量表示添加位置编码信息得到卷积神经网络的输入矩阵,以利用卷积神经网络从输入矩阵中提取局部信息向量;根据所述局部信息向量获得所述给定文本的注意力信息;根据所述注意力信息生成所述给定文本的编码向量。5.根据权利要求1-3任一项所述的方法,其特征在于,所述获取给定文本的向量表示,根据所述向量表示生成所述给定文本的编码向量,包括:处理所述给定文本,得到给定文本的向量表示;从给定文本的向量表示中获取初步增强矩阵;对所述初步增强矩阵添加位置编码信息得到卷积神经网络的输入矩阵,以利用卷积神经网络从所述输入矩阵中提取局部信息向量;根据所述局部信息向量获得所述给定文本的注意力信息;根据所述注意力信息生成所述给定文本的编码向量。6.根据权利要求5所述的方法,其特征在于,所述从给定文本的向量表示中获取初步增强矩阵,包括:对给定文本的向量表示进行卷积计算;对卷积计算结果进行转置卷积计算,得到与给定文本的向量表示结构相同的初步增强矩阵。7.根据权利要求...
【专利技术属性】
技术研发人员:李健铨,刘小康,晋耀红,
申请(专利权)人:安徽省泰岳祥升软件有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。