缺失语义补全方法及装置制造方法及图纸

技术编号:26478715 阅读:28 留言:0更新日期:2020-11-25 19:22
本发明专利技术公开了人工智能领域自然语言处理领域中的一种缺失语义补全方法,包括:获取提问语句及历史对话语句;获取提问语句中的待消解项的位置信息,根据历史对话语句和待消解项的位置信息对提问语句的待消解项进行消解,以得到消解后的提问语句;确定提问语句中是否有成分被省略,若提问语句中有成分被省略,则根据历史对话语句将省略的成分补全,以得到省略补全的提问语句;对消解后的提问语句和省略补全的提问语句进行融合,以得到融合后的提问语句;从消解后的提问语句、省略补全的提问语句和融合后的提问语句中确定目标补全提问语句。本发明专利技术的方法适用于各种缺失语义补全的应用场景,有利于提高补全提问语句中缺失语义的准确性及效率。

【技术实现步骤摘要】
缺失语义补全方法及装置
本专利技术涉及人工智能领域,尤其涉及一种缺失语义补全方法及装置。
技术介绍
人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能随着人工智能技术的不断发展,让人机之间能够通过自然语言进行交互的自然语言人机交互系统变的越来越重要。人机之间能够通过自然语言进行交互,就需要系统能够识别出人类自然语言的具体含义。通常,系统通过采用对自然语言的句子进行关键信息提取来识别句子的具体含义。自然语言对话中,指代和省略是常见的语言现象。在口语对话系统或交互式问答系统中,通过指代和省略,用户不用每次使用包含完整语义的句子,使得表达更加简洁和自然。但对于自然语言理解来说,指代和省略本文档来自技高网...

【技术保护点】
1.一种缺失语义补全方法,其特征在于,包括:/n获取历史对话语句及用户输入的提问语句;/n获取所述提问语句中的待消解项的位置信息,并根据所述历史对话语句和所述待消解项的位置信息对所述提问语句的待消解项进行消解,以得到消解后的提问语句;/n确定所述提问语句中是否有成分被省略,若确定所述提问语句中有成分被省略,则根据所述历史对话语句将省略的成分补全,以得到省略补全的提问语句;/n对所述消解后的提问语句和省略补全的提问语句进行融合,以得到融合后的提问语句;/n从所述消解后的提问语句、省略补全的提问语句和融合后的提问语句中确定目标补全提问语句,所述目标补全提问语句为所述消解后的提问语句、省略补全的提问...

【技术特征摘要】
1.一种缺失语义补全方法,其特征在于,包括:
获取历史对话语句及用户输入的提问语句;
获取所述提问语句中的待消解项的位置信息,并根据所述历史对话语句和所述待消解项的位置信息对所述提问语句的待消解项进行消解,以得到消解后的提问语句;
确定所述提问语句中是否有成分被省略,若确定所述提问语句中有成分被省略,则根据所述历史对话语句将省略的成分补全,以得到省略补全的提问语句;
对所述消解后的提问语句和省略补全的提问语句进行融合,以得到融合后的提问语句;
从所述消解后的提问语句、省略补全的提问语句和融合后的提问语句中确定目标补全提问语句,所述目标补全提问语句为所述消解后的提问语句、省略补全的提问语句和融合后的提问语句中句子主干完整程度及句子中所有词汇构成一句话的概率均最高的提问语句。


2.根据权利要求1所述的方法,其特征在于,所述获取所述提问语句中的待消解项的位置信息,包括:
获取所述提问语句的词语编号序列和词性编号序列,其中,所述词语编号序列由所述提问语句中每个词的对应的编号组成,所述词性编号序列由所述提问语句中的每个词的词性对应的编号组成;
将所述提问语句的词语编号序列和词性编号序列输入到第一序列标注模型中进行运算,以得到所述待消解项的位置信息。


3.根据权利要求1或2所述的方法,其特征在于,所述历史对话语句包括所述提问语句的上轮语句,所述根据所述所述历史对话语句和所述待消解项的位置信息对所述提问语句的待消解项进行消解,以得到消解后的提问语句,包括:
从所述提问语句的上轮语句中获取一个或多个备选先行语;其中,所述备选先行语为所述上轮语句中的名词或名词短语;
采用消解模型对所述一个或多个备选先行语中的每个备选先行语进行打分,以得到所述每个备选先行语的分数;
从所述一个或多个备选先行语选取出分数高于第一阈值的备选先行语;
采用分数高于第一阈值的备选先行语中分数最高的备选先行语对所述提问语句的待消解项进行消解,以得到所述消解后的提问语句。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述确定所述提问语句中是否有成分被省略,包括:
确定所述提问语句中是否有句子主干成分被省略,或;
确定所述提问语句中是否有属性词对应的实体词被省略,或;
确定所述提问语句中是否有通用成分被省略。


5.根据权利要求4所述的方法,其特征在于,所述历史对话语句包括所述提问语句的上轮语句,所述确定所述提问语句中是否有句子主干成分被省略,包括:
判断所述提问语句的句型和所述上轮语句的句型是否满足预设条件,或者判断所述提问语句的句型的主体是否为所述上轮语句的真子集;
若确定所述提问语句的句型和所述上轮语句的句型满足所述预设条件,或者确定所述提问语句的句型的主干为所述上轮语句的真子集,则判断所述提问语句中的短语与所述上轮语句中的短语是否存在同类关系;若所述提问语句中的短语与所述上轮语句中的短语存在同类关系,则确定提问语句中有句子主干成分被省略。


6.根据权利要求5所述的方法,其特征在于,所述预设条件包括:
所述上轮语句的句型为疑问句,所述提问语句的句型为疑问句或者提问语句的主体为“那+名词短语+呢”的组合,或者;
所述上轮语句的句型为陈述句,所述提问语句的句型为疑问句,或者所述提问语句的主体为“那+名词短语+呢”的组合或“名词短语+呢”的组合。


7.根据权利要求5或6所述的方法,其特征在于,所述判断所述提问语句的句型的主干是否为所述上轮语句的真子集,包括:
分别提取所述上轮语句和提问语句的主干;
判断所述提问语句的主干中的非名词短语部分是否为所述上轮语句的主干的真子集。


8.根据权利4所述的方法,其特征在于,所述确定所述提问语句中是否有属性词对应的实体词被省略,包括:
去除所述提问语句句首的无实意词,以得到处理后的提问语句;
判断所述处理后的提问语句的句首词是否为属性词;若所述处理后的提问语句的句首词为属性词,则确定所述提问语句中有属性词对应的实体词被省略。


9.根据权利4所述的方法,其特征在于,所述确定所述提问语句中是否有通用成分被省略,包括:
获取所述提问语句中每个词的词性编号序列和词语编号序列,其中,所述词语编号序列由所述提问语句中每个词的对应的编号组成,所述词性编号序列由所述提问语句中的每个词的词性对应的编号组成;
将所述每个词的词语编号序列和词性编号序列输入到第二序列标注模型中进行计算,以得到在所述提问语句中通用成分被省略的位置信息。


10.根据权利要求5-7任一项所述的方法,其特征在于,所述根据所述历史对话语句将省略的成分补全,以得到省略补全的提问语句,包括:
保留所述上轮语句的整体结构,将所述上轮语句中的短语替换为所述提问语句中的短语,以得到所述省略补全后的提问语句;
其中,所述上轮语句中的短语与所述提问语句中的短语存在同类关系。


11.根据权利要求8所述的方法,其特征在于,所述历史对话语句包括所述提问语句的上轮语句,所述根据所述历史对话语句将省略的成分补全,以得到省略补全的提问语句,包括:
获取所述上轮语句中一个或多个备选实体词;
根据补全模型对所述上轮语句中的一个或多个备选实体词中的每个备选实体词进行评分,以得到所述每个备选实体词的评分;
从所述一个或多个备选实体词中获取评分高于第二阈值的备选实体词;
根据评分高于所述第二阈值的备选实体词中评分最高的备选实体词将所述提问语句中被省略的属性词对应的实体词补全,以得到所述省略补全的提问语句。


12.根据权利要求9所述的方法,其特征在于,所述历史对话语句包括所述提问语句的上轮语句,所述根据所述历史对话语句将省略的成分补全,以得到省略补全的提问语句,包括:
通过补全模型对所述上轮语句中的一个或多个名词/名词短语中的每个名词/名词短语进行评分,以得到所述每个名词/名词短语的评分;
从所述一个或多个名词/名词短语中获取评分高于第三阈值的名词/名词短语;
根据评分高于所述第三阈值的名词/名词短语中评分最高的名词/名词短语将所述提问语句中被省略的通用成分补全,以得到所述省略补全的提问语句。


13.根据权利要求1-12任一项所述的方法,其特征在于,所述从所述消解后的提问语句、省略补全的提问语句和融合后的提问语句中确定目标补全提问语句,包括:
对所述消解后的提问语句、省略补全后的提问语句和融合后的提问语句中的每个提问语句进行评分,以得到每个提问语句的完整性评分和可能性评分,其中,所述完整性评分用于表征语句的主干的主谓宾的完整程度,所述可能性评分用于表征将语句中所有词汇构成一个句子的概率;
对所述每个提问语句的完整性评分和可能性评分进行加权求和,以得到该提问语句的加权评分;
将所述加权评分最高的提问语句确定为目标补全提问语句。


14.根据权利要求3、11、12或13所述的方法,其特征在于,所述方法还包括:
将分数高于所述第一阈值的备选先行语中,分数与最高分数之间差值的绝对值小于第四阈值的备选先行语确定为候选补全项,并将所述候选补全项保存至备选表中,或者;
将评分高于所述第二阈值的备选名词或名词短语中,评分与最高评分之间差值的绝对值小于第五阈值的备选名词或名词短语确定为所述候选补全项,并将所述候选补全项保存至所述备选表中,或者;
将评分结果高于所述第三阈值的备选名词或名词短语中,评分结果与最高评分结果之间差值的绝对值小于第六阈值的备选名词或名词短语确定为所述候选补全项,并将所述候选补全项保存至所述备选表中。


15.根据权利要求14所述的方法,其特征在于,所述方法还包括:
若所述备选表中包含备选补全项,则执行澄清操作;
其中,所述执行澄清操作,包括:
根据所述备选补全项生成询问语句,并发起询问对话;其中,所述询问语句包括所述备选补全项;
获取用户回答语句,并从所述回答语句中获取用户选择的备选补全项;
若所述用户选择的候选补全项与所述备选表中的候选补全项一致时,根据所述用户选择的候选补全项修改所述目标补全提问语句,以得到修改后的提问语句。


16.根据权利要求1-13任一项或15所述的方法,其特征在于,所述方法还包括:
从本地数据库中或第三方服务器中获取针对所述目标补全提问语句或修改后的提问语句的答案,并根据该答案生成回复语句。


17.根据权利要求1-13任一项所述的方法,其特征在于,所述方法还包括:
基于语法规则、句式和历史候选补全项判断用户是否发起纠错对话;
若确定用户发起纠错对话,则从所述纠错对话中提取候选备选项,并根据该候选备选项修改所述目标补全提问语句或修改后的提问语句,以得到新的提问语句;
针对所述新的提问语句生成新的回复语句。


18.一种缺失语义补全装置,其特征在于,包括:
存储器,用于存储指令;以及至少一台处理器,与所述存储器耦合;
其中,当所述至少一台处理器执行所述指令时,执行如下步骤:
获取历史对话语句及用户输入的提问语句;
获取所述提问语句中的待消解项的位置信息,并根据所述历史对话语句和所述待消解项...

【专利技术属性】
技术研发人员:曾毓珑魏建生王雅圣邓利群崔安颀
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1