【技术实现步骤摘要】
人机对话方法、装置及设备
本申请实施例涉及数据处理中的自然语言处理
,尤其涉及一种人机对话方法、装置及设备。
技术介绍
在人机对话场景中,用户的意图可能需要经过多轮对话才能表述清楚。因此,有些场景下,需要将用户本轮输入的语句与上一轮输入的语句结合起来理解,以便准确理解用户的意图。现有技术中,每次获取到用户输入的语句时,通过预设规则对本轮语句的主谓宾成分进行检测,判断本轮语句是否为省略形态。当确定本轮语句为省略形态时,将本轮语句与上一轮语句结合起来理解确定出用户的意图。在确定本轮语句为非省略形态时,将本轮语句单独理解确定出用户的意图。然而,上述方式依然存在对用户语义理解不够准确的问题,导致对话效率较低,降低用户体验。
技术实现思路
本申请实施例提供了一种人机对话方法、装置及设备,用以提高对用户语义理解的准确性,提升用户对话体验。第一方面,本申请实施例提供一种人机对话方法,包括:获取用户输入的第一语句,并对所述第一语句进行语义解析得到第一关键信息集合,所述第一关键 ...
【技术保护点】
1.一种人机对话方法,其特征在于,包括:/n获取用户输入的第一语句,并对所述第一语句进行语义解析得到第一关键信息集合,所述第一关键信息集合包括至少一个第一关键信息;/n获取至少一个历史语句对应的第二关键信息集合,所述第二关键信息集合包括至少一个第二关键信息;/n根据所述第一关键信息集合和所述第二关键信息集合,确定所述第一语句对应的多个候选语义;/n根据所述多个候选语义,生成所述第一语句对应的应答语句。/n
【技术特征摘要】
1.一种人机对话方法,其特征在于,包括:
获取用户输入的第一语句,并对所述第一语句进行语义解析得到第一关键信息集合,所述第一关键信息集合包括至少一个第一关键信息;
获取至少一个历史语句对应的第二关键信息集合,所述第二关键信息集合包括至少一个第二关键信息;
根据所述第一关键信息集合和所述第二关键信息集合,确定所述第一语句对应的多个候选语义;
根据所述多个候选语义,生成所述第一语句对应的应答语句。
2.根据权利要求1所述的方法,其特征在于,根据所述第一关键信息集合和所述第二关键信息集合,确定所述第一语句对应的多个候选语义,包括:
对所述第一关键信息集合和所述第二关键信息集合中的关键信息进行组合处理,得到多种关键信息组合结果;
根据所述多种关键信息组合结果,确定所述第一语句对应的多个候选语义,所述多种关键信息组合结果与所述多个候选语义一一对应。
3.根据权利要求2所述的方法,其特征在于,对所述第一关键信息集合和所述第二关键信息集合中的关键信息进行组合处理,得到多种关键信息组合结果,包括:
生成所述第二关键信息集合对应的多个子集;
将所述第一关键信息集合和所述多个子集分别进行组合,得到所述多种关键信息组合结果。
4.根据权利要求3所述的方法,其特征在于,根据所述多个候选语义,生成所述第一语句对应的应答语句,包括:
分别确定每种关键信息组合结果对应的候选语义的概率得分;
按照所述概率得分由高到低的顺序,对所述多个候选语义进行排序;
按照排序后的顺序依次对所述多个候选语义进行答案检索,直至检索得到答案,并根据所述答案,生成所述第一语句对应的应答语句。
5.根据权利要求4所述的方法,其特征在于,分别确定每种关键信息组合结果对应的候选语义的概率得分,包括:
根据每种关键信息组合结果中的所述第一关键信息集合和所述子集,确定在所述第一关键信息集合出现的情况下,所述子集也出现的条件概率;
将所述条件概率作为该关键信息组合结果对应的候选语义的概率得分。
6.根据权利要求5所述的方法,其特征在于,根据每种关键信息组合结果中的所述第一关键信息集合和所述子集,确定在所述第一关键信息集合出现的情况下,所述子集也出现的条件概率,包括:
获取所述第一关键信息集合中的每个第一关键信息与所述子集中的每个第二关键信息之间的共现概率;
根据所述共现概率,确定在所述第一关键信息集合出现的情况下,所述子集也出现的条件概率。
7.根据权利要求5所述的方法,其特征在于,根据每种关键信息组合结果中的所述第一关键信息集合和所述子集,确定在所述第一关键信息集合出现的情况下,所述子集也出现的条件概率,包括:
获取所述第一语句为省略形态的概率;
获取所述第一关键信息集合中的每个第一关键信息与所述子集中的每个第二关键信息之间的共现概率;
根据所述第一语句为省略形态的概率以及所述共现概率,确定在所述第一关键信息集合出现的情况下,所述子集也出现的条件概率。
8.根据权利要求6或7所述的方法,其特征在于,获取所述第一关键信息集合中的每个第一关键信息与所述子集中的每个第二关键信息之间的共现概率,包括:
获取历史语料,根据所述历史语料生成关键信息共现数据库,所述关键信息共现数据库中包括不同关键信息之间的共现概率;
通过查询所述关键信息共现数据库,得到所述第一关键信息集合中的每个第一关键信息与所述子集中的每个第二关键信息之间的共现概率。
9.根据权利要求8所述的方法,其特征在于,根据所述历史语料生成关键信息共现数据库,包括:
对所述历史语料进行关键信息挖掘,得到多个关键信息;
统计所述多个关键信息中的任意两个关键信息在所述历史语料中的共现次数;
根据所述共现次数,确定所述任意两个关键信息之间的共现概率。
<...
【专利技术属性】
技术研发人员:何晓楠,殷超,鞠强,谢剑,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。