语句补全方法、装置及计算机可读存储介质制造方法及图纸

技术编号:26597802 阅读:20 留言:0更新日期:2020-12-04 21:20
本公开涉及一种语句补全方法、装置及计算机可读存储介质,所述方法包括:获取对话中的待补全语句和所述对话中在所述待补全语句之前的在先语句;将所述待补全语句和所述在先语句输入对话预测模型,以获得所述在先语句对应的第一概率分布和第二概率分布,以及所述待补全语句对应的插入位置的概率分布;根据所述第一概率分布和所述第二概率分布,从所述在先语句中确定所述目标片段;根据所述插入位置的概率分布确定所述待补全语句对应的目标插入位置;根据所述目标片段、所述目标插入位置对所述待补全语句进行补全,以获得与所述待补全语句对应的目标补全语句。由此,可以提高语句补全的效率,提高人机交互对话过程中的对用户输入内容的响应速度。

【技术实现步骤摘要】
语句补全方法、装置及计算机可读存储介质
本公开涉及计算机
,尤其涉及语句补全方法、装置及计算机可读存储介质。
技术介绍
在日常的人机对话交互中,用户经常使用简短的语句与机器进行对话,其中,用户能够轻松结合对话上下文对当前语句进行理解,然而此种行为模式对机器自然语言的理解造成了一定挑战。相关技术中,通常是通过分析对话,构建上轮问题对话的承接词袋及实体词袋,从而基于上述信息进行判断,以对待补全语句进行重写,获得补全后的语句。在上述方案中,需要基于端到端生成式模型从头到尾对待补全语句进行重写,耗费时间多,数据处理量较大。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种语句补全方法、装置及计算机可读存储介质。根据本公开实施例的第一方面,提供一种语句补全方法,包括:获取对话中的待补全语句和所述对话中在所述待补全语句之前的在先语句;将所述待补全语句和所述在先语句输入对话预测模型,以获得所述在先语句对应的第一概率分布和第二概率分布,以及所述待补全语句对应的插入位置的概率分布,其中,所述第一概率分布用于表征所述在先语句中的每一个字作为待截取的目标片段的起始位置的概率,所述第二概率分布用于表征所述在先语句中的每一个字作为所述目标片段的终止位置的概率;根据所述第一概率分布和所述第二概率分布,从所述在先语句中确定所述目标片段;根据所述插入位置的概率分布确定所述待补全语句对应的目标插入位置;根据所述目标片段、所述目标插入位置对所述待补全语句进行补全,以获得与所述待补全语句对应的目标补全语句。可选地,所述根据所述第一概率分布和所述第二概率分布,从所述在先语句中确定所述目标片段,包括:将所述第一概率分布和所述第二概率分布中的一者作为行向量,另一者作为列向量,并进行矩阵相乘,以获得所述目标片段对应的概率矩阵;根据所述概率矩阵,确定所述目标片段在所述在先语句中对应的起始位置和终止位置;将所述在先语句中从所述起始位置起至所述终止位置的片段确定为所述目标片段。可选地,所述根据所述概率矩阵,确定所述目标片段在所述在先语句中对应的起始位置和终止位置,包括:通过以下任一方式确定所述概率矩阵中的目标元素:将所述概率矩阵中的目标三角矩阵中的元素值最大的元素确定为目标元素;将所述概率矩阵中的目标三角矩阵中的元素值大于预设阈值的元素确定为目标元素;针对确定出的每一所述目标元素,根据所述目标元素在所述概率矩阵中的位置确定所述目标片段在所述在先语句中对应的起始位置和终止位置。可选地,所述第一概率分布作为所述行向量,所述第二概率分布作为所述列向量,所述目标三角矩阵为所述概率矩阵对应的上三角矩阵;相应地,所述根据所述目标元素在所述概率矩阵中的位置确定所述目标片段在所述在先语句中对应的起始位置和终止位置,包括:将所述目标元素在所述概率矩阵中的位置的行编号确定为所述起始位置,将所述目标元素在所述概率矩阵中的位置的列编号确定为所述终止位置;或者,所述第一概率分布作为所述列向量,所述第二概率分布作为所述行向量,所述目标三角矩阵为所述概率矩阵对应的下三角矩阵;相应地,所述根据所述目标元素在所述概率矩阵中的位置确定所述目标片段在所述在先语句中对应的起始位置和终止位置,包括:将所述目标元素在所述概率矩阵中的位置的列编号确定为所述起始位置,将所述目标元素在所述概率矩阵中的位置的行编号确定为所述终止位置。可选地,在确定出的所述目标片段为多个的情况下,所述根据所述插入位置的概率分布确定所述待补全语句对应的目标插入位置,包括:根据所述插入位置的概率分布,按照每一所述插入位置对应的概率由大至小的顺序,将排序前N的插入位置作为候选插入位置,其中,N为大于或等于所述目标片段的总数的整数;分别计算每一所述目标片段对应的向量与所述候选插入位置对应的向量之间的相似度;针对每一所述目标片段,将与该目标片段对应的相似度最大的候选插入位置确定为该目标片段对应的插入位置,其中,确定出的多个所述目标片段对应的插入位置作为所述待补全语句对应的目标插入位置。可选地,所述根据所述目标片段、所述目标插入位置对所述待补全语句进行补全,以获得与所述待补全语句对应的目标补全语句,包括:在所述待补全语句的所述目标插入位置处插入与所述目标插入位置对应的所述目标片段,获得补全语句;对所述补全语句进行规则匹配,其中,每一规则中包括一对词语;根据匹配到的目标规则,将所述补全语句中的与所述目标规则匹配的词语替换为所述目标规则中的另一词语,获得所述目标补全语句。可选地,所述将所述待补全语句和所述在先语句输入对话预测模型,以获得所述在先语句对应的第一概率分布和第二概率分布,以及所述待补全语句对应的插入位置的概率分布,包括:将所述待补全语句和所述在先语句进行拼接,获得拼接语句;将所述拼接语句输入所述对话预测模型,以基于所述对话预测模型对所述拼接语句进行编码,获得拼接语句编码向量,并根据所述在先语句的长度对所述拼接语句编码向量进行归一化处理,以确定所述第一概率分布、所述第二概率分布,根据所述待补全语句的长度对所述拼接语句编码向量进行归一化处理,以确定所述插入位置的概率分布。根据本公开实施例的第二方面,提供一种语句补全装置,所述装置包括:获取模块,被配置为获取对话中的待补全语句和所述对话中在所述待补全语句之前的在先语句;输入模块,被配置为将所述待补全语句和所述在先语句输入对话预测模型,以获得所述在先语句对应的第一概率分布和第二概率分布,以及所述待补全语句对应的插入位置的概率分布,其中,所述第一概率分布用于表征所述在先语句中的每一个字作为待截取的目标片段的起始位置的概率,所述第二概率分布用于表征所述在先语句中的每一个字作为所述目标片段的终止位置的概率;第一确定模块,被配置为根据所述第一概率分布和所述第二概率分布,从所述在先语句中确定所述目标片段;第二确定模块,被配置为根据所述插入位置的概率分布确定所述待补全语句对应的目标插入位置;补全模块,被配置为根据所述目标片段、所述目标插入位置对所述待补全语句进行补全,以获得与所述待补全语句对应的目标补全语句。可选地,所述第一确定模块包括:第一计算子模块,被配置为将所述第一概率分布和所述第二概率分布中的一者作为行向量,另一者作为列向量,并进行矩阵相乘,以获得所述目标片段对应的概率矩阵;第一确定子模块,被配置为根据所述概率矩阵,确定所述目标片段在所述在先语句中对应的起始位置和终止位置;第二确定子模块,被配置为将所述在先语句中从所述起始位置起至所述终止位置的片段确定为所述目标片段。可选地,所述第一确定子模块包括:第三确定子模块,被配置为通过以下任一方式确定所述概率矩阵中的目标元素:将所述概率矩阵中的目标三角矩阵中的元素值最大的元素确定为目标本文档来自技高网...

【技术保护点】
1.一种语句补全方法,其特征在于,包括:/n获取对话中的待补全语句和所述对话中在所述待补全语句之前的在先语句;/n将所述待补全语句和所述在先语句输入对话预测模型,以获得所述在先语句对应的第一概率分布和第二概率分布,以及所述待补全语句对应的插入位置的概率分布,其中,所述第一概率分布用于表征所述在先语句中的每一个字作为待截取的目标片段的起始位置的概率,所述第二概率分布用于表征所述在先语句中的每一个字作为所述目标片段的终止位置的概率;/n根据所述第一概率分布和所述第二概率分布,从所述在先语句中确定所述目标片段;/n根据所述插入位置的概率分布确定所述待补全语句对应的目标插入位置;/n根据所述目标片段、所述目标插入位置对所述待补全语句进行补全,以获得与所述待补全语句对应的目标补全语句。/n

【技术特征摘要】
1.一种语句补全方法,其特征在于,包括:
获取对话中的待补全语句和所述对话中在所述待补全语句之前的在先语句;
将所述待补全语句和所述在先语句输入对话预测模型,以获得所述在先语句对应的第一概率分布和第二概率分布,以及所述待补全语句对应的插入位置的概率分布,其中,所述第一概率分布用于表征所述在先语句中的每一个字作为待截取的目标片段的起始位置的概率,所述第二概率分布用于表征所述在先语句中的每一个字作为所述目标片段的终止位置的概率;
根据所述第一概率分布和所述第二概率分布,从所述在先语句中确定所述目标片段;
根据所述插入位置的概率分布确定所述待补全语句对应的目标插入位置;
根据所述目标片段、所述目标插入位置对所述待补全语句进行补全,以获得与所述待补全语句对应的目标补全语句。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第一概率分布和所述第二概率分布,从所述在先语句中确定所述目标片段,包括:
将所述第一概率分布和所述第二概率分布中的一者作为行向量,另一者作为列向量,并进行矩阵相乘,以获得所述目标片段对应的概率矩阵;
根据所述概率矩阵,确定所述目标片段在所述在先语句中对应的起始位置和终止位置;
将所述在先语句中从所述起始位置起至所述终止位置的片段确定为所述目标片段。


3.根据权利要求2所述的方法,其特征在于,所述根据所述概率矩阵,确定所述目标片段在所述在先语句中对应的起始位置和终止位置,包括:
通过以下任一方式确定所述概率矩阵中的目标元素:
将所述概率矩阵中的目标三角矩阵中的元素值最大的元素确定为目标元素;
将所述概率矩阵中的目标三角矩阵中的元素值大于预设阈值的元素确定为目标元素;
针对确定出的每一所述目标元素,根据所述目标元素在所述概率矩阵中的位置确定所述目标片段在所述在先语句中对应的起始位置和终止位置。


4.根据权利要求3所述的方法,其特征在于,所述第一概率分布作为所述行向量,所述第二概率分布作为所述列向量,所述目标三角矩阵为所述概率矩阵对应的上三角矩阵;
相应地,所述根据所述目标元素在所述概率矩阵中的位置确定所述目标片段在所述在先语句中对应的起始位置和终止位置,包括:
将所述目标元素在所述概率矩阵中的位置的行编号确定为所述起始位置,将所述目标元素在所述概率矩阵中的位置的列编号确定为所述终止位置;
或者,
所述第一概率分布作为所述列向量,所述第二概率分布作为所述行向量,所述目标三角矩阵为所述概率矩阵对应的下三角矩阵;
相应地,所述根据所述目标元素在所述概率矩阵中的位置确定所述目标片段在所述在先语句中对应的起始位置和终止位置,包括:
将所述目标元素在所述概率矩阵中的位置的列编号确定为所述起始位置,将所述目标元素在所述概率矩阵中的位置的行编号确定为所述终止位置。


5.根据权利要求1所述的方法,其特征在于,在确定出的所述目标片段为多个的情况下,所述根据所述插入位置的概率分布确定所述待补全语句对应的目标插入位置,包括:
根据所述插入位置的概率分布,按照每一所述插入位置对应的概率由大至小的顺序,将排序前N的插入位置作为候选插入位置,其中,N为大于或等于所述目标片段的总数的整数;
分别计算每一所述目标片段对应的向量与所述候选插入位置对应的向量之间的相似度;
针对每一所述目标片段,将与该目标片段对应的相似度最大的候选插入位置...

【专利技术属性】
技术研发人员:张嘉益崔志
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1