一种沟通时机判断方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37357406 阅读:17 留言:0更新日期:2023-04-27 07:07
本申请实施例提供一种沟通时机判断方法、装置、电子设备及存储介质,应用于人机对话场景,所述方法包括:获取用户语音输入的文本序列;文本序列包括多个字符;利用已训练的标点预测模型对文本序列进行标点预测,获取标注有标签的预测文本;标签包括空白标签与标点标签;根据预测文本最后一个字符所标注的标签,若判断用户已完成语音输入,播报预设的对话内容;若判断用户未完成语音输入,进入等待状态,以使用户完成语音输入。通过为文本序列标注上标点来确定用户当前的语音输入是否为完整的一句话,是从语义分析的角度,根据发言内容来判断用户是否完成了发言,从而能更准确地判断沟通时机。沟通时机。沟通时机。

【技术实现步骤摘要】
一种沟通时机判断方法、装置、电子设备及存储介质


[0001]本申请涉及人机交互
,具体而言,涉及一种沟通时机判断方法、装置、电子设备及存储介质。

技术介绍

[0002]在人机对话场景中,用户与机器人进行对话,机器人需要在用户发言完毕后与用户对话沟通。因此机器人需要判断沟通的时机。若沟通时机判断错误,则机器人会打断了用户发言。一方面严重影响了用户的对话体验,另一方面因遗漏用户的发言内容,导致机器人无法正确理解用户意图。因此,如何准确地判断机器人的沟通时机,是本领域亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的目的在于提供一种沟通时机判断方法、装置、电子设备及存储介质,用以实现准确地判断沟通时机的技术效果。
[0004]本申请实施例第一方面提供了一种沟通时机判断方法,应用于人机对话场景,所述方法包括:
[0005]获取用户语音输入的文本序列;所述文本序列包括多个字符;
[0006]利用已训练的标点预测模型对所述文本序列进行标点预测,获取标注有标签的预测文本;所述标签包括空白标签与标点标签;
[0007]根据所述预测文本最后一个字符所标注的标签,若判断所述用户已完成语音输入,播报预设的对话内容;若判断所述用户未完成语音输入,进入等待状态,以使所述用户完成语音输入。
[0008]在上述实现过程中,利用标点预测模型对用户语音输入的文本序列进行标点预测,可以为文本序列标注上标点。并根据最后一个字符所标注的标签,来判断该文本序列是否为一个完整的句子,从而判断用户是否完成语音输入,由此判断当前时刻是否为适合的沟通时机。此外,通过为文本序列标注上标点来确定用户当前的语音输入是否为完整的一句话,是从语义分析的角度,根据发言内容来判断用户是否完成了发言,从而能更准确地判断沟通时机。
[0009]进一步地,所述方法还包括:
[0010]对所述文本序列进行关键词匹配和/或语义分析的处理;
[0011]若根据处理结果判断所述用户表现对话暂停意图,进入对话暂停状态;
[0012]若根据所述处理结果判断所述用户未表现所述对话暂停意图,执行所述对所述文本序列进行标点预测的步骤。
[0013]在上述实现过程中,首先通过关键词匹配和/或语义分析确定用户是否表达出对话暂停意图,若是,则可以直接确定用户未完成语音输入,而无需借助标点预测进行判断。在用户未表现出对话暂停意图的情况下,再通过标点预测来判断用户是否完成语音输入。
通过先后预测用户的对话暂停意图以及语音输入完成,可进一步提高沟通时机预测的准确度。
[0014]进一步地,在所述进入等待状态后,所述方法还包括:
[0015]若所述等待状态维持时间大于第一等待时间,播报预设的对话内容。
[0016]在上述实现过程中,通过在等待状态超过第一等待时间时就继续播放对话内容,避免了因模型预测失误,导致误认户已完成语音输入,但用户实际上已完成语音输入,而机器人一直处于等待状态的情况。
[0017]进一步地,所述若判断所述用户已完成语音输入,播报预设的对话内容,包括:
[0018]若判断所述用户已完成语音输入,在经过第二等待时间后,播报预设的对话内容;其中,所述第一等待时间大于所述第二等待时间。
[0019]在上述实现过程中,在判断用户已完成语音输入后,会经过第二等待时间后再播报对话内容,从而保证了与用户对话的衔接性。
[0020]进一步地,所述标点预测模型包括语义特征提取层与标注层;所述利用已训练的标点预测模型对所述文本序列进行标点预测,获取标注有标签的预测文本,包括:
[0021]获取所述文本序列的文本向量;
[0022]利用所述语义特征提取层从所述文本向量中提取语义特征;
[0023]将所述语义特征输入所述标注层,获取所述标注层输出的标注有标签的预测文本。
[0024]在上述实现过程中,通过语义特征提取层提取出文本序列的语义特征,是从语义分析的角度,根据发言内容来判断用户是否完成了发言,从而能更准确地判断沟通时机。
[0025]进一步地,所述语义特征提取层包括BERT模型与长短期记忆网络LSTM;所述标注层为条件随机场CRF模型。
[0026]在上述实现过程中,BERT模型能有效丰富特征表征,LSTM能将在前字符的信息也考虑到在后字符的语义计算中,从而更好地提取出语义特征。
[0027]进一步地,所述标点预测模型通过有监督训练得到;样本数据包括完整句子样本与非完整句子样本。
[0028]在上述实现过程中,利用包括完整句子样本与非完整句子样本的样本数据对标点预测模型进行有监督训练,使得训练后的模型能准确预测各种文本序列的标点,从而判断用户是否完成语音输入。
[0029]本申请实施例第二方面提供了一种沟通时机判断装置,应用于人机对话场景,所述装置包括:
[0030]获取模块,用于获取用户语音输入的文本序列;所述文本序列包括多个字符;
[0031]预测模块,用于利用已训练的标点预测模型对所述文本序列进行标点预测,获取标注有标签的预测文本;所述标签包括空白标签与标点标签;
[0032]判断模块,用于根据所述预测文本最后一个字符所标注的标签,若判断所述用户已完成语音输入,播报预设的对话内容;若判断所述用户未完成语音输入,进入等待状态,以使所述用户完成语音输入。
[0033]本申请实施例第三方面提供了一种电子设备,所述电子设备包括:
[0034]处理器;
[0035]用于存储处理器可执行指令的存储器;
[0036]其中,所述处理器调用所述可执行指令时实现第一方面任一所述方法的操作。
[0037]本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现第一方面任一所述方法的步骤。
附图说明
[0038]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0039]图1为本申请实施例提供的一种沟通时机判断方法的流程示意图;
[0040]图2为本申请实施例提供的另一种沟通时机判断方法的流程示意图;
[0041]图3为本申请实施例提供的一种标点预测模型的结构示意图;
[0042]图4为本申请实施例提供的另一种沟通时机判断方法的流程示意图;
[0043]图5为本申请实施例提供的另一种标点预测模型的结构示意图
[0044]图6为本申请实施例提供的一种沟通时机判断装置的结构框图;
[0045]图7为本申请实施例提供的一种电子设备的硬件结构图。
具体实施方式
[0046]下面将结合本申请实施例中的附图,对本申请实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种沟通时机判断方法,其特征在于,应用于人机对话场景,所述方法包括:获取用户语音输入的文本序列;所述文本序列包括多个字符;利用已训练的标点预测模型对所述文本序列进行标点预测,获取标注有标签的预测文本;所述标签包括空白标签与标点标签;根据所述预测文本最后一个字符所标注的标签,若判断所述用户已完成语音输入,播报预设的对话内容;若判断所述用户未完成语音输入,进入等待状态,以使所述用户完成语音输入。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述文本序列进行关键词匹配和/或语义分析的处理;若根据处理结果判断所述用户表现对话暂停意图,进入对话暂停状态;若根据所述处理结果判断所述用户未表现所述对话暂停意图,执行所述对所述文本序列进行标点预测的步骤。3.根据权利要求1所述的方法,其特征在于,在所述进入等待状态后,所述方法还包括:若所述等待状态维持时间大于第一等待时间,播报预设的对话内容。4.根据权利要求3所述的方法,其特征在于,所述若判断所述用户已完成语音输入,播报预设的对话内容,包括:若判断所述用户已完成语音输入,在经过第二等待时间后,播报预设的对话内容;其中,所述第一等待时间大于所述第二等待时间。5.根据权利要求1所述的方法,其特征在于,所述标点预测模型包括语义特征提取层与标注层;所述利用已训练的标点预测模型对所述文本序列进行标点预测,获取标注有标签的预测文本,包括:获取所述文本序列的文本向量;利用所述...

【专利技术属性】
技术研发人员:陈勇曾文佳陈新月
申请(专利权)人:零犀北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1