【技术实现步骤摘要】
语音对话检测方法及装置
[0001]本申请涉及语音处理
,尤其涉及一种语音对话检测方法及装置。
技术介绍
[0002]检测语音对话的参与方是否存在插抢话行为,是语音对话检测的重要组成部分,广泛应用于电话作业、智能问答等场景。
[0003]目前常规的语音对话检测方法主要基于简单的检测规则判断语音对话的参与方是否存在插抢话行为,比如参与方A在参与方B未说完话的情况下回应,就判定参与方A存在插抢话行为。但是,这种检测方式只是单纯地“一刀切”,并不能准确检测复杂对话场景中的插抢话行为,例如在参与方A滔滔不绝地说话时,参与方B只是出于对参与方A的耐心和尊重才在参与方A未说完话的情况下回应,而并非真的插话或抢话参与方A。
技术实现思路
[0004]本申请实施例的目的是提供一种语音对话检测方法及装置,用于解决现有的语音对话检测方法的检测准确率低的问题。
[0005]为了实现上述目的,本申请实施例采用下述技术方案:
[0006]第一方面,本申请实施例提供一种语音对话检测方法,包括:
[0007]基于目标语音数据中的语音对话的对话相关信息及对话文本,对所述目标语音数据中的语音对话进行插抢话预检测,得到候选语音对话,其中,所述目标语音数据包括不同角色的说话人的语音对话,所述对话相关信息包括对话起止时间信息及说话人角色;
[0008]基于预设情绪识别模型对所述候选语音对话进行情绪识别,得到情绪识别结果;
[0009]基于所述情绪识别结果和所述候选语音对话的语音特征,确定 ...
【技术保护点】
【技术特征摘要】
1.一种语音对话检测方法,其特征在于,包括:基于目标语音数据中的语音对话的对话相关信息及对话文本,对所述目标语音数据中的语音对话进行插抢话预检测,得到候选语音对话,其中,所述目标语音数据包括不同角色的说话人的语音对话,所述对话相关信息包括对话起止时间信息及说话人角色;基于预设情绪识别模型对所述候选语音对话进行情绪识别,得到情绪识别结果;基于所述情绪识别结果和所述候选语音对话的语音特征,确定所述候选语音对话是否存在插抢话行为。2.根据权利要求1所述的方法,其特征在于,所述情绪识别结果包括所述候选语音对话的负向情绪值;所述候选语音对话的语音特征包括所述候选语音对话相对于第一关联语音对话的音量变化值,所述第一关联语音对话的说话人角色与所述候选语音对话的说话人角色相同;所述基于所述情绪识别结果和所述候选语音对话的语音特征,确定所述候选语音对话是否存在插抢话行为,包括:若所述候选语音对话的负向情绪值超过预设情绪阈值或者所述音量变化值超过预设音量值,则确定所述候选语音对话存在插抢话行为。3.根据权利要求1所述的方法,其特征在于,在基于所述情绪识别结果和所述候选语音对话的语音特征,确定所述候选语音对话是否存在插抢话行为之前,所述方法还包括:基于所述候选语音对话的第二关联语音对话和第三关联语音对话,确定所述候选语音对话是否满足预设免检条件,其中,所述第二关联语音对话的说话人角色与所述候选语音对话的说话人角色不同,所述第三关联语音对话的说话人角色与所述候选语音对话的说话人角色不同;所述基于所述情绪识别结果和所述候选语音对话的语音特征,确定所述候选语音对话是否存在插抢话行为,包括:若所述候选语音对话不满足所述预设免检条件,则基于所述情绪识别结果和所述候选语音对话的语音特征,确定所述候选语音对话是否存在插抢话行为。4.根据权利要求3所述的方法,其特征在于,所述预设免检条件包括所述第二关联语音对话的意图为结束对话、且所述第三关联语音对话的对话文本与预设结束对话文本之间的匹配程度值超过第一预设程度阈值;所述基于所述候选语音对话的第二关联语音对话和所述第三关联语音对话,确定所述候选语音对话是否满足预设免检条件,包括:基于预设意图识别模型和所述第二关联语音对话的对话文本,对所述第二关联语音对话进行意图识别,得到所述第二关联语音对话的意图识别结果其中,所述第二关联语音对话的起始时间位于所述候选语音对话的起始时间之前;将所述第三关联语音对话的对话文本与预设结束对话文本进行匹配,得到第一匹配结果,其中,所述第三关联语音对话的起始时间位于所述第二关联语音对话的起始时间与所述候选语音对话的起始时间之间;基于所述意图识别结果和所述第一匹配结果,确定所述候选语音对话是否满足所述预设免检条件。5.根据权利要求3所述的方法,其特征在于,在基于所述候选语音对话的第二关联语音
对话和所述第三关联语音对话,确定所述候选语音对话是否满足预设免检条件之后,所述方法还包括:若所述候选语音对话满足所述预设免检条件,...
【专利技术属性】
技术研发人员:邓成东,曾琳铖曦,郭江,吴海英,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。