【技术实现步骤摘要】
一种识别人机对话中坏例的方法及装置
本专利技术涉及计算机
,更具体的说,涉及一种识别人机对话中坏例的方法及装置。
技术介绍
人机交互是指人与机器之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与机器之间的信息交换过程。在人机交互过程中,单条对话的逻辑是:以用户所说的话为样本,机器根据一系列的规则将样本识别到意图上,根据意图确定对应的话术,并播放对应的话术。然而在实际应用中,机器可能因为缺少用户的说话样本,而无法识别用户所说的话或者对用户提出的问题回答错误。机器存在的无法识别用户所说的话或者对用户提出的问题回答错误的情况,称为人机对话中的坏例(badcase)。坏例的存在会导致人机交互无法顺利进行,因此影响了人机交互功能的可靠性。因此,需要识别人机对话中的badcase,以作为对人机交互进行优化的依据或基础,才能更好的满足用户的需求。
技术实现思路
有鉴于此,本专利技术公开一种识别人机对话中坏例的方法及装置,以实现对人机对话数据是否是badcase进行识别,以便基于badca ...
【技术保护点】
1.一种识别人机对话中坏例的方法,其特征在于,所述方法包括:/n获取待识别人机对话数据;/n从所述待识别人机对话数据中,提取出对话特征信息;/n基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,其中,所述badcase筛选规则基于历史标注badcase通话样本集确定。/n
【技术特征摘要】 【专利技术属性】
1.一种识别人机对话中坏例的方法,其特征在于,所述方法包括:
获取待识别人机对话数据;
从所述待识别人机对话数据中,提取出对话特征信息;
基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,其中,所述badcase筛选规则基于历史标注badcase通话样本集确定。
2.根据权利要求1所述的方法,其特征在于,所述对话特征信息包括:用于表征对话数据量的特征和/或用于表征对话内容的特征;
所述用于表征对话数据量的特征包括:对话总时长、单条对话时长和单条对话字数中的任意一个或多个的组合;
所述用于表征对话内容的特征包括:关键词。
3.根据权利要求2所述的方法,其特征在于,所述基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,具体包括:
获取预先依据用于表征对话内容特征建立的所述badcase筛选规则,所述badcase筛选规则包括:关键词及该关键词至少出现的次数,所述关键词为所述从历史标注badcase通话样本集中出现的统计值超过预设统计值的词;
判断所述对话特征信息中包含的关键词及所述关键词出现的次数,是否符合所述预先建立的至少一条badcase筛选规则中的至少一条规则;
如果是,则确定所述待识别人机对话数据为badcase;
如果否,则确定所述待识别人机对话数据不为badcase。
4.根据权利要求2所述的方法,其特征在于,所述基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,具体包括:
获取预先依据用于表征对话数据量的特征建立的所述badcase筛选规则,所述badcase筛选规则包括:对话总时长、单条对话时长和单条对话字数中的任意一个或多个的组合;
判断所述对话特征信息的用于表征对话数据量的特征,是否符合所述对话总时长、所述单条对话时长和所述单条对话字数中的任意一个或多个的组合;
如果是,则确定所述待识别人机对话数据为badcase;
如果否,则确定所述待识别人机对话数据不为badcase。
5.根据权利要求1所述的方法,其特征在于,所述基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,具体包括:
调用badcase筛选模型,所述badcase筛选模型为:以在建立所述badcase筛选规则所使用的所述历史标注badcase对话样本集,以及所述历史标注badcase对话样本集中各个badcase对话样本文本的badcase特征信息作为训练样本,以对所述badcase对话样本文本的badcase标注结果为样本标签进行训练得到;
将所述待识别人机对话数据和所述对话特征信息输入至所述badcase筛选模型,获得所述待识别人机对话数据为badcase的概率分值;
判断所述概率分值是否小于预设阈值,所述预设阈值为预设的badcase出现的概率;
如果是,则确定所述待识别人机对话数据为badcase;
如果否,则确定所述待识别人机对话数据不为badcase。
6.根据权利要求1~5任意一项所述的方法,其特征在于,还包括:当所述待识别人机对话数据为badcase时,将所述待识别人机对话数据添加至所述历史标注badcase对话样本集中。
7.一种识别人机对话中坏例的装置,其特征在于,所述装置包括:
技术研发人员:郭灿,
申请(专利权)人:上海优扬新媒信息技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。