【技术实现步骤摘要】
基于通话录音的风险识别方法、装置、计算机设备及介质
[0001]本专利技术适用于风险识别领域,尤其涉及一种基于通话录音的风险识别方法、装置、计算机设备及介质。
技术介绍
[0002]在商业活动中,业务员和客户的对话内容往往包含丰富的信息,随着手机等各种采录设备的飞速发展,风控人员往往通过听取现场或通话录音,凭借个人的业务经验和专家总结的风险特征来甄别风险事件,但由于主观因素会造成偏见偏差,该种风险识别方式的效率和准确率都较低。
[0003]现有风险识别方法一般是将通话录音转换成文本,根据领域内字典对文本句子进行分词,进而提取关键词并进行聚类,根据每个关键词对应的风险程度获得最终的风险结果。但由于客户和业务员通话过程中的对话形式较为口语化,不同客户对于同一关键词可能有多种表达形式,上述通过提取关键词并进行聚类的方法,获得的风险结果的准确率较低。
[0004]因此,在获取业务员与客户的通话录音后,如何提高风险识别的准确性成为亟待解决的问题。
技术实现思路
[0005]本专利技术实施例提供了一种基于 ...
【技术保护点】
【技术特征摘要】
1.一种基于通话录音的风险识别方法,其特征在于,所述识别方法包括:获取业务员与各个客户之间通话录音的N个历史音频,获取业务员与当前客户之间通话录音的目标音频,将N个所述历史音频转换为N个历史文本,将所述目标音频转换为目标文本,所述历史文本分为风险文本和非风险文本;确定历史文本中的敏感词,包括标准敏感词集中的敏感词,和各非风险文本中的敏感词;所述标准敏感词集包括各风险文本中的各敏感词;根据所述历史文本中的敏感词确定目标文本中的若干个敏感词;在所述标准敏感词集中,确定出与目标文本中的各敏感词唯一匹配的标准敏感词,根据目标文本的标准敏感词的组合,确定目标文本的标准敏感词组;根据所述各风险文本中的各敏感词的组合,确定各风险文本的标准敏感词组;根据所述目标文本的标准敏感词组和所述各风险文本的标准敏感词组之间的相似度,确定所述目标音频的风险程度。2.根据权利要求1所述的风险识别方法,其特征在于,确定所述标准敏感词集的过程包括:将各风险文本分割成若干个词或字;根据预设的模糊正则表达式,确定各风险文本对应的各个词或字中的敏感词,得到风险文本的标准敏感词集。3.根据权利要求1所述的风险识别方法,其特征在于,确定所述历史文本中的敏感词的过程包括:将各非风险文本分割成若干个词或字;根据预设的模糊正则表达式,确定各非风险文本对应的各个词或字中的敏感词,与所述各风险文本中的各个敏感词一起作为历史文本中的敏感词。4.根据权利要求1所述的风险识别方法,其特征在于,所述根据所述历史文本中的敏感词确定目标文本中的若干个敏感词,包括:提取目标文本中的关键词,确定目标文本中各个关键词的词向量和所述历史文本中的各个敏感词的词向量;计算所述目标文本中各个关键词的词向量与所述历史文本中的各个敏感词的词向量之间的第一相似度,当第一相似度大于或等于第一相似度阈值时,将目标文本中的对应关键词作为目标文本中的敏感词,确定目标文本中的若干个敏感词。5.根据权利要求1所述的风险识别方法,其特征在于,所述在所述标准敏感词集中,确定出与目标文本中的各敏感词唯一匹配的标准敏感词,包括:确定所述标准敏感词集中各敏感词的词向量,确定所述目标文本中的各敏感词的词向量;计算所述目标文本中的各敏感词的词向量和所述标准敏感词集中各敏感词的词向量之间的第二相似度,确定目标文本中的各敏感词的候选标准敏感词,得到目标文本中的各敏感词的候选标准敏感词集合;计算所述候选标准敏感词集合中各候选标准敏感词...
【专利技术属性】
技术研发人员:李正扬,王健宗,黄章成,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。