银行双录场景的语言合规性检查方法、装置、设备和介质制造方法及图纸

技术编号:30793371 阅读:14 留言:0更新日期:2021-11-16 07:57
本发明专利技术属于语音处理领域,具体提供一种银行双录场景的语言合规性检查方法、装置、计算机设备和存储介质,旨在解决如何通过自然语言处理模型实现对银行双录场景的语音数据进行语言合规性检查的问题。为此目的,本发明专利技术的方法包括:获取银行双录的语音数据,并将语音数据转换为文本数据;通过话术切分模型将文本数据切分为客户语音的文本数据和银行工作人员的文本数据;分别对客户语音的文本数据和银行工作人员的文本数据进行语言合规性检查。应用本发明专利技术的方法,可快速准确地对用户意图、银行工作人员语言的敏感词、理财场景匹配等场景自动进行合规性检查,从而进一步促进银行工作人员按程序、按规定开展工作,同时也可以更好地保护客户权益。保护客户权益。保护客户权益。

【技术实现步骤摘要】
银行双录场景的语言合规性检查方法、装置、设备和介质


[0001]本专利技术属于语音处理领域,具体涉及一种银行双录场景的语言合规性检查方法、装置、设备和存储介质。

技术介绍

[0002]银行双录是指银行业金融机构在营业场所销售自身依法发行的理财产品及合作机构依法发行的金融产品,应实施专区“双录”管理,即设立销售专区,并在销售专区内装配电子系统,对每笔产品销售过程同步录音录像,以确保销售人员按程序、按规定介绍产品,使购买者更清楚地了解产品的性质和自身享有的权利、承担的责任和风险。
[0003]目前多数银行仍在使用人工质检,即人工查看录音录像文件进行质量检查,并且人工质检主要以抽检为主,存在覆盖范围低和效率较低的问题。如何利用自然语言处理技术快速准确地对银行双录场景的语音数据自动进行语言合规性检查的问题,已经成为本领域亟待解决的问题。
[0004]相应地,本领域需要一种新的方案来解决上述问题。

技术实现思路

[0005]本专利技术旨在解决上述技术问题,即,解决如何利用自然语言处理技术快速准确地对银行双录场景的语音数据自动进行语言合规性检查的问题。
[0006]在第一方面,本专利技术提供一种银行双录场景的语言合规性检查方法,所述方法包括:
[0007]获取银行双录的语音数据,并将所述语音数据转换为文本数据;
[0008]通过话术切分模型将所述文本数据切分为第一文本数据和第二文本数据,其中,所述第一文本数据为客户语音的文本数据,所述第二文本数据为银行工作人员语音的文本数据
[0009]分别对所述第一文本数据和所述第二文本数据进行语言合规性检查。
[0010]在上述银行双录场景的语言合规性检查方法一个实施方式中,所述“分别对所述第一文本数据和所述第二文本数据进行语言合规性检查”的步骤具体包括:
[0011]通过意图识别模型对所述第一文本数据中的客户意图进行识别;
[0012]通过理财场景模板匹配模型对所述第二文本数据中的理财场景进行匹配;
[0013]通过敏感词模型对所述第二文本数据中的敏感词进行识别。
[0014]在上述银行双录场景的语言合规性检查方法一个实施方式中,所述话术切分模型为RoBERTa模型和CRF模型的混合模型,并且经过话术切分语料库的微调。
[0015]在上述银行双录场景的语言合规性检查方法一个实施方式中,所述意图识别模型为RoBERTa模型,并且经过意图肯定否定语料库的微调;并且/或者
[0016]所述理财场景模板匹配模型为RoBERTa模型和CRF模型的混合模型,并且经过理财场景模板匹配语料库的微调;并且/或者
[0017]所述敏感词模型为RoBERTa模型和CRF模型的混合模型,并且经过敏感词语料库的微调。
[0018]在上述银行双录场景的语言合规性检查方法一个实施方式中,所述混合模型的具体内容包括:
[0019]通过所述RoBERTa模型进行文本分类;
[0020]通过所述CRF模型进行序列标注;
[0021]输出文本分类结果和序列标注结果;
[0022]其中,所述CRF模型的损失值计算中包含文本分类的[CLS]信息,并且所述混合模型仅包含一个Dense全连接层。
[0023]在第二方面,本专利技术提供一种银行双录场景的语言合规性检查装置,所述装置包括:
[0024]数据获取模块,所述数据获取模块被配置成获取银行双录的语音数据,并将所述语音数据转换为文本数据;
[0025]话术切分模块,其被配置成通过话术切分模型将所述文本数据切分为第一文本数据和第二文本数据,其中,所述第一文本数据为客户语音的文本数据,所述第二文本数据为银行工作人员语音的文本数据;
[0026]语言合规性检查模块,所述语言合规性检查模块被配置成分别对所述第一文本数据和所述第二文本数据进行语言合规性检查。
[0027]在上述银行双录场景的语言合规性检查装置一个实施方式中,所述语言合规性检查模块具体执行以下操作:
[0028]通过意图识别模型对所述第一文本数据中的客户意图进行识别;
[0029]通过理财场景模板匹配模型对所述第二文本数据中的理财场景进行匹配;
[0030]通过敏感词模型对所述第二文本数据中的敏感词进行识别。
[0031]在上述银行双录场景的语言合规性检查装置一个实施方式中,所述话术切分模型为RoBERTa模型和CRF模型的混合模型,并且经过话术切分语料库的微调。
[0032]在上述银行双录场景的语言合规性检查装置一个实施方式中,所述意图识别模型为RoBERTa模型,并且经过意图肯定否定语料库的微调;并且/或者
[0033]所述理财场景模板匹配模型为RoBERTa模型和CRF模型的混合模型,并且经过理财场景模板匹配语料库的微调;并且/或者
[0034]所述敏感词模型为RoBERTa模型和CRF模型的混合模型,并且经过敏感词语料库的微调。
[0035]在上述银行双录场景的语言合规性检查装置一个实施方式中,所述混合模型的具体内容包括:
[0036]通过所述RoBERTa模型进行文本分类;
[0037]通过所述CRF模型进行序列标注;
[0038]输出文本分类结果和序列标注结果;
[0039]其中,所述CRF模型的损失值计算中包含文本分类的[CLS]信息,并且所述混合模型仅包含一个Dense全连接层。
[0040]在第三方面,本专利技术提供一种计算机设备,所述设备包括处理器和存储装置,所述
存储装置适于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行所述银行双录场景的语言合规性检查方法中的任一项。
[0041]在第四方面,本专利技术提供一种存储介质,所述存储介质适于存储多条程序代码,所述程序代码适于由处理器加载并运行以执行所述银行双录场景的语言合规性检查方法中的任一项。
[0042]在采用上述技术方案的情况下,本专利技术能够根据银行双录质检的需求,通过话术切分模型、意图识别模型、理财场景模板匹配模型和敏感词模型实现对银行双录场景语音数据的语言合规性进行快速准确地自动检查,从而提高双录质检的效率,进一步促进银行工作人员按程序、按规定开展工作,同时也可以更好地保护消费者权益。并且使用改进的基于RoBERTa模型和CRF模型的混合模型,进一步提高了语音合规性检查的准确性。
附图说明
[0043]下面结合附图来描述本专利技术的优选实施方式,附图中:
[0044]图1是本专利技术的实施例的银行双录场景的语言合规性检查方法的主要步骤流程图。
[0045]图2是图1中的步骤S103的具体实现流程示意图。
[0046]图3是本专利技术的实施例的银行双录场景的语言合规性检查装置的结构示意图。
具体实施方式
[0047]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本专利技术实施例的技术方案进行清楚、完整地本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种银行双录场景的语言合规性检查方法,其特征在于,所述方法包括:获取银行双录的语音数据,并将所述语音数据转换为文本数据;通过话术切分模型将所述文本数据切分为第一文本数据和第二文本数据,其中,所述第一文本数据为客户语音的文本数据,所述第二文本数据为银行工作人员语音的文本数据;分别对所述第一文本数据和所述第二文本数据进行语言合规性检查。2.根据权利要求1所述的银行双录场景的语言合规性检查方法,其特征在于,所述“分别对所述第一文本数据和所述第二文本数据进行语言合规性检查”的步骤具体包括:通过意图识别模型对所述第一文本数据中的客户意图进行识别;通过理财场景模板匹配模型对所述第二文本数据中的理财场景进行匹配;通过敏感词模型对所述第二文本数据中的敏感词进行识别。3.根据权利要求1或2所述的银行双录场景的语言合规性检查方法,其特征在于,所述话术切分模型为RoBERTa模型和CRF模型的混合模型,并且经过话术切分语料库的微调。4.根据权利要求2所述的银行双录场景的语言合规性检查方法,其特征在于,所述意图识别模型为RoBERTa模型,并且经过意图肯定否定语料库的微调;并且/或者所述理财场景模板匹配模型为RoBERTa模型和CRF模型的混合模型,并且经过理财场景模板匹配语料库的微调;并且/或者所述敏感词模型为RoBERTa模型和CRF模型的混合模型,并且经过敏感词语料库的微调。5.根据权利要求3或4所述的银行双录场景的语言合规性检查方法,其特征在于,所述混合模型的处理过程包括:通过所述RoBERTa模型进行文本分类;通过所述CRF模型进行序列标注;输出文本分类结果和序列标注结果;其中,所述CRF模型的损失值计算中包含文本分类的[CLS]信息,并且所述混合模型仅包含一个Dense全连接层。6.一种银行双录场景的语言合规性检查装置,其特征在于,所述装置包括:数据获取模块,所述数据获取模块被配置成获取银行双录的语音数据,并将所述语音数据转换为文本数据;话术切分模块,其被配置成通过话术切分模型将所述文本数据切分为第一文本数据和...

【专利技术属性】
技术研发人员:李波郝东
申请(专利权)人:上海云从企业发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1