银行双录场景的语言合规性检查方法、装置、设备和介质制造方法及图纸

技术编号：30793371 阅读：14 留言：0更新日期：2021-11-16 07:57

本发明专利技术属于语音处理领域，具体提供一种银行双录场景的语言合规性检查方法、装置、计算机设备和存储介质，旨在解决如何通过自然语言处理模型实现对银行双录场景的语音数据进行语言合规性检查的问题。为此目的，本发明专利技术的方法包括：获取银行双录的语音数据，并将语音数据转换为文本数据；通过话术切分模型将文本数据切分为客户语音的文本数据和银行工作人员的文本数据；分别对客户语音的文本数据和银行工作人员的文本数据进行语言合规性检查。应用本发明专利技术的方法，可快速准确地对用户意图、银行工作人员语言的敏感词、理财场景匹配等场景自动进行合规性检查，从而进一步促进银行工作人员按程序、按规定开展工作，同时也可以更好地保护客户权益。保护客户权益。保护客户权益。

全部详细技术资料下载

【技术实现步骤摘要】
银行双录场景的语言合规性检查方法、装置、设备和介质

[0001]本专利技术属于语音处理领域，具体涉及一种银行双录场景的语言合规性检查方法、装置、设备和存储介质。

技术介绍

[0002]银行双录是指银行业金融机构在营业场所销售自身依法发行的理财产品及合作机构依法发行的金融产品，应实施专区“双录”管理，即设立销售专区，并在销售专区内装配电子系统，对每笔产品销售过程同步录音录像，以确保销售人员按程序、按规定介绍产品，使购买者更清楚地了解产品的性质和自身享有的权利、承担的责任和风险。
[0003]目前多数银行仍在使用人工质检，即人工查看录音录像文件进行质量检查，并且人工质检主要以抽检为主，存在覆盖范围低和效率较低的问题。如何利用自然语言处理技术快速准确地对银行双录场景的语音数据自动进行语言合规性检查的问题，已经成为本领域亟待解决的问题。
[0004]相应地，本领域需要一种新的方案来解决上述问题。

技术实现思路

[0005]本专利技术旨在解决上述技术问题，即，解决如何利用自然语言处理技术快速准确地对银行双录场景的语音数据自动进行语言合规性检查的问题。
[0006]在第一方面，本专利技术提供一种银行双录场景的语言合规性检查方法，所述方法包括：
[0007]获取银行双录的语音数据，并将所述语音数据转换为文本数据；
[0008]通过话术切分模型将所述文本数据切分为第一文本数据和第二文本数据，其中，所述第一文本数据为客户语音的文本数据，所述第二文本数据为银行工作人员语音的文本数据...

【技术保护点】

【技术特征摘要】
1.一种银行双录场景的语言合规性检查方法，其特征在于，所述方法包括：获取银行双录的语音数据，并将所述语音数据转换为文本数据；通过话术切分模型将所述文本数据切分为第一文本数据和第二文本数据，其中，所述第一文本数据为客户语音的文本数据，所述第二文本数据为银行工作人员语音的文本数据；分别对所述第一文本数据和所述第二文本数据进行语言合规性检查。2.根据权利要求1所述的银行双录场景的语言合规性检查方法，其特征在于，所述“分别对所述第一文本数据和所述第二文本数据进行语言合规性检查”的步骤具体包括：通过意图识别模型对所述第一文本数据中的客户意图进行识别；通过理财场景模板匹配模型对所述第二文本数据中的理财场景进行匹配；通过敏感词模型对所述第二文本数据中的敏感词进行识别。3.根据权利要求1或2所述的银行双录场景的语言合规性检查方法，其特征在于，所述话术切分模型为RoBERTa模型和CRF模型的混合模型，并且经过话术切分语料库的微调。4.根据权利要求2所述的银行双录场景的语言合规性检查方法，其特征在于，所述意图识别模型为RoBERTa模型，并且经过意图肯定否定语料库的微调；并且/或者所述理财场景模板匹配模型为RoBERTa模型和CRF模型的混合模型，并且经过理财场景模板匹配语料库的微调；并且/或者所述敏感词模型为RoBERTa模型和CRF模型的混合模型，并且经过敏感词语料库的微调。5.根据权利要求3或4所述的银行双录场景的语言合规性检查方法，其特征在于，所述混合模型的处理过程包括：通过所述RoBERTa模型进行文本分类；通过所述CRF模型进行序列标注；输出文本分类结果和序列标注结果；其中，所述CRF模型的损失值计算中包含文本分类的[CLS]信息，并且所述混合模型仅包含一个Dense全连接层。6.一种银行双录场景的语言合规性检查装置，其特征在于，所述装置包括：数据获取模块，所述数据获取模块被配置成获取银行双录的语音数据，并将所述语音数据转换为文本数据；话术切分模块，其被配置成通过话术切分模型将所述文本数据切分为第一文本数据和...

【专利技术属性】
技术研发人员：李波，郝东，
申请(专利权)人：上海云从企业发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人