一种基于大模型的催收敏感词质检方法和装置制造方法及图纸

技术编号：39648859 阅读：9 留言：0更新日期：2023-12-09 11:17

本发明专利技术提出了一种基于大模型的催收敏感词质检方法和装置，该方法包括：获取线上生成的催收录音；调用翻译模型

全部详细技术资料下载

【技术实现步骤摘要】
一种基于大模型的催收敏感词质检方法和装置

[0001]本专利技术涉及金融
，具体而言，涉及一种基于大模型的催收敏感词质检方法和装置
。

技术介绍

[0002]随着金融行业的监管力度加大，对催收行为的合规性要求越来越高
。
企业需要对催收过程中的敏感词进行识别和过滤，以确保催收行为符合相关法律法规和行业标准，降低潜在的法律风险
。
贷后催收是金融机构在做风险管理的重要环节，也是人工介入最多的环节
。
尤其是传统催收质检领域，主要依靠人工进行，成本高且效率低，不能满足金融催收行业的发展需求
。

技术实现思路

[0003]鉴于上述问题，本专利技术提供了一种基于大模型的催收敏感词质检方法和装置，解决了传统催收质检领域，主要依靠人工进行，成本高且效率低的问题
。
[0004]为解决上述技术问题，本专利技术采用的技术方案是：一种基于大模型的催收敏感词质检方法，包括如下步骤：获取线上生成的催收录音；调用翻译模型
API
接口将所述催收录音转换出录音文本；对所述录音文本进行预处理，并对所述录音文本中的长文本进行分割，获得输入文本；将所述输入文本导入原始模型中进行质检，输出第一质检结果；构建本地催收合规向量知识库，基于大语言模型调用所述向量知识库，并将所述输入文本导入大语言模型进行质检，输出第二质检结果；根据历史催收录音数据，并基于大语言模型进行
P
‑
tuning
训练，获得定制大语...

【技术保护点】

【技术特征摘要】
1.
一种基于大模型的催收敏感词质检方法，其特征在于，包括如下步骤：获取线上生成的催收录音；调用翻译模型
API
接口将所述催收录音转换出录音文本；对所述录音文本进行预处理，并对所述录音文本中的长文本进行分割，获得输入文本；将所述输入文本导入原始模型中进行质检，输出第一质检结果；构建本地催收合规向量知识库，基于大语言模型调用所述向量知识库，并将所述输入文本导入大语言模型进行质检，输出第二质检结果；根据历史催收录音数据，并基于大语言模型进行
P
‑
tuning
训练，获得定制大语言模型；将所述输入文本导入定制大语言模型中进行质检，获得第三质检结果；若第一质检结果
、
第二质检结果和第三质检结果中存在至少一项不合规，则最终的质检结果为不合规
。2.
根据权利要求1所述的基于大模型的催收敏感词质检方法，其特征在于，所述构建本地催收合规向量知识库，包括
:
基于专家经验或历史客户投诉案例
,
收集催收录音；将所述催收录音转成录音文本后，筛选出催收员的讲话部分；使用编码软件将所述录音文本转化成
512
维的向量，并将转化后的向量存储在数据库中；将待评估的录音文本转化成
512
维向量后，与数据库中的所有向量进行内积计算，内积越大，相似度越高；若相似度超过设定阈值，则说明对应录音存在历史发生过的不合规问题
。3.
根据权利要求1所述的基于大模型的催收敏感词质检方法，其特征在于，在将所述输入文本导入大语言模型进行质检之前，还包括：读取内容，获取与用户请求相关的上下文；使用请求内容和上下文内容填充模板，获得提示词；将所述提示词输入到大语言模型中
。4.
根据权利要求1所述的基于大模型的催收敏感词质检方法，其特征在于，对所述录音文本进行预处理，包括：去除小于
30
秒的录音文本，并增加基于专家经验和历史投诉信息的目标标签信息
。5.
根据权利要求1所述的基于大模型的催收敏感词质检方法，其特征在于，所述根据历史催收录音数据，并基于大语言模型进行
P
‑
tuning
训练，获得定制大语言模型，包括：收集催收领域的录音和文本数据，并对数据预处理；利用
ASR
技术识别录音数据，区分出催收人员和逾期用户，并把录音数据转换成文本数据；使用专...

【专利技术属性】
技术研发人员：陈希，徐维，段祖宁，
申请(专利权)人：江苏苏宁银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人