一种NLP质检方法及计算机可读存储介质技术

技术编号：40564383 阅读：34 留言：0更新日期：2024-03-05 19:28

本发明专利技术涉及一种NLP质检方法及计算机可读存储介质，将分离或标注出不同讲话人的大篇幅音频会话内容转换为文本，通过模糊查找方式，检查会话内容字符串中是否包含有所述目标字符串中的预期话术内容或/和固定问答内容，如有，则将会话内容字符串中包含的与目标字符串中的预期话术内容或/和固定问答内容相同或相似的文本内容进行剔除，对经步骤3处理后的会话内容字符串进行分句，然后对每个分句进行逐句语义分类，对会话内容字符串中包含的消极情绪分类项进行统计；对处理后的整段会话内容字符串使用大语言模型进行处理，并输出质检结果。本发明专利技术在使用少的算力资源同时，将不同讲话人的对话内容进行有效的NLP处理。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及质检领域，尤其涉及一种nlp质检方法及计算机可读存储介质。

技术介绍

1、在许多行业中，需要对一些重要会话进行记录，并对其进行质检，例如呼叫中心、金融产品销售、保险销售等等。基本的流程是先通过自动语音识别(automatic speechrecognition，asr)技术将对话内容转换为文本，然后用自然语言处理(natural languageprocessing,nlp)技术对其进行质检。现有的质检方式通常包括语义查找及语义分类，其中语义查找即查找是否存在关键词及关键话术，语义分类即对某个短语进行nlp分类，确定其不同类别，比如积极的、消极的等。

2、传统的nlp质检中，语义分析适用于对短语或一句话进行处理，对大篇幅会话内容缺少逻辑推理能力。对于关键问题的质检，通常使用穷举关键词匹配的方式进行查找，比较依赖关键词库的完整性，灵活度不足，具有应用局限。而大语言模型(large languagemodel，llm)虽然能够很好的理解上下文，也能进行逻辑推理，但一方面需要较高的硬件配置，处理成本和能耗高；另一方面...

【技术保护点】

1.一种NLP质检方法，用于对大篇幅音频会话内容进行NLP质检，其特征在于，包括以下步骤：

2.根据权利要求1所述的NLP质检方法，其特征在于：所述步骤2中大篇幅会话音频如果包括分别为不同讲话人声音的多声道音频数据，则直接将不同声道的音频数据处理为不同讲话人的会话内容；如果同一个声道中有不同讲话人的声音，则通过声纹识别技术区分不同讲话人的会话内容。

3.根据权利要求1所述的NLP质检方法，其特征在于：所述步骤3中，模糊查找会话内容字符串中是否包含有所述目标字符串中的预期话术内容或/和固定问答内容的具体方式包括：

4.根据权利要求3所述的NLP质检方法，...

【技术特征摘要】

1.一种nlp质检方法，用于对大篇幅音频会话内容进行nlp质检，其特征在于，包括以下步骤：

2.根据权利要求1所述的nlp质检方法，其特征在于：所述步骤2中大篇幅会话音频如果包括分别为不同讲话人声音的多声道音频数据，则直接将不同声道的音频数据处理为不同讲话人的会话内容；如果同一个声道中有不同讲话人的声音，则通过声纹识别技术区分不同讲话人的会话内容。

3.根据权利要求1所述的nlp质检方法，其特征在于：所述步骤3中，模糊查找会话内容字符串中是否包含有所述目标字符串中的预期话术内容或/和固定问答内容的具体方式包括：

4.根据权利要求3所述的nlp质检方法，其特征在于：所述通配符包括第一通配符及第二通配符，所述第一通配符为'.'，代表任意一个长度为1的字符；所述第二通配符为'*'，代表任意长度任意内容的字符串，该字符串可为空。

5.根据权利要求3所述的nlp质检方法，其特征在于：所述块结构体数组具有三个属性值spos、dpos及len，spos表示局部完全匹配字符串在会话内容字符串中的起始位置，dpos表示局部完全匹配字符串在目标字符串中的起始位置，len表示局部完全匹配字符串的长度。

【专利技术属性】
技术研发人员：钱晓炯，周银，董泽，周方斌，
申请(专利权)人：宁波菊风系统软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人