一种对话文本分析方法、装置、设备和可读介质制造方法及图纸

技术编号：26478728 阅读：35 留言：0更新日期：2020-11-25 19:22

本说明书实施例公开了一种对话文本分析方法、装置、设备和计算机可读介质。方案可以包括：获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；对所述多媒体文件进行语音识别，得到对话文本；确定所述对话文本对应的业务场景信息；根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

全部详细技术资料下载

【技术实现步骤摘要】
一种对话文本分析方法、装置、设备和可读介质
本申请涉及计算机
，尤其涉及一种对话文本分析方法、装置、设备和计算机可读介质。
技术介绍
随着互联网技术的普及，目前许多业务可以通过互联网进行，例如保险业务、理财业务等。在进行业务推广、办理等过程中，对工作人员的规范性有一定要求，例如，不能辱骂等；并且，有些业务具有强监管的属性，例如保险业务，对话术以及能够提及的信息都有界定，不能越过监管红线，否则会有合规风险。为了实现对网络业务执行过程的规范管理，需要对网络业务执行过程中的信息进行分析，以识别出违法或违规行为。因此，需要提供一种能够对对话文本进行分析的方法。
技术实现思路
本说明书实施例提供一种对话文本分析方法、装置、设备和计算机可读介质，用于对网络业务中产生的对话文本进行分析，以检出不合规内容。为解决上述技术问题，本说明书实施例是这样实现的：本说明书实施例提供的一种对话文本分析方法，包括：获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；对所述多媒体文件进行语...

【技术保护点】
1.一种对话文本分析方法，包括：/n获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；/n对所述多媒体文件进行语音识别，得到对话文本；/n确定所述对话文本对应的业务场景信息；/n根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；/n采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。/n

【技术特征摘要】
1.一种对话文本分析方法，包括：
获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；
对所述多媒体文件进行语音识别，得到对话文本；
确定所述对话文本对应的业务场景信息；
根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；
采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

2.如权利要求1所述的方法，所述确定所述对话文本对应的业务场景信息之前，还包括：
根据业务场景，配置适用于所述业务场景的至少一条分析规则；
与所述至少一条分析规则对应地，存储用于表示所述业务场景的业务场景信息。

3.如权利要求2所述的方法，所述根据业务场景，配置适用于所述业务场景的至少一条分析规则，具体包括：
对于配置一条分析规则：
选定至少一个规则算子；所述规则算子包括基于正则表达式模型的算子或基于关键词模型的算子；
基于所述至少一个规则算子，确定所述分析规则；所述分析规则为一个规则算子，或者，为由至少一个规则算子以及逻辑运算符构成逻辑表达式。

4.如权利要求1所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集，具体包括：
解析所述对话文本，获得所述对话文本中对话角色的角色信息；
从所述分析规则集中，确定对应于所述角色信息的分析规则子集；
采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集；所述分析规则子集用于表示所述对话文本中对应于所述对话角色的对话内容是否合规；所述分析规则子集是所述分析规则集的子集。

5.如权利要求4所述的方法，所述采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集，具体包括：
对于所述规则子集中的一条分析规则，执行：
从所述对话文本中确定与所述角色信息对应的对话片段；
采用所述分析规则，分析所述对话片段，得到与所述对话片段对应的分析结果；所述分析结果用于表示所述对话片段是否命中所述分析规则；所述分析结果为所述分析结果子集中的元素。

6.如权利要求4所述的方法，所述采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集，具体包括：
对于所述规则子集中的一条分析规则，执行：
从所述对话文本中确定与所述角色信息对应的对话片段；
基于所述对话片段，确定目标片段；所述目标片段包含所述对话片段以及所述对话片段的上文和/或下文；
采用所述分析规则，分析所述目标片段，得到与所述目标片段对应的分析结果；所述分析结果用于表示所述目标片段是否命中所述分析规则；所述分析结果为所述分析结果子集中的元素。

7.如权利要求1所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集，具体包括：
对于所述分析规则集中的任一分析规则，执行：
判断所述对话文本是否具有所述分析规则对应的风险，得到第一判断结果；
若所述第一判断结果为是，确定所述分析规则对应的风险标签。

8.如权利要求7所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集之后，还包括：
与所述对话文本对应地，存储所述风险标签。

9.如权利要求7所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集之后，还包括：
与所述对话文本对应地，存储所述风险标签和所述分析规则的标识信息。

10.如权利要求7所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集之后，还包括：
与所述对话文本对应地，存储所述风险标签、所述分析规则的标识信息以及风险定位信息；所述风险定位信息用于表示所述风险标签对应的对话内容在所述对话文本中的位置。

11.如权利要求1所述的方法，所述多媒体文件包括音频文件或视频文件。

12.如权利要求11所述的方法，所述多媒体文件为音频文件，所述对所述多媒体文件进行语音识别，得到对话文本，具体包括：
通过语音识别，提取...

【专利技术属性】
技术研发人员：马振，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人