话术提取方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：38989920 阅读：15 留言：0更新日期：2023-10-07 10:20

本申请涉及一种话术提取方法、装置、电子设备及可读存储介质，所述方法包括步骤：获取会话记录，并将所述会话记录进行语义切片得到语义片段，其中，相邻的所述语义片段对应的会话主题不同；在所述语义片段中确定可提取话术片段。通过根据会话主题的不同将会话记录进行划分得到语义片段，使得无论是针对相同主题的单轮或多轮对话均能够被划分到同一语义片段中，进而基于语义片段能够实现单轮或多轮对话场景下的话术提取。场景下的话术提取。场景下的话术提取。

全部详细技术资料下载

【技术实现步骤摘要】
话术提取方法、装置、电子设备及可读存储介质

[0001]本申请涉及深度学习
，尤其涉及一种话术提取方法、装置、电子设备及可读存储介质。

技术介绍

[0002]现有的话术提取方案多为从历史会话数据中采集客户问题以及其后紧跟的员工回复，并将客户问题与对应的回复作为潜在话术并进行聚类；然而这种方式只能针对单轮消息话术进行采集，但实际业务场景中，客户的异议处理往往需要多轮沟通才能处理或消除，即存在多轮话术，现有的话术提取方法无法针对多轮话术场景进行完整提取。

技术实现思路

[0003]本申请提供了一种话术提取方法、装置、电子设备及可读存储介质，旨在解决现有技术中无法针对多轮话术场景进行完整提取的技术问题。
[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种话术提取方法，所述方法包括步骤：
[0005]获取会话记录，并将所述会话记录进行语义切片得到语义片段，其中，相邻的所述语义片段对应的会话主题不同；
[0006]在所述语义片段中确定可提取话术片段。
[0007]可选地，所述将所述会话记录进行语义切片得到语义片段的步骤包括：
[0008]将所述会话记录划分为连续的多个单位消息；
[0009]在各所述单位消息之间的划分点中确定语义突变点；
[0010]将所述语义突变点作为切片位置对所述会话记录进行语义切片得到所述语义片段。
[0011]可选地，所述在各所述单位消息之间的划分点中确定语义突变点的步骤包括：
[

【技术保护点】

【技术特征摘要】
1.一种话术提取方法，其特征在于，所述方法包括：获取会话记录，并将所述会话记录进行语义切片得到语义片段，其中，相邻的所述语义片段对应的会话主题不同；在所述语义片段中确定可提取话术片段。2.如权利要求1所述的话术提取方法，其特征在于，所述将所述会话记录进行语义切片得到语义片段的步骤包括：将所述会话记录划分为连续的多个单位消息；在各所述单位消息之间的划分点中确定语义突变点；将所述语义突变点作为切片位置对所述会话记录进行语义切片得到所述语义片段。3.如权利要求2所述的话术提取方法，其特征在于，所述在各所述单位消息之间的划分点中确定语义突变点的步骤包括：计算所述会话记录中消息窗口的窗口语义向量，其中，任意连续的预设数量个所述单位消息对应一个消息窗口；针对任意相邻的两个所述消息窗口，根据所述窗口语义向量计算两个所述消息窗口之间的窗口语义距离；若所述窗口语义距离大于预设窗口语义距离，则将位于两个所述消息窗口中间的所述划分点作为所述语义突变点。4.如权利要求1所述的话术提取方法，其特征在于，所述在所述语义片段中确定可提取话术片段的步骤包括：确定所述会话记录中的目标事件；通过所述目标事件对所述语义片段进行筛选得到目标语义片段；在所述目标语义片段中确定可提取话术片段。5.如权利要求4所述的话术提取方法，其特征在于，所述在所述目标语义片段中确定可提取话术片段的步骤包括：基于对应的所述目标事件对所述目标语义片段进行分组得到多个片段组别；针对每一所述片段组别，对包含的所述目标语义片段基于片段语义距离进行聚类得到至少一个话术类别；获取各所述目标语义片段对应的业绩标识，并根据所述业绩标识在所述话术...

【专利技术属性】
技术研发人员：赵亮，姜平，
申请(专利权)人：北京明略昭辉科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人