话术提取方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:38989920 阅读:15 留言:0更新日期:2023-10-07 10:20
本申请涉及一种话术提取方法、装置、电子设备及可读存储介质,所述方法包括步骤:获取会话记录,并将所述会话记录进行语义切片得到语义片段,其中,相邻的所述语义片段对应的会话主题不同;在所述语义片段中确定可提取话术片段。通过根据会话主题的不同将会话记录进行划分得到语义片段,使得无论是针对相同主题的单轮或多轮对话均能够被划分到同一语义片段中,进而基于语义片段能够实现单轮或多轮对话场景下的话术提取。场景下的话术提取。场景下的话术提取。

【技术实现步骤摘要】
话术提取方法、装置、电子设备及可读存储介质


[0001]本申请涉及深度学习
,尤其涉及一种话术提取方法、装置、电子设备及可读存储介质。

技术介绍

[0002]现有的话术提取方案多为从历史会话数据中采集客户问题以及其后紧跟的员工回复,并将客户问题与对应的回复作为潜在话术并进行聚类;然而这种方式只能针对单轮消息话术进行采集,但实际业务场景中,客户的异议处理往往需要多轮沟通才能处理或消除,即存在多轮话术,现有的话术提取方法无法针对多轮话术场景进行完整提取。

技术实现思路

[0003]本申请提供了一种话术提取方法、装置、电子设备及可读存储介质,旨在解决现有技术中无法针对多轮话术场景进行完整提取的技术问题。
[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种话术提取方法,所述方法包括步骤:
[0005]获取会话记录,并将所述会话记录进行语义切片得到语义片段,其中,相邻的所述语义片段对应的会话主题不同;
[0006]在所述语义片段中确定可提取话术片段。
[0007]可选地,所述将所述会话记录进行语义切片得到语义片段的步骤包括:
[0008]将所述会话记录划分为连续的多个单位消息;
[0009]在各所述单位消息之间的划分点中确定语义突变点;
[0010]将所述语义突变点作为切片位置对所述会话记录进行语义切片得到所述语义片段。
[0011]可选地,所述在各所述单位消息之间的划分点中确定语义突变点的步骤包括:
[0012]计算所述会话记录中消息窗口的窗口语义向量,其中,任意连续的预设数量个所述单位消息对应一个消息窗口;
[0013]针对任意相邻的两个所述消息窗口,根据所述语义向量计算两个所述消息窗口之间的窗口语义距离;
[0014]若所述窗口语义距离大于预设窗口语义距离,则将位于两个所述消息窗口中间的所述划分点作为所述语义突变点。
[0015]可选地,所述在所述语义片段中确定可提取话术片段的步骤包括:
[0016]确定所述会话记录中的目标事件;
[0017]通过所述目标事件对所述语义片段进行筛选得到目标语义片段;
[0018]在所述目标语义片段中确定可提取话术片段。
[0019]可选地,所述在所述目标语义片段中确定可提取话术片段的步骤包括:
[0020]基于对应的所述目标事件对所述目标语义片段进行分组得到多个片段组别;
[0021]针对每一所述片段组别,对包含的所述目标语义片段基于片段语义距离进行聚类得到至少一个话术类别;
[0022]获取各所述目标语义片段对应的业绩标识,并根据所述业绩标识在所述话术类别中确定目标话术类别;
[0023]将所述目标话术类别包含的所述目标语义片段作为所述可提取话术片段。
[0024]可选地,所述根据所述业绩标识在所述话术类别中确定目标话术类别的步骤包括:
[0025]针对每一所述话术类别,计算业绩标识为成功的所述目标语义片段在所述话术类别中的比例,得到类别成功率;
[0026]判断所述类别成功率是否大于预设成功率阈值;
[0027]若所述类别成功率大于所述预设成功率阈值,则将所述话术类别作为所述目标话术类别。
[0028]可选地,所述确定所述会话记录中的目标事件的步骤包括:
[0029]对所述会话记录进行问句识别确定所述会话记录中的问句消息;
[0030]对各所述问句消息进行聚类得到多个问句事件类别,并确定各所述问句事件类别对应的消息数量;
[0031]将消息数量大于预设问句阈值的所述问句事件类别作为目标事件类别,并将所述目标事件类别中的所述问句消息作为所述目标事件。
[0032]为实现上述目的,本专利技术还提供一种话术提取装置,所述话术提取装置包括:
[0033]第一获取模块,用于获取会话记录,并将所述会话记录进行语义切片得到语义片段,其中,相邻的所述语义片段对应的会话主题不同;
[0034]第一确定模块,用于在所述语义片段中确定可提取话术片段。
[0035]为实现上述目的,本专利技术还提供一种电子设备,所述电子设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的话术提取方法的步骤。
[0036]为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的话术提取方法的步骤。
[0037]本专利技术可以应用于在深度学习
进行自然语言处理。本专利技术提出的一种话术提取方法、装置、电子设备及可读存储介质,获取会话记录,并将所述会话记录进行语义切片得到语义片段,其中,相邻的所述语义片段对应的会话主题不同;在所述语义片段中确定可提取话术片段。通过根据会话主题的不同将会话记录进行划分得到语义片段,使得无论是针对相同主题的单轮或多轮对话均能够被划分到同一语义片段中,进而基于语义片段能够实现单轮或多轮对话场景下的话术提取。
附图说明
[0038]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0039]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0040]图1为本专利技术话术提取方法中第一实施例的流程示意图;
[0041]图2为本专利技术话术提取方法的整体流程示意图;
[0042]图3为本专利技术电子设备的模块结构示意图。
具体实施方式
[0043]应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0044]本专利技术提供一种话术提取方法,参照图1,图1为本专利技术话术提取方法第一实施例的流程示意图,所述方法包括步骤:
[0045]步骤S10,获取会话记录,并将所述会话记录进行语义切片得到语义片段,其中,相邻的所述语义片段对应的会话主题不同;
[0046]会话记录是指历史会话产生的记录数据,会话记录中可以包括多次会话产生的记录数据;可以理解的是,基于会话场景不同,会话记录的数据记录形式包括但不限于文本、语音或视频;需要说明的是,后续对会话记录进行处理时,可以基于实际的记录形式进行处理,还可以转换为统一的形式进行处理,如将不同记录形式均转换为文本。...

【技术保护点】

【技术特征摘要】
1.一种话术提取方法,其特征在于,所述方法包括:获取会话记录,并将所述会话记录进行语义切片得到语义片段,其中,相邻的所述语义片段对应的会话主题不同;在所述语义片段中确定可提取话术片段。2.如权利要求1所述的话术提取方法,其特征在于,所述将所述会话记录进行语义切片得到语义片段的步骤包括:将所述会话记录划分为连续的多个单位消息;在各所述单位消息之间的划分点中确定语义突变点;将所述语义突变点作为切片位置对所述会话记录进行语义切片得到所述语义片段。3.如权利要求2所述的话术提取方法,其特征在于,所述在各所述单位消息之间的划分点中确定语义突变点的步骤包括:计算所述会话记录中消息窗口的窗口语义向量,其中,任意连续的预设数量个所述单位消息对应一个消息窗口;针对任意相邻的两个所述消息窗口,根据所述窗口语义向量计算两个所述消息窗口之间的窗口语义距离;若所述窗口语义距离大于预设窗口语义距离,则将位于两个所述消息窗口中间的所述划分点作为所述语义突变点。4.如权利要求1所述的话术提取方法,其特征在于,所述在所述语义片段中确定可提取话术片段的步骤包括:确定所述会话记录中的目标事件;通过所述目标事件对所述语义片段进行筛选得到目标语义片段;在所述目标语义片段中确定可提取话术片段。5.如权利要求4所述的话术提取方法,其特征在于,所述在所述目标语义片段中确定可提取话术片段的步骤包括:基于对应的所述目标事件对所述目标语义片段进行分组得到多个片段组别;针对每一所述片段组别,对包含的所述目标语义片段基于片段语义距离进行聚类得到至少一个话术类别;获取各所述目标语义片段对应的业绩标识,并根据所述业绩标识在所述话术...

【专利技术属性】
技术研发人员:赵亮姜平
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1