基于聊天日志的摘要生成方法及装置、存储介质及电子终端制造方法及图纸

技术编号:20273047 阅读:21 留言:0更新日期:2019-02-02 03:51
本公开涉及电子商务技术领域,具体涉及一种基于聊天日志的摘要生成方法、一种基于聊天日志的摘要生成装置、一种存储介质以及一种电子终端。所述方法包括:对聊天日志按预设规则进行清理,得到由会话一方的消息语句组成的消息记录;计算所述消息记录中各消息语句与所述消息记录的相似度得分;根据各消息语句的相似度得分排序,并选取预设排序数量的消息语句生成摘要。本公开能够准确的识别聊天日志中的核心主题,使得生成的摘要能够准确体现会话的核心内容,同时可以有效的减少摘要中的无用信息,提高读者的阅读效率。

【技术实现步骤摘要】
基于聊天日志的摘要生成方法及装置、存储介质及电子终端
本公开涉及电子商务
,具体涉及一种基于聊天日志的摘要生成方法、一种基于聊天日志的摘要生成装置、一种存储介质以及一种电子终端。
技术介绍
随着互联网电子商务的蓬勃发展,在线客服作为与客户沟通交流的渠道,已成为电子商务网站的重要组成部分,同时也是展示企业形象的重要工具。在线客服经常需要在短时间内浏览大量的会话记录信息,以快速了解客户信息和需求。例如,在接听其他人工客服或客服机器人转接进线时,需要快速了解客户与前一个客服的聊天记录,以了解客户需求;或者在接收到客户的留言信息时,客户留言中可能包含数量较多的内容以及多个问题描述,此时客服需要阅读大量的消息记录以整理出简短且有效的信息及数据。或者当访问的客户较多,在线客服需要同时接待多个客户时,在线客户难以对客户信息快速响应,客户可能会连续输入多条消息,此时在线客服就需要阅读大量的消息记录并作出回应。此时对聊天记录进行压缩、提炼,生成摘要就显得尤为重要。现有技术中为会话记录生成摘要主要通过以下几种方式:1)在线客服与客户沟通并保存会话记录,通过人工去除无用信息的方式整理出摘要;2)基于文本相似度的自动处理,对消息记录的内容进行筛选以生成摘要。但以上方式均存在一定的问题,人工去除无用信息时,信息压缩效果差,经常会剩余过多的消息记录,数据量仍然较大,阅读负担较重;而基于文本相似度的自动处理方式准确率较低,由于客户表述的内容较多,可能使自动生产的摘要偏离主题,从而误导阅读者。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一基于聊天日志的摘要生成方法、一种基于聊天日志的摘要生成装置、一种存储介质以及一种电子终端,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的第一方面,提供一种基于聊天日志的摘要生成方法,包括:对聊天日志按预设规则进行清理,得到由会话一方的消息语句组成的消息记录;计算所述消息记录中各消息语句与所述消息记录的相似度得分;根据各消息语句的相似度得分排序,并选取预设排序数量的消息语句生成摘要。在本公开的一种示例性实施例中,所述对聊天日志按预设规则进行清理包括:删除所述聊天日志中的系统消息语句以及会话另一方发出的消息语句,保留会话一方发出的消息语句。在本公开的一种示例性实施例中,所述对聊天日志按预设规则进行清理包括下述处理中的一种或多种:语句删除处理,删除所述消息记录中的标识会话开始、标识会话结束以及表示问候的消息语句;表情符号删除处理,删除所述消息记录中的表情符号。在本公开的一种示例性实施例中,所述对聊天日志按预设规则进行清理还包括:占位符处理,统一各所述消息语句中的占位符;替换处理,将所述消息语句中的口头用语替换为书面用语。在本公开的一种示例性实施例中,所述计算所述消息记录中各语句与所述消息记录的相似度包括:依据各所述消息语句中的关键字利用余弦公式计算各所述消息语句与所述消息记录的相似度,所述余弦公式如下:其中,Ai为所述消息语句中关键字的字频向量;Bi为消息记录中关键字的字频向量。在本公开的一种示例性实施例中,所述根据各消息语句的相似度得分排序包括:判断各消息语句的相似度得分是否相同;在判断存在相似度得分相同的消息语句时,随机选取一条所述相似度得分相同的消息语句进行排序;其余的所述相似度得分相同的消息语句不进行排序。在本公开的一种示例性实施例中,所述聊天日志中包括:文本消息、音频消息或视频消息中的一种或多种。根据本公开的第二方面,提供一种基于聊天日志的摘要生成装置,包括:消息整理模块,用于对聊天日志按预设规则进行清理,得到由会话一方的消息语句组成的消息记录;相似度计算模块,用于计算所述消息记录中各消息语句与所述消息记录的相似度得分;摘要生成模块,用于根据各消息语句的相似度得分排序,并选取预设排序数量的消息语句生成摘要。根据本公开的第三方面,提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的基于聊天日志的摘要生成方法。根据本公开的第四方面,提供一种电子终端,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行以下操作:对聊天日志按预设规则进行清理,得到由会话一方的消息语句组成的消息记录;计算所述消息记录中各消息语句与所述消息记录的相似度得分;根据各消息语句的相似度得分排序,并选取预设排序数量的消息语句生成摘要。本公开的一种实施例所提供的基于聊天日志的摘要生成方法中,通过对聊天日志进行清理,只保留会话双方中一方所发送的消息语句;并对各消息语句与完整的消息记录进行相似度得分计算,并依据相似度得分排序,根据排序结果选取消息语句生成摘要信息。通过对聊天日志进行清理,能够删除聊天日志中一部分与主题无关的消息语句,从而减少计算相似度语句的数量,进而减轻数据计算的负担。并且,通过将各消息语句与完整的消息记录计算相似度得分,使各消息语句的相似度得分更加准确,更能够体现各消息语句与聊天日志核心内容的相关程度,使得最终生成的摘要能够更加准确的表达聊天记录的核心内容,减少摘要中的无用信息,进而提高阅读者的阅读效率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开示例性实施例中一种基于聊天日志的摘要生成方法示意图;图2示意性示出本公开示例性实施例中一种基于聊天日志的摘要生成装置的组成示意图;图3示意性示出本公开示例性实施例中一种基于聊天日志的摘要生成装置的另一种示意图;图4示意性示出本公开示例性实施例中一种基于聊天日志的摘要生成装置的再一种示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。本示例实施方式中首先提供了一种基于聊天日志的摘要生成方法,可以应用于电子商务网站、语音客服等平台的在线客户服务系统。参考图1中所示,上述的基于聊天日志的摘要生成方法可以包括以下步骤:S1,对聊天日志按本文档来自技高网
...

【技术保护点】
1.一种基于聊天日志的摘要生成方法,其特征在于,包括:对聊天日志按预设规则进行清理,得到由会话一方的消息语句组成的消息记录;计算所述消息记录中各消息语句与所述消息记录的相似度得分;根据各消息语句的相似度得分排序,并选取预设排序数量的消息语句生成摘要。

【技术特征摘要】
1.一种基于聊天日志的摘要生成方法,其特征在于,包括:对聊天日志按预设规则进行清理,得到由会话一方的消息语句组成的消息记录;计算所述消息记录中各消息语句与所述消息记录的相似度得分;根据各消息语句的相似度得分排序,并选取预设排序数量的消息语句生成摘要。2.根据权利要求1所述的基于聊天日志的摘要生成方法,其特征在于,所述对聊天日志按预设规则进行清理包括:删除所述聊天日志中的系统消息语句以及会话另一方发出的消息语句,保留会话一方发出的消息语句。3.根据权利要求2所述的基于聊天日志的摘要生成方法,其特征在于,所述对聊天日志按预设规则进行清理包括下述处理中的一种或多种:语句删除处理,删除所述消息记录中的标识会话开始、标识会话结束以及表示问候的消息语句;表情符号删除处理,删除所述消息记录中的表情符号。4.根据权利要求2或3所述的基于聊天日志的摘要生成方法,其特征在于,所述对聊天日志按预设规则进行清理还包括:占位符处理,统一各所述消息语句中的占位符;替换处理,将所述消息语句中的口头用语替换为书面用语。5.根据权利要求1所述的基于聊天日志的摘要生成方法,其特征在于,所述计算所述消息记录中各语句与所述消息记录的相似度包括:依据各所述消息语句中的关键字利用余弦公式计算各所述消息语句与所述消息记录的相似度,所述余弦公式如下:其中,Ai为所述消息语句中关键字的字频向量;Bi为消息记录中关键字的...

【专利技术属性】
技术研发人员:何刚
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1