摘要提取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27935643 阅读:27 留言:0更新日期:2021-04-02 14:15
本申请提出一种摘要提取方法、装置、计算机设备和存储介质,其中,方法包括:读取会话中的多个句子及关键字数据库;关键字数据库中存储有多个关键字及每个关键字对应的标签;将每个句子与关键字数据库中的关键字匹配,以得到每个句子在关键字数据库中的匹配关键字;根据每个句子在关键字数据库中的匹配关键字,确定每个句子在关键字数据库中的匹配标签数量;根据每个句子在关键字数据库中的匹配标签数量,确定每个句子为摘要句子的概率;根据概率从多个句子中选取目标句子,以将目标句子作为会话的摘要。由此,能够实现通过关键字数据库收录交互场景下所需的关键字,以便进行摘要提取,可以使得计算机设备自动化提取的会话摘要更加具有针对性。

【技术实现步骤摘要】
摘要提取方法、装置、计算机设备和存储介质
本申请涉及信息处理
,尤其涉及一种摘要提取方法、装置、计算机设备和存储介质。
技术介绍
随着互联网电子商务的蓬勃发展,在线客服作为与客户沟通交流的渠道,已成为电子商务网站的重要组成部分,同时也是展示企业形象的重要工具。在线客服经常需要在短时间内浏览大量的会话记录信息,以快速了解客户信息和需求。例如,在接听其他人工客服或客服机器人转接进线时,需要快速了解客户与前一个客服的聊天记录,以了解客户需求,或者,在接收到客户的留言信息时,其中,客户留言中可能包含数量较多的内容以及多个问题描述,此时客服需要阅读大量的消息记录以整理出简短且有效的信息及数据。因此,计算机设备自动化对聊天记录进行提炼,生成摘要就显得尤为重要。相关技术中,计算机设备基于句子的高频词聚类,来生成摘要。然而,由于客户在咨询时,一般简单几句即可说明意图,与词频无关,因此上述摘要提取方法不适用于客户咨询场景。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。本申请提出一种摘要提取方法、本文档来自技高网...

【技术保护点】
1.一种摘要提取方法,其特征在于,包括:/n读取会话中的多个句子,以及读取关键字数据库;其中,所述关键字数据库中存储有多个关键字,以及每个所述关键字对应的标签;/n将每个所述句子与关键字数据库中的关键字匹配,以得到每个所述句子在所述关键字数据库中的匹配关键字;/n根据每个所述句子在所述关键字数据库中的匹配关键字,确定每个所述句子在所述关键字数据库中的匹配标签数量;所述匹配标签数量,是在所述关键字数据库中匹配关键字所对应标签的数量;/n根据每个所述句子在所述关键字数据库中的匹配标签数量,确定每个所述句子为摘要句子的概率;/n根据所述概率,从所述多个句子中选取目标句子,以将所述目标句子作为所述会话...

【技术特征摘要】
1.一种摘要提取方法,其特征在于,包括:
读取会话中的多个句子,以及读取关键字数据库;其中,所述关键字数据库中存储有多个关键字,以及每个所述关键字对应的标签;
将每个所述句子与关键字数据库中的关键字匹配,以得到每个所述句子在所述关键字数据库中的匹配关键字;
根据每个所述句子在所述关键字数据库中的匹配关键字,确定每个所述句子在所述关键字数据库中的匹配标签数量;所述匹配标签数量,是在所述关键字数据库中匹配关键字所对应标签的数量;
根据每个所述句子在所述关键字数据库中的匹配标签数量,确定每个所述句子为摘要句子的概率;
根据所述概率,从所述多个句子中选取目标句子,以将所述目标句子作为所述会话的摘要。


2.根据权利要求1所述的摘要提取方法,其特征在于,所述关键字数据库为多个,所述根据每个所述句子在所述关键字数据库中的匹配标签数量,确定每个所述句子为摘要句子的概率,包括:
查询多个所述关键字数据库的权重;
对每个所述句子,根据所述多个关键字数据库的权重,以及每个所述关键字数据库中的匹配标签数量,确定加权数量;
根据每个所述句子的所述加权数量,确定每个所述句子为摘要句子的概率。


3.根据权利要求2所述的摘要提取方法,其特征在于,所述根据每个所述句子的所述加权数量,确定每个所述句子为摘要句子的概率,包括:
对每个所述句子进行类型识别,以确定每个所述句子的类型;其中,所述类型,用于表征每个所述句子属于疑问句类型或非疑问句类型;
查询每个所述句子的类型所对应的分值;其中,所述疑问句类型对应的分值大于所述非疑问句类型对应的分值;
对每个所述句子,根据所述加权数量与所述分值,确定每个所述句子为摘要句子的概率。


4.根据权利要求3所述的摘要提取方法,其特征在于,所述对每个所述句子进行类型识别,以确定每个所述句子的类型,包括:
采用分类模型对每个所述句子进行类型识别,以确定每个所述句子的类型;其中,所述类型包括多个所述疑问句类型和非疑问句类型,所述多个疑问句类型分别对不同对象进行提问。


5.根据权利要求1所述的摘要提取方法,其特征在于,所述根据所述概率,从所述多个句子中选取目标句子之前,还包括:
确定每个所述句子在所述会话中的顺序;
根据每个所述句子的顺序,确定每个所述句子的系数;其中,顺序在前的句子的系数大于顺序在后的句子的系数;
根据每个所述句子的系数,对每个所述句子的概率进行修正。


6.根据权利要求1-5任一项所述的摘要提取方法,其特征在于,所述将每个所述句子与关键字数据库中的关键字匹配,以得到每个所述句子在所述关键字数据库中的匹配关键字,包括:
将每个所述句子进行分词,以得到每个所述句子的多个文本片段;
对每个所述句子,将所述多个所述文本片段与所述关键字数据库中的关键字匹配,以得到所述关键字数据库中的匹配关键字。


7.根据权利要求1-5任一项所述的摘要提取方法,其特征在于,所述根据每个所述句子在所述关键字数据库中的匹配关键字,确定每个所述句子在所述关键字数据库中的匹配标签数量,包括:
确定每个所述句子在所述关键字数据库中的匹配关键字所对应的标签;
对每个所述句子的匹配关键字所对应的标签去重后进行计数,以得到所述匹配标签数量。


8.一种摘要提取装置,其特征在于,包括:
读取模块,用于读取会话中的...

【专利技术属性】
技术研发人员:杨洋张瀚林
申请(专利权)人:京东数字科技控股股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1