【技术实现步骤摘要】
摘要提取方法、系统、设备及存储介质
[0001]本申请涉及数据处理
,尤其涉及一种摘要提取方法
、
系统
、
设备及存储介质
。
技术介绍
[0002]近年来,随着业务的不断拓展和用户数量的增多,企业收到的客户投诉数量也随之增加,客户投诉问题逐渐得到关注
。
想要快速准确地处理用户投诉,其重点在于及时从大量的投诉中发现热点问题,以便相关部门尽早地制定解决方案去应对,避免问题处理不及时而造成不良的影响
。
其中,热点问题包括普通热点问题和突发性热点问题
。
与普通热点问题相比,突发性热点问题一般不易发现,在实际应用场景中,对突发性热点问题的检测至关重要
。
[0003]相关技术中,采用文本摘要提取算法抽取文本摘要,但是文本摘要提取算法抽取文本摘要时,只考虑句子的重要性,忽视词与句子的相互关联,导致摘要抽取结果不够准确
。
技术实现思路
[0004]本申请实施例通过提供一种摘要提取方法
、
系统
、
设备及存储介质,旨在提高摘要抽取结果的准确性
。
[0005]本申请实施例提供了一种摘要提取方法,所述摘要提取方法包括:构建文本关系网络,并将所述文本关系网络划分为多个子主题社团,所述文本关系网络由多个句子节点和句子节点之间的连接边构成;根据各个子主题社团中,每个句子的句子权重和每个句子中的词对句子的贡献值,得到每个句子的评分结果;基于所述评分结 ...
【技术保护点】
【技术特征摘要】
1.
一种摘要提取方法,其特征在于,所述摘要提取方法包括:构建文本关系网络,并将所述文本关系网络划分为多个子主题社团,所述文本关系网络由多个句子节点和句子节点之间的连接边构成;根据各个子主题社团中,每个句子的句子权重和每个句子中的词对句子的贡献值,得到每个句子的评分结果;基于所述评分结果从文本中选取目标句子,并根据所述目标句子生成文本摘要
。2.
如权利要求1所述的摘要提取方法,其特征在于,所述根据各个子主题社团中,每个句子的句子权重和每个句子中的词对句子的贡献值,得到每个句子的评分结果的步骤包括:获取各个子主题社团中,每个句子在上次迭代后的句子权重
、
阻尼系数
、
所述文本关系网络的节点数量和句子节点之间的连接边的权重;根据每个句子在上次迭代后的句子权重
、
所述阻尼系数
、
所述文本关系网络的节点数量和所述句子节点之间的连接边的权重,确定每个句子在本次迭代后的句子权重;获取每个句子中的每个词的复杂网络综合特征值;根据每个句子在本次迭代后的句子权重和所述每个句子中的每个词的复杂网络综合特征值,得到每个句子中的词对句子的贡献值;融合所述每个句子在本次迭代后的句子权重和所述每个句子中的词对句子的贡献值,得到每个句子的评分结果
。3.
如权利要求1或2所述的摘要提取方法,其特征在于,所述基于所述评分结果从文本中选取目标句子,并根据所述目标句子生成文本摘要的步骤包括:基于所述评分结果对所述文本中的各个句子进行排序,得到各个句子对应的重要程度,并将重要程度大于预设程度的句子确定为所述目标句子;基于各个目标句子在所述文本中的初始位置,连接各个所述目标句子,得到所述文本摘要
。4.
如权利要求1所述的摘要提取方法,其特征在于,所述构建文本关系网络的步骤包括:根据文本中各个句子的词向量,确定各个句子对应的句向量;确定任意两个句向量之间的余弦相似度,并根据所述余弦相似度确定各个句子之间的连接边的权重,其中,每个句子表征一个句子节点;根据各个所述句子节点和对应的连接边的权重,生成所述文本关系网络
。5.
如权利要求1或4所述的摘要提取方法,其特征在于,所述将所述文本关系网络划分为多个子主题社团的步骤包括:初始化所述文本关系网络,得到多个初始子社团和所述文本关系网络的第一模块度,其中,所述初始子社团的数量与所述文本关系网络中句子节点的数量相等;获取每个初始子社团中各个句子节点的相邻社团,并预测在将各个所述句子节点合并到对应的相邻社团之后,所述文本关系网络的第二模块度;根据所述第一模块度和所述第二模块度,确定各个句子节点合并前后,所述文本关系网络的模块度增量;在所述模块度增量大于预设值时,将模块度增量大于预设值时对应的句子节点合并至
...
【专利技术属性】
技术研发人员:孟远,田国良,蒋强,邵森,单浩,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。