焦点信息提取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37977924 阅读:7 留言:0更新日期:2023-06-30 09:53
本申请涉及一种焦点信息提取方法、装置、计算机设备和存储介质。所述方法包括:获取待处理文本,对待处理文本进行聚类,得到聚类主题、主题特征信息以及待处理文本和聚类主题的对应关系;根据对应关系,拼接待处理文本,得到与聚类主题对应的聚类文本,从聚类文本中提取关键文本特征;根据关键文本特征,对聚类主题进行合并,得到目标聚类主题;根据目标聚类主题、主题特征信息以及关键文本特征,得到焦点信息。采用本方法能够实现得到准确的焦点信息。息。息。

【技术实现步骤摘要】
焦点信息提取方法、装置、计算机设备和存储介质


[0001]本申请涉及大数据
,特别是涉及一种焦点信息提取方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机技术的发展,出现了云计算技术,云计算是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。
[0003]传统技术中,存在提供云计算服务的平台,用户通过在平台上购买云计算服务即可进行使用,在使用过程中若发现问题,用户会向平台投诉,平台在接收到用户投诉后,会跟进用户问题进行解决,并对产品进行优化。
[0004]然而,传统方法,主要是点对点跟进单个用户问题,没有以全局视角观察近期投诉的焦点,无法准确提取投诉的焦点。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够准确提取焦点信息的焦点信息提取方法、装置、计算机设备、存储介质和程序产品。
[0006]一种焦点信息提取方法,所述方法包括:
[0007]获取待处理文本,对待处理文本进行聚类,得到聚类主题、主题特征信息以及待处理文本和聚类主题的对应关系;
[0008]根据对应关系,拼接待处理文本,得到与聚类主题对应的聚类文本,从聚类文本中提取关键文本特征;
[0009]根据关键文本特征,对聚类主题进行合并,得到目标聚类主题;
[0010]根据目标聚类主题、主题特征信息以及关键文本特征,得到焦点信息。
[0011]一种焦点信息提取装置,所述装置包括:
[0012]聚类模块,用于获取待处理文本,对待处理文本进行聚类,得到聚类主题、主题特征信息以及待处理文本和聚类主题的对应关系;
[0013]特征提取模块,用于根据对应关系,拼接待处理文本,得到与聚类主题对应的聚类文本,从聚类文本中提取关键文本特征;
[0014]合并模块,用于根据关键文本特征,对聚类主题进行合并,得到目标聚类主题;
[0015]处理模块,用于根据目标聚类主题、主题特征信息以及关键文本特征,得到焦点信息。
[0016]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0017]获取待处理文本,对待处理文本进行聚类,得到聚类主题、主题特征信息以及待处理文本和聚类主题的对应关系;
[0018]根据对应关系,拼接待处理文本,得到与聚类主题对应的聚类文本,从聚类文本中提取关键文本特征;
[0019]根据关键文本特征,对聚类主题进行合并,得到目标聚类主题;
[0020]根据目标聚类主题、主题特征信息以及关键文本特征,得到焦点信息。
[0021]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0022]获取待处理文本,对待处理文本进行聚类,得到聚类主题、主题特征信息以及待处理文本和聚类主题的对应关系;
[0023]根据对应关系,拼接待处理文本,得到与聚类主题对应的聚类文本,从聚类文本中提取关键文本特征;
[0024]根据关键文本特征,对聚类主题进行合并,得到目标聚类主题;
[0025]根据目标聚类主题、主题特征信息以及关键文本特征,得到焦点信息。
[0026]一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0027]获取待处理文本,对待处理文本进行聚类,得到聚类主题、主题特征信息以及待处理文本和聚类主题的对应关系;
[0028]根据对应关系,拼接待处理文本,得到与聚类主题对应的聚类文本,从聚类文本中提取关键文本特征;
[0029]根据关键文本特征,对聚类主题进行合并,得到目标聚类主题;
[0030]根据目标聚类主题、主题特征信息以及关键文本特征,得到焦点信息。
[0031]上述焦点信息提取方法、装置、计算机设备、存储介质和程序产品,通过获取待处理文本,对待处理文本进行聚类,能够自动抽取出大量待处理文本中的共性问题,得到聚类主题、主题特征信息以及待处理文本和聚类主题的对应关系,通过根据对应关系,拼接待处理文本,得到与聚类主题对应的聚类文本,从聚类文本中提取关键文本特征,能够通过文本特征提取,进一步加强共性问题的可阅读性和可解释性,通过根据关键文本特征,对聚类主题进行合并,得到目标聚类主题,能够调整不合适主题数量,得到准确的目标聚类主题,从而可以根据目标聚类主题、主题特征信息以及关键文本特征,得到准确的焦点信息。
附图说明
[0032]图1为一个实施例中焦点信息提取方法的应用环境图;
[0033]图2为一个实施例中焦点信息提取方法的流程示意图;
[0034]图3为一个实施例中在得到聚类主题后服务器的处理流程示意图;
[0035]图4为一个实施例中对待处理文本进行分词的流程示意图;
[0036]图5为另一个实施例中焦点信息提取方法的流程示意图;
[0037]图6为又一个实施例中焦点信息提取方法的流程示意图;
[0038]图7为一个实施例中焦点信息提取装置的结构框图;
[0039]图8为一个实施例中计算机设备的内部结构图。
具体实施方式
[0040]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0041]本申请提供的焦点信息提取方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。当用户在使用云计算服务的过程中发现问题时,会通过终端102发送投诉文本至服务器104进行投诉,服务器104在接收到投诉文本后,会缓存投诉文本至数据存储系统。在缓存投诉文本之后,服务器104会按照预先设置的待优化产品想关注的投诉周期长度,从数据存储系统中获取与待优化产品对应的投诉周期内的投诉文本,对投诉文本进行聚类,得到聚类主题、主题特征信息以及投诉文本和聚类主题的对应关系,根据对应关系,拼接投诉文本,得到与聚类主题对应的聚类文本,从聚类文本中提取关键文本特征,根据关键文本特征,对聚类主题进行合并,得到目标聚类主题,根据目标聚类主题、主题特征信息以及关键文本特征,得到投诉焦点信息。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现,也可以为区块链上的节点。
[0042]在一个实施例中,如图2所示,提供了一种焦点信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种焦点信息提取方法,其特征在于,所述方法包括:获取待处理文本,对所述待处理文本进行聚类,得到聚类主题、主题特征信息以及所述待处理文本和所述聚类主题的对应关系;根据所述对应关系,拼接所述待处理文本,得到与所述聚类主题对应的聚类文本,从所述聚类文本中提取关键文本特征;根据所述关键文本特征,对所述聚类主题进行合并,得到目标聚类主题;根据所述目标聚类主题、所述主题特征信息以及所述关键文本特征,得到焦点信息。2.根据权利要求1所述的方法,其特征在于,所述对所述待处理文本进行聚类,得到聚类主题、主题特征信息以及所述待处理文本和所述聚类主题的对应关系包括:对所述待处理文本进行分词以及词性分词,根据预设停用词库以及词性分析结果对分词结果进行过滤,得到与所述待处理文本对应的待处理文本词集;根据所述待处理文本词集,对所述待处理文本进行聚类,得到聚类主题、主题特征信息以及所述待处理文本和所述聚类主题的对应关系。3.根据权利要求2所述的方法,其特征在于,所述根据所述待处理文本词集,对所述待处理文本进行聚类,得到聚类主题、主题特征信息以及所述待处理文本和所述聚类主题的对应关系包括:获取聚类主题数量;根据所述聚类主题数量,为所述待处理文本词集中每个待处理文本单词随机指定初始聚类主题;根据所述初始聚类主题,对所述待处理文本单词进行聚类主题估计,得到聚类主题,并确定所述待处理文本单词和所述聚类主题的归属关系;根据所述归属关系,确定所述待处理文本和所述聚类主题的对应关系;根据所述对应关系和所述归属关系,得到主题特征信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述归属关系,确定所述待处理文本和所述聚类主题的对应关系包括:根据预设领域词库,确定所述待处理文本单词中目标文本单词,为所述目标文本单词设置特定词权重;根据所述特定词权重和所述归属关系,确定所述待处理文本归属于各聚类主题的归属概率;根据所述归属概率,得到所述待处理文本和所述聚类主题的对应关系。5.根据权利要求3所述的方法,其特征在于,所述根据所述对应关系和所述归属关系,得到主题特征信息包括:根据所述对应关系,确定与所述聚类主题对应的待处...

【专利技术属性】
技术研发人员:刘必为
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1