文本主题提取方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:37376487 阅读:27 留言:0更新日期:2023-04-27 07:19
本申请提供一种文本主题提取方法、装置、计算机设备及存储介质,方法包括:获取待处理文本的Bert词向量和Bert句向量;将Bert词向量和Bert句向量作为节点,构建拓扑图模型;通过携带有注意力机制的图自编码器,对拓扑图模型进行节点优化,获取各个节点的多重特征;通过聚类算法分析多重特征,以提取待处理文本的主题信息。采用本方法能够提高文本主题的提取准确率。确率。确率。

【技术实现步骤摘要】
文本主题提取方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能
,具体涉及一种文本主题提取方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着电子商务的迅猛发展,客诉已成为电商行业主要的业务关注点。精准预测客诉主题可以有效的对客诉进行止损,从而达到节约成本、提升账号活跃度、提高业务好评度的目的。
[0003]然而,现有技术中的主题预测往往是通过人工筛选订单特征,再运用机器学习模型进行的,所花费的时间成本巨大,且预测结果的精准率和召回率都不太理想。
[0004]因此,现有基于机器学习的文本主题提取方法存在准确率不高的问题。

技术实现思路

[0005]基于此,有必要针对上述技术问题提供一种文本主题提取方法、装置、计算机设备及存储介质,用以提高文本主题的提取准确率。
[0006]第一方面,本申请提供一种文本主题提取方法,包括:
[0007]获取待处理文本的Bert词向量和Bert句向量;
[0008]将Bert词向量和Bert句向量作为节点,构建拓扑图模型;
...

【技术保护点】

【技术特征摘要】
1.一种文本主题提取方法,其特征在于,包括:获取待处理文本的Bert词向量和Bert句向量;将所述Bert词向量和所述Bert句向量作为节点,构建拓扑图模型;通过携带有注意力机制的图自编码器,对所述拓扑图模型进行节点优化,获取各个节点的多重特征;通过聚类算法分析所述多重特征,以提取所述待处理文本的主题信息。2.如权利要求1所述的方法,其特征在于,所述通过聚类算法分析所述多重特征,以提取所述待处理文本的主题信息,包括:并联处理所述各个节点的多重特征,得到所述拓扑图模型的特征矩阵;通过聚类算法分析所述特征矩阵,获取各个节点对应的第一概率分布和第二概率分布,所述第二概率分布为所述第一概率分布的二次方分析结果;根据所述第一概率分布和所述第二概率分布,提取所述待处理文本的主题信息。3.如权利要求2所述的方法,其特征在于,所述根据所述第一概率分布和所述第二概率分布,提取所述待处理文本的主题信息,包括:获取所述第一概率分布与所述第二概率分布之间的KL散度信息,作为目标损失;通过预设优化算法分析所述目标损失,以更新所述拓扑图模型的模型参数,得到更新后的模型参数;若所述KL散度信息小于预设的散度阈值,根据所述更新后的模型参数,提取所述待处理文本的主题信息。4.如权利要求3所述的方法,其特征在于,所述若所述KL散度信息小于预设的散度阈值,根据所述更新后的模型参数,提取所述待处理文本的主题信息,包括:若所述KL散度信息小于预设的散度阈值,根据所述更新后的模型参数,获取训练后的拓扑图模型;基于所述训练后的拓扑图模型,获取各个节点所属的目标集合;提取各所述目标集合的中心节点,得到所述待处理文本的主题信息。5.如权利要求1所述的方法,其特征在于,所述将所述Bert词向量和所述Bert句向量作为节点,构建拓扑图模型,包括:将所述Bert词向量和所述Bert句向量作为节点,构建初始拓扑图模型;确定所述初始拓扑图模型中的目标Bert词向量和目标Bert词句向量,所述目标Bert词向量为两个相邻的Bert词向量节点,所述目标Bert词句向量为两个相邻的Bert词向量节点和Bert句向量节点;获取所述目标Bert词向量和所述目标Bert词句向量各自对应的边值,以利用所述边值对所述初始拓...

【专利技术属性】
技术研发人员:武晨
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1