【技术实现步骤摘要】
一种目标主题确定方法及装置
[0001]本专利技术涉及人工智能
,具体涉及一种目标主题确定方法及装置。
技术介绍
[0002]目标主题,可以根据实际情况自主确定,其包含的内容广泛,例如热点赛事和新闻时事等,通过及时确定目标主题,有助于企业根据目标主题创作出相关内容,通过内容营销可以有效促进企业开展相关业务。
[0003]现有目标主题确定方法通过对比深度图像聚类来实现,具体通过对比机制将节点划分为不相连的组。在近年来的研究中,基于难样本挖掘的算法以其良好的性能得到了广泛的关注。然而,现有的难样本挖掘方法存在以下两个问题:
[0004]1、在测量样本难度时,计算样本相似度时忽略了重要的结构信息,降低了所选难负样品的代表性。
[0005]2、以往的研究只关注难的负样本,而忽略了难的正样本,限制了样本的判别能力。
技术实现思路
[0006]针对现有技术中的问题,本专利技术实施例提供一种目标主题确定方法及装置,能够至少部分地解决现有技术中存在的问题。
[0007]一方面,本专利技术 ...
【技术保护点】
【技术特征摘要】
1.一种目标主题确定方法,其特征在于,包括:获取文档集合,对所述文档集合中的每篇文档进行关键词提取,得到每篇文档中的关键词;基于预设目标主题确定模型对每篇文档中的关键词进行处理,得到目标主题;其中,所述预设目标主题确定模型根据目标主题确定难样本对比学习深度图像聚类得到。2.根据权利要求1所述的目标主题确定方法,其特征在于,所述对所述文档集合中的每篇文档进行关键词提取,得到每篇文档中的关键词,包括:基于预设关键词提取模型对所述文档集合中的每篇文档进行关键词提取,得到每篇文档中的关键词;其中,所述预设关键词提取模型根据关键词提取样本训练图卷积神经网络得到。3.根据权利要求1所述的目标主题确定方法,其特征在于,建立所述预设目标主题确定模型,包括:获取目标主题确定样本,获取每个目标主题确定样本的双视图属性嵌入和双视图结构嵌入;根据各双视图属性嵌入和各双视图结构嵌入,计算分别位于双视图中的各目标主题确定样本之间的相似度;根据分别位于双视图中的两个目标主题确定样本的伪标签确定分别位于双视图中的两个目标主题确定样本之间的样本对伪标签,根据所述样本对伪标签、所述相似度和目标主题确定样本对是否具有高置信度的判定结果,确定调制函数;根据所述调制函数和所述相似度构建难样本对比损失函数,根据所述难样本对比损失函数构建总体损失函数,根据所述总体损失函数进行难样本对比学习深度图像聚类,得到所述预设目标主题确定模型。4.根据权利要求3所述的目标主题确定方法,其特征在于,所述根据分别位于双视图中的两个目标主题确定样本的伪标签确定分别位于双视图中的两个目标主题确定样本之间的样本对伪标签,包括:若确定分别位于双视图中的两个目标主题确定样本的伪标签的比较结果相同,则确定所述样本对伪标签为第一样本对伪标签,并通过所述第一样本对伪标签表示难样本中的正样本对;若确定分别位于双视图中的两个目标主题确定样本的伪标签的比较结...
【专利技术属性】
技术研发人员:冯如,王娜,王茹楠,卢健,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。