【技术实现步骤摘要】
文章处理方法、电子设备和程序产品
[0001]本公开的实施例总体上涉及计算机技术,具体地涉及文章处理方法、电子设备和计算机程序产品,可用于数据分析领域和用户偏好推荐领域。
技术介绍
[0002]诸如大数据、物联网和人工智能等各种颠覆性技术的出现促使我们的社会生成大量的数据。从这些大量的数据中有效、高效、透明地捕获和融合与知识相关联的信息正变得日益流行和至关重要。在对信息进行捕获和融合的过程中,知识图可以是实现目标的好方法。在对知识图的使用过程中,通过以结构的形式捕获前述信息,可以进一步提供有关当前趋势甚至未来趋势预测的报告。然而,如何利用知识图和新文章来寻找新文章与现有文章之间的关联以及如何基于它们来生成准确的趋势报告仍然具有挑战性。
[0003]在传统技术中,在利用知识图和新文章来寻找新文章与现有文章之间的关联以及基于它们来生成准确的趋势报告方面的不足导致旨在获取这些内容的用户的用户体验被降低。
技术实现思路
[0004]本公开的实施例提供了文章处理方法、电子设备和计算机程序产品。
[000 ...
【技术保护点】
【技术特征摘要】
1.一种文章处理方法,包括:基于目标文章的内容,确定与目标文章相关联的目标文章向量,所述目标文章向量属于文章向量空间;获取与参考文章集合相关联的参考文章向量集合,所述参考文章向量集合中的参考文章向量属于所述文章向量空间;以及基于所述目标文章向量与所述参考文章向量集合中的参考文章向量在所述文章向量空间中的距离,将所述参考文章向量集合中与所述目标文章向量相关联的参考文章向量确定为关联文章向量。2.根据权利要求1所述的方法,其中所述参考文章向量集合被表示为文章知识图,所述文章知识图的节点对应于所述参考文章向量集合中的参考文章向量,所述文章知识图中的两个节点之间的边表示与所述两个节点对应的参考文章向量之间的文章向量关联性,所述方法还包括:确定所述文章知识图中的,与所述关联文章向量对应的关联节点;以及基于所述关联节点以及与所述关联节点有关的边,构建文章子知识图。3.根据权利要求2所述的方法,还包括:基于所述文章子知识图中的边,确定所述文章子知识图中的低关联性节点;以及从所述关联文章向量中,去除与所述低关联性节点对应的关联文章向量。4.根据权利要求3所述的方法,其中确定所述低关联性节点包括以下至少一项:如果所述文章子知识图中的第一节点与其他节点之间的边的数目小于阈值数目,将所述第一节点确定为所述低关联性节点;以及如果所述文章子知识图中的第一节点与其他节点之间的边的长度均大于阈值长度,将所述第一节点确定为所述低关联性节点。5.根据权利要求2所述的方法,还包括:基于所述目标文章的内容,确定与所述文章子知识图中的节点相关联的参考文章与所述目标文章的文章关联性;基于所述文章关联性,将与所述目标文章相关联的目标节点添加到所述文章子知识图中,其中所述目标节点和所述文章子知识图中的节点之间的边基于所述文章关联性而被确定;以及使用已添加所述目标节点的所述文章子知识图来更新所述文章知识图。6.根据权利要求2所述的方法,其中所述目标文章为第一目标文章,所述文章子知识图为第一文章子知识图,所述方法还包括:基于所述第一目标文章和至少一个第二目标文章的内容,生成与所述第一目标文章和所述至少一个第二目标文章相关联的热点话题;获取与所述至少一个第二目标文章相关联的至少一个第二文章子知识图;以及基于所述热点话题、所述第一文章子知识图和所述至少一个第二文章子知识图,确定与所述第一目标文章和所述至少一个第二目标文章相关联的知识图报告。7.根据权利要求1所述的方法,其中所述目标文章为第一目标文章,所述方法还包括:基于所述第一目标文章和至少一个第二目标文章的内容,生成与所述第一目标文章和所述至少一个第二目标文章相关联的热点话题;
确定与所述至少一个第二目标文章相关联的至少一个关联文章向量;以及基于所述热点话题、与所述关联文章向量相关联的参考文章和与所述至少一个关联文章向量相关联的至少一个参考文章,确定与所述第一目标文章和所述至少一个第二目标文章相关联的文章报告。8.根据权利要求1所述的方法,其中所述目标文章的内容包括以下至少一项:所述文章的题目;所述文章的作者;所述文章的摘要;以及所述文章的正文。9.一种电子设备,包括:至少一个处理单元;以及至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令当由所述至少一个处理单元执行时,使得所述设备执行动作,所述动作包括:基于目...
【专利技术属性】
技术研发人员:王子嘉,贾真,倪嘉呈,
申请(专利权)人:伊姆西IP控股有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。