基于时间关联交互融合的网络社区帖子影响排序方法技术

技术编号:15704874 阅读:112 留言:0更新日期:2017-06-26 10:10
本发明专利技术涉及一种基于时间关联交互融合的网络社区帖子影响排序方法。该方法包括:确定基于时间关联的影响排序;根据文本语义模型,对帖子的文本内容进行语义建模,构建基于语义上下文相似度的语义树;按照统一的交互融合算法,将帖子的文本语义和网络社区的结构信息融合在一起,对帖子的影响进行排序。通过将时间关联信息融入排序方法中,形成时间关联影响排序的方式,在此基础上实现了结合语义和网络社区结构的统一融合框架,将网络结构和文本内容融合在一起,从而解决了网络社区中潜在影响源的发现问题,能够充分利用网络社区帖子的所显示的时间信息和语义上下文信息。

【技术实现步骤摘要】
基于时间关联交互融合的网络社区帖子影响排序方法
本专利技术涉及网络挖掘与社会计算
,特别涉及一种基于时间关联交互融合的网络社区帖子影响排序方法。
技术介绍
随着网络的蓬勃发展,越来越多的用户喜欢在网上交流兴趣、发表见解。于是,有一些很有影响力的帖子涌现出来,吸引了大量的用户参与。不同于整个互联网络不加选择地收录庞杂的信息,网络社区常常关注一个或者几个相关的领域,这些网络社区成为了特定领域研究者快速获取信息或者做出决策的理想之地。鉴于一些网络社区的影响力、活跃度以及作为特定领域稳定的内容发布平台,挖掘网络社区并找出有价值的或者潜在影响力大的帖子就成为亟待解决的问题。某些网络社区具有特定的网络结构(显式的或者是隐含的)。比如一个经典的以线索组织的讨论区的结构如图1所示。纵轴反映了各个组织的线索,横轴反映的是时间线的向前发展,每个线索中各讨论帖子通过交互回复向前推进。基于影响的基本分析方法,潜在影响与帖子的质量高度相关,同时与线索中帖子回复的活跃度也紧密联系,前者考虑的帖子本身的内容信息,而后者则反映了整个线索所包含的结构信息。网络交互的帖子除了内容和结构信息之外,还包含有丰富的元数本文档来自技高网...
基于时间关联交互融合的网络社区帖子影响排序方法

【技术保护点】
一种基于时间关联交互融合的网络社区帖子影响排序方法,其特征在于,所述方法包括:确定基于时间关联的影响排序;根据文本语义模型,对所述帖子的文本内容进行语义建模,构建基于语义上下文相似度的语义树;按照统一的交互融合算法,将所述帖子的文本语义和网络社区的结构信息融合在一起,对所述帖子的影响进行排序。

【技术特征摘要】
1.一种基于时间关联交互融合的网络社区帖子影响排序方法,其特征在于,所述方法包括:确定基于时间关联的影响排序;根据文本语义模型,对所述帖子的文本内容进行语义建模,构建基于语义上下文相似度的语义树;按照统一的交互融合算法,将所述帖子的文本语义和网络社区的结构信息融合在一起,对所述帖子的影响进行排序。2.根据权利要求1所述的方法,其特征在于,所述确定基于时间关联的影响排序具体包括:对网络社区线索的帖子进行筛选,提取所述线索中各帖子发表的时间戳;针对提取的所述时间戳,确定所述帖子在所述线索中的时效性函数和时间关联权重;按照随机游走算法,并通过迭代的方法,确定所述时间关联的影响排序。3.根据权利要求1所述的方法,其特征在于,所述根据文本语义模型,对所述帖子的文本内容进行语义建模,构建基于语义上下文相似度的语义树,具体包括:按照所述文本语义模型提取所述网络社区所述各线索中所述帖子的文本语义特征;基于所述文本语义特征,以所述线索为组织方式,通过所述帖子之间的语义关联程度,将所述线索中所述帖子的集合构建为语义树。4.根据权利要求3所述的方法,其特征在于,所述基于所述文本语义特征,以所述线索为组织方式,通过所述帖子之间的语义关联程度,将所述线索中所述帖子的集合构建为语义树,具体包括:在所述文本语义模型下,计算所述线索中所述帖子之间的语义上下文相似度;根据所述帖子发表的时间戳,确定所述线索中所述帖子的父节点备选集合;基于所述父节点备选集合,根据下式,确定所述线索中所述帖子的父节点,从而构建所述语义树:其中,所述L*表示所述帖子;所述Li表示在所述文本语义模型下,所述线索包含的所述帖子的所述文本语义特征,所述i、j=1......M;所述M表示所述线索所含所述帖子的数量。5.根据权利要求4所述的方法,其特征在于,所述在所述文本语义模型下,计算所述线索中所述帖子之间的语义上下文相似度,具体包括:根据下式计算方向相似度:其中,所述Scos(Li,Lj)表示所述方向相似度;所述Lj表示在所述文本语义模型下,所述线索包含的所述帖子的所述文本语义特征,i<j,j=1......M;根据下式计算幅度相似度:其中,所述Sstr(Li,Lj)表示所述幅度相似度;根据下式计算在所述文本语义模型下,所述线索中所述帖子之间的所述语义上下文相似度:

【专利技术属性】
技术研发人员:胡卫明游强吴偶
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1