在话题关联计算中使用的方法及装置制造方法及图纸

技术编号:21089768 阅读:46 留言:0更新日期:2019-05-11 10:02
本公开涉及一种在话题关联计算中使用的方法及装置。该方法包括:通过为若干个待选择话题分配随机权重,得到用于在SCA算法中迭代的种群,种群的每个个体中,每个待选择话题均具有对应的权重分量;利用SCA算法对种群中的个体进行迭代更新,SCA算法使用的适应度函数以个体为变量,在适应度函数的解析式中,由待选择话题与已关注话题之间的关联性统计数量对待选择话题的权重分量进行修正;将SCA算法迭代结束后种群最优解个体作为已关注话题与若干个待选择话题的关联度进行输出。由于最优个体的权重可以达到与表征关联性的统计数量相适应的最优权重,且SCA算法迭代过程具高效的特点,因此,本公开实现了高效率地进行话题关联计算的目的。

【技术实现步骤摘要】
在话题关联计算中使用的方法及装置
本公开涉及数据挖掘领域,具体地,涉及一种在话题关联计算中使用的方法及装置。
技术介绍
当今,是知识爆炸的时代,只有不断学习才能够提高自己的知识储备量。为了便于学习,很多企业都建立了知识门户网站。用户可以登录到公司的知识门户网站,进入知识库学习,关注自己感兴趣的话题。同时,系统也可以根据用户关注的话题推荐相关的话题,包括文章、书籍、行业专家等。话题关联计算的核心是话题关联度。目前,一般采用的是余弦相似度算法来计算话题关联度。但是,余弦相似度算法需要先计算复杂的语义信息,如特征词的概率分布等,得到词向量,再对词向量之间的夹角进行计算,才能得到话题间的关联度,计算复杂,效率低。
技术实现思路
有鉴于此,本公开的目的是提供一种在话题关联计算中使用的方法及装置,以实现高效率地进行关联话题计算的目的。在本公开实施例的第一个方面中,提供了一种在话题关联计算中使用的方法,该方法包括:通过为若干个待选择话题分配随机权重,得到用于在SCA算法(sinecosinealgorithm,正弦余弦算法)中迭代的种群,其中,所述种群的每个个体中,每个待选择话题均具有对应的权重分量;本文档来自技高网...

【技术保护点】
1.一种在话题关联计算中使用的方法,其特征在于,包括:通过为若干个待选择话题分配随机权重,得到用于在SCA算法(sine cosine algorithm,正弦余弦算法)中迭代的种群,其中,所述种群的每个个体中,每个待选择话题均具有对应的权重分量;利用SCA算法对所述种群中的个体进行迭代更新,其中,所述SCA算法使用的适应度函数以所述个体为变量,在所述适应度函数的解析式中,由所述待选择话题与已关注话题之间的关联性统计数量对所述待选择话题的权重分量进行修正;将所述SCA算法迭代结束后所述种群中最优解个体作为所述已关注话题与所述若干个待选择话题的关联度进行输出。

【技术特征摘要】
1.一种在话题关联计算中使用的方法,其特征在于,包括:通过为若干个待选择话题分配随机权重,得到用于在SCA算法(sinecosinealgorithm,正弦余弦算法)中迭代的种群,其中,所述种群的每个个体中,每个待选择话题均具有对应的权重分量;利用SCA算法对所述种群中的个体进行迭代更新,其中,所述SCA算法使用的适应度函数以所述个体为变量,在所述适应度函数的解析式中,由所述待选择话题与已关注话题之间的关联性统计数量对所述待选择话题的权重分量进行修正;将所述SCA算法迭代结束后所述种群中最优解个体作为所述已关注话题与所述若干个待选择话题的关联度进行输出。2.根据权利要求1所述的方法,其特征在于,所述待选择话题与已关注话题之间的关联性统计数量为待选择话题与已关注话题在若干篇文档资料中同篇出现的次数;所述适应度函数fit(Wk)的解析式为:其中,Wk表示所述种群中第k个个体;|Topic|表示用户已经关注的话题的个数,|T|表示所述待选择话题的个数,topici表示第i个已关注话题;tj表示第j个待选择话题,wkj表示Wk的第j个待选择话题的权重分量,count(topici,tj)的函数返回值表示第i个已关注话题与第j个待选择话题在所述若干篇文档资料中同篇出现的次数。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述SCA算法迭代的每次迭代中,获取更新的动态淘汰值,所述动态淘汰值随着迭代次数增加逐渐减小;在每次迭代中,在允许被淘汰的个体数量大于等于所述动态淘汰值的情况下,从所述种群中淘汰出与所述动态淘汰值相应数量的允许被淘汰的个体,在允许被淘汰的个体数量小于所述动态淘汰值的情况下,从所述种群中淘汰出允许被淘汰的个体。4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:在所述SCA算法迭代的每次迭代中,保存所述适应度函数对应于当前迭代得到的种群个体的函数值;在所述SCA算法迭代的每次迭代中,根据上一次迭代保存的函数值及所述种群中个体数...

【专利技术属性】
技术研发人员:杜鹏王亮李健王伟光
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1