相关度模型的建立方法、判定方法、站点发现方法及装置制造方法及图纸

技术编号:28622918 阅读:20 留言:0更新日期:2021-05-28 16:18
本发明专利技术提供一种站点与行业相关度模型的建立方法,构建站点版块与行业的相关度模型,并根据站点版块与行业的相关度模型构建站点与行业的相关度模型。进一步地,还提供站点与行业相关度模型的建立装置,站点与行业相关度的判定方法及装置,面向行业的站点发现方法及装置。使得行业用户可根据本发明专利技术的站点与行业的相关度模型评价分析深度网络的站点,从而获取全面而合适的深度网络站点。

【技术实现步骤摘要】
相关度模型的建立方法、判定方法、站点发现方法及装置
本专利技术涉及通信
,具体涉及一种站点与行业相关度模型的建立方法及装置、站点与行业相关度的判定方法及装置、面向行业的站点发现方法及装置。
技术介绍
深层网络是指不能被标准搜索引擎能索引的非表面网络内容,与表面网络相比,深层网络具有更大的数据量和更高的数据质量。随着Web(WorldWideWeb,全球广域网)技术的日益成熟,深层网络所蕴含的数据量快速增长,使得对深层网络的研究也越来越重要。由于深层网络的数据量大,且缺乏合理的深层网络的站点与行业相关度的评价模型,使得行业用户难以获取全面而合适的深度网络站点信息。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的上述不足,提供一种站点与行业相关度模型的建立方法及装置、站点与行业相关度的判定方法及装置、面向行业的站点发现方法及装置,以提供合理的站点与行业相关度的评价模型,使得行业用户根据该评价模型获取全面而合适的深度网络站点。第一方面,本专利技术实施例提供一种站点与行业相关度模型的建立方法,包括:本文档来自技高网...

【技术保护点】
1.一种站点与行业相关度模型的建立方法,其特征在于,包括:/n构建站点版块与行业的相关度模型:/n

【技术特征摘要】
1.一种站点与行业相关度模型的建立方法,其特征在于,包括:
构建站点版块与行业的相关度模型:



其中,Relevance(Module)为站点版块与行业的相关度,Ai为与行业相关的第i个判定依据,Bj为当前时刻之前的不同时间段,Number(Ai∩Bj)为在Bj内满足Ai判定依据的信息数量,Hj为与Bj对应的权重系数,0≤Hj≤1,
根据站点版块与行业的相关度模型构建站点与行业的相关度模型:



其中,Relevance(Website)为站点与行业的相关度,Relevance(Modulek)为站点中第k个站点版块与行业的相关度。


2.根据权利要求1所述的站点与行业相关度模型的建立方法,其特征在于,
与行业相关的第i个判定依据包括行业关键词,或行业相关企业信息,其中,行业关键词的数量为一个或多个,行业相关企业信息包括企业名称和企业产品,
时间段的时间粒度包括月、年,
Hj为与Bj对应的权重系数,具体为:Hj与Bj的取值反相关。


3.一种站点与行业相关度的判定方法,其特征在于,包括:
根据权利要求1或2所述的站点与行业相关度模型的建立方法建立的站点与行业的相关度模型,计算出站点的行业相关度;
在计算出的站点的行业相关度不为0时,判定结果为站点与行业相关。


4.一种面向行业的站点发现方法,其特征在于,包括:
爬取各站点的站点信息,以构建第一站点列表,其中,第一站点列表包括站点网址和站点版块的映射关系;
对第一站点列表中各站点网址对应的所有站点版块进行内容爬取,获取相应的站点版块内容;
构建第二站点列表,其中,第二站点列表包括站点网址、站点版块、站点版块内容,及其三者之间的映射关系;
根据权利要求3所述的站点与行业相关度的判定方法及第二站点列表,获取第二站点列表中判定结果为与行业相关的各站点的行业相关度;
构建第三站点列表,其中,第三站点列表包括站点网址、相关的站点版块、站点版块内容、站点的行业相关度,及其四者之间的映射关系。


5.根据权利要求4所述的面向行业的站点发现方法,其特征在于,在所述构建第三站点列表之后,还包括:
将第三站点列表按照站点的行业相关度进行降序排列,得到第四站点列表;
获取第四站点列表中前N个站点的站点网址、相关的站点版块、站点版块内容、站点的行业相关度,并将之存储至区块链。


6.根据权利要求5所述的面向行业的站点发现方法,其特征在于,还包括:
将不同的行业所对应的站点网址、相关的站点版块、站点版块内容、站点的行业相关度存储至不同的区块链...

【专利技术属性】
技术研发人员:曹咪徐雷陶冶边林刘伟
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1