System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及互联网,尤其涉及一种站点评估方法、装置、设备及存储介质。
技术介绍
1、随着互联网的快速发展,网络用户通过搜索引擎获取所需内容。在搜索引擎中点击与自己需求相关的内容后,需要网页内容是有权威度的,内容结果是有较高可信度的,这样用户才能根据结果进行判断分析,提升用户体验,如果网页结果的可信度较低或者质量较差,出现作弊,死链等问题,很大程度降低用户的体验,用户无法根据结果进行使用。目前权威度判断基本都是基于入链出链数量等方法进行判断,让很多网站有机可乘,可以制造很多网页通过增加入链和出链的数量的方式来增加权威度,这样会导致很多站点的排序靠前,大大降低了用户的体验。因此,如何提高站点权威度的准确度,提高用户体验,成为一个亟待解决的问题。
2、上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本专利技术的主要目的在于提供了一种站点评估方法、装置、设备及存储介质,旨在解决如何提高站点权威度的准确度,提高用户体验的技术问题。
2、为实现上述目的,本专利技术提供了一种站点评估方法,所述站点评估方法包括以下步骤:
3、获取目标站点对应的站点信息;
4、对所述站点信息进行数据平滑处理,获得所述目标站点对应的目标特征信息;
5、将所述目标特征信息输入至预设站点评估模型中,获得所述目标站点对应的站点权威度,所述预设站点评估模型为根据不同站点的入链出链特征和站点重要性特征信息进行迭代训练后
6、可选地,所述获取目标站点对应的站点信息的步骤,具体包括:
7、获取目标站点对应的用户行为信息和站点抓取时间信息;
8、获取所述目标站点对应的备案信息;
9、获取所述目标站点对应的入链出链信息和站点重要性信息;
10、根据所述用户行为信息、所述站点抓取时间信息、所述备案信息、所述入链出链信息以及所述站点重要性信息中的至少一项确定所述目标站点对应的站点信息。
11、可选地,所述获取目标站点对应的用户行为信息和站点抓取时间信息的步骤,具体包括:
12、获取目标站点对应的站点日志信息;
13、根据所述站点日志信息确定用户展现信息和用户点击信息,并根据所述用户展现信息和所述用户点击信息确定用户行为信息;
14、根据所述站点日志信息确定站点抓取时间信息。
15、可选地,所述获取所述目标站点对应的入链出链信息的步骤,具体包括:
16、获取所述目标站点对应的站点页面数据;
17、根据所述站点页面数据对应的站点页面源代码确定所述目标站点中的链接标签信息;
18、根据所述链接标签信息确定链接地址信息;
19、根据所述链接地址信息确定所述目标站点对应的入链出链信息。
20、可选地,所述获取所述目标站点对应的站点重要性信息的步骤,具体包括:
21、获取所述目标站点的相关链接;
22、获取所述相关链接的链接数量信息和链接质量信息;
23、根据所述链接数量信息和所述链接质量信息确定所述目标站点对应的站点重要性信息。
24、可选地,所述对所述站点信息进行数据平滑处理,获得所述目标站点对应的目标特征信息的步骤,具体包括:
25、获取所述目标站点对应的站点地址;
26、根据所述站点地址对所述站点信息进行筛选,获得所述目标站点对应的初始特征信息;
27、对所述初始特征信息进行数据平滑处理,获得所述目标站点对应的目标特征信息。
28、可选地,所述根据所述站点地址对所述站点信息进行筛选,获得所述目标站点对应的初始特征信息的步骤,具体包括:
29、根据所述站点地址对所述站点信息中的用户行为信息、站点抓取时间信息、备案信息、入链出链信息以及站点重要性信息分别进行筛选,获得筛选后的用户行为信息、筛选后的站点抓取时间信息、筛选后的备案信息、筛选后的入链出链信息以及筛选后的站点重要性信息;
30、根据所述筛选后的用户行为信息确定初始用户行为特征;
31、根据所述筛选后的站点抓取时间信息确定初始站点年龄特征;
32、根据所述筛选后的备案信息确定初始备案特征;
33、根据所述筛选后的入链出链信息确定初始入链出链特征;
34、根据所述筛选后的站点重要性信息确定初始站点重要性特征;
35、根据所述初始用户行为特征、所述初始站点年龄特征、所述初始备案特征、所述初始入链出链特征以及所述初始站点重要性特征中的至少一项确定所述目标站点对应的初始特征信息。
36、可选地,所述根据所述筛选后的用户行为信息确定初始用户行为特征的步骤,具体包括:
37、根据所述筛选后的用户行为信息确定目标展现信息和目标点击信息;
38、根据所述目标展现信息和所述目标点击信息确定点击通过率信息;
39、根据所述目标展现信息、所述目标点击信息以及所述点击通过率信息确定初始用户行为特征。
40、可选地,所述根据所述筛选后的站点抓取时间信息确定初始站点年龄特征的步骤,具体包括:
41、根据所述筛选后的站点抓取时间信息确定首次抓取时间信息和当前抓取时间信息;
42、根据所述首次抓取时间信息和所述当前抓取时间信息确定初始站点年龄特征。
43、可选地,所述对所述初始特征信息进行数据平滑处理,获得所述目标站点对应的目标特征信息的步骤,具体包括:
44、对所述初始特征信息进行滤波处理,获得滤波后的特征信息;
45、对所述滤波后的特征信息进行归一化处理,获得归一化后的特征信息;
46、对所述归一化后的特征信息进行数据平滑处理,获得所述目标站点对应的目标特征信息。
47、可选地,所述将所述目标特征信息输入至预设站点评估模型中,获得所述目标站点对应的站点权威度的步骤之前,还包括:
48、获取初始站点在预设时间段内的历史站点信息;
49、对所述历史站点信息进行数据平滑处理,获得所述初始站点对应的历史特征信息;
50、获取所述初始站点对应的历史权威度信息;
51、根据所述历史特征信息和所述历史权威度信息对初始xgboost模型进行迭代训练,获得预设站点评估模型。
52、此外,为实现上述目的,本专利技术还提供一种站点评估装置,所述站点评估装置包括:
53、信息获取模块,用于获取目标站点对应的站点信息;
54、数据处理模块,用于对所述站点信息进行数据平滑处理,获得所述目标站点对应的目标特征信息;
55、站点评估模块,用于将所述目标特征信息输入至预设站点评估模型中,获得所述目标站点对应的站点权威度,所述预设站点评估模型为根据不同站点的入链出链特征和站点重要性特征信息进行迭代本文档来自技高网...
【技术保护点】
1.一种站点评估方法,其特征在于,所述站点评估方法包括以下步骤:
2.如权利要求1所述的站点评估方法,其特征在于,所述获取目标站点对应的站点信息的步骤,具体包括:
3.如权利要求2所述的站点评估方法,其特征在于,所述获取目标站点对应的用户行为信息和站点抓取时间信息的步骤,具体包括:
4.如权利要求2所述的站点评估方法,其特征在于,所述获取所述目标站点对应的入链出链信息的步骤,具体包括:
5.如权利要求2所述的站点评估方法,其特征在于,所述获取所述目标站点对应的站点重要性信息的步骤,具体包括:
6.如权利要求2所述的站点评估方法,其特征在于,所述对所述站点信息进行数据平滑处理,获得所述目标站点对应的目标特征信息的步骤,具体包括:
7.如权利要求6所述的站点评估方法,其特征在于,所述根据所述站点地址对所述站点信息进行筛选,获得所述目标站点对应的初始特征信息的步骤,具体包括:
8.一种站点评估装置,其特征在于,所述站点评估装置包括:
9.一种站点评估设备,其特征在于,所述设备包括:存储器、处
10.一种存储介质,其特征在于,所述存储介质上存储有站点评估程序,所述站点评估程序被处理器执行时实现如权利要求1至7中任一项所述的站点评估方法的步骤。
...【技术特征摘要】
1.一种站点评估方法,其特征在于,所述站点评估方法包括以下步骤:
2.如权利要求1所述的站点评估方法,其特征在于,所述获取目标站点对应的站点信息的步骤,具体包括:
3.如权利要求2所述的站点评估方法,其特征在于,所述获取目标站点对应的用户行为信息和站点抓取时间信息的步骤,具体包括:
4.如权利要求2所述的站点评估方法,其特征在于,所述获取所述目标站点对应的入链出链信息的步骤,具体包括:
5.如权利要求2所述的站点评估方法,其特征在于,所述获取所述目标站点对应的站点重要性信息的步骤,具体包括:
6.如权利要求2所述的站点评估方法,其特征在于,所述对所述站点信息进行数据平滑处理,获得所...
【专利技术属性】
技术研发人员:程龙,刘国徽,张向征,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。