【技术实现步骤摘要】
一种页面权威值的识别方法、装置、设备和存储介质
本申请涉及计算机
,尤其人工智能和深度学习技术,具体涉及一种页面权威值的识别方法、装置、设备和存储介质。
技术介绍
随着互联网技术的发展,线上办公、电子化办公的发展趋势明显。以企业为例,当企业经过多年的运作,会以一定载体积累大量的生产、研发、运营、工作的经验与知识,包括各种规章制度、项目文档、和工作经验等文档,成为企业日积月累的知识财富。这些各种内容的文档,可以通过电子页面的形式进行创建、多人协同编辑、保存和浏览。典型例子如企业级wiki系统,即企业级多人协作的写作系统。当页面积累数量过多时,就会为用户提供页面搜索、推荐等服务功能,这些功能均需要了解页面的价值、重要性,才能够为用户提供更适合的知识信息。因此,需要提供一种能够有效对页面重要性和价值进行评估和展现的技术方案。
技术实现思路
本申请实施例提供了一种页面权威值的识别方法、装置、设备和存储介质,以有效地识别和展现页面的重要性和价值。第一方面,本申请实施例提供了一种页面权威 ...
【技术保护点】
1.一种页面权威值的识别方法,包括:/n获取页面的页面属性特征、页面所属空间特征和页面链指关系特征;/n将所述页面属性特征、页面所属空间特征和页面链指关系特征输入至预先训练的页面权威值识别模型中,输出所述页面的权威值。/n
【技术特征摘要】
1.一种页面权威值的识别方法,包括:
获取页面的页面属性特征、页面所属空间特征和页面链指关系特征;
将所述页面属性特征、页面所属空间特征和页面链指关系特征输入至预先训练的页面权威值识别模型中,输出所述页面的权威值。
2.根据权利要求1所述的方法,其中:
所述页面为多人协作写作页面,所述页面配置有至少一个用户对所述页面的操作权限;
所述页面所属空间为企业办公空间。
3.根据权利要求1所述的方法,其中,所述页面属性特征包括页面行为特征、页面结构特征和页面内容特征;
所述页面行为特征为用户对所述页面所执行的至少一种操作行为的统计数据;
所述页面结构特征为所述页面包括的符合至少一种协议或格式的文档结构数据;
所述页面内容特征为所述页面所包括内容的特征。
4.根据权利要求3所述的方法,其中:
所述操作行为的统计数据包括下述至少一种:点赞数和评论数;
所述页面结构特征包括下述至少一种:页面所包括插件数量、页面所包括附件数量、页面所包括列表数量、页面所包括标题数量、页面所包括表格数量、页面中表格的行数、是否存在目录插件、是否存在子页面插件、以及html结构特征;
所述页面内容特征包括下述至少一种:是否命中预设正样本关键词、命中的预设正样本关键词、是否命中负样本关键词、命中的预设负样本关键词、标题分词、正文分词、正文文本长度、正文段落数量、页面所包括图片数量、页面在所属空间内的页面地址层级、以及标题标签属性。
5.根据权利要求1所述的方法,其中,页面所属空间为所述页面的用户所属的用户组织空间,所述页面所属空间特征包括下述至少一个:所述页面的创建用户的重要性等级特征、是否默认首页、所述页面所配置的空间操作权限。
6.根据权利要求5所述的方法,其中,所述重要性等级特征,按照重要性高低,从高至低包括团队空间等级和个人空间等级,所述团队空间等级包括与团队等级对应的至少一个级别。
7.根据权利要求1所述的方法,其中,所述页面链指关系特...
【专利技术属性】
技术研发人员:郑小裕,刘昊,和为,刘准,何伯磊,李雅楠,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。