一种添加内链的方法及装置制造方法及图纸

技术编号:14938823 阅读:46 留言:0更新日期:2017-04-01 00:47
本发明专利技术实施例提供了一种添加内链的方法及装置,该方法包括:获取待更新至文档数据库的第一文档,使用关键词库中的关键词对第一文档进行关键词分析,得到至少一个关键词;统计至少一个关键词在第一文档中出现的次数,计算至少一个关键词在第一文档中的权值,并根据权值由大到小的顺序生成关键词列表;根据至少一个关键词在文档数据库中进行查找,得到与至少一个关键词对应的关键词权值最高的第二文档,对至少一个关键词和与至少一个关键词对应的第二文档添加内链,得到添加内链后的第一文档;将添加内链后的第一文档与关键词列表更新至文档数据库中。通过本发明专利技术实施例,能够实现在自动添加内链时,降低服务器处理难度,提高服务器处理速度。

【技术实现步骤摘要】

本专利技术涉及互联网
,特别是涉及一种添加内链的方法及装置
技术介绍
随着互联网的广泛应用,互联网信息的增长呈现爆炸式增长,各种各样的信息可以通过互联网快速传播,例如:有关经济的、政治的、娱乐的、教育的、生活的、科技的信息,而互联网的应用,可以使人们轻易地获取到这些信息,人们在获取这些信息的时候,除了采用主动查找的方式获取想要的信息外,还可以通过被动推荐的方式获取这些信息。目前,针对被动推荐的方式,较为普遍采用的方法是:通过对网页文本中出现的关键词给予一个指向另一个网页的链接;用户在阅读网页文本时,若对该关键词感兴趣,可以通过点击该关键词,获取与该关键词有关的内容,而不待采用主动查找方式寻找感兴趣的内容。这种位于同一个网站下的一个网页文本与一个关键词之间的链接,也被成为内链。但是,现有的设置内链的方式主要包括由人工添加和由系统自动添加。对于人工添加的方式,由于其添加内链是凭借自身的知识能力/经验来决定如何添加内链的,主观任意性较强,造成内链遗漏和内链闲置等问题,而且人工添加的方式,待耗费大量的人力物力,且人工添加的方式效率低下。对于系统自动添加的方式,首先对待添加内链的文档进行分词处理,获取待添加内链的文档关键词,再对关键词添加内链,分词处理使得服务器处理速度降低,增加了处理复杂度。
技术实现思路
本专利技术实施例的目的在于提供一种添加内链的方法及装置,以实现在将文档更新至文档数据库时,通过关键词库统计待添加内链的文档的关键词,实现自动添加内链,降低服务器处理难度,提高服务器处理速度。具体技术方案如下:第一方面,本专利技术实施例提供了一种添加内链的方法,包括:获取待更新至文档数据库的第一文档,使用关键词库中的关键词对第一文档进行关键词分析,得到至少一个关键词;统计至少一个关键词在第一文档中出现的次数,计算至少一个关键词在第一文档中的权值,并根据权值由大到小的顺序生成关键词列表,其中,权值用于表示至少一个关键词在第一文档中所占的比例;根据至少一个关键词在文档数据库中进行查找,得到与至少一个关键词对应的关键词权值最高的第二文档,对至少一个关键词和与至少一个关键词对应的第二文档添加内链,得到添加内链后的第一文档,其中,至少一个关键词与第二文档一一对应;将添加内链后的第一文档与关键词列表更新至文档数据库中。可选的,所述根据至少一个关键词在文档数据库中进行查找,得到与至少一个关键词对应的关键词权值最高的第二文档,包括:根据至少一个关键词在文档数据库中进行查找,得到与至少一个关键词对应的多个文档;获取至少一个关键词在对应的多个文档的每个文档中的权值,并选择与至少一个关键词对应的关键词权值最高的第二文档。可选的,在所述根据至少一个关键词在文档数据库中进行查找,得到与至少一个关键词对应的多个文档之后,本专利技术实施例的添加内链的方法还包括:获取至少一个关键词在对应的多个文档的每个文档的权值,并判断权值是否大于或等于预设阈值;在权值大于或等于预设阈值时,将与至少一个关键词对应的多个文档按权值由大到小的顺序进行排序,并生成与至少一个关键词对应的文档列表。可选的,在所述根据至少一个关键词在文档数据库中进行查找,得到与至少一个关键词对应的关键词权值最高的第二文档,对至少一个关键词和与至少一个关键词对应的第二文档添加内链,得到添加内链后的第一文档之后,本专利技术实施例的添加内链的方法还包括:对至少一个关键词添加标识,以与第一文档中的其他文字进行区分。可选的,本专利技术实施例的添加内链的方法还包括:在接收到第一客户端发送的获取添加内链后的第一文档的请求指令后,生成包含添加内链后的第一文档在内的网页,缓存与至少一个关键词对应的关键词权值最高的第二文档,并返回给第一客户端。可选的,本专利技术实施例的添加内链的方法还包括:在接收到第一客户端发送的获取添加内链后的第一文档的请求指令后,生成包含添加内链后的第一文档和与至少一个关键词对应的文档列表在内的网页,缓存与至少一个关键词对应的关键词权值最高的第二文档及文档列表中包含的文档,并返回给所述第一客户端。另一方面,本专利技术实施例还提供了一种添加内链的装置,包括:关键词分析模块,用于获取待更新至文档数据库的第一文档,通过关键词库中的关键词对第一文档进行关键词分析,得到至少一个关键词;权值计算模块,用于统计至少一个关键词在第一文档中出现的次数,计算至少一个关键词在第一文档中的权值,并根据权值由大到小的顺序生成关键词列表,其中,权值用于表示至少一个关键词在第一文档中所占的比例;内链添加模块,用于根据至少一个关键词在文档数据库中进行查找,得到与至少一个关键词对应的关键词权值最高的第二文档,对至少一个关键词和与至少一个关键词对应的第二文档添加内链,得到添加内链后的第一文档,其中至少一个关键词与第二文档一一对应;更新模块,用于将添加内链后的第一文档与关键词列表更新至文档数据库中。可选的,本专利技术实施例的内链添加模块包括:查找子模块,用于根据至少一个关键词在文档数据库中进行查找,得到与至少一个关键词对应的多个文档;选择子模块,用于获取至少一个关键词在对应的多个文档的每个文档中的权值,并选择与至少一个关键词对应的关键词权值最高的第二文档。可选的,本专利技术实施例的内链添加模块还包括:阈值判断子模块,用于获取至少一个关键词在对应的多个文档的每个文档的权值,并判断权值是否大于或等于预设阈值;文档列表生成子模块,用于在权值大于或等于预设阈值时,将与至少一个关键词对应的多个文档按权值由大到小的顺序进行排序,并生成与至少一个关键词对应的文档列表。可选的,本专利技术实施例的添加内链的装置还包括:标识添加模块,用于对至少一个关键词添加标识,以区分至少一个关键词和第一文档中的其他文字。可选的,本专利技术实施例的添加内链的装置还包括:页面返回模块,用于在接收到第一客户端发送的获取添加内链后的第一文档的请求指令后,生成包含添加内链后的第一文档在内的网页,缓存与至少一个关键词对应的关键词权值最高的第二文档,并返回给第一客户端。可选的,所述页面返回模块,还用于在接收到第一客户端发送的获取添加内链后的第一文档的请求指令后,生成包含添加内链后的第一文档和与至少一个关键词对应的文档列表在内的网页,缓存与至少一个关键词对应的关键词权值最高的第二文档及文档列表中包含的文档,并返回给第一客户端。本专利技术实施例提供的一种添加内链的方法及装置,可以通过使用关键词库对待更新至文档数据库的第一文档进行关键词分析,计算每个关键词的权重,然后在文档数据库中进行查找,得到关键词权值最高的第二文档,对每个关键词和与每个关键词对应的权值最高的第二文档添加内链,得到添加内链后的第一文档,并将添加内链后的第一文档更新至文档数据库中,在接收到第一客户端发送的获取添加内链后的第一文档的请求指令后,生成包含添加内链后的第一文档在内的网页,缓存与至少一个关键词对应的关键词权值最高的第二文档,并返回给第一客户端。通过本专利技术实施例,能够在将待更新至文档数据库的文档更新至文档数据库时,通过关键词库统计待添加内链的文档的关键词,实现自动添加内链,降低服务器处理难度,提高服务器处理速度,在第一客户端获取所述文档时,能够快速获得所述文档,提高用户体验。当然,实施本专利技术的任一产品或方法必不一定需要同时达到以本文档来自技高网...
一种添加内链的方法及装置

【技术保护点】
一种添加内链的方法,其特征在于,包括:获取待更新至文档数据库的第一文档,通过关键词库中的关键词对所述第一文档进行关键词分析,得到至少一个关键词;统计所述至少一个关键词在所述第一文档中出现的次数,计算所述至少一个关键词在所述第一文档中的权值,并根据权值由大到小的顺序生成关键词列表,其中,所述权值用于表示所述至少一个关键词在所述第一文档中所占的比例;根据所述至少一个关键词在所述文档数据库中进行查找,得到与所述至少一个关键词对应的关键词权值最高的第二文档,对所述至少一个关键词和与所述至少一个关键词对应的所述第二文档添加内链,得到添加内链后的第一文档,其中,所述至少一个关键词与所述第二文档一一对应;将所述添加内链后的第一文档与所述关键词列表更新至所述文档数据库中。

【技术特征摘要】
1.一种添加内链的方法,其特征在于,包括:获取待更新至文档数据库的第一文档,通过关键词库中的关键词对所述第一文档进行关键词分析,得到至少一个关键词;统计所述至少一个关键词在所述第一文档中出现的次数,计算所述至少一个关键词在所述第一文档中的权值,并根据权值由大到小的顺序生成关键词列表,其中,所述权值用于表示所述至少一个关键词在所述第一文档中所占的比例;根据所述至少一个关键词在所述文档数据库中进行查找,得到与所述至少一个关键词对应的关键词权值最高的第二文档,对所述至少一个关键词和与所述至少一个关键词对应的所述第二文档添加内链,得到添加内链后的第一文档,其中,所述至少一个关键词与所述第二文档一一对应;将所述添加内链后的第一文档与所述关键词列表更新至所述文档数据库中。2.根据权利要求1所述的添加内链的方法,其特征在于,所述根据所述至少一个关键词在所述文档数据库中进行查找,得到与所述至少一个关键词对应的关键词权值最高的第二文档,包括:根据所述至少一个关键词在所述文档数据库中进行查找,得到与所述至少一个关键词对应的多个文档;获取所述至少一个关键词在所述对应的多个文档的每个文档中的权值,并选择与所述至少一个关键词对应的关键词权值最高的第二文档。3.根据权利要求2所述的添加内链的方法,其特征在于,在所述根据所述至少一个关键词在所述文档数据库中进行查找,得到与所述至少一个关键词对应的多个文档之后,所述的添加内链的方法还包括:获取所述至少一个关键词在所述对应的多个文档的每个文档的权值,并判断所述权值是否大于或等于预设阈值;在所述权值大于或等于所述预设阈值时,将与所述至少一个关键词对应的多个文档按权值由大到小的顺序进行排序,并生成与所述至少一个关键词对应的文档列表。4.根据权利要求1所述的添加内链的方法,其特征在于,在所述根据所述至少一个关键词在所述文档数据库中进行查找,得到与所述至少一个关键词对应的关键词权值最高的第二文档,对所述至少一个关键词和与所述至少一个关键词对应的所述第二文档添加内链,得到添加内链后的第一文档之后,所述的添加内链的方法还包括:对所述至少一个关键词添加标识,以区分所述至少一个关键词和所述第一文档中的其他文字。5.根据权利要求1或2所述的添加内链的方法,其特征在于,所述的添加内链的方法还包括:在接收到第一客户端发送的获取所述添加内链后的第一文档的请求指令后,生成包含所述添加内链后的第一文档...

【专利技术属性】
技术研发人员:沈文策
申请(专利权)人:福建中金在线信息科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1