一种基于密度分布检测自动生成锚文本的seo优化方法技术

技术编号:38996455 阅读:11 留言:0更新日期:2023-10-07 10:27
本发明专利技术公开了一种基于密度分布检测自动生成锚文本的seo优化方法,包括以下步骤:1.获取用户输入的关键词及其跳转链接;2.获取用户编辑存储的文章富文本内容;3.清洗富文本内容,得到纯文本内容;4.计算关键词在纯文本内容中第一次出现的位置;5.关键词存在包含关系且位置相同时,过滤掉较短的关键词;6.关键词在富文本中如果已经存在链接,过滤该关键词;7.检测关键词在文章中的密度分布,过滤掉过于密集的关键词;8.根据过滤后的关键词及链接,生成对应的锚文本。本发明专利技术提供一种系统自动匹配生成锚文本的方法,有助于搜索引擎更快的爬行网站,增加收录;提高关键词排名;提升网站权重。且极大的减少了其中的人力成本、学习成本和操作失误成本。和操作失误成本。和操作失误成本。

【技术实现步骤摘要】
一种基于密度分布检测自动生成锚文本的seo优化方法


[0001]本专利技术涉及web应用开发和搜索引擎优化
,具体是一种基于密度分布检测自动生成锚文本的seo优化方法。

技术介绍

[0002]锚文本又称锚文本链接,是链接的一种形式。和超链接类似,超链接的代码是锚文本,把关键词做一个链接,指向别的网页,这种形式的链接就叫作锚文本。锚文本实际上是建立了文本关键词与URL链接的关系。由于传统的锚文本添加方法由人工添加费时费力,且效率低下,无法准确全面的添加设置锚文本。而且还需要培育对应seo锚文本设置知识,设置不合理还有可能造成网站权重降低等问题。

技术实现思路

[0003]本专利技术针对上述的问题,提供了一种一种基于密度分布检测自动生成锚文本的seo优化方法。
[0004]为了达到上述目的,本专利技术采用的技术方案为,
[0005]一种基于密度分布检测自动生成锚文本的seo优化方法,具体包括以下步骤:
[0006]A、获取用户输入的关键词及其对应的跳转链接;
[0007]B、获取用户编辑存储的文章富文本内容,并对纯文本内容进行提取;
[0008]C、根据特殊指令提取出纯文本内容中的关键词及其对应的跳转链接;
[0009]D、根据提取出来的关键词及其对应的跳转链接,生成对应的锚文本。
[0010]作为优选,所述步骤C中的特殊指令依次包括:关键词筛选、用户设置优先、密度分布检测。
[0011]作为优选,所述关键词筛选为计算关键词在纯文本内容中第一次出现的位置,具体包括一下两种方式:
[0012]1)去重及单词匹配,对于英文单词计算关键词在纯文本内容中第一次出现的位置时,需判断该单词是否完整的英文单词,单词里的部分不做匹配,如:存在关键词“market”,纯文本内容存在“marketing”,此时不做关键词“market”的匹配;
[0013]2)长词优选,关键词存在包含关系且位置相同时,过滤掉较短的关键词,如:关键词“搜索引擎优化”包含了关键词“搜索引擎”,则留下关键词“搜索引擎优化”,过滤掉关键词“搜索引擎”,且不会再匹配后面的“搜索引擎”。
[0014]作为优选,所述用户设置优先为关键词在文章富文本中如果已经存在链接,则提取该关键词。
[0015]作为优选,所述密度分布检测为文章的纯文本内容总字数在300字内则仅保留一个关键词,超过300字时则每500个字范围内保留三个关键词;对于超出密度分布范围的关键词,优先选取位置靠前的关键词,多余的关键词直接过滤掉。
[0016]作为优选,步骤B中的对纯文本内容进行提取,具体为清洗文章富文本内容,得到
文章的纯文本内容。
[0017]与现有技术相比,本专利技术的优点和积极效果在于,
[0018]1、本专利技术有助于搜索引擎更快的爬行网站,增加收录;提高关键词排名;增加用户体验;提升网站权重。且极大的减少了其中的人力成本、学习成本和操作失误成本。
附图说明
[0019]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本专利技术所述基于密度分布检测自动生成锚文本的seo优化方法示意图。
具体实施方式
[0021]为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和实施例对本专利技术做进一步说明。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0022]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是,本专利技术还可以采用不同于在此描述的其他方式来实施,因此,本专利技术并不限于下面公开说明书的具体实施例的限制。
[0023]实施例1,如图1所示,本专利技术提供了一种基于密度分布检测自动生成锚文本的seo优化方法,包括以下步骤:
[0024]1.从关键词

链接数据库中获取用户输入存储的关键词key及其对应的链接url跳转链接,对链接进行优先筛选,去除不合法的链接及重复的链接;得到key

url对应关系数据;
[0025]2.从文章数据库获取用户编辑存储的文章富文本html内容;
[0026]3.对获取到的文章富文本html内容进行清洗,去掉标签、样式及脚本,得到文章的纯文本内容text;
[0027]4.去重及单词匹配:计算步骤1的关键词key在纯文本内容text中第一次出现的位置,得到对应的位置pos,不存在时则直接过滤掉,按照位置pos从小到大排序得到key

url

pos对应关系数据;对于英文单词计算关键词key在纯文本内容text中第一次出现的位置时,需判断该单词在纯文本内容text中是否完整的英文单词,单词里的部分不做匹配,如:存在关键词“market”,纯文本内容存在“marketing”,此时不做关键词“market”的匹配;
[0028]5.长词优先:判断同个位置pos下的关键词key是否存在包含关系,如果存在,则去掉较短的关键词key,如:关键词“搜索引擎优化”包含了关键词“搜索引擎”,则留下关键词“搜索引擎优化”,过滤掉关键词“搜索引擎”,且不会再匹配后面的“搜索引擎”;得到剩下的key

url

pos对应关系;
[0029]6.用户设置优先:关键词key在文章富文本html首次出现位置如果已经存在a标签设置跳转链接,则过滤掉该关键词,若关键词key与已经存在a标签的文本有重叠部分,也需过滤掉该关键词;得到剩下的key

url

pos对应关系;
[0030]7.密度分布检测:文章纯文本内容总字数在300字内则仅保留一个关键词,超过300字时则每500个字范围内保留三个关键词。对于超出密度分布范围的关键词,优先选取位置靠前的关键词,多余的关键词直接过滤掉;
[0031]a.如果清洗后的纯文本内容text长度小于等于300,则直接取位置pos最小对应的关键词key;
[0032]b.如果清洗后的纯文本内容text长度大于300,则遍历key

url

pos每一项,取当前项的pos赋值给index,若(index,index+500]区间内中存在大于两项的部分则保留前两项,区间内靠后的关键词key直接舍去,直到所有遍历结束,得到最终的key

url

pos对应关系集合。
[0033]8.根据过滤后的关键词及链接,生成对应的锚文本。并且用户可在管理后台查看、编译或删除key

url对应关系数据,保存后即可同步更新锚文本到所有文章。
[0034]以上所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于密度分布检测自动生成锚文本的seo优化方法,其特征在于,具体包括以下步骤:A、获取用户输入的关键词及其对应的跳转链接;B、获取用户编辑存储的文章富文本内容,并对纯文本内容进行提取;C、根据特殊指令提取出纯文本内容中的关键词及其对应的跳转链接;D、根据提取出来的关键词及其对应的跳转链接,生成对应的锚文本。2.根据权利要求1所述的一种基于密度分布检测自动生成锚文本的seo优化方法,其特征在于,所述步骤C中的特殊指令依次包括:关键词筛选、用户设置优先、密度分布检测。3.根据权利要求2所述的一种基于密度分布检测自动生成锚文本的seo优化方法,其特征在于,所述关键词筛选为计算关键词在纯文本内容中第一次出现的位置,具体包括一下两种方式:1)去重及单词匹配,对于英文单词计算关键词在纯文本内容中第一次出现的位置时,需判断该单词是否完整的英文单词,单词里的部分不做匹配;2)长词优选,关键词存在包含关系且位置相同时,过滤掉较短的...

【专利技术属性】
技术研发人员:黄柱聪
申请(专利权)人:广州凡科互联网科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1