用于测量关键词的语义相关性的系统和方法技术方案

技术编号:21579521 阅读:15 留言:0更新日期:2019-07-10 17:43
服务器可以接收接收种子关键词,以生成与种子关键词相关的附加关键词。服务器可以使用语义关系图识别关键词类别。每个关键词可以具有小于阈值的与种子关键字之间的语义距离。针对关键词类别的每个关键词,服务器可以基于信息资源上关键词与种子关键词出现的频率生成关键词‑种子亲和度分数。对于每个关键字类别,服务器可以基于关键字类别中的每个关键字的关键词‑种子亲和度分数来确定类别‑种子亲和度分数。服务器可以比较每个类别‑种子亲和度分数和阈值。服务器可以发送关键字以供显示。基于比较,一个关键词类别可被指示为已选择,并且另一关键词类别可被指示为未选择。

Systems and Methods for Measuring Semantic Relevance of Keywords

【技术实现步骤摘要】
【国外来华专利技术】用于测量关键词的语义相关性的系统和方法相关申请的交叉引用本申请要求于2016年10月24日提交的、序号为15/332,551、标题为“SYSTEMSANDMETHODSFORMEASURINGTHESEMATNICRELEVANCEOFKEYWORDS”美国专利申请的权益和优先权,其全部内容通过引用结合于此。
技术介绍
在诸如因特网的计算机网络环境中,内容提供者提供用于在终端用户计算设备上显示的内容。内容通常采用可以显示的一个或多个部分的形式。例如,通常通过一个或多个网页的方式提供内容的各部分,其中每个部分的内容被提供为网页。
技术实现思路
至少一个方面涉及一种通过解析信息资源来测量关键词的语义相关性的方法。具有一个或多个处理器的数据处理系统可以从对应于域实体的内容提供者计算设备接收种子关键词,以生成与种子关键词相关的附加关键词。数据处理系统可以使用语义关系图来识别包括第一关键词类别和第二关键词类别的多个关键词类别。多个关键词类别中的每一个可以包括多个关键词。多个关键词中的每一个可以具有小于语义距离阈值的与种子关键词的语义距离。针对第一关键词类别和第二关键词类别的每个关键词,数据处理系统可以基于在域实体的信息资源上关键词与种子关键词出现的频率生成关键词-种子亲和度分数。对于第一关键词类别,数据处理系统可以基于第一关键词类别中的多个关键词中的每一个的关键词-种子亲和度分数来确定第一类别-种子亲和度分数。对于第二关键词类别,数据处理系统可以基于第二关键词类别中的多个关键词中的每一个的关键词-种子亲和度分数来确定第二类别-种子亲和度分数。数据处理系统可以将第一类别-种子亲和度分数和第二类别-种子亲和度分数中的每一个与亲和度分数阈值进行比较。数据处理系统可以确定第一类别-种子亲和度分数大于亲和度分数阈值并且第二类别-种子亲和度分数小于亲和度分数阈值。数据处理系统可以向内容提供者计算设备发送多个关键词以供显示。响应于确定第一类别-种子亲和度分数大于亲和度分数阈值并且第二类别-种子亲和度分数小于亲和度分数阈值,可以将第一关键词类别指示为已选择,并且可以将第二关键词类别指示为未选择。在一些实施方式中,数据处理系统可以使用语义关系图来识别第一关键词类别和第二关键词类别之间的语义冲突。在一些实施方式中,响应于识别第一关键词类别和第二关键词类别之间的语义冲突,数据处理系统可以将第一类别-种子亲和度分数与第二类别亲和度分数进行比较。在一些实施方式中,数据处理系统可以发送多个关键词。响应于确定第一类别-种子亲和度分数大于第二类别-种子亲和度分数,可以将第一关键词类别指示为已选择,并且可以将第二关键词类别指示为未选择。在一些实施方式中,数据处理系统可以使用语义关系图来识别第一关键词类别、第二关键词类别和第三关键词类别之间的语义冲突。在一些实施方式中,数据处理系统可以基于语义冲突确定第一类别组和第二类别组,第一类别组包括第一关键词类别,第二类别组包括第二关键词类别和第三关键词类别类别。在一些实施方式中,数据处理系统可以确定第一类别组的第一组-种子亲和度分数和第二类别组的第二组-种子亲和度分数。在一些实施方式中,数据处理系统可以将第一组-种子亲和度分数与第二组-种子亲和度分数进行比较。在一些实施方式中,数据处理系统可以发送多个关键词。响应于确定第一组-种子亲和度分数大于第二组-种子亲和度分数,可以将第一关键词类别指示为已选择,并且可以将第二关键词类别和第三关键词类别指示为未选择。在一些实施方式中,针对第一关键词类别和第二关键词类别的每个关键词,数据处理系统可以将关键词-种子亲和度分数与第二亲和度分数阈值进行比较。在一些实施方式中,针对第一关键词类别和第二关键词类别中的每一个,数据处理系统可以识别各自具有小于第二亲和度分数阈值的关键词-种子亲和度分数的关键词的子集。在一些实施方式中,数据处理系统可以发送多个关键词。响应于识别各自具有小于第二亲和度分数阈值的关键词-种子亲和度分数的关键词的子集,可以将第一关键词类别或第二关键词类别中的关键词的子集指示为未选择。在一些实施方式中,数据处理系统可以基于第一关键词类别中的多个关键词中的每一个的关键词-种子亲和度分数来计算第一组合分数。在一些实施方式中,数据处理系统可以基于第二关键词类别中的多个关键词中的每一个的关键词-种子亲和度分数来计算第二组合分数。在一些实施方式中,数据处理系统可以解析信息资源,以识别信息资源的一个或多个术语以及一个或多个术语中的每个术语在信息资源上的放置。在一些实施方式中,对于第一关键词类别和第二关键词类别中的至少一个关键词,数据处理系统可以使用语义关系图确定在信息资源的一个或多个术语中的至少一个与相应的关键词之间的第一语义匹配。在一些实施方式中,数据处理系统可以使用语义关系图确定在信息资源的一个或多个术语中的至少一个与种子关键词之间的第二语义匹配。在一些实施方式中,响应于确定第一语义匹配和确定第二语义匹配,数据处理系统可以基于信息资源上的对应关键词的放置来计算关键词-种子亲和度分数。在一些实施方式中,数据处理系统可以识别信息资源的分层深度。在一些实施方式中,针对第一关键词类别和第二关键词类别中的每个关键词-种子亲和度分数,数据处理系统可以基于针对信息资源识别的分层深度利用预设权重调整关键词-种子亲和度分数。在一些实施方式中,数据处理系统可以针对第一关键词类别和第二关键词类别的每个关键词识别指示跨越多个信息资源的关键词的平均频率的归一化因子。在一些实施方式中,数据处理系统可以针对第一关键词类别和第二关键词类别的每个关键词-种子亲和度分数,通过归一化因子来调整关键词-种子亲和度分数。在一些实施方式中,数据处理系统可以使用语义关系图从多个关键词中识别代表第一关键词类别的第一主题关键词和代表第二关键词类别的第二主题关键词。第一主题关键词可以具有小于语义距离阈值的与第一关键词类别中的多个关键词中的每个关键词的第一最小语义距离。第二主题关键词可以具有小于语义距离阈值的与第二关键词类别中的多个关键词中的每个关键词的第二最小语义距离。在一些实施方式中,数据处理系统可以发送多个关键词。响应于识别第一主题关键词和第二主题关键词,可以将多个关键词分类为具有第一主题关键词的第一关键词类别以及具有第二主题关键词的第二关键词类别。在一些实施方式中,数据处理系统可以发送脚本。脚本可以触发内容提供者计算设备显示关键词选择界面。关键词选择界面可以包括指示第一关键词类别的多个关键词中的每一个被选择的第一内容元素和指示第二关键词类别的多个关键词中的每一个未被选择的第二内容元素。至少一个方面涉及一种用于通过解析信息资源来测量关键词的语义相关性的系统。该系统可以包括在具有一个或多个处理器的数据处理系统上执行的关键词生成器模块。关键词生成器模块可以从对应于域实体的内容提供者计算设备接收种子关键词,以生成与种子关键词相关的附加关键词。关键词生成器模块可以使用语义关系图来识别包括第一关键词类别和第二关键词类别的多个关键词类别。多个关键词类别中的每一个可以包括多个关键词。多个关键词中的每一个可以具有小于语义距离阈值的与种子关键词的语义距离。该系统可以包括在数据处理系统上执行的频率计算器模块。频率计算器模块可以针对本文档来自技高网...

【技术保护点】
1.一种通过解析信息资源来测量关键词的语义相关性的方法,包括:通过具有一个或多个处理器的数据处理系统从对应于域实体的内容提供者计算设备接收种子关键词,以生成与种子关键词相关的附加关键词;通过数据处理系统使用语义关系图来识别包括第一关键词类别和第二关键词类别的多个关键词类别,多个关键词类别中的每一个包括多个关键词,多个关键词中的每一个具有小于语义距离阈值的与种子关键词的语义距离;针对第一关键词类别和第二关键词类别的每个关键词,通过数据处理系统基于在域实体的信息资源上关键词与种子关键词出现的频率生成关键词‑种子亲和度分数;对于第一关键词类别,通过数据处理系统基于第一关键词类别中的多个关键词中的每一个的关键词‑种子亲和度分数来确定第一类别‑种子亲和度分数;对于第二关键词类别,通过数据处理系统基于第二关键词类别中的多个关键词中的每一个的关键词‑种子亲和度分数来确定第二类别‑种子亲和度分数;通过数据处理系统将第一类别‑种子亲和度分数和第二类别‑种子亲和度分数中的每一个与亲和度分数阈值进行比较;通过数据处理系统确定第一类别‑种子亲和度分数大于亲和度分数阈值并且第二类别‑种子亲和度分数小于亲和度分数阈值;以及通过数据处理系统向内容提供者计算设备发送多个关键词以供显示,响应于确定第一类别‑种子亲和度分数大于亲和度分数阈值并且第二类别‑种子亲和度分数小于亲和度分数阈值,将第一关键词类别指示为已选择、并且将第二关键词类别指示为未选择。...

【技术特征摘要】
【国外来华专利技术】2016.10.24 US 15/332,5511.一种通过解析信息资源来测量关键词的语义相关性的方法,包括:通过具有一个或多个处理器的数据处理系统从对应于域实体的内容提供者计算设备接收种子关键词,以生成与种子关键词相关的附加关键词;通过数据处理系统使用语义关系图来识别包括第一关键词类别和第二关键词类别的多个关键词类别,多个关键词类别中的每一个包括多个关键词,多个关键词中的每一个具有小于语义距离阈值的与种子关键词的语义距离;针对第一关键词类别和第二关键词类别的每个关键词,通过数据处理系统基于在域实体的信息资源上关键词与种子关键词出现的频率生成关键词-种子亲和度分数;对于第一关键词类别,通过数据处理系统基于第一关键词类别中的多个关键词中的每一个的关键词-种子亲和度分数来确定第一类别-种子亲和度分数;对于第二关键词类别,通过数据处理系统基于第二关键词类别中的多个关键词中的每一个的关键词-种子亲和度分数来确定第二类别-种子亲和度分数;通过数据处理系统将第一类别-种子亲和度分数和第二类别-种子亲和度分数中的每一个与亲和度分数阈值进行比较;通过数据处理系统确定第一类别-种子亲和度分数大于亲和度分数阈值并且第二类别-种子亲和度分数小于亲和度分数阈值;以及通过数据处理系统向内容提供者计算设备发送多个关键词以供显示,响应于确定第一类别-种子亲和度分数大于亲和度分数阈值并且第二类别-种子亲和度分数小于亲和度分数阈值,将第一关键词类别指示为已选择、并且将第二关键词类别指示为未选择。2.如权利要求1所述的方法,还包括:通过数据处理系统使用语义关系图来识别第一关键词类别和第二关键词类别之间的语义冲突;响应于识别第一关键词类别和第二关键词类别之间的语义冲突,通过数据处理系统将第一类别-种子亲和度分数与第二类别亲和度分数进行比较;以及其中,发送多个关键词还包括发送多个关键词,响应于确定第一类别-种子亲和度分数大于第二类别-种子亲和度分数,第一关键词类别被指示为已选择并且第二关键词类别被指示为未选择。3.如权利要求1和2中任一项所述的方法,还包括:通过数据处理系统使用语义关系图来识别在第一关键词类别、第二关键词类别和第三关键词类别之间的语义冲突;通过数据处理系统基于语义冲突确定第一类别组和第二类别组,第一类别组包括第一关键词类别,第二类别组包括第二关键词类别和第三关键词类别类别;通过数据处理系统确定第一类别组的第一组-种子亲和度分数和第二类别组的第二组-种子亲和度分数;通过数据处理系统将第一组-种子亲和度分数与第二组-种子亲和度分数进行比较;以及其中,发送多个关键词以供显示还包括发送多个关键词,响应于确定第一组-种子亲和度分数大于第二组-种子亲和度分数,第一关键词类别被指示为已选择并且第二关键词类别和第三关键词类别被指示为未选择。4.如前述权利要求任一项所述的方法,还包括:针对第一关键词类别和第二关键词类别的每个关键词,通过数据处理系统将关键词-种子亲和度分数与第二亲和度分数阈值进行比较;以及针对第一关键词类别和第二关键词类别中的每一个,通过数据处理系统识别各自具有小于第二亲和度分数阈值的相应关键词-种子亲和度分数的关键词的子集;以及其中,发送多个关键词还包括发送多个关键词,响应于识别各自具有小于第二亲和度分数阈值的关键词-种子亲和度分数的关键词的子集,第一关键词类别或第二关键词类别中的关键词的子集被指示为未选择。5.如前述权利要求任一项所述的方法,其中,确定第一类别-种子亲和度分数还包括基于第一关键词类别中的多个关键词中的每一个的关键词-种子亲和度分数来计算第一组合分数;并且其中,确定第二类别-种子亲和度分数还包括基于第二关键词类别中的多个关键词中的每一个的关键词-种子亲和度分数来计算第二组合分数。6.如前述权利要求任一项所述的方法,其中,生成关键词-种子亲和度分数还包括:解析信息资源,以识别信息资源的一个或多个术语以及一个或多个术语中的每个术语在信息资源上的放置;和对于第一关键词类别和第二关键词类别中的至少一个关键词,使用语义关系图确定在信息资源的一个或多个术语中的至少一个与相应的关键词之间的第一语义匹配;使用语义关系图确定在信息资源的一个或多个术语中的至少一个与种子关键词之间的第二语义匹配;和响应于确定第一语义匹配和确定第二语义匹配,基于对应关键词在信息资源上的放置来计算关键词-种子亲和度分数。7.如前述权利要求任一项所述的方法,其中生成关键词-种子亲和度分数还包括:识别信息资源的分层深度;和针对第一关键词类别和第二关键词类别中的每个关键词-种子亲和度分数,基于针对信息资源识别的分层深度利用预设权重调整...

【专利技术属性】
技术研发人员:J刘易斯G詹姆斯
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1