【技术实现步骤摘要】
本专利技术涉及网络
,尤其涉及基于网络搜索的紧密度确定方法及装置。
技术介绍
随着互联网的快速发展,人们可以快速地浏览互联网上的信息。尤其是搜索引擎的发展,只要人们在搜索引擎的搜索框中输入检索串后,搜索引擎就可以根据检索词搜索互联网上与检索词匹配的页面,供用户访问,极大地方便了用户的信息获取。但是现有技术中,若搜索引擎中无法准确地确定检索串中各检索词之间的紧密度时,给用户提供的检索结果无法满足要求。因此,网络搜索中紧密度的确定至关重要。
技术实现思路
本专利技术实施例的主要目的在于提供一种基于网络搜索的紧密度确定方法和装置,旨在解决现有技术中网络搜索时的紧密度确定不准确而导致搜索结果无法满足用户要求的技术问题。为实现上述目的,本专利技术实施例提供了一种基于网络搜索的紧密度确定方法,包括:接收网络搜索请求;对所述网络搜索请求中的检索串进行分词处理,获得所述检索串的词语对;从预先计算的紧密度词典中获取与所述词语对匹配的紧密度分值及词语对的点击次数;对所述词语对的紧密度分值进行加权计算,获得所述词语对的紧密度。此外,为实现上述目的,本专利技术实施例还提供了一种基于网络搜索的紧密度确定装置,包括:接收模块,用于接收网络搜索请求;分词模块,用于对所述网络搜索请求中的检索串进行分词处理,获得所述检索串的词语对;紧密度分值获取模块,用于从 ...
【技术保护点】
一种基于网络搜索的紧密度确定方法,其特征在于,所述基于网络搜索的紧密度确定方法包括以下步骤:接收网络搜索请求;对所述网络搜索请求中的检索串进行分词处理,获得所述检索串的词语对;从预先计算的紧密度词典中获取与所述词语对匹配的紧密度分值及词语对的点击次数;根据所述词语对的点击次数,对所述词语对的紧密度分值进行相应的加权计算,获得所述词语对的紧密度。
【技术特征摘要】
1.一种基于网络搜索的紧密度确定方法,其特征在于,所述基于网络搜
索的紧密度确定方法包括以下步骤:
接收网络搜索请求;
对所述网络搜索请求中的检索串进行分词处理,获得所述检索串的词语
对;
从预先计算的紧密度词典中获取与所述词语对匹配的紧密度分值及词语
对的点击次数;
根据所述词语对的点击次数,对所述词语对的紧密度分值进行相应的加
权计算,获得所述词语对的紧密度。
2.如权利要求1所述的基于网络搜索的紧密度确定方法,其特征在于,
所述紧密度词典包括:根据用户的网络搜索点击日志统计用户所搜索的检索
串的词语对在全上下文模式、单上文模式、单下文模式、无上下文模式时的
紧密度分值和词语对的点击次数。
3.如权利要求2所述的基于网络搜索的紧密度确定方法,其特征在于,
所述紧密度词典的生成方法包括:
根据用户的网络搜索点击日志,统计依据所搜索的检索串进行检索,且
在检索页面中点击的页面标题对应的点击次数,获得三元组信息;
根据所述三元组信息,累加获得词语对分别在全上下文模式、单上文模
式、单下文模式、无上下文模式时,所述词语对在页面标题中的紧密命中次
数之和、所述词语对的两个词语都在页面标题中的次数之和、所述词语对的
点击次数之和;
按照预设的计算公式,根据词语对在页面标题中的紧密命中次数之和、
所述词语对的两个词语都在页面标题中的次数之和、所述词语对的点击次数
之和,计算获得所述词语对分别在全上下文模式、单上文模式、单下文模式、
无上下文模式时的紧密度分值;
根据所述词语对分别在全上下文模式、单上文模式、单下文模式、无上
\t下文模式时的紧密度分值及点击次数,生成紧密度词典。
4.如权利要求3所述的基于网络搜索的紧密度确定方法,其特征在于,
所述根据所述三元组信息,累加获得词语对分别在全上下文模式、单上文模
式、单下文模式、无上下文模式时,所述词语对在页面标题中的紧密命中次
数之和、所述词语对的两个词语都在页面标题中的次数之和、所述词语对的
点击次数之和包括:
对所述三元组信息中的检索串及点击的页面标题进行分词处理,分别获
得检索串的词语对及页面标题的分词结果;
根据所述词语对及页面标题的分词结果,获得词语对在全上下文模式、
单上文模式、单下文模式、无上下文模式时,所述词语对在页面标题中的紧
密命中次数、所述词语对的两个词语都在页面标题中的次数、所述词语对的
点击次数;
将所述词语对同一模式下时,所述词语对在页面标题中的紧密命中次数、
所述词语对的两个词语都在页面标题中的次数、所述词语对的点击次数对应
进行累加,获得所述词语对同一模式下时,所述词语对在页面标题中的紧密
命中次数之和、所述词语对的两个词语都在页面标题中的次数之和、所述词
语对的点击次数之和。
5.如权利要求1所述的基于网络搜索的紧密度确定方法,其特征在于,
所述根据所述词语对的点击次数,对所述词语对的紧密度分值进行相应的加
权计算,获得所述词语对的紧密度包括以下步骤:
判断所述词语对在全上下文模式的点击次数是否大于或等于预设阈值;
当所述词语对在全上下文模式的点击次数大于或等于预设阈值时,将所
述词语对在全上下文模式的紧密度分值作为所述词语对的紧密度;
当所述词语对在全上下文模式的点击次数小于预设阈值时,判断所述词
语对在单上文模式的点击次数和所述词语对在单下文模式的点击次数之和是
否大于或等于预设阈值;
当所述词语对在单上文模式的点击次数和所述词语对在单下文模式的点
击次数之和大于或等于预设阈值时,对所述词语对在全上下文模式的紧密度
\t分值、所述词语对在单上文模式的紧密度分值、所述词语对在单下文模式的
紧密度分值进行加权计算,获得所述词语对的紧密度;
当所述词语对在单上文模式的点击次数和所述词语对在单下文模式的点
击次数之和小于预设阈值时,对所述词语对在全上下文模式的紧密度分值、
所述词语对在单上文模式的紧密度分值、所述词语对在单下文模式的紧密度
分值、所述词语对在无上下文模式的紧密度分值进行加权计算,获得所述词
语对的紧密度。
6.一种基于网络搜索的紧密度确定装置...
【专利技术属性】
技术研发人员:刘安安,王迪,赵琳,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。