基于语意识别的搜索结果排序方法及相关装置制造方法及图纸

技术编号:23161693 阅读:32 留言:0更新日期:2020-01-21 21:59
本发明专利技术的实施例提供了一种基于语意识别的搜索结果排序方法及相关装置。该基于语意识别的搜索结果排序方法包括:通过基于获取的所述撰写时间确定第一分数、所述撰写者标识确定第二分数、所述历史访问信息确定第三分数、所述用户访问所述搜索结果后的行为操作信息确定第四分数;再基于所述第一分数、第二分数、第三分数、第四分数,确定所述搜索结果的综合评分;根据所述搜索结果的综合评分,对所述搜索结果进行排序。本公开实施例的技术方案可以通过所述搜索结果对应的综合评分进行排序,从而提高用户选择的效率。

【技术实现步骤摘要】
基于语意识别的搜索结果排序方法及相关装置
本公开涉及数据处理
,具体而言,涉及一种基于语意识别的搜索结果排序方法及相关装置。
技术介绍
随着互联网技术的不断发展,网络成为人们认知世界和获取信息的重要途径,现有技术中,人们通过在搜索引擎中输入关键词,然后搜索引擎基于输入的关键词在海量的网络数据中确定人们所需要的候选信息,人们仍需要在确定的海量的候选信息中浏览查找自己实际需要的信息。虽然现在也有一些搜索引擎引入一些算法对搜索出的结果进行优化排序,如运用DBN(DynamicBayesianNetwork,动态贝叶斯网络)点击模型对搜索结果进行优化,根据历史用户点击次数对搜索结果进行优化等;但现有技术对语意识别的搜索结果排序仍然难以确切的满足用户的需求,如根据历史用户点击次数,因人们会仅仅因为搜索结果排名靠前而点击并访问该搜索结果,而不管该搜索结果是否符合用户的需求,因为现有的搜索引擎仅仅是将搜索结果以搜索结果列表的方式展现给用户,在搜索结果列表中仅仅展现了搜索结果的一部分内容,而并不是全部内容,进而也就进一步导致点击率高的并不是用户所本文档来自技高网...

【技术保护点】
1.一种基于语意识别的搜索结果排序方法,其特征在于,包括:/n获取用户输入的问题信息;/n将所述问题信息输入预设的语意识别模型,获取由所述语意识别模型输出的所述问题信息对应的语意信息;/n在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合;/n获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表;/n针对所述搜索结果列表中每个搜索结果,获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息;/n基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用...

【技术特征摘要】
1.一种基于语意识别的搜索结果排序方法,其特征在于,包括:
获取用户输入的问题信息;
将所述问题信息输入预设的语意识别模型,获取由所述语意识别模型输出的所述问题信息对应的语意信息;
在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合;
获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表;
针对所述搜索结果列表中每个搜索结果,获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息;
基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用户访问所述搜索结果后的行为操作信息确定第四分数;
基于所述第一分数、第二分数、第三分数、第四分数,确定所述搜索结果的综合评分;
基于所述搜索结果的综合评分,对所述搜索结果进行排序。


2.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述语意识别模型通过以下方式进行训练:
预先设置问题信息集合;
预先识别出所述问题信息结合中每个问题信息样本对应的语意信息;
将所述问题信息样本输入所述语意识别模型,获取由所述语意识别模型输出的所述问题信息样本对应的语意信息,将所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息进行比对,如不一致则,调整所述语意识别模型的参数,直至所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息比对一致。


3.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述获取所述问题信息及所述近似问题信息集合中每个近似问题信息对应的搜索结果列表,包括:
提取所述问题信息对应的关键词与所述近似问题信息对应的关键词;
基于所述问题信息的关键词在预存的网络数据库中确定所述问题信息对应的搜索结果列表;
基于所述近似问题信息对应的关键词在预存的网络数据库中确定所述近似问题信息对应的搜索结果列表。


4.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述基于所述撰写时间确定第一分数,包括:
确定所述撰写时间距当前时间的长度;
根据以下公式确定第一分数:S1=a1/(b1+T1),其中所述S1是第一分数,T1是所述撰写时间距离当前时间的长度,a1和b1是预设的常数。


5.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述基于所述撰写者标识确定第二分数,包括:
基于所述撰写者标识在预存的用户信息库数据库,确定所述撰写者标识对应的撰写者信息,其中所述撰写者信息包含所述撰写者对应的撰写者等级;
根据以下公式确定第二分数:S2=a2·R·D1,其中S2是所述第二分数,D1是所述撰写者等级,a2是预设的正常数,R是预设的大于1的常数。...

【专利技术属性】
技术研发人员:钱柏丞
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1