一种数据处理方法、装置和电子设备制造方法及图纸

技术编号:25637268 阅读:28 留言:0更新日期:2020-09-15 21:29
本发明专利技术实施例提供了一种数据处理方法、装置和电子设备,其中,所述方法包括:接收搜索词;依据所述搜索词进行在线图片搜索确定在线搜索结果,以及依据所述搜索词从离线图片库中搜索离线搜索结果,其中,所述离线图片库中包括优质分值高于优质阈值的图片,所述优质分值依据图片的美学价值和相关性确定;将所述离线搜索结果排在所述在线搜索结果之前返回;进而可以将优质图片排在前面进行展示,从而提高了搜索结果质量,且还能够提高用户体验。

【技术实现步骤摘要】
一种数据处理方法、装置和电子设备
本专利技术涉及数据处理
,特别是涉及一种数据处理方法、装置和电子设备。
技术介绍
随着互联网技术的不断发展,以及搜索引擎的技术的发展,用户可以通过搜索应用进行信息搜索,例如进行视频搜索、音乐搜索、论文搜索、图片搜索等等。通常在图片搜索的过程中,搜索引擎通常会才用相关性作为排序的标准,将相关性高的图片排在相关性低的图片之前,然后按照排序结果返回。但是相关性可能不能很好的体现图片的好坏,例如用户输入搜索词“湖面倒影”并进行图片搜索,返回的搜索结果页中一张普通用户随手拍的湖景排在一张摄影大师拍的湖面倒影之前,即普通用户随手拍的图片比摄影大师拍的图片相关性高,但实际摄影大师拍的图片比普通用户随手拍的图片更能吸引人眼球;可见,现有图片搜索结果质量低。
技术实现思路
本专利技术实施例提供一种数据处理方法,以提高搜索结果质量。相应的,本专利技术实施例还提供了一种数据处理装置和一种电子设备,用以保证上述方法的实现及应用。为了解决上述问题,本专利技术实施例公开了一种数据处理方法,具体包括:接收搜索词;依据所述搜索词进行在线图片搜索确定在线搜索结果,以及依据所述搜索词从离线图片库中搜索离线搜索结果,其中,所述离线图片库中包括优质分值高于优质阈值的图片,所述优质分值依据图片的美学价值和相关性确定;将所述离线搜索结果排在所述在线搜索结果之前返回。可选地,所述依据所述搜索词从离线图片库中搜索离线搜索结果,包括:基于所述搜索词查找映射关系,从离线图片库中查找多个图片;依据各图片对应的优质分值对各图片进行降序排序,生成离线搜索结果。可选地,所述依据所述搜索词进行在线图片搜索确定在线搜索结果,包括:计算在线图片库中各图片与所述搜索词的相关性分值;依据各图片的相关性分值对各图片进行降序排序,生成在线搜索结果。可选地,所述的方法还包括建立离线图片库的步骤:获取第一数据集,所述第一数据集包括:多个第一历史搜索词、各第一历史搜索词对应的多个第一图片和各第一图片对应的图片特征信息,其中,所述图片特征信息包括:用户行为特征信息、相关性特征信息和美学特征信息;依据所述第一数据集和预设模型,确定各第一历史搜索词对应各第一图片的优质分值;选取优质分值高于优质阈值的目标图片,依据所述目标图片和对应第一历史搜索词建立离线图片库。可选地,所述依据所述目标图片和对应第一历史搜索词建立离线图片库,包括:分别建立各目标图片与对应第一历史搜索词的映射关系;采用各目标图片、各目标图片对应的映射关系和优质分值,建立离线图片库。可选地,所述获取多个第一历史搜索词,包括:从图片搜索日志获取多个历史搜索词,并统计各历史搜索词对应的频次;选取出频次最高的前N个历史搜索词作为第一历史搜索词,N为正整数。可选地,所述获取各第一图片对应图片特征信息,包括:从图片搜索日志中获取各第一图片对应的用户行为特征信息,其中,用户行为特征信息包括多个维度;计算各第一图片与对应第一历史搜索词对应的相关性分值,依据所述相关性分值确定相关性特征信息;采用美学质量评价模型,确定各第一图片对应的美学特征信息。可选地,所述的方法还包括训练所述预设模型的步骤:获取第二数据集,所述第二数据集包括:多个第二历史搜索词、各第二历史搜索词对应的多张第二图片和各第二图片对应的图片特征信息;确定各第二图片的参考美学特征信息和参考相关性特征信息,依据所述参考美学特征信息和参考相关性特征信息确定各第二图片的参考优质分值;依据所述第二数据集和参考优质分值,对所述预设模型进行训练。可选地,所述依据所述第二数据集和参考优质分值,对所述预设模型进行训练,包括:将所述第二数据集输入至所述预设模型中的得到优质分值;将所述优质分值与对应的参考优质分值进行比对,调整所述预设模型。本专利技术实施例还公开了一种数据处理装置,具体包括:接收模块,用于接收搜索词;搜索模块,用于依据所述搜索词进行在线图片搜索确定在线搜索结果,以及依据所述搜索词从离线图片库中搜索离线搜索结果,其中,所述离线图片库中包括优质分值高于优质阈值的图片,所述优质分值依据图片的美学价值和相关性确定;返回模块,用于将所述离线搜索结果排在所述在线搜索结果之前返回。可选地,所述搜索模块包括:离线搜索子模块,用于基于所述搜索词查找映射关系,从离线图片库中查找多个图片;依据各图片对应的优质分值对各图片进行降序排序,生成离线搜索结果。可选地,所述搜索模块包括:在线搜索子模块,用于计算线上图片库中各图片与所述搜索词的相关性分值;依据各图片的相关性分值对各图片进行降序排序,生成在线搜索结果。可选地,所述的装置还包括:第一获取模块,用于获取第一数据集,所述第一数据集包括:多个第一历史搜索词、各第一历史搜索词对应的多个第一图片和各第一图片对应的图片特征信息,其中,所述图片特征信息包括:用户行为特征信息、相关性特征信息和美学特征信息;打分模块,用于依据所述第一数据集和预设模型,确定各第一历史搜索词对应各第一图片的优质分值;图片库建立模块,用于选取优质分值高于优质阈值的目标图片,依据所述目标图片和对应第一历史搜索词建立离线图片库。可选地,所述图片库建立模块,用于分别建立各目标图片与对应第一历史搜索词的映射关系;采用各目标图片、各目标图片对应的映射关系和优质分值,建立离线图片库。可选地,所述获取模块包括:搜索词获取子模块,用于从图片搜索日志获取多个历史搜索词,并统计各历史搜索词对应的频次;选取出频次最高的前N个历史搜索词作为第一历史搜索词,N为正整数。可选地,所述获取模块包括:特征信息获取子模块,用于从图片搜索日志中获取各第一图片对应的用户行为特征信息,其中,用户行为特征信息包括多个维度;计算各第一图片与对应第一历史搜索词对应的相关性分值,依据所述相关性分值确定相关性信息;采用美学质量评价模型,确定各第一图片对应的美学特征信息。可选地,所述的装置还包括:第二获取模块,用于获取第二数据集,所述第二数据集包括:多个第二历史搜索词、各第二历史搜索词对应的多张第二图片和各第二图片对应的图片特征信息;参考信息确定模块,用于确定各第二图片的参考美学特征信息和参考相关性信息,依据所述参考美学特征信息和参考相关性信息确定各第二图片的参考优质分值;训练模块,用于依据所述第二数据集和参考优质分值,对所述预设模型进行训练。可选地,所述训练模块,用于将所述第二数据集输入至所述预设模型中的得到优质分值;将所述优质分值与对应的参考优质分值进行比对,调整所述预设模型。本专利技术实施例还公开了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本专利技术实施例任一所述的数据处理方法。本专利技术实施例还公开了一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收搜索词;依据所述搜索词进行在线图片搜索确定在本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n接收搜索词;/n依据所述搜索词进行在线图片搜索确定在线搜索结果,以及依据所述搜索词从离线图片库中搜索离线搜索结果,其中,所述离线图片库中包括优质分值高于优质阈值的图片,所述优质分值依据图片的美学价值和相关性确定;/n将所述离线搜索结果排在所述在线搜索结果之前返回。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
接收搜索词;
依据所述搜索词进行在线图片搜索确定在线搜索结果,以及依据所述搜索词从离线图片库中搜索离线搜索结果,其中,所述离线图片库中包括优质分值高于优质阈值的图片,所述优质分值依据图片的美学价值和相关性确定;
将所述离线搜索结果排在所述在线搜索结果之前返回。


2.根据权利要求1所述的方法,其特征在于,所述依据所述搜索词从离线图片库中搜索离线搜索结果,包括:
基于所述搜索词查找映射关系,从离线图片库中查找多个图片;
依据各图片对应的优质分值对各图片进行降序排序,生成离线搜索结果。


3.根据权利要求1所述的方法,其特征在于,所述依据所述搜索词进行在线图片搜索确定在线搜索结果,包括:
计算在线图片库中各图片与所述搜索词的相关性分值;
依据各图片的相关性分值对各图片进行降序排序,生成在线搜索结果。


4.根据权利要求1所述的方法,其特征在于,所述的方法还包括建立离线图片库的步骤:
获取第一数据集,所述第一数据集包括:多个第一历史搜索词、各第一历史搜索词对应的多个第一图片和各第一图片对应的图片特征信息,其中,所述图片特征信息包括:用户行为特征信息、相关性特征信息和美学特征信息;
依据所述第一数据集和预设模型,确定各第一历史搜索词对应各第一图片的优质分值;
选取优质分值高于优质阈值的目标图片,依据所述目标图片和对应第一历史搜索词建立离线图片库。


5.根据权利要求4所述的方法,其特征在于,所述依据所述目标图片和对应第一历史搜索词建立离线图片库,包括:
分别建立各目标图片与对应第一历史搜索词的映射关系;
采用各目标图片、各目标图片对应的映射关系和优质分值,建立离线图片库。


6.根据权利要求4所述的...

【专利技术属性】
技术研发人员:谢泽华周泽南苏雪峰许静芳
申请(专利权)人:搜狗杭州智能科技有限公司北京搜狗科技发展有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1