基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质技术方案

技术编号:29757972 阅读:20 留言:0更新日期:2021-08-20 21:11
本发明专利技术公开基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,通过将用户需要搜索的图片导入至网页搜索引擎,同时通过用户选择搜索方式,若用户选择图片搜索方式,则分析计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照综合匹配度符合系数差值从小到大顺序依次进行排序;若用户选择文本搜索方式,则分析计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,提高网页搜索引擎的智能排序水平。

【技术实现步骤摘要】
基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质
本专利技术涉及网页搜索排序
,涉及到基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质。
技术介绍
随着互联网技术的发展和普及,网页搜索几乎已经成为现代人闲余生活中获取有效信息的必备途经。随着网页搜索引擎在人们生活中使用频率的提高,对网页搜索内容排序管理研究也更加重要。目前,现有的网页图片搜索排序管理基本根据图片上传时间进行排序,这样方式虽然简洁、方便,但是无法实现网页搜索引擎中图片排序管理的智能化水平,导致用户需求的图片被深埋在众多图片中难以快速查找,从而增加用户查找类似图片的时间,降低用户搜索需求图片的效率,同时现有的网页图片搜索无法实现多种搜索方式的选择,从而不能满足用户的实际搜索需求,减少用户对网页图片搜索的体验感和满意感,进而影响网页搜索引擎的智能排序水平,为了解决以上问题,现设计基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质。
技术实现思路
本专利技术的目的在于提供基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,本专利技术通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序;若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,解决了
技术介绍
中存在的问题。本专利技术的目的可以通过以下技术方案实现:第一方面,本专利技术提供基于移动互联网数据深度挖掘的网页搜索智能排序方法,包括如下步骤:S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7;S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积;S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比;S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词;S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数;S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξmax,计算用户导入搜索图片的综合匹配度符合系数,将用户导入搜索图片的综合匹配度符合系数与网页搜索引擎中各图片的综合匹配度符合系数进行对比,统计网页搜索引擎中各图片的综合匹配度符合系数差值,按照综合匹配度符合系数差值从小到大的顺序依次对网页搜索引擎中各图片进行排序;S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′1,s′2,...,s′r,...,s′l),s′r表示为用户导入搜索图片中第r个类别图像面积,计算用户导入搜索图片中各类别图像的权重比例;S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词;S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合fpB(fpb1,fpb2,...,fpbr,...,fpbl),fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q;S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。进一步地,所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s1,s2,...,si,...,sn),si表示为用户导入搜索图片中第i个特征点区域的面积。进一步地,所述用户搜索图片中各特征点区域的面积占比计算公式为ki表示为用户搜索图片中第i个特征点区域的面积占比,si表示为用户导入搜索图片中第i个特征点区域的面积,S设定表示为网页搜索引擎中图片导入的设定规格面积。进一步地,所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合WjA(wja1,wja2,...,wjaf,....,wjav),wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m。进一步地,所述用户导入搜索图片的文字信息中各主题的权重系数计算公式为ξj表示为用户导入搜索图片的文字信息中第j个主题的权重系数,λf表示为用户导入搜索图片的文字信息中第f个有效词所处位置的影响补偿系数,wjaf表示为用户导入搜索图片的文字信息中第j个主题内第f个有效词所处文本位置编号,j=1,2,...,m,W总表示为用户导入搜索图片的文字信息中有效词所处文本位置的总编号数量。进一步地,所述用户导入搜索图片的综合匹配度符合系数计算公式为ψ表示为用户导入搜索图片的综合匹配度符合系数,ξmax表示为用户导入搜索图片的文字信息对应主题的权重系数,α表示为图片特征点区域面积占比对应的权重修正系数,n表示为用户导入搜索图片中特征点的总数量,ki表示为用户搜索图片中本文档来自技高网
...

【技术保护点】
1.基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:包括如下步骤:/nS1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7;/nS2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积;/nS3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比;/nS4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词;/nS5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数;/nS6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξ...

【技术特征摘要】
1.基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:包括如下步骤:
S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7;
S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积;
S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比;
S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词;
S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数;
S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξmax,计算用户导入搜索图片的综合匹配度符合系数,将用户导入搜索图片的综合匹配度符合系数与网页搜索引擎中各图片的综合匹配度符合系数进行对比,统计网页搜索引擎中各图片的综合匹配度符合系数差值,按照综合匹配度符合系数差值从小到大的顺序依次对网页搜索引擎中各图片进行排序;
S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′1,s′2,...,s′r,...,s′l),s′r表示为用户导入搜索图片中第r个类别图像面积,计算用户导入搜索图片中各类别图像的权重比例;
S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词;
S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合fpB(fpb1,fpb2,...,fpbr,...,fpbl),fpbr表示为网页搜索引擎中第p个文本内容内第r个关键词的词频,p=1,2,...,q;
S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。


2.根据权利要求1所述的基于移动互联网数据深度挖掘的网页搜索智能排序方法,其特征在于:所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s1,s2,...,si,...,sn),si表示为用户导入搜索图片中第i个特征...

【专利技术属性】
技术研发人员:刘伟
申请(专利权)人:武汉瑞通慧行电子商务有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1