一种检索展示方法、装置、设备及存储介质制造方法及图纸

技术编号:21454029 阅读:26 留言:0更新日期:2019-06-26 04:48
本发明专利技术实施例公开了一种检索展示方法、装置、设备及存储介质。该方法包括:获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式,通过本发明专利技术的技术方案,能够优化搜索功能,增强用户搜索体验。

【技术实现步骤摘要】
一种检索展示方法、装置、设备及存储介质
本专利技术实施例涉及计算机技术,尤其涉及一种检索展示方法、装置、设备及存储介质。
技术介绍
内容检索是提供数据服务的IT系统、搜索引擎或者SaaS应用的核心功能,针对不同的检索关键词或者检索式生成的检索结果页面是给用户做结果预览、操作或者优化检索式进一步搜索,所以搜索结果页的具体展现方式对提供数据服务的产品至关重要。现有的搜索引擎主要有Google的搜索引擎和百度搜索引擎。Google的搜索引擎主要采用SergeyBrin和LawrencePage提出的PageRank算法,该算法基于从许多优质的网页链接过来的网页来判定网页的重要性,进而进行排序,目前已经有200多个维度来对网页进行排序。百度搜索引擎主要采用超链分析算法对网络爬虫的搜索结果进行排序。目前无论是Google还是百度搜索引擎的算法都只是解决网页或者文章排序的问题,并没有解决针对搜索结果页如何更好的展现的问题。现有技术中,针对专利文献的搜索结果与搜索引擎搜索结果页的展现目的有所不同,一般的网页是非结构的文本,搜索引擎会根据标题或者局部文本的匹配来部分显示匹配的内容,并且显示出来。而一般论文或者专利文献是结构化的文本,有标题、摘要、权利要求、说明书和附图等,这些不同的部分都是专利搜索者,根据搜索的意图去查看和预览的部分,但是现有的搜索引擎的显示结果页都不能很好的展现这些不同的部分。即使是专业的专利搜索引擎工具,有不同的显示视图,比如列表视图、表格视图、图文视图也不能很好的展现结构化的论文或者专利不同部分的搜索结果比重,有的是按照标题,有是按照摘要的匹配程度,但是没有按照标题、摘要、权利要求、说明书和附图的这些部分匹配程度来显示搜索结果。目前搜索结果页的使用问题:如图1A所示,为表格视图的图示。根据“人工智能”关键字去搜索得到的搜索结果页,搜索结果页中无论是标题,摘要,还是描述说明书中,都无法看出这个专利跟“人工智能”的匹配程度。如图1B所示,为标准视图的图示。根据“人工智能”关键字去搜索得到的搜索结果页,搜索结果页中无论是标题,摘要,还是描述说明书中,都无法看出这个专利跟“人工智能”的匹配程度。如图1C所示,为一种搜索结果页示意图,是根据分类关键词或者学术的关键词做的匹配搜索,但是并不能比较出,跟摘要,说明书,权利要求等所有地方的直观的匹配比重。如图1D所示,为另一种搜索结果页示意图,是根据标题、摘要等地方显示文本匹配,以及略缩图显示,并不能很好的展现关键词对应的匹配密度和权重。
技术实现思路
本专利技术实施例提供一种检索展示方法、装置、设备及存储介质,以实现优化搜索功能,增强用户搜索体验。第一方面,本专利技术实施例提供了一种检索展示方法,包括:获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式。进一步的,所述将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式,包括:预先设定所述目标文档的不同文本区域的面积权重;根据所述文本区域的面积权重与所述文本区域对应文本内容的长度的乘积确定所述文本区域的展示面积;根据所述展示面积生成不同文本区域的展示方式。进一步的,生成不同文本区域的展示方式包括:确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;根据所述第一命中数确定所述文本区域的匹配权重;根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;根据所述展示颜色生成不同文本区域的展示方式。进一步的,所述文本区域包括多个不同区块,生成不同文本区域的展示方式包括:确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;根据所述第二命中数确定所述不同区块的热力权重;根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;根据所述颜色深度生成不同文本区域的展示方式。进一步的,所述文本区域包括多个不同区块,生成不同文本区域的展示方式之后,还包括:确定所述关键词在所述文本区域的命中位置,所述命中位置为所述关键词和文本区域的文本内容匹配成功时的位置;根据所述命中位置确定命中区块,所述命中位置处于所述命中区块的范围内;突出显示所述命中区块或使用所述关键词、关键词的缩略词以及关键词的替代词之一对所述命中区块进行标记。进一步的,所述确定所述关键词在所述文本区域的命中位置,包括:获取所述关键词在所述文本区域匹配成功时的行数作为第一位置参数;获取所述关键词在所述文本区域匹配成功时的行偏移量作为第二位置参数;根据所述第一位置参数和第二位置参数确定所述命中位置。进一步的,所述展示方式包括:矩形、圆形、椭圆中的至少一种。第二方面,本专利技术实施例还提供了检索展示装置,该装置包括:获取模块,用于获取用户输入的关键词;生成模块,用于将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示模块,用于显示所述展示方式。进一步的,生成模块包括:设定单元,用于预先设定所述目标文档的不同文本区域的面积权重;确定单元,用于根据所述文本区域的面积权重与所述文本区域对应文本内容的长度的乘积确定所述文本区域的展示面积;图形生成单元,用于根据所述展示面积生成不同文本区域的展示方式。进一步的,生成模块包括:第一命中数确定单元,用于确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;匹配权重确定单元,用于根据所述第一命中数确定所述文本区域的匹配权重;展示颜色确认单元,用于根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;展示方式生成单元,用于根据所述展示颜色生成不同文本区域的展示方式。进一步的,所述文本区域包括多个不同区块,生成模块具体用于:确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;根据所述第二命中数确定所述不同区块的热力权重;根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;根据所述颜色深度生成不同文本区域的展示方式。进一步的,还包括:命中位置确定单元,用于确定所述关键词在所述文本区域的命中位置,所述命中位置为所述关键词和文本区域的文本内容匹配成功时的位置;命中区块确定单元,用于根据所述命中位置确定命中区块,所述命中位置处于所述命中区块的范围内;标记单元,用于突出显示所述命中区块或使用所述关键词、关键词的缩略词以及关键词的替代词之一对所述命中区块进行标记。进一步的,命中位置确定单元具体用于:获取所述关键词在所述文本区域匹配成功时的行数作为第一位置参数;获取所述关键词在所述文本区域匹配成功时的行偏移量作为第二位置参数;根据所述第一位置参数和第二位置参数确定所述命中位置。进一步的,所述展示方式包括:矩形、圆形、椭圆中的至少一种。第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、本文档来自技高网
...

【技术保护点】
1.一种检索展示方法,其特征在于,包括:获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式。

【技术特征摘要】
1.一种检索展示方法,其特征在于,包括:获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式。2.根据权利要求1所述的方法,其特征在于,所述将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式,包括:预先设定所述目标文档的不同文本区域的面积权重;根据所述文本区域的面积权重与所述文本区域对应文本内容的长度的乘积确定所述文本区域的展示面积;根据所述展示面积生成不同文本区域的展示方式。3.根据权利要求1所述的方法,其特征在于,生成不同文本区域的展示方式包括:确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;根据所述第一命中数确定所述文本区域的匹配权重;根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;根据所述展示颜色生成不同文本区域的展示方式。4.根据权利要求1所述的方法,其特征在于,所述文本区域包括多个不同区块,生成不同文本区域的展示方式包括:确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;根据所述第二命中数确定所述不同区块的热力权重;根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;根据所述颜色深度生成不...

【专利技术属性】
技术研发人员:张济徽尹华华王新波
申请(专利权)人:智慧芽信息科技苏州有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1