基于语义概念关联的文献检索方法、系统、存储介质及终端技术方案

技术编号:21115981 阅读:19 留言:0更新日期:2019-05-16 09:03
本发明专利技术提供一种基于语义概念关联的文献检索方法、系统、存储介质及终端,包括以下步骤:当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词;构建所述语义概念词之间互为关联揭示;构建所述第一文献检索结果中的任一文献与所述任一语义概念词互为关联揭示。本发明专利技术的基于语义概念关联的文献检索方法、系统、存储介质及终端是在传统文献搜索结果的基础上实时介入的一种基于语义概念互为关联、语义概念与文献互为关联的检索方法、系统、存储介质及终端,以辅助用户实现更为高效的文献检索。

Document Retrieval Method, System, Storage Media and Terminal Based on Semantic Concept Association

【技术实现步骤摘要】
基于语义概念关联的文献检索方法、系统、存储介质及终端
本专利技术涉及文献检索的
,特别是涉及一种基于语义概念关联的文献检索方法、系统、存储介质及终端。
技术介绍
文献是指具有历史价值的文章和论著或与某一学科有关的重要资料。文献检索(InformationRetrieval)是指根据学习和工作的需要获取文献的过程。随着现代网络技术的发展,文献检索更多是通过计算机技术来完成。现有技术中,通常通过搜索引擎在文献数据库中基于搜索词进行文献检索。该方法虽然能够满足基本的文献检索需求,但文献检索结果仅仅是单一维度的一篇篇文献的线性排列,文献之间除了先后顺序外,没有文献内容之间的交叉关联揭示。事实上,同属于一个搜索结果的各篇文献之间在内容层面上必然存在某种程度的知识关联。而上述知识关联必然有益于用户进一步获取所需的文献。因此,如何基于文献内容的知识关联进一步进行文献检索成为当前研究的热点课题。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于语义概念关联的文献检索方法、系统、存储介质及终端,能够在文献内容语义概念基础上进一步实现对文献的聚类细分和对语义概念的关联揭示。从而辅助用户实现更为高效的文献检索。为实现上述目的及其他相关目的,本专利技术提供一种基于语义概念关联的文献检索方法,包括以下步骤:当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词;构建所述语义概念词之间互为关联揭示;构建所述第一文献检索结果中的任一文献与所述任一语义概念词互为关联揭示。于本专利技术一实施例中,所述第一文献检索结果至少来自一个文献数据库。于本专利技术一实施例中,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词包括以下步骤:识别所述文献文本内容中的文本语词,所述文本语词的提取不依赖于术语词典,并且无需事先训练;赋予所述文本语词以权重;按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词。于本专利技术一实施例中,所述第一文献检索结果中的任一文献包含有一组至少一个语义概念词的语义概念词子集。于本专利技术一实施例中,所述任一语义概念词对应所述第一文献检索结果中的一组至少一篇文献的文献子集;并且所述任一语义概念词由相关文献数量N和1对应N模式的相关文献链接指引所表达。于本专利技术一实施例中,所述语义概念词之间的互为关联揭示包括:所述任一语义概念词对应一组第三预设数量的关联语义概念词子集;所述关联语义概念词子集中的任一语义概念词能够重构一组新的第三预设数量的关联语义概念词子集。于本专利技术一实施例中,所述任一文献与所述任一语义概念词之间的互为关联揭示包括:在所述第一文献检索结果中的任一文献中的任一语义概念词对应一组新的文献检索结果子集;在所述文献检索结果子集中的任一语义概念词对应一组新的关联语义概念词子集;在所述关联语义概念词子集中的任一语义概念词对应一组新的文献检索结果子集。于本专利技术一实施例中,还包括能够追溯基于语义概念词的文献浏览历史以及基于语义概念词的关联语义概念子集的浏览历史。本专利技术提供一种基于语义概念关联的文献检索系统,包括实时文献获取模块、语义概念词提取及其关联分析模块和语义概念及其文献关联揭示模块;所述实时文献获取模块用于实时动态截获与用户当前搜索词对应的第一预设数量的第一文献检索结果;所述语义概念词提取和关联分析模块用于在所述第一文献检索结果的文献文本内容中提取第二预设数量的关联的语义概念词,包括识别所述文献文本内容中的文本语词;赋予文本语词以权重;按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词;以及构建所述语义概念词之间关联关系;所述语义概念与关联文献揭示模块用于由所述任一语义概念词揭示对应的一组第三预设数量的关联语义概念词子集;由所述关联语义概念词子集中的任一语义概念词重构揭示一组新的第三预设数量的关联语义概念词子集;在所述任一文献中的任一语义概念词揭示对应的一组新的文献检索结果子集;在所述文献检索结果子集中的任一语义概念词揭示对应的一组新的关联语义概念词子集;在所述关联语义概念词子集中的任一语义概念词揭示对应的一组新的文献检索结果子集。本专利技术提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的基于语义概念关联的文献检索方法。最后,本专利技术提供一种终端,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行上述的基于语义概念关联的文献检索方法。如上所述,本专利技术所述的基于语义概念关联的文献检索方法、系统、存储介质及终端,具有以下有益效果:(1)能够基于文献内容的语义概念关联对文献进行进一步检索,从而实现文献内容的聚类细分,得到可追溯的启发式发散关联的文献检索结果;(2)语义概念的提取不基于词典,无需事先训练,保证了所提取语义概念的实时性和原始语汇的准确性;(3)能够实现文献的快速定位,辅助用户实现更为高效的文献检索;(4)能够记录文献的浏览历史,帮助用户追溯文献浏览,极大地提升了用户体验;(5)基于客户端实现,不增加搜索引擎服务器的工作负荷;当这种检索模式嵌入原始搜索引擎时,是对当前搜索引擎读者服务界面的扩充;当这种检索模式应用于宏搜索引擎时,是对多个搜索引擎跨库搜索结果统一的读者服务界面的扩充。附图说明图1显示为本专利技术的基于语义概念关联的文献检索方法于一实施例中的流程图;图2显示为本专利技术的基于语义概念关联的文献检索方法于一实施例中的框架结构图;图3显示为本专利技术的基于语义概念关联的文献检索系统于一实施例中的结构示意图;图4显示为本专利技术的终端于一实施例中的结构示意图。元件标号说明31实时文献获取模块32语义概念词提取及其关联分析模块33语义概念及其文献关联揭示模块41处理器42存储器具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。本专利技术的基于语义概念关联的文献检索方法、系统、存储介质及终端能够基于文献内容的语义概念关联对文献检索结果进行进一步检索,能够在已有文献检索结果的基础上实现文献内容的聚类细分和相互关联,有助于用户实现更为高效的文献检索和文献阅读,极大地提升了用户体验。如图1所示,于一实施例中,本专利技术的基于语义概念关联的文献检索方法包括以下步骤:步骤S1、当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词。具体地,基于作为客户端的终端的搜索引擎在一个或多个数据库中针对某一搜索词进行文献检索,获取所述一个或多个数据库返回的第一预设数本文档来自技高网...

【技术保护点】
1.一种基于语义概念关联的文献检索方法,其特征在于:包括以下步骤:当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词;构建所述语义概念词之间互为关联揭示;构建所述第一文献检索结果中的任一文献与所述任一语义概念词互为关联揭示。

【技术特征摘要】
1.一种基于语义概念关联的文献检索方法,其特征在于:包括以下步骤:当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词;构建所述语义概念词之间互为关联揭示;构建所述第一文献检索结果中的任一文献与所述任一语义概念词互为关联揭示。2.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述第一文献检索结果至少来自一个文献数据库。3.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词包括以下步骤:识别所述文献文本内容中的文本语词,所述文本语词的提取不依赖于术语词典,并且无需事先训练;赋予所述文本语词以权重;按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词。4.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述第一文献检索结果中的任一文献包含有一组至少一个语义概念词的语义概念词子集。5.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述任一语义概念词对应所述第一文献检索结果中的一组至少一篇文献的文献子集;并且所述任一语义概念词由相关文献数量N和1对应N模式的相关文献链接指引所表达。6.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述语义概念词之间的互为关联揭示包括:所述任一语义概念词对应一组第三预设数量的关联语义概念词子集;所述关联语义概念词子集中的任一语义概念词能够重构一组新的第三预设数量的关联语义概念词子集。7.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述任一文献与所述任一语义概念词之间的互为关联揭示包括:在所述第一文献检索结果中的任一文献中的任一语义概念词对应一组新的文献检索结果...

【专利技术属性】
技术研发人员:耿亦兵
申请(专利权)人:上海半坡网络技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1