一种基于语义信息的图书检索推荐方法技术

技术编号:22566157 阅读:42 留言:0更新日期:2019-11-16 12:29
本发明专利技术公开的一种基于语义信息的图书检索推荐方法,包括以下步骤:步骤1、用户输入检索信息;步骤2、处理输入检索信息并形成初始检索词序列;步骤3、对初始检索词序列进行语义扩展;步骤4、对初始检索词序列进行语义量化和模糊化;步骤5、关键字权重计算;步骤6、运用语义信息融合算法计算出用户输入的初始检索词与系统中的图书信息匹配程度,得到用户所需求的图书名称。本发明专利技术公开一种基于语义信息的图书检索推荐方法,体现了检索系统的智能化水平,提高了图书检索效率准确度。

A book retrieval recommendation method based on semantic information

The invention discloses a book retrieval recommendation method based on semantic information, which comprises the following steps: Step 1, user input retrieval information; step 2, processing input retrieval information and forming initial retrieval word sequence; step 3, semantic extension of initial retrieval word sequence; step 4, semantic quantification and fuzziness of initial retrieval word sequence; step 5, keyword weighting Step 6: use the semantic information fusion algorithm to calculate the matching degree between the initial search term input by the user and the book information in the system, and get the book name required by the user. The invention discloses a book retrieval recommendation method based on semantic information, which embodies the intelligent level of the retrieval system and improves the efficiency and accuracy of the book retrieval.

【技术实现步骤摘要】
一种基于语义信息的图书检索推荐方法
本专利技术属于图书信息化管理
,具体涉及一种基于语义信息的图书检索推荐方法。
技术介绍
推荐系统是使用电子商务网站为客户提供决策支持与信息服务的过程。推荐系统目前在许多领域得到广泛的应用,学术界对推荐系统也有着相当高的研究热度,随着推荐系统研究的不断深入和图书检索需求的不断增加,在图书领域使用推荐系统解决相关问题已经成为近年来的研究热点。图书检索活动有较长的发展历程,简单来说,图书检索可分为广义的图书检索技术和狭义的图书检索技术。广义的图书检索技术包括信息存储和检索两部分,它首先将信息数据依据一定的规则存储起来,然后再根据用户的检索需求查找出相关的信息数据。狭义的图书检索技术是指从信息数据库中查找所需检索信息的过程,即平常所说的图书搜索。语用学研究的内容是在某种语境中使用语言时,在此过程中所产生的文字表面的意义和蕴含的意义,以及由此引发的最终效果。目前国内外语义信息技术研究主要集中在基于本体的查询技术、语义标注问题、语义关系检索和中文分词技术。目前的图书检索模型,用户往往花费较长时间去逐一浏览结果以确定是否是自己所需信息,有些情况下,用户要多次检索才能找到所需检索信息,这位用户带来了极大不便,耗费时间、影响用户对所需数据的采集、学习且不能从根本上解决关键字语义多重性、排序杂乱性的特点。
技术实现思路
本专利技术的目的在于提供一种基于语义信息的图书检索推荐方法,提高了图书检索效率准确度。本专利技术所采用的技术方案是:一种基于语义信息的图书检索推荐方法,包括以下步骤:步骤1、用户输入检索信息;步骤2、处理用户输入的检索信息并形成初始检索词序列;步骤3、对初始检索词序列进行语义扩展;步骤4、对扩展后的初始检索词序列进行语义量化和模糊化;步骤5、关键字权重计算;步骤6、运用语义信息融合算法计算出用户输入的初始检索词与系统中的图书信息匹配程度,得到用户所需求的图书名称。本专利技术的特点还在于,步骤2具体包括:若用户输入的检索信息包含一个完整的检索语句,则按照以下具体步骤进行:步骤2.1:将用户输入的检索信息与中文分词词典中的词条进行匹配;步骤2.2:运用中文分词词法规则对匹配后的词汇进行歧义校正;步骤2.3:提取中文分词后句子中的关键词,组成初始检索词序列;若用户输入的检索信息只有关键词,则按顺序进行步骤2.2和步骤2.3。步骤3采用基于本体树的语义扩展方法,具体按照以下步骤实施:步骤3.1:从左至右标记中文分词后得到的初始检索词序列S1,判断此检索词Wi是否为本体中的概念Bi;步骤3.2:若Wi≠Bi,则将标记移位到下一个检索词Wi+1;若Wi+1为空,则语义扩展结束;若Wi+1不为空,则执行步骤3.1;若Wi=Bi,则执行步骤3.3;步骤3.3:若Wi=Bi,在本体树中确定其位置,并通过同义关系、继承关系、实例关系进行语义扩展,为该检索词Wi增添同义词、相对抽象的上位词及相对具体的下位词,最后,将检索词标记位移至下一检索词Wi+1,并执行步骤3.1。步骤4采用三角模糊数法对扩展后的初始检索词序列进行语义量化和模糊化,具体按照以下步骤实施:步骤4.1:确定隶属函数μA(x),使得μA(x)满足连续函数、凸模糊集、存在一实数x0,使得隶属函数μA(x0)为1三个条件;步骤4.2:将语义量尺分为非常重要、比较重要、一般、比较不重要、非常不重要五级;步骤4.3:与五级语义量尺分别对应的三角模糊数分别为(5,6,6)、(3,5,6)、(1,3,5)、(0,1,3)、(0,0,1),用三角模糊数表示模糊化后的μA(x)。步骤5具体按照以下步骤实施:步骤5.1:根据需求,对语义量化和模糊化后每个关键词语义信息需求的重视程度划分为:一般重视、比较重视、很重视、非常重视、特别重视;步骤5.2:建立比较判断矩阵:在进行第i个元素与第j个元素相对上一层某个因素重要性比较时,使用数量化的权重值表示;步骤5.3:计算权向量:利用特征根法求比较判断矩阵的特征根;步骤5.4:一致性检验:根据比较判断矩阵的一致性比率大小检验其一致性,当其比率小于等于0.1,则直接计算其权向量;当其比率大于0.1,则对矩阵进行调整,直到其比率小于等于0.1;步骤5.5:对步骤5.2中输入信息的原始权重值进行归一化处理,得对各个关键字语义信息需求的重视程度权重。步骤6具体按照以下步骤实施:步骤6.1:根据步骤5中确定的每个关键字的原始权重P和加权因子Q计算得到关键字的总融合值;步骤6.2:将用户需要的图书作为参考序列,将关键字的总融合值作为比较序列求出各数据之间的关联系数和关联程度;步骤6.3:根据计算求得的关联度得到每条数据的相对查准率,根据查准率判断检索结果与用户所需图书的关联程度,关联程度越大,表示越符合用户需求,则优先推荐。本专利技术的有益效果是:(1)本专利技术一种基于语义信息的图书检索推荐方法能够明确用户的检索需求,对于用户提交的检索请求,检索模型能够在不改变用户检索意图的前提下,对检索语句进行语义模糊化、语义扩展化,明确检索需求,从而确保检索主题的正确性,避免出现检索主题偏移;(2)本专利技术一种基于语义信息的图书检索推荐方法提出的图书检索推荐模型有助于实现个性化推荐式检索服务,具有一定语义处理能力,优化关键字权重,引入了数据融合算法,查准率结果随可模糊化词语个数增加而提升。能解决多义词相关语义确定问题,理解用户的检索需求,优化图书检索排序算法,实现最适合用户要求的相关图书推荐功能。附图说明图1是本专利技术一种基于语义信息的图书检索推荐方法的流程图;图2是本专利技术一种基于语义信息的图书检索推荐方法中对应语义的三角模糊数隶属函数图。具体实施方式下面结合附图以及具体实施方式对本专利技术进行详细说明。本专利技术提供了一种基于语义信息的图书检索推荐方法,如图1所示,具体按照以下步骤实施:步骤1、用户输入检索信息。用户输入反映自身检索意图的检索语句。该语句可能只是几个检索关键词,也可能是一个完整的句子。步骤2、中文分词处理,形成初始检索词序列。具体按照以下方法实施:(1)将用户输入数据与中文分词词典中的词条进行匹配。(2)运用中文分词法规则对匹配后的词汇进行歧义校正,对歧义进行校正之后可以提高分词切割精度。(3)提取中文分词后句子中的关键词,组成初始检索词序列。步骤3、采用1998年Studer提出的本体树的语义扩展方法。具体按照以下方法实施:(1)从左至右标记中文分词后得到的初始检索词序列S1,判断此检索词Wi是否为本体中的概念Bi;(2)若Wi≠Bi,则将标记移位到下一个检索词Wi+1。若Wi+1为空,则语义扩展结束;若Wi+1不为空,则执行(1)。若Wi=Bi,则执行本文档来自技高网...

【技术保护点】
1.一种基于语义信息的图书检索推荐方法,其特征在于,包括以下步骤:/n步骤1、用户输入检索信息;/n步骤2、处理用户输入的检索信息并形成初始检索词序列;/n步骤3、对初始检索词序列进行语义扩展;/n步骤4、对扩展后的初始检索词序列进行语义量化和模糊化;/n步骤5、关键字权重计算;/n步骤6、运用语义信息融合算法计算出用户输入的初始检索词与系统中的图书信息匹配程度,得到用户所需求的图书名称。/n

【技术特征摘要】
1.一种基于语义信息的图书检索推荐方法,其特征在于,包括以下步骤:
步骤1、用户输入检索信息;
步骤2、处理用户输入的检索信息并形成初始检索词序列;
步骤3、对初始检索词序列进行语义扩展;
步骤4、对扩展后的初始检索词序列进行语义量化和模糊化;
步骤5、关键字权重计算;
步骤6、运用语义信息融合算法计算出用户输入的初始检索词与系统中的图书信息匹配程度,得到用户所需求的图书名称。


2.如权利要求1所述的一种基于语义信息的图书检索推荐方法,其特征在于,所述步骤2具体包括:若用户输入的检索信息包含一个完整的检索语句,则按照以下具体步骤进行:
步骤2.1:将用户输入的检索信息与中文分词词典中的词条进行匹配;
步骤2.2:运用中文分词词法规则对匹配后的词汇进行歧义校正;
步骤2.3:提取中文分词后句子中的关键词,组成初始检索词序列;
若用户输入的检索信息只有关键词,则按顺序进行步骤2.2和步骤2.3。


3.如权利要求2所述的一种基于语义信息的图书检索推荐方法,其特征在于,所述步骤3采用基于本体树的语义扩展方法,具体按照以下步骤实施:
步骤3.1:从左至右标记中文分词后得到的初始检索词序列S1,判断此检索词Wi是否为本体中的概念Bi;
步骤3.2:若Wi≠Bi,则将标记移位到下一个检索词Wi+1;若Wi+1为空,则语义扩展结束;若Wi+1不为空,则执行步骤3.1;若Wi=Bi,则执行步骤3.3;
步骤3.3:若Wi=Bi,在本体树中确定其位置,并通过同义关系、继承关系、实例关系进行语义扩展,为该检索词Wi增添同义词、相对抽象的上位词及相对具体的下位词,最后,将检索词标记位移至下一检索词Wi+1,并执行步骤3.1。


4.如权利要求3所述的一种基于语义信息的图书检索推荐方法,其特征在于,所述步骤4采用三角模糊数法对扩展后的初始检索词序列进行...

【专利技术属性】
技术研发人员:宋爱香马冲王思敏
申请(专利权)人:西安工程大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1