System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种智能搜索方法,尤其涉及一种基于人工智能推荐的智能搜索方法。
技术介绍
1、智能搜索方法可以根据用户输入的查询,在搜索结果中提供并展示与输入查询相关的实体建议,帮助用户便捷地发现与其都多需求相关的其他实体,让用户高效的获得丰富的信息内容,有效提升用户的信息发现体验,但是传统的相关试题推荐任务方法存在以下缺点和不足:
2、一、实体推荐存在无关性:部分搜索引擎中展现的一些推荐实体与用户输入的搜索查询语句包含的实体无关联,与用户搜索意图不相匹配,这类推荐实体对用户完全无意义,甚至降低用户的参与度及搜索体验性;
3、二、推荐领域的单一性:传统的实体推荐任务中对用户推荐的实体通常限定于同一领域,如商品或电影,而用户期望获得的实体推荐是没有限定领域的,它可以来自知识库中的任何一个领域。
4、综上,现有的实体推荐方法中为用户展示的相关实体与用户输入的搜索查询语句包含的实体可能存在无关性,或相关性较弱,并非用户所关注的内容,无法引起用户的探索欲和兴趣,也不能引导用户进行再次搜索,甚至导致用户体验下降。
技术实现思路
1、为了解决上述技术所存在的不足之处,本专利技术提供了一种基于人工智能推荐的智能搜索方法。
2、为了解决以上技术问题,本专利技术采用的技术方案是:一种基于人工智能推荐的智能搜索方法,包括以下步骤:
3、步骤s1:接受用户输入的查询q,使用数据获取工具爬取重点应用平台、web站点的数据,并存储到对应的数据库中;对
4、步骤s2:针对查询q对应的查询实体进行相关实体发现,获取与查询实体相关的候选实体,进而得到相关实体集合;
5、步骤s3:基于构建实体无向带权图模型计算查询实体与候选实体间的相似度,根据查询实体和各个候选实体的相似度得分对候选实体进行排序,相似度得分越高,查询实体与各个候选实体的相似度得分的排序越高,相关程度越大;
6、步骤s4:基于排序结果获得相关实体推荐结果,排序结果越高,相关实体推荐结果的优先级越高。
7、进一步地,步骤s1中数据包括结构化数据、半结构化数据、文本类非结构化数据和开放领域的其他第三方数据。
8、进一步地,步骤s1中本体库的本体是描述客观世界的抽象模型,用于指导用户在特定的领域范围内,对真实世界存在的事物和领域内的术语及概念,进行认知建模;基于构建本体库进而构建知识图谱的具体步骤如下:
9、s11:针对结构化数据构建本体库:基于关系型数据库中的语义信息,按照关系模型与本体模型之间的映射规则,将关系模型转化为本体模型;关系模型与本体模型之间的映射规则包括本体概念映射规则、本体属性映射规则和本体概念之间关系映射规则;关系型数据库包含完整的表结构信息,并隐含着相关领域的关系及概念模型;
10、s12:针对半结构化数据构建本体库:首先将半结构化数据转为结构化数据,抽取关系模型,通过s11中关系模型与本体模型之间的映射规则将关系模型转化为本体模型;
11、s13:将s11、s12中得到的本体模型与通用知识图谱中的实体进行对齐,采用word2vec判断新提取出的实体与通用知识图谱中的实体是否一致,将指向同一对象的实体进行合并,并用唯一的id对该实体进行标记,最后将实体抽取出的新关系增加到知识图谱中,将知识图谱存储至图数据库中;
12、s14:构建文本类的非结构化数据的知识图谱,采用无监督的文本三元组提取法,提取句子中符合一定语法规则的关系组,最终将文本提取为多个三元组的集合,提取文本的具体过程如下:
13、s141:文本由多个句子组成,拆解每个文本里的句子,得到n个拆解句子;
14、s142:对每个拆解句子进行分词处理,将拆解句子变为一系列的词汇和标点符号集;
15、s143:通过词性标注得到向量即把拆解句子变为一系列的词汇和标点组成的向量;
16、s144:对拆解句子进行句法分析,得到句法依存关系,提取到三元组即本体模型;
17、s145:将三元组与通用知识图谱进行融合;进行实体对齐,并用唯一的id对该实体进行标记,最终将实体抽取出的新关系增加到知识图谱中,将知识图谱存储至图数据库中。
18、进一步地,步骤s2中获取与查询实体相关的候选实体的方法为基于知识图谱来获取查询实体的相关候选实体,包括以下步骤:
19、a1:基于知识图谱抽取出与查询q有关的查询实体eq;
20、a2:在知识图谱中抽取与eq存在关联关系的其他实体即候选实体e,将e作为q的相关实体集合,记为k(eq);
21、计算查询q与候选实体e∈k(eq)间的相关性得分,公式为:
22、
23、其中,p1为a方法的相关性得分;e为候选实体;eq为查询实体。
24、进一步地,步骤s2中获取与查询实体相关的候选实体的方法为在基于知识图谱获取查询实体的相关候选实体的基础上,再基于搜索会话共现补齐查询q的其他相关候选实体。
25、进一步地,搜索会话共现是基于用户的搜索日志来挖掘实体及其关系,搜索日志为用户在搜索引擎中进行搜索时,在同一搜索会话中多次搜索不同的查询,该搜索行为的累积形成了用户的搜索日志;包括以下步骤:
26、b1:在搜索日志中查找出与eq在同一搜索会话中多次共现的共现实体;
27、b2:按照共现次数由高至低,取满足条件的前n个共现实体作为q的相关实体集合,记为s(eq);并采用点互信息计算查询q与候选实体e∈k(eq)间的相关性得分,公式为:
28、
29、其中,
30、e′∈s(eq);
31、
32、cnt(e,eq)为e与eq共同出现即共现过的搜索会话个数,而cnt(e)为含有e的搜索会话个数。
33、进一步地,合并基于知识图谱获取查询实体的相关候选实体方法得到的相关实体集合和基于搜索会话共现补齐查询q的其他相关候选实体方法得到的相关实体集合,最终得到查询q的相关实体集合v′(q),公式为:
34、v′(q)≈k(eq)∪s(eq);
35、其中,k(eq)为基于知识图谱获取查询实体eq的相关候选实体的实体集合;s(eq)为基于搜索会话共现补齐查询实体eq的相关候选实体的实体集合。
36、进一步地,步骤s3中基于构建实体无向带权图模型计算查询实体与候选实体间的相似度,包括以下步骤:
37、s31:在无向带权图模型中根据知识图谱中查询实体的节点和候选实体的节点之间的关系来构造无向边;再根据候选实体之间的余弦相似度构造各候选实体之间的无向边;
38、s32:按照候选实体在知识图谱中的向量相关性,计算无向带权图模型边上的权重,得到候选实体之间的相关本文档来自技高网...
【技术保护点】
1.一种基于人工智能推荐的智能搜索方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤S1中数据包括结构化数据、半结构化数据、文本类非结构化数据和开放领域的其他第三方数据。
3.根据权利要求2所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤S1中本体库的本体是描述客观世界的抽象模型,用于指导用户在特定的领域范围内,对真实世界存在的事物和领域内的术语及概念,进行认知建模,基于构建本体库进而构建知识图谱的具体步骤如下:
4.根据权利要求1所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤S2中获取与查询实体相关的候选实体的方法为基于知识图谱来获取查询实体的相关候选实体,包括以下步骤:
5.根据权利要求4所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤S2中获取与查询实体相关的候选实体的方法为在基于知识图谱获取查询实体的相关候选实体的基础上,再基于搜索会话共现补齐查询q的其他相关候选实体。
6.根据权利要求5所述的基于人工智能推荐的智能搜索方
7.根据权利要求6所述的基于人工智能推荐的智能搜索方法,其特征在于:合并所述基于知识图谱获取查询实体的相关候选实体方法得到的相关实体集合和基于搜索会话共现补齐查询q的其他相关候选实体方法得到的相关实体集合,最终得到查询q的相关实体集合V′(q),公式为:
8.根据权利要求1所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤S3中基于构建实体无向带权图模型计算查询实体与候选实体间的相似度,包括以下步骤:
9.根据权利要求8所述的基于人工智能推荐的智能搜索方法,其特征在于:所述S31中任意选择两个候选实体,若两个候选实体对应向量间的余弦相似度为正,则在无向带权模型中构造一条两个候选实体的无向边,表示两个候选实体为相关;若两个候选实体对应向量间的余弦相似度不为正,表示两个候选实体为不相关;余弦相似度计算公式为:
10.根据权利要求1所述的基于人工智能推荐的智能搜索方法,其特征在于:所述S33中计算候选实体的相似度得分的公式即每条路径上权重的平均值中最大值的公式为:
...【技术特征摘要】
1.一种基于人工智能推荐的智能搜索方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤s1中数据包括结构化数据、半结构化数据、文本类非结构化数据和开放领域的其他第三方数据。
3.根据权利要求2所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤s1中本体库的本体是描述客观世界的抽象模型,用于指导用户在特定的领域范围内,对真实世界存在的事物和领域内的术语及概念,进行认知建模,基于构建本体库进而构建知识图谱的具体步骤如下:
4.根据权利要求1所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤s2中获取与查询实体相关的候选实体的方法为基于知识图谱来获取查询实体的相关候选实体,包括以下步骤:
5.根据权利要求4所述的基于人工智能推荐的智能搜索方法,其特征在于:所述步骤s2中获取与查询实体相关的候选实体的方法为在基于知识图谱获取查询实体的相关候选实体的基础上,再基于搜索会话共现补齐查询q的其他相关候选实体。
6.根据权利要求5所述的基于人工智能推荐的智能搜索方法,其特征在于:所述搜索会话共现是基于用户的搜索日志来挖掘及其关...
【专利技术属性】
技术研发人员:李绍俊,李少杰,刘海迪,张夏苗,李尚雄,
申请(专利权)人:长春嘉诚信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。