The invention discloses a search method, device and electronic equipment based on artificial intelligence. Among them, the search method based on artificial intelligence includes: obtaining the input query sentences, dividing the query sentences, and getting the sequence of participle composed of multiple participle; structure analysis of the sequence of participle, and the text structure; based on the text This structure makes a knowledge analysis of the sequence of participle, and generates the result of semantic analysis. According to the result of text structure and semantic analysis, the results of the understanding of the query statements are determined. The search method, device and electronic equipment based on artificial intelligence in the embodiment of the invention, through structured analysis and knowledge analysis of the query sentence, get the result of text structure and semantic analysis, so as to determine the understanding result corresponding to the query sentence, reduce the error recall of the search results, improve the accuracy and satisfy the user. Demand.
【技术实现步骤摘要】
基于人工智能的搜索方法、装置和电子设备
本专利技术涉及信息处理
,尤其涉及一种基于人工智能的搜索方法、装置和电子设备。
技术介绍
传统的搜索引擎,对query(查询信息)的理解,主要还是将query切分为多个关键词来进行解析。具体地,可先对query进行分词,生成由多个关键词(keyword)组成的序列,并为每个关键词分配一定的权重(weight)。然后,对待检索内容(比如互联网网页)同样做分词,生成分词(term)序列,并分配一定的权重。计算两个序列中分词的重合程度(相似度),同时配合权重计算得分,得到一个纯文本相关度的排序结果。最后,基于用户对原始排序结果不断地点击行为的记录,动态调整排序结果,从而得到用户更愿意点击或停留的搜索结果。但是,上述方法并没有对query进行更深层次地理解,依靠比较扁平化的关键词序列来召回排序结果,依靠用户的历史行为来优化排序结果,准确率并不高,无法满足用户的需求。
技术实现思路
本专利技术提供一种基于人工智能的搜索方法、装置和电子设备,以解决上述技术问题中的至少一个。本专利技术实施例提供一种基于人工智能的搜索方法,包括:获取输入 ...
【技术保护点】
一种基于人工智能的搜索方法,其特征在于,包括:获取输入的查询语句;切分所述查询语句,得到多个分词组成的分词序列;对所述分词序列进行结构化分析,生成文本结构;基于所述文本结构,对所述分词序列进行知识化分析,生成语义分析结果;根据所述文本结构和所述语义分析结果,确定所述查询语句对应的理解结果。
【技术特征摘要】
1.一种基于人工智能的搜索方法,其特征在于,包括:获取输入的查询语句;切分所述查询语句,得到多个分词组成的分词序列;对所述分词序列进行结构化分析,生成文本结构;基于所述文本结构,对所述分词序列进行知识化分析,生成语义分析结果;根据所述文本结构和所述语义分析结果,确定所述查询语句对应的理解结果。2.如权利要求1所述的方法,其特征在于,对所述分词序列进行结构化分析,生成文本结构,包括:基于历史查询日志,对所述分词序列进行共现挖掘和同义挖掘,以获取多个扩展查询语句;基于预设聚类算法,对所述多个扩展查询语句进行聚类;对聚类后的所述多个扩展查询语句进行结构抽取,以生成所述文本结构。3.如权利要求2所述的方法,其特征在于,在生成所述文本结构之后,还包括:对所述文本结构进行泛化和等价归一。4.如权利要求1所述的方法,其特征在于,基于所述文本结构,对所述分词序列进行知识化分析,生成语义分析结果,包括:对所述分词序列进行需求识别,以生成需求识别结果;基于知识库,对所述需求识别结果进行概念识别,以生成概念识别结果;基于所述知识库,对所述概念识别结果进行意图识别,以生成所述语义分析结果。5.如权利要求2所述的方法,其特征在于,对聚类后的所述多个扩展查询语句进行结构抽取,以生成所述文本结构,包括:基于所述多个扩展查询语句之间的重叠的频度和错位的长尾性,获取所述多个扩展查询语句之间的共性的序列区间和特异性的序列区间;基于预设类型的槽位,替换所述多个扩展查询语句之间的特异性的序列区间;基于所述共性的序列区间和所述预设类型的槽位,生成所述文本结构。6.如权利要求3所述的方法,其特征在于,对所述文本结构进行泛化和等价归一,包括:对所述文本结构和候选文本结构填充相同的多组语义成分,以生成所述文本结构对应的第一查询语句和所述候选文本结构对应的第二查询语句;基于所述第一查询语句进行查询获取第一搜索结果;基于所述第二查询语句进行查询获取第二搜索结果;计算所述第一搜索结果和所述第二搜索结果的点击共现分数;当所述点击共现分数大于预设分数时,确定所述候选文本结构与所述文本结构等价。7.如权利要求4所述的方法,其特征在于,对所述分词序列进行需求识别,以生成需求识别结果,包括:提取所述分词序列对应的查询语句特征;获取与所述查询语句对应的搜索结果的特征;根据所述查询语句特征和所述搜索结果的特征生成所述需求识别结果。8.如权利要求7所述的方法,其特征在于,所述搜索结果的特征包括题目特征、摘要特征、位置特征、样式特征中的至少一种。9.如权利要求7所述的方法,其特征在于,在根据所述查询语句特征和所述搜索结果的特征生成所述需求识别结果之后,还包括:对所述需求识别结果进行需求消歧。10.如权利要求9所述的方法,其特征在于,对所述需求识别结果进行需求消歧,包括:获取与所述查询语句对应的搜索结果的语义片段;利用预设模型获得所述语义片段中的实体标签;基于所述实体标签对所述需求识别结果进行需求消歧。11.一种基于人工智能的搜索装置,其特征在于,包括:获取模块,用于获取输入的查询语句;切分模块,用于切分所述查询语句,得到多个分词组成的分词序列;结构化分析模块,用...
【专利技术属性】
技术研发人员:朱勇,宋勋超,李莹,张一麟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。