一种智能语义识别方法、搜索方法、装置及系统制造方法及图纸

技术编号:16399306 阅读:47 留言:0更新日期:2017-10-17 19:41
本发明专利技术提供了一种智能语义识别方法、搜索方法、装置及系统,该智能语义识别方法包括:构建配置文件,所述配置文件中包括至少一个关键词以及每一个所述关键词分别对应的正则表达式;获取用户输入的至少一个关键词;从所述配置文件中确定与所述用户输入的至少一个关键词对应的至少一个目标正则表达式;根据所述至少一个目标正则表达式,将所述用户输入的至少一个关键词转换为至少一个设定格式的目标关键词;将所述至少一个设定格式的目标关键词发送给外部的搜索引擎。本方案能提高搜索结果的准确性。

Intelligent semantic recognition method, search method, device and system

The invention provides an intelligent semantic identification method, device and system, including intelligent search method, the semantic recognition method: build configuration files, including at least one keyword and each of the keywords corresponding to the regular expression of the configuration file; for at least one keyword from the user input; determining at least a regular expression corresponding to at least one keyword input with the user from the configuration file; according to the at least one target of regular expressions, converting at least one keyword input by the user for at least one set format of the target keywords; the at least one format the target keyword is sent to an external search engine. This scheme can improve the accuracy of search results.

【技术实现步骤摘要】
一种智能语义识别方法、搜索方法、装置及系统
本专利技术涉及计算机
,特别涉及一种智能语义识别方法、搜索方法、装置及系统。
技术介绍
随着大数据时代的到来,数据量急剧增加。如何从海量的数据中快速准确的获取有用的数据,成为用户关注的重点。搜索引擎作为可为用户提供搜索服务的系统,成为解决此类问题的首选。全文搜索引擎是最常用的搜索引擎,其工作原理一般为:按照预定义的分词规则,对各个文章中的字符进行分词,然后对分词后的每一个词建立相应的索引,并指明该词在文章中出现的次数和位置。当接收到用户输入的关键词时,可根据预先建立的索引查找对应的文章,并将查找到的文章反馈给用户。由于用户一般根据日常使用习惯进行关键词的输入,这使得用户输入的关键词与搜索引擎的分词规则不相符,从而导致无法利用用户输入的关键词准确搜索到对应的文章,造成搜索结果准确性较低。
技术实现思路
本专利技术实施例提供了一种智能语义识别方法、搜索方法、装置及系统,能提高搜索结果的准确性。第一方面,本专利技术实施例提供了一种智能语义识别方法,包括:构建配置文件,所述配置文件中包括至少一个关键词以及每一个所述关键词分别对应的正则表达式;还包本文档来自技高网...
一种智能语义识别方法、搜索方法、装置及系统

【技术保护点】
一种智能语义识别方法,其特征在于,包括:构建配置文件,所述配置文件中包括至少一个关键词以及每一个所述关键词分别对应的正则表达式;还包括:获取用户输入的至少一个关键词;从所述配置文件中确定与所述用户输入的至少一个关键词对应的至少一个目标正则表达式;根据所述至少一个目标正则表达式,将所述用户输入的至少一个关键词转换为至少一个设定格式的目标关键词;将所述至少一个设定格式的目标关键词发送给外部的搜索引擎。

【技术特征摘要】
1.一种智能语义识别方法,其特征在于,包括:构建配置文件,所述配置文件中包括至少一个关键词以及每一个所述关键词分别对应的正则表达式;还包括:获取用户输入的至少一个关键词;从所述配置文件中确定与所述用户输入的至少一个关键词对应的至少一个目标正则表达式;根据所述至少一个目标正则表达式,将所述用户输入的至少一个关键词转换为至少一个设定格式的目标关键词;将所述至少一个设定格式的目标关键词发送给外部的搜索引擎。2.根据权利要求1所述的方法,其特征在于,所述构建配置文件,所述配置文件中包括至少一个关键词以及每一个所述关键词分别对应的正则表达式,包括:构建可扩展标记语言xml文档,所述xml文档中包括至少一个关键词以及每一个所述关键词分别对应的正则表达式。3.根据权利要求2所述的方法,其特征在于,所述构建可扩展标记语言xml文档,所述xml文档中包括至少一个关键词以及每一个所述关键词分别对应的正则表达式,包括:构建xml初始文档;在所述xml初始文档中构建至少一个节点,每一个所述节点下存储至少一个所述正则表达式,形成所述xml文档;其中,同一个节点下存储的各个所述正则表达式与当前节点下对应的关键词的类型相同。4.根据权利要求3所述的方法,其特征在于,所述从所述配置文件中确定与所述用户输入的至少一个关键词对应的至少一个目标正则表达式,包括:针对所述用户输入的每一个所述关键词,均执行:根据所述关键词的格式,确定所述关键词对应的类型;从所述xml文档中确定与所述关键词的类型对应的节点;从确定出的所述节点下存储的至少一个正则表达式中,确定与所述关键词对应的目标正则表达式。5.一种搜索方法,其特征在于,应用于搜索引擎,包括:接收至少一个设定格式的目标关键词;根据所述至少一个设定格式的目标关键词,进行搜索。6.根据权利...

【专利技术属性】
技术研发人员:刘鹏付安龙
申请(专利权)人:浪潮软件股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1