The invention discloses an accurate retrieval method based on keywords, at least one keyword receiving user input, and the keywords as the first name of the search words; to acquire the information in the library and the text information, and the text information Chinese word for word segmentation, word by word as the second words; word similarity between the first word and the second words; according to whether the word similarity of the first word and the second word match success. In the invention, by calculating the key words and the text information contained in word similarity between words, the keyword retrieval, and the word similarity is based on the data to split the word matching, based on the formation of concept set calculated, because the concept of this concept in the collection can cover the essential meaning of words maximum the degree, so can effectively improve the retrieval accuracy.
【技术实现步骤摘要】
一种基于关键词的精确检索方法
本专利技术信息检索领域,尤其涉及一种基于关键词的精确检索方法。
技术介绍
由于目前数据库中信息量较大,用户往往会面对需要从数据库中快速获取所需信息的需要,因此如果从大量的信息中快速检测中所需信息,是比较重要的研究方向。在现在的网络通信或数据处理过程中,常常会产生对两个词语进行相似度匹配的需求。现有技术主要采用的匹配方式为字面含义的匹配,通过相同或近似的字来判断词语是否匹配,例如“接近”和“靠近”,由于都具有“近”这个字,系统会判断这两个词匹配度较高,但是,文字的内涵博大精深,仅仅依靠字面含义进行词语匹配经常容易出现错误,从而严重影响了检索的精确度。因此,现有技术还有待进一步的改进。
技术实现思路
本专利技术提供了一种数据匹配方法。一种基于关键词的精确检索方法,其中,所述方法包括:接收用户输入的至少一个关键词,并将所述关键词作为第一词语;获取待检索信息库中文章的名称与摘要的文字信息,并对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;对所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;计算所述第一概念集合中的第一概念与所述第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;根据所述词语相似度判断所述第一词语与所述第二词语是否匹配成功;若匹配成功,则将含有对应所述第一词语的文章进行显示。所述的基于关 ...
【技术保护点】
一种基于关键词的精确检索方法,其特征在于,所述方法包括:接收用户输入的至少一个关键词,并将所述关键词作为第一词语;获取待检索信息库中文章的名称与摘要的文字信息,并对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;对所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;计算所述第一概念集合中的第一概念与所述第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;根据所述词语相似度判断所述第一词语与所述第二词语是否匹配成功;若匹配成功,则将含有对应所述第一词语的文章进行显示。
【技术特征摘要】
1.一种基于关键词的精确检索方法,其特征在于,所述方法包括:接收用户输入的至少一个关键词,并将所述关键词作为第一词语;获取待检索信息库中文章的名称与摘要的文字信息,并对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;对所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;计算所述第一概念集合中的第一概念与所述第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;根据所述词语相似度判断所述第一词语与所述第二词语是否匹配成功;若匹配成功,则将含有对应所述第一词语的文章进行显示。2.根据权利要求1所述的基于关键词的精确检索方法,其特征在于,在上述步骤中,还包括:将每个关键词作为第一词语;将文字信息分词后得到的各个词语作为第二词语;依次对每个第一词语进行概念拆分,得到与每个第一词语所对应的包含若干个概念的第一概念集合,依次对每个所述第二词语进行概念拆分,得到与每个第二词语所对应的包含若干个概念的第二概念集合;依次计算每个第一词语所属第一概念集合中的第一概念与每个第二词语所属第二概念集合中的第二概念之间的概念相似度,得到每个第一词语与任意一个第二词语之间的词语相似度。3.根据权利要求1所述的基于关键词的精确检索方法,其特征在于,所述计算所述第一概念集合中的第一概念与所述第二概念集合中的第二概念之间的概念相似度包括:计算所述第一概念的第一独立义原与第二概念的第一独立义原之间的第一相似度;计算所述第一概念的第二独立义原与第二概念的第二独立义原之间的第二相似度,所述第二独立义原为语义表达式中除所述第一独立义原以外的所有其他独立义原;计算所述第一概念的关系义原与第二概念的关系义原之间的第三相似度;计算所述第一概念的符号义原与第二概念的符号义原之间的第四相似度;根据所述第一相似度、第二相似度、第三相似度、第四相似度计算所述第一概念与所述第二概念之间的概念相似度。4.根据权...
【专利技术属性】
技术研发人员:向敏明,
申请(专利权)人:东莞市华睿电子科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。