智能结构化搜索系统及其搜索方法技术方案

技术编号:15542405 阅读:125 留言:0更新日期:2017-06-05 11:22
本发明专利技术提供了一种智能结构化搜索系统,包括采集模块,用于采集客户端输入的自然语言查询数据;处理模块,用于对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换;分析模块,用于分析识别处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;数据存储模块,用于存储结构化数据及关系数据;查询模块,将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出。本发明专利技术还公开了一种智能结构化搜索系统的搜索方法。本发明专利技术用户可随意输入搜索条件,操作简单,能够准确的实现搜索需求。

Intelligent structured search system and search method thereof

The invention provides a structured intelligent search system, including data acquisition module, for natural language acquisition client input query data; processing module is used to convert the character set of natural language query data, the Chinese and non Chinese unified data conversion for the same character set, the natural language character set conversion after the query data resolution for individual words, and words are synonyms for each keyword conversion; analysis module is used to analyze the recognition module after processing words, according to the semantic logical expression or structured logic tree; data storage module for storing structured data and relational data; query module, comparing the data of logical expressions or structured logic the tree and the data storage module, and query result output. The invention also discloses a search method of an intelligent structured search system. The user can input the search condition at will, the operation is simple, and the search requirement can be realized accurately.

【技术实现步骤摘要】
智能结构化搜索系统及其搜索方法
本专利技术涉及医疗信息领域,更具体地,涉及一种智能结构化搜索系统及其搜索方法。
技术介绍
随着信息技术的发展和医疗信息化的建设,现在医院及各种医疗机构早已实施了各类信息化系统软件,如“HIS(医院信息管理系统)”、“EMR(电子病历系统)”、“PACS(医学影像存档及传输系统)”、“RIS(影像信息管理系统)”等。随着信息化系统遍布各个医疗领域,多年以来,生成并积攒了大量数据,其中既有基本的患者人口学信息,也有非常有价值的医学诊断等大量信息,如何对这些数据进行快速有效的搜索成为日益困难的问题。现有的信息系统软件,对于搜索条件的录入主要有如下三种方式:1直接列出所有的搜索项供用户选择(如图1所示),该种方法虽然操作简单,但是搜索条件严格受限于软件的设计,即使有的软件可以在后期填加查询项目,也不可能把所有可能性全部排布到软件界面中。2采用树型结构显示更多的查询项目(如图2所示),此方法虽然可以不受屏幕空间的限制,显示更多的查询项目,但也无法穷举出所有的查询可能;而且操作复杂,界面繁琐,用户不易找到自己想要的查询项目。3类似百度等搜索引擎,查询关键字,虽然此种方法比较灵活,可以任意录入内容,但是只能进行关键字匹配查询,无法精确定位,使用极其受限。例如无法实现类似于“所有年龄大于50岁的患者”的搜索。因此以上无论何种方法,都无法简单并且准确的实现搜索需求。随着医疗信息系统的普及以及深入应用,更多未知类型的数据正在产生,因此如何帮助医生及其他用户方便准确的搜索到感兴趣数据也日益迫切。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种智能结构化搜索系统及其搜索方法,能够解决现有技术中存在的搜索不准确、操作复杂以及搜索界面繁琐的问题。为达到上述目的,本专利技术的技术方案是这样实现的:一方面,本专利技术提供了一种智能结构化搜索系统,包括采集模块、处理模块、分析模块、数据存储模块和查询模块,其中,采集模块,与处理模块相连,用于采集客户端输入的自然语言查询数据;处理模块,分别与采集模块和分析模块相连,用于对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换,根据同义词字典进行同义词归一;分析模块,与处理模块相连,用于分析识别处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;数据存储模块,与查询模块相连,用于存储结构化数据以及关系数据;查询模块,分别与分析模块和数据存储模块相连,将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出。优选地,当分析模块生成的是逻辑表达式时,查询模块将逻辑表达式与关系数据进行对比,并将符合该逻辑表达式的相关数据输出。优选地,当分析模块生成的是结构化逻辑树时,查询模块将结构化逻辑树与结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。优选地,分析模块还包括结构化语言查询生成单元,用于将逻辑表达式生成结构化语言查询表达式,此时,查询模块将结构化语言查询表达式与关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。优选地,该系统还包括存储模块,与查询模块相连,用于在查询模块输出查询结果之后自动保存客户端输入的自然语言查询数据。另一方面,本专利技术还提供了一种智能结构化搜索系统的搜索方法,包括:采集模块采集客户端输入的自然语言查询数据;处理模块对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换,根据同义词字典进行同义词归一;分析模块分析识别处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;查询模块将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出;其中,数据存储模块存储的数据为结构化数据以及关系数据。优选地,当分析模块生成的是逻辑表达式时,查询模块将逻辑表达式与关系数据进行对比,并将符合该逻辑表达式的相关数据输出。优选地,当分析模块生成的是结构化逻辑树时,查询模块将结构化逻辑树与结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。优选地,该方法还包括:结构化语言查询生成单元将逻辑表达式生成结构化语言查询表达式,此时,查询模块将结构化语言查询表达式与关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。优选地,在查询模块输出查询结果之后,存储模块自动保存客户端输入的自然语言查询数据。本专利技术的技术效果:1.由于本专利技术中设置了处理模块和分析模块,用户可以随意输入搜索条件,例如,用户可以直接以“年龄大于50岁”、“有吸烟史”、“左肺有肿瘤”等作为搜索条件,可以将用户输入的自然语言查询数据进行处理并生成逻辑表达式或结构化逻辑树,不受软件设计或现有的数据种类的限制,兼容未来新产生的数据,使用户操作简单,易于使用,提高了搜索效率;2.本专利技术不受搜索条件限制,解决了现有技术中存在的搜索受限于软件本身的设计,无法穷举所有的搜索可能的问题,能够简单准确的实现搜索需求,提高了搜索的准确度;3.由于本专利技术设置了存储模块,在查询模块输出查询结果之后自动保存客户端输入的自然语言查询数据,自动保存历史搜索条件,随着搜索次数的增多,本专利技术可以根据用户的录入习惯自动提示相关的搜索条件,方便了用户的录入,使之更加人性化。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1示出了现有技术中直接列出所有的搜索项用户界面示意图;图2示出了现有技术中树型结构显示的用户界面示意图;图3示出了根据本专利技术实施例一的智能结构化搜索系统结构示意图;图4示出了根据本专利技术实施例一的智能结构化搜索系统的文本结构树示意图;图5示出了根据本专利技术实施例一的智能结构化搜索系统的文本结构树示意图;图6示出了根据本专利技术实施例一的智能结构化搜索系统中分析模块生成逻辑表达式的示意图;图7示出了根据本专利技术实施例一的智能结构化搜索系统中分析模块生成结构化逻辑树的示意图;图8示出了根据本专利技术实施例二的智能结构化搜索系统结构示意图;图9示出了根据本专利技术实施例三的智能结构化搜索系统结构示意图;图10示出了根据本专利技术实施例四的智能结构化搜索系统的搜索方法流程图;图11示出了根据本专利技术实施例四的智能结构化搜索系统的搜索方法中文本结构树示意图;图12示出了根据本专利技术实施例四的智能结构化搜索系统的搜索方法中文本结构树示意图;图13示出了根据本专利技术实施例四的智能结构化搜索系统的搜索方法中逻辑表达式生成的示意图;图14示出了根据本专利技术实施例四的智能结构化搜索系统的搜索方法中结构化逻辑树生成的示意图。具体实施方式下面将参考附图并结合实施例,来详细说明本专利技术。实施例一图3示出了根据本专利技术实施例一的智能结构化搜索系统结构示意图;如图1所示,该系统包括:采集模块10、处理模块20、分析模块30、数据存储模块40和查询模块50,其中,采集模块10,与处理模块20相连,用于采集客户端输入的自然语言查询数据;处理模块20,分别与采集模块10和分析模块本文档来自技高网...
智能结构化搜索系统及其搜索方法

【技术保护点】
一种智能结构化搜索系统,其特征在于,包括采集模块、处理模块、分析模块、数据存储模块和查询模块,其中,所述采集模块,与所述处理模块相连,用于采集客户端输入的自然语言查询数据;所述处理模块,分别与所述采集模块和所述分析模块相连,用于对所述自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的所述自然语言查询数据拆分为单独的关键词词汇,并对每个所述关键词词汇进行同义词转换,根据同义词字典进行同义词归一;所述分析模块,与所述处理模块相连,用于分析识别所述处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;所述数据存储模块,与所述查询模块相连,用于存储结构化数据以及关系数据;所述查询模块,分别与所述分析模块和所述数据存储模块相连,将所述逻辑表达式或所述结构化逻辑树与所述数据存储模块中的数据进行对比,并将查询结果输出。

【技术特征摘要】
1.一种智能结构化搜索系统,其特征在于,包括采集模块、处理模块、分析模块、数据存储模块和查询模块,其中,所述采集模块,与所述处理模块相连,用于采集客户端输入的自然语言查询数据;所述处理模块,分别与所述采集模块和所述分析模块相连,用于对所述自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的所述自然语言查询数据拆分为单独的关键词词汇,并对每个所述关键词词汇进行同义词转换,根据同义词字典进行同义词归一;所述分析模块,与所述处理模块相连,用于分析识别所述处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;所述数据存储模块,与所述查询模块相连,用于存储结构化数据以及关系数据;所述查询模块,分别与所述分析模块和所述数据存储模块相连,将所述逻辑表达式或所述结构化逻辑树与所述数据存储模块中的数据进行对比,并将查询结果输出。2.根据权利要求1所述的智能结构化搜索系统,其特征在于,当所述分析模块生成的是逻辑表达式时,所述查询模块将所述逻辑表达式与所述关系数据进行对比,并将符合该逻辑表达式的相关数据输出。3.根据权利要求1所述的智能结构化搜索系统,其特征在于,当所述分析模块生成的是结构化逻辑树时,所述查询模块将所述结构化逻辑树与所述结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。4.根据权利要求1所述的智能结构化搜索系统,其特征在于,所述分析模块还包括结构化语言查询生成单元,用于将所述逻辑表达式生成结构化语言查询表达式,此时,所述查询模块将所述结构化语言查询表达式与所述关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。5.根据权利要求1所述的智能结构化搜索系统,其特征在于,该系统...

【专利技术属性】
技术研发人员:贺长征
申请(专利权)人:北京赛迈特锐医疗科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1