一种基于简化标签的知识匹配方法、系统及设备技术方案

技术编号:22000143 阅读:51 留言:0更新日期:2019-08-31 05:22
本发明专利技术提供一种基于简化标签的知识匹配方法及系统,其中方法包括获取询问描述语句,还包括以下步骤:提取所述语句的知识主干信息;对信息知识进行匹配。本发明专利技术提出一种针对普通用户的基于简化标签的知识匹配方法及系统,针对询问描述句子主干信息进行提取和匹配知识,可实现根据询问句子的主要信息匹配已有数据知识,以及具有同义词关系的知识。

A Knowledge Matching Method, System and Equipment Based on Simplified Label

【技术实现步骤摘要】
一种基于简化标签的知识匹配方法、系统及设备
本专利技术涉及医疗诊断的
,特别是一种基于简化标签的知识匹配方法及系统。
技术介绍
随着人们生活节奏加快,各种疾病也随即而来,传统的就医手段需要一系列的手续,很浪费时间。医疗健康信息处理主要利用信息技术对与人类医疗健康相关的数据进行处理,挖掘蕴含在这些数据中的有用信息和规律,弥补医疗资源的短缺,为实现智能化医疗、提高人类医疗健康服务水平提供技术支撑。健康是促进人类发展的必然要求,医疗健康相关领域的发展关乎社会和谐与民生幸福,目前存在的问题主要为如何快速的对信息进行检索,即如何根据询问语句中包含的信息匹配知识库中的知识,其难点在于要根据询问语句的句子主干信息匹配出知识,但用户叙述的描述性语句通常只含有要询问知识的关键词的信息,此外通过语音途径获得的语句也可能包含错误的文字,并不包含一个知识的完整叙述,这样使得以往的数据库查询技术不再适合使用。公开号为CN107993724A的专利技术专利公开了一种医学智能问答数据处理的方法及装置,其中方法包括:在用户查询问题数据中提取问题关键词,进行同义转换,确定问题关键词的同义词组;根据问题关键词的同义词组在预先设定的问答对知识库和规则知识库进行查找;若成功,输出问题关键词的同义词组中问题关键词及其同义词对应的答案结果数据;若失败,对问题关键词进行语义扩展处理,得到问题关键词及其同义词的下位词的同义词组;根据问题关键词及其同义词的下位词的同义词组继续匹配查找,生成包含检索结果的检索结果列表;对检索结果列表中的检索结果进行相似度计算,确定各检索结果的相似度;根据各检索结果的相似度对各检索结果进行排序并输出。在该方法中的知识库和规则模板知识库的仍需要较大的规模,目前建立这种知识库的方法大多还是采用手工或半手工方法,库中的问答对越丰富,规则模板越详细,匹配失败的可能性越小,查询的精度也相对越高,然而带来的工作量增大、所需的时间和成本提高,限制了此类方法的使用。该方法不能从根本上解决前述预先建立知识库和后期对知识库的维护扩充时工作量大、耗时长、成本高等问题。
技术实现思路
为了解决上述的问题,本专利技术提出一种针对普通用户的基于简化标签的知识匹配方法及系统,针对询问描述句子主干信息进行提取和匹配知识,可实现根据询问句子的主要信息匹配已有数据知识,以及具有同义词关系的知识。本专利技术的第一目的是提供了一种基于简化标签的知识匹配方法,包括对用户上传的医院检查报告单进行OCR识别,还包括以下步骤:步骤1:进行异常指标信息的抓取;步骤2:生成电子检查报告信息;步骤3:结合专家知识库,自动生成推荐信息;步骤4:根据所述推荐信息,生成所述医院检查报告单的解读文件。优选的是,所述步骤1包括以下子步骤:步骤11:指标关键词抓取;步骤12:指标异常信息的判断;步骤13:指标异常信息的确认。在上述任一方案中优选的是,所述步骤11还包括根据专家知识库中的指标名称从所述OCR识别结果中匹配指标关键词。在上述任一方案中优选的是,使用文本相似算法计算相似度。相似度超过相似阈值的自动确认为该指标关键词。在上述任一方案中优选的是,所述步骤11还包括根据识别出来的所述指标关键词结合所述专家知识库判断项目类别。在上述任一方案中优选的是,所述步骤12还包括在所述指标关键词的相邻位置查找指标异常标志,来判断指标的状态。在上述任一方案中优选的是,所述步骤12还包括在所述指标关键词的相邻位置抓取指标对应的结果和范围。判断指标是否异常。在上述任一方案中优选的是,所述步骤13还包括根据所述确认结果,识别出错误和/或漏掉信息,对指标信息进行删除、修改和增加中至少一种操作。在上述任一方案中优选的是,所述确认包括计算机确认和用户确认。在上述任一方案中优选的是,所述解读文件包括指标的临床意义和/或健康指导。本专利技术的第二目的是一种基于简化标签的知识匹配系统,包括用于对用户上传的医院检查报告单进行OCR识别的识别模块,还包括以下模块:抓取模块:用于进行异常指标信息的抓取;生成模块:用于生成电子检查报告信息;推荐模块:用于结合专家知识库,自动生成推荐信息;解读模块:根据所述推荐信息,生成所述医院检查报告单的解读文件;专家知识库:用于存储指标信息、指标含义和健康指导信息中至少一种。。优选的是,所述抓取模块包括以下子模块:关键词子模块:用于指标关键词抓取;判断子模块:用于指标异常信息的判断;确认子模块:用于指标异常信息的确认。在上述任一方案中优选的是,所述关键词子模块还用于根据专家知识库中的指标名称从所述OCR识别结果中匹配指标关键词。在上述任一方案中优选的是,使用文本相似算法计算相似度。相似度超过相似阈值的自动确认为该指标关键词。在上述任一方案中优选的是,所述关键词子模块还用于根据识别出来的所述指标关键词结合所述专家知识库判断项目类别。在上述任一方案中优选的是,所述判断子模块还用于在所述指标关键词的相邻位置查找指标异常标志,来判断指标的状态。在上述任一方案中优选的是,所述判断子模块还用于在所述指标关键词的相邻位置抓取指标对应的结果和范围。判断指标是否异常。在上述任一方案中优选的是,所述确认子模块还用于根据所述确认结果,识别出错误和/或漏掉信息,对指标信息进行删除、修改和增加中至少一种操作。在上述任一方案中优选的是,所述确认包括计算机确认和用户确认。在上述任一方案中优选的是,所述解读文件包括指标的临床意义和/或健康指导。本专利技术提出了一种基于简化标签的知识匹配方法及系统,解决了以往查询匹配中的多个检索问题,利用了句法分析、分词、同义词、SQL查询等技术,减少了检索的输入、实现关键词的无序输入、也实现了同义词检索。附图说明图1为按照本专利技术的基于简化标签的知识匹配方法的一优选实施例的流程图。图2为按照本专利技术的基于简化标签的知识匹配系统的一优选实施例的模块图。图3为按照本专利技术的基于简化标签的知识匹配方法的解读报告单的一实施例的指标关键词示意图。图4为按照本专利技术的基于简化标签的知识匹配方法的解读报告单的另一实施例的报告单原图。图5为按照本专利技术的基于简化标签的知识匹配方法的解读报告单的再一实施例的报告单原图。具体实施方式下面结合附图和具体的实施例对本专利技术做进一步的阐述。实施例一如图1、2所示,执行步骤100,获取询问描述语句。执行步骤110,提取模块210提取所述语句的知识主干信息。在所述步骤110中,执行步骤111,规则建立子模块211根据现在汉语的成分分析法,建立目前句子主干结构的组成规则。执行步骤112,语句分析子模块212以所述询问描述语句为根节点T,对所述询问描述语句进行句法分析,将分析的结果作为一个子节点,得到句子的下一层结构,根据所述组成规则对每个节点的成分进行过滤,得到主要成分。执行步骤113,成分组合子模块213将步骤112中得到的主要成分进行组合,得到句子的主要成分,即已有知识的标签。执行步骤114,核对修改子模块214对所述知识标签进行人工的核对,修改其中不准确的标签以及前后有冲突的数据。执行步骤120,匹配模块220对信息知识进行匹配。在所述步骤120中,执行步骤121,关系表制作子模块221对已有知识表述提取的所述主干信息,制作“原知识—标签映射”关系表。步骤122,同义词替换子模块本文档来自技高网
...

【技术保护点】
1.一种基于简化标签的知识匹配方法,包括获取询问描述语句,其特征在于,还包括以下步骤:步骤1:提取所述语句的知识主干信息;步骤2:对信息知识进行匹配。

【技术特征摘要】
1.一种基于简化标签的知识匹配方法,包括获取询问描述语句,其特征在于,还包括以下步骤:步骤1:提取所述语句的知识主干信息;步骤2:对信息知识进行匹配。2.如权利要求1所述的基于简化标签的知识匹配方法,其特征在于,所述步骤1包括以下子步骤:步骤11:根据现在汉语的成分分析法,建立目前句子主干结构的组成规则;步骤12:以所述询问描述语句为根节点T,对所述询问描述语句进行句法分析;步骤13:将步骤12中得到的主要成分进行组合,得到句子的主要成分,即已有知识的标签;步骤14:对所述知识标签进行人工的核对,修改其中不准确的标签以及前后有冲突的数据。3.如权利要求2所述的基于简化标签的知识匹配方法,其特征在于,所述步骤12还包括将分析的结果作为一个子节点,得到句子的下一层结构。4.如权利要求3所述的基于简化标签的知识匹配方法,其特征在于,所述步骤12还包括根据所述组成规则对每个节点的成分进行过滤,得到主要成分。5.如权利要求4所述的基于简化标签的知识匹配方法,其特征在于,所述步骤2包括以下子步骤:步骤21:对已有知识表述提取的所述主干信息,制作“原知识—标签映射”关系表;步骤22:对标签进行同义词替换,得到标准表述的映射关系列表;步骤23:将所述标签列进行分词,并将分词后的结果按词性划分到各个维度中;步骤...

【专利技术属性】
技术研发人员:吕军震陈烽刘爱民汤青
申请(专利权)人:深圳宇诺智能有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1