一种适用于医疗系统的数据查询方法及系统技术方案

技术编号:32969295 阅读:10 留言:0更新日期:2022-04-09 11:31
本发明专利技术公开了一种适用于医疗系统的数据查询方法及系统,该适用于医疗系统的数据查询方法包括以下步骤:S1、利用预设网络爬虫工具抓取医疗系统内的数据并对其进行预处理,得到文本特征向量;S2、利用预先配置的注意力机制对文本特征向量分配不同的注意力权重,并进行加权求和获得标签特征向量;S3、基于统计语言模型计算所述标签特征向量的分类概率,并添加索引分类标签;S4、将所述索引分类标签导入至医疗检索系统。本发明专利技术提高了医疗检索系统的中文查询信息的准确度和效率性,对医疗系统的研发具有积极意义。发具有积极意义。发具有积极意义。

【技术实现步骤摘要】
一种适用于医疗系统的数据查询方法及系统


[0001]本专利技术涉及医疗数据的
,具体来说,涉及一种适用于医疗系统的数据查询方法及系统。

技术介绍

[0002]医院信息系统的组成主要由硬件系统和软件系统两大部分组成。在硬件方面,要有高性能的中心电子计算机或服务器、大容量的存储装置、遍布医院各部门的用户终端设备以及数据通信线路等,组成信息资源共享的计算机网络;在软件方面,需要具有面向多用户和多种功能的计算机软件系统,包括系统软件、应用软件和软件开发工具等,要有各种医院信息数据库及数据库管理系统。
[0003]临床医疗检索系统为医生进行临床就诊时提供了一定的便利,医生就诊时通过检索查询可得到相关的信息,以做出更好的临床决策,但现有的临床医疗检索系统在检索中文时,其数据库通常采用模糊查询的方式,由于模糊查询的方式较为低效,不仅使得查询速度较慢,且查询得到的数据存在不准确的问题。
[0004]针对相关技术中的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]针对相关技术中的问题,本专利技术提出一种适用于医疗系统的数据查询方法及系统,以克服现有相关技术所存在的上述技术问题。
[0006]为此,本专利技术采用的具体技术方案如下:
[0007]根据本专利技术的一个方面,提供了一种适用于医疗系统的数据查询方法,该方法包括以下步骤:
[0008]S1、利用预设网络爬虫工具抓取医疗系统内的数据并对其进行预处理,得到文本特征向量;
[0009]S2、利用预先配置的注意力机制对文本特征向量分配不同的注意力权重,并进行加权求和获得标签特征向量;
[0010]S3、基于统计语言模型计算所述标签特征向量的分类概率,并添加索引分类标签;
[0011]S4、将所述索引分类标签导入至医疗检索系统。
[0012]进一步的,所述利用网络爬虫工具抓取医疗系统内的数据并对其进行预处理,得到文本特征向量还包括以下步骤:
[0013]S11、将待分类的医疗系统数据文本进行分词并获得词序列;
[0014]S12、依次将所述词序列中每个词的语义信息对应转换成为词向量,并集成词向量矩阵;
[0015]S13、将所述词向量矩阵输入注意力机制中,并利用注意力机制矩阵提取文本特征向量。
[0016]进一步的,所述将待分类的医疗系统数据文本进行分词并获得词序列还包括以下
步骤:
[0017]定义每个词序列中有n个词数,且n是预先设定的序列长度;
[0018]若文本词数超过n,则多余的部分将被剔除;
[0019]若文本词数不满足n,则自动填充占位符。
[0020]进一步的,所述利用注意力机制对文本特征向量分配不同的注意力权重并进行加权求和,获得标签特征向量还包括以下步骤:
[0021]S21、将类别标签层次结构中第一层的每个标签创建标签注意向量,并随机初始化;
[0022]S22、利用注意力机制为文本特征向量分配不同的注意力权重;
[0023]S23、将每个文本特征向量与注意力权重进行加权求和,得到标签特征向量;
[0024]S24、获得与标签层次结构中第一层的所有标签相对应的标签特征向量。
[0025]进一步的,所述基于统计语言模型计算标签特征向量的分类概率,并添加索引分类标签还包括以下步骤:
[0026]S31、将标签特征向量连接统计语言模型;
[0027]S32、计算所述统计语言模型的输出,并得到每个标签的分类概率;
[0028]S33、根据分类概率输出添加索引分类标签。
[0029]根据本专利技术的另一方面,提供了一种适用于医疗系统的数据查询系统,该系统包括:
[0030]预处理模块,用于利用预设网络爬虫工具抓取医疗系统内的数据并对其进行预处理,得到文本特征向量;
[0031]权重分配模块,用于利用预先配置的注意力机制对文本特征向量分配不同的注意力权重,并进行加权求和获得标签特征向量;
[0032]分类概率计算模块,用于基于统计语言模型计算所述标签特征向量的分类概率,并添加索引分类标签;
[0033]标签导入模块,用于将所述索引分类标签导入至医疗检索系统。
[0034]进一步的,所述利用网络爬虫工具抓取医疗系统内的数据并对其进行预处理,得到文本特征向量还包括以下步骤:
[0035]将待分类的医疗系统数据文本进行分词并获得词序列;
[0036]依次将所述词序列中每个词的语义信息对应转换成为词向量,并集成词向量矩阵;
[0037]将所述词向量矩阵输入注意力机制中,并利用注意力机制矩阵提取文本特征向量。
[0038]进一步的,所述将待分类的医疗系统数据文本进行分词并获得词序列还包括以下步骤:
[0039]定义每个词序列中有n个词数,且n是预先设定的序列长度;
[0040]若文本词数超过n,则多余的部分将被剔除;
[0041]若文本词数不满足n,则自动填充占位符。
[0042]进一步的,所述利用注意力机制对文本特征向量分配不同的注意力权重并进行加权求和,获得标签特征向量还包括以下步骤:
[0043]将类别标签层次结构中第一层的每个标签创建标签注意向量,并随机初始化;
[0044]利用注意力机制为文本特征向量分配不同的注意力权重;
[0045]将每个文本特征向量与注意力权重进行加权求和,得到标签特征向量;
[0046]获得与标签层次结构中第一层的所有标签相对应的标签特征向量。
[0047]进一步的,所述基于统计语言模型计算标签特征向量的分类概率,并添加索引分类标签还包括以下步骤:
[0048]将标签特征向量连接统计语言模型;
[0049]计算所述统计语言模型的输出,并得到每个标签的分类概率;
[0050]根据分类概率输出添加索引分类标签。
[0051]本专利技术的有益效果为:本专利技术通过网络爬虫工具抓取医疗系统内的数据并对其进行预处理,得到文本特征向量,利用注意力机制对文本特征向量分配不同的注意力权重并进行加权求和,获得标签特征向量,基于统计语言模型计算标签特征向量的分类概率,添加索引分类标签,将索引分类标签导入医疗检索系统中,便于后期查询,同时,本专利技术提高了医疗检索系统的中文查询信息的准确度和效率性,对医疗系统的研发具有积极意义。
附图说明
[0052]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0053]图1是根据本专利技术实施例的一种适用于医疗系统的数据查询方法的流程图;
[0054]图2是根据本专利技术实施例的一种适用于医疗系统的数据查询系统的原理框图。
[0055]图中:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适用于医疗系统的数据查询方法,其特征在于,该方法包括以下步骤:S1、利用预设网络爬虫工具抓取医疗系统内的数据并对其进行预处理,得到文本特征向量;S2、利用预先配置的注意力机制对文本特征向量分配不同的注意力权重,并进行加权求和获得标签特征向量;S3、基于统计语言模型计算所述标签特征向量的分类概率,并添加索引分类标签;S4、将所述索引分类标签导入至医疗检索系统。2.根据权利要求1所述的一种适用于医疗系统的数据查询方法,其特征在于,所述利用网络爬虫工具抓取医疗系统内的数据并对其进行预处理,得到文本特征向量还包括以下步骤:S11、将待分类的医疗系统数据文本进行分词并获得词序列;S12、依次将所述词序列中每个词的语义信息对应转换成为词向量,并集成词向量矩阵;S13、将所述词向量矩阵输入注意力机制中,并利用注意力机制矩阵提取文本特征向量。3.根据权利要求2所述的一种适用于医疗系统的数据查询方法,其特征在于,所述将待分类的医疗系统数据文本进行分词并获得词序列还包括以下步骤:定义每个词序列中有n个词数,且n是预先设定的序列长度;若文本词数超过n,则多余的部分将被剔除;若文本词数不满足n,则自动填充占位符。4.根据权利要求1所述的一种适用于医疗系统的数据查询方法,其特征在于,所述利用注意力机制对文本特征向量分配不同的注意力权重并进行加权求和,获得标签特征向量还包括以下步骤:S21、将类别标签层次结构中第一层的每个标签创建标签注意向量,并随机初始化;S22、利用注意力机制为文本特征向量分配不同的注意力权重;S23、将每个文本特征向量与注意力权重进行加权求和,得到标签特征向量;S24、获得与标签层次结构中第一层的所有标签相对应的标签特征向量。5.根据权利要求1所述的一种适用于医疗系统的数据查询方法,其特征在于,所述基于统计语言模型计算标签特征向量的分类概率,并添加索引分类标签还包括以下步骤:S31、将标签特征向量连接统计语言模型;S32、计算所述统计语言模型的输出,并得到每个标签的分类概率;S33、根据分类概率输出添加索引分类标签。6.一种适用于医疗系统的数据查询系...

【专利技术属性】
技术研发人员:李华京杜雯翀王静魏涛
申请(专利权)人:垒途智能教科技术研究院江苏有限公司中津软件南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1