生物医学资料搜索方法、系统、装置及存储介质制造方法及图纸

技术编号:34471165 阅读:16 留言:0更新日期:2022-08-10 08:45
本发明专利技术公开了一种生物医学资料搜索方法、系统、装置及存储介质,包括:获取用户输入的搜索文本,并对搜索文本进行分词得到第一分词集合;搜索文本包括疾病文本或基因文本或动物模型中的任一种;计算第一分词集合与预设的数据库索引的搜索得分;根据搜索得分从预设的数据库中筛选出预设数量的生物医学资料,并根据预设数量的生物医学资料进行显示;其中,预设的数据库索引通过以下方法建立:从预设的数据库中筛选出各生物医学资料的索引段落;对索引段落进行分词得到第二分词集合;根据第二分词集合建立数据库索引。本发明专利技术实施例能够提高搜索到目标生物医学资料的概率且搜索速度,可广泛应用于互联网技术领域。应用于互联网技术领域。应用于互联网技术领域。

【技术实现步骤摘要】
生物医学资料搜索方法、系统、装置及存储介质


[0001]本专利技术涉及互联网
,尤其涉及一种生物医学资料搜索方法、系统、装置及存储介质。

技术介绍

[0002]随着社会的发展,健康状况受到广泛关注,一些医学专业相关网站可以为用户提供搜索查询服务,为用户提供相关疾病的相关资料以供查询、了解或学习。但是,目前有些网站需要通过用户输入专业词汇才能查询到相对准确的相关资料,搜索反应时间长,对于一般普通用户较难确定相对准确的专业词汇,这样还会导致一般普通用户搜索到目标生物医学资料的概率较低。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的是提供一种生物医学资料搜索方法、系统、装置及存储介质,能够提高搜索到目标生物医学资料的概率和搜索速度。
[0004]第一方面,本专利技术实施例提供了一种生物医学资料搜索方法,包括以下步骤:
[0005]获取用户输入的搜索文本,并对所述搜索文本进行分词得到第一分词集合;所述搜索文本包括疾病文本或基因文本或动物模型中的任一种;
[0006]计算所述第一分词集合与预设的数据库索引的搜索得分;
[0007]根据所述搜索得分从预设的数据库中筛选出预设数量的生物医学资料,并根据所述预设数量的生物医学资料进行显示;
[0008]其中,预设的数据库索引通过以下方法建立:
[0009]从预设的数据库中筛选出各生物医学资料的索引段落;
[0010]对所述索引段落进行分词得到第二分词集合;
[0011]根据所述第二分词集合建立数据库索引。
[0012]可选地,计算所述第一分词集合与预设的数据库索引的搜索得分,具体包括:
[0013]计算所述第一分词集合与所述预设的数据库索引的相关性得分;
[0014]根据所述相关性得分、所述预设的数据库索引的信息丰富度得分及对应的预设权重计算所述预设的数据库索引的搜索得分。
[0015]可选地,所述相关性得分的计算公式如下:
[0016][0017]其中,score(t,q,d)表示包含单词t的文档d在文档集合q中的相关性得分,n表示单词t在文档集合q中出现的总次数,idf(t)表示逆向文件频率,Boost(t)表示指定的单词t的权重,tfNorm(t,d)表示单词t在文档d中的频率权重。
[0018]可选地,所述逆向文件频率的计算公式如下:
[0019][0020]其中,docCount表示文档总数,docFreq表示包含单词t的文档数量。
[0021]可选地,所述单词t在文档d中的频率权重的计算公式如下:
[0022][0023]其中,f(t,d)表示单词t在文档d中出现的次数,k1表示词语频率饱和度,b表示字段长度归约,|D|表示单词t的文本长度,avgdl表示文档集合中q包含单词t的索引文本的平均长度。
[0024]可选地,根据所述搜索得分从预设的数据库中筛选出预设数量的生物医学资料,并根据所述预设数量的生物医学资料进行显示,具备包括:
[0025]将所述搜索得分按高低顺序进行排序;
[0026]选取搜索得分排名靠前的预设数量的数据库索引,并根据所述预设数量的数据库索引确定对应预设数量的生物医学资料;
[0027]从所述预设数量的生物医学资料中选取第一显示内容,并根据第一显示内容补充第二显示内容;
[0028]将所述第一显示内容及所述第二显示内容按照预设样式显示。
[0029]第二方面,本专利技术实施例提供了一种生物医学资料搜索系统,包括:
[0030]第一模块,用于获取用户输入的搜索文本,并对所述搜索文本进行分词得到第一分词集合;所述搜索文本包括疾病文本或基因文本或动物模型中的任一种;
[0031]第二模块,用于计算所述第一分词集合与预设的数据库索引的搜索得分;
[0032]第三模块,用于根据所述搜索得分从预设的数据库中筛选出预设数量的生物医学资料,并各级所述预设数量的生物医学资料进行显示;
[0033]其中,预设的数据库索引通过以下方法建立:
[0034]从预设的数据库中筛选出各生物医学资料的索引段落;
[0035]对所述索引段落进行分词得到第二分词集合;
[0036]根据所述第二分词集合建立数据库索引。
[0037]第三方面,本专利技术实施例提供了一种生物医学资料搜索装置,包括:
[0038]至少一个处理器;
[0039]至少一个存储器,用于存储至少一个程序;
[0040]当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述的方法。
[0041]第四方面,本专利技术实施例提供了一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行上述的方法。
[0042]第五方面,本专利技术实施例提供了一种生物医学资料搜索系统,包括若干个数据库以及与所述若干个数据库连接的计算机设备;其中,
[0043]所述若干个数据库,用于获取各生物医学资料;
[0044]所述计算机设备包括:
[0045]至少一个处理器和一个显示器,所述显示器用于显示搜索网页;
[0046]至少一个存储器,用于存储至少一个程序;
[0047]当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述的方法。
[0048]实施本专利技术实施例包括以下有益效果:本实施例中首先对预设的数据库中的生物医学资料筛选出索引段落,再对索引段落进行分词得到第二分词集合,并根据第二分词集合建立数据库索引;然后对用户输入的搜索文本进行分词得到第一分词集合,计算第一分词集合及数据库索引的搜索得分,并根据搜索得分从数据库中筛选出一定数量的生物医学资料并进行显示;通过从数据库中的生物医学资料筛选出索引段落,对索引段落进行分词并建立数据库索引,增加了数据库索引的数据来源及准确性,从而实现提高搜索到目标生物医学资料的概率和搜索速度。
附图说明
[0049]图1是本专利技术实施例提供的一种生物医学资料搜索方法的步骤流程示意图;
[0050]图2是本专利技术实施例提供的一种生物医学资料搜索系统的结构框图;
[0051]图3是本专利技术实施例提供的一种生物医学资料搜索装置的结构框图;
[0052]图4是本专利技术实施例提供的一种生物医学资料搜索系统的另一种结构框图。
具体实施方式
[0053]下面结合附图和具体实施例对本专利技术做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0054]如图1所示,本专利技术实施例提供了一种生物医学资料搜索方法,其包括的步骤如下所示。
[0055]S100、获取用户输入的搜索文本,并对所述搜索文本进行分词得到第一分词集合;所述搜索文本包括疾病文本或基因文本或动物模型中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生物医学资料搜索方法,其特征在于,包括:获取用户输入的搜索文本,并对所述搜索文本进行分词得到第一分词集合;所述搜索文本包括疾病文本或基因文本或动物模型中的任一种;计算所述第一分词集合与预设的数据库索引的搜索得分;根据所述搜索得分从预设的数据库中筛选出预设数量的生物医学资料,并根据所述预设数量的生物医学资料进行显示;其中,预设的数据库索引通过以下方法建立:从预设的数据库中筛选出各生物医学资料的索引段落;对所述索引段落进行分词得到第二分词集合;根据所述第二分词集合建立数据库索引。2.根据权利要求1所述的方法,其特征在于,计算所述第一分词集合与预设的数据库索引的搜索得分,具体包括:计算所述第一分词集合与所述预设的数据库索引的相关性得分;根据所述相关性得分、所述预设的数据库索引的信息丰富度得分及对应的预设权重计算所述预设的数据库索引的搜索得分。3.根据权利要求1所述的方法,其特征在于,所述相关性得分的计算公式如下:其中,score(t,q,d)表示包含单词t的文档d在文档集合q中的相关性得分,n表示单词t在文档集合q中出现的总次数,idf(t)表示逆向文件频率,Boost(t)表示指定的单词t的权重,tfNorm(t,d)表示单词t在文档d中的频率权重。4.根据权利要求3所述的方法,其特征在于,所述逆向文件频率的计算公式如下:其中,docCount表示文档总数,docFreq表示包含单词t的文档数量。5.根据权利要求3所述的方法,其特征在于,所述单词t在文档d中的频率权重的计算公式如下:其中,f(t,d)表示单词t在文档d中出现的次数,k1表示词语频率饱和度,b表示字段长度归约,|D|表示单词t的文本长度,avgdl表示文档集合中q包含单词t的索引文本的平均长度。6.根据权利要求1

5任一项所述的方法,其特征在于,根据所述搜索得分从预设的数据库中筛选出预设数量的生物医学资料,并根据所述预设数量的生物医...

【专利技术属性】
技术研发人员:颜志辉黄颖沈超田栋铭霍癸酉韩蓝青
申请(专利权)人:广州赛业百沐生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1