一种医疗设备文档的搜索和浏览方法技术

技术编号:39190292 阅读:12 留言:0更新日期:2023-10-27 08:37
本申请涉及医疗设备技术领域,特别是涉及一种医疗设备文档的搜索和浏览方法。所述方法包括:解析医疗设备的文档;将每一页文档对应的图片、每一页文档内的图片文字内容、每一页文档内的文本文字内容、及文档对应的医疗设备描述信息、文档描述信息、每一页的页描述信息整合为文档页整合数据保存,并通过分词构建所述文档页整合数据对应的分词数据;响应于第一搜索词,确定符合第一搜索词的文档页整合数据并提取信息作为用于显示的搜索结果数据;基于主观特征、客观特征和词频特征,使用预设的排序算法对各搜索结果数据进行排序;聚合后按序显示搜索结果数据。本申请的医疗设备文档的搜索和浏览方法,方便使用者快速高效地搜索和浏览信息。览信息。览信息。

【技术实现步骤摘要】
一种医疗设备文档的搜索和浏览方法


[0001]本申请涉及医疗设备
,特别是涉及一种医疗设备文档的搜索和浏览方法。

技术介绍

[0002]随着医院建设水平和医疗设备技术的不断提高,各种功能特殊,结构复杂的医疗设备不断被研发并参与到实际的医疗诊断和手术过程中。医疗设备在使用过程中,往往会设置多个与医疗设备对应的文档信息,以便运维人员查看,然而随着医疗设备数目的增多、以及每个医疗设备对应的文档增多,再加上文档信息种类的繁杂,导致运维人员在网页端想要快速查找到自己想要的内容越来越困难,体验非常不好。

技术实现思路

[0003]为了解决现有技术存在的不足,本申请的目的在于提供一种医疗设备文档的搜索和浏览方法,以方便运维人员高效搜索浏览文档信息。
[0004]为实现上述目的,本申请提供一种医疗设备文档的搜索和浏览方法,包括:解析医疗设备的每一文档为文档原始数据并保存,所述文档原始数据包括文档对应的图片格式数据、图片内文字数据和文本文字数据;其中,所述图片格式数据包括每一页文档对应的图片;所述图片内文字数据包括每一页文档内图片的图片文字内容;所述文本文字数据包括每一页文档内的文本文字内容;将所述文档页原始数据中每一页文档对应的图片、每一页文档内的图片文字内容、每一页文档内的文本文字内容、及文档对应的医疗设备描述信息、文档描述信息、每一页的页描述信息整合为文档页整合数据保存,并通过分词构建所述文档页整合数据对应的分词数据;响应于第一搜索词,生成所述第一搜索词对应的各分词,遍历所有文档页整合数据及对应的分词数据,确定包括所述第一搜索词或第一搜索词对应的分词的各文档页整合数据,并分别提取各文档页整合数据中的医疗设备描述信息、文档描述信息和页描述信息作为用于显示的搜索结果数据;基于各文档页整合数据的主观特征、客观特征和各文档页整合数据关于所述第一搜索词对应的各分词的词频特征,使用预设的排序算法对各搜索结果数据进行排序;所述主观特征为文档上传人员对文档的评价量化值,所述客观特征为工程师对文档的评价量化值;对排序后的搜索结果数据进行聚合,使各搜索结果数据中对于每一文档只存在排序最高的搜索结果数据,并确定聚合后各搜索结果数据对应的医疗设备描述信息;组装搜索结果数据为列表,使用第一虚拟列表依序显示搜索结果数据为搜索结果,并通过所述聚合后各搜索结果数据对应的医疗设备描述信息对搜索结果进行筛选和再显示;
响应于对显示的搜索结果对应的内容的查看,确定所述搜索结果对应的文档、文档页码和文档对应的图片格式数据,并使用第二虚拟列表从所述文档页码开始显示所述图片格式数据。
[0005]进一步的,所述基于各文档页整合数据的主观特征、客观特征和各文档页整合数据关于所述第一搜索词对应分词的词频特征,使用预设的排序算法对各搜索结果数据进行排序的具体步骤包括:确定文档页整合数据中各项子数据关于所述第一搜索词对应的各分词的词频特征;对文档页整合数据中各项子数据关于所述第一搜索词对应的各分词的词频特征加权整合为文档页整合数据关于第一搜索词的词特征;对所述文档页整合数据的主观特征、客观特征和所述文档页整合数据关于第一搜索词的词频特征进行加权整合,得到文档页整合数据对应的搜索结果数据的排序评分;基于各搜索结果数据的排序评分,对文档页整合数据对应的搜索结果数据进行排序。
[0006]进一步的,所述对文档页整合数据中各项子数据关于所述第一搜索词对应的各分词的词频特征加权整合为文档页整合数据关于第一搜索词的词特征采用如下公式:;;;其中,S为第一搜索词,T为表示符合条件的文档页整合数据,为文档页整合数据T关于第一搜索词S的词特征,m为搜索词S的分词总数,n为文档页整合数据T的子数据项数,为第一搜索词S的逆文档频率,为数据项j关于分词i的词频特征,为数据项j的权重,docFreq表示符合条件的文档页整合数据的数量,docCount表示文档页数据的总数,freq表示分词i在数据项j中出现的频率,k1为词语频率饱和度,b为字段长度归约,为为分词j长度;avgFieldLength为所有分词的平均长度。
[0007]进一步的,所述对所述文档页整合数据的主观特征、客观特征和所述文档页整合数据关于第一搜索词的词频特征进行加权整合,得到文档页整合数据对应的搜索结果数据的排序评分采用如下公式:;其中,为文档页整合数据T对应的搜索结果数据的排序评分,为文档页整合数据T的主观特征,为文档页整合数据T的客观特征。
[0008]进一步的,所述医疗设备描述信息包括:设备型号、设备名称、设备品牌、设备一级分类信息、设备二级分类信息、设备三级分类信息和设备生产商信息;所述文档描述信息包括:文档标题、文档简介、文档类别、文档标识和文档总页数;所述页描述信息包括:文档当
前页页码。
[0009]进一步的,所述提取各文档页整合数据中的医疗设备描述信息、文档描述信息和页描述信息作为用于显示的搜索结果数据包括:提取各文档页整合数据中的设备型号、设备名称、设备品牌、设备一级分类信息、设备二级分类信息、设备三级分类信息、文档标题、文档总页码和当前页的页码作为用于显示的搜索结果数据。
[0010]进一步的,所述通过分词构建所述文档页整合数据对应的分词数据包括:对所述文档页整合数据中的文档描述信息和设备描述信息进行默认分词生成第一分词数据;对所述文档页整合数据中的文档描述信息和设备描述信息进行IK最细粒度分词和自定义分词生成第二分词数据;对所述第一分词数据和所述第二分词数据进行转小写、语气词删除、同义词配置。
[0011]进一步的,所述第一搜索词包括至少一个关键词。
[0012]进一步的,所述方法还包括:基于输入的搜索图,并进行OCR识别确定搜索图中的第一搜索词。
[0013]为实现上述目的,本申请提供的电子设备,包括:处理器;存储器,其上存储有一个或多个在所述处理器上运行的计算机程序指令;其中,所述处理器运行所述计算机指令时,执行如上所述的医疗设备文档的搜索和浏览方法。
[0014]为实现上述目的,本申请提供的计算机可读存储介质,其上存储有计算机指令,当计算机指令被处理器运行时,执行如上所述的医疗设备文档的搜索和浏览方法的步骤。
[0015]本申请提供的医疗设备文档的搜索和浏览方法,通过对医疗设备的文档进行解析、整合等处理生成了文档页整合数据,并根据文档页整合数据适配地相设计了搜索排序算法,方便使用者快速高效的搜索和浏览信息。
[0016]本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。
附图说明
[0017]附图用来提供对本申请的进一步理解,并且构成说明书的一部分,并与本申请的实施例一起,用于解释本申请,并不构成对本申请的限制。在附图中:图1为本申请的一种医疗设备文档的搜索和浏览方法的结构示意图;图2为本申请的构建文档页整合数据对应的分词数据的流程示意图;图3为本申请的使用预设的排序算法对各搜索结果数据进行排序的流程示意图。
具体实施方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗设备文档的搜索和浏览方法,其特征在于,所述方法包括:解析医疗设备的每一文档为文档原始数据并保存,所述文档原始数据包括文档对应的图片格式数据、图片内文字数据和文本文字数据;其中,所述图片格式数据包括每一页文档对应的图片;所述图片内文字数据包括每一页文档内图片的图片文字内容;所述文本文字数据包括每一页文档内的文本文字内容;将所述文档页原始数据中每一页文档对应的图片、每一页文档内的图片文字内容、每一页文档内的文本文字内容、及文档对应的医疗设备描述信息、文档描述信息、每一页的页描述信息整合为文档页整合数据保存,并通过分词构建所述文档页整合数据对应的分词数据;响应于第一搜索词,生成所述第一搜索词对应的各分词,遍历所有文档页整合数据及对应的分词数据,确定包括所述第一搜索词或第一搜索词对应的分词的各文档页整合数据,并分别提取各文档页整合数据中的医疗设备描述信息、文档描述信息和页描述信息作为用于显示的搜索结果数据;基于各文档页整合数据的主观特征、客观特征和各文档页整合数据关于所述第一搜索词对应的各分词的词频特征,使用预设的排序算法对各搜索结果数据进行排序;所述主观特征为文档上传人员对文档的评价量化值,所述客观特征为工程师对文档的评价量化值;对排序后的搜索结果数据进行聚合,使各搜索结果数据中对于每一文档只存在排序最高的搜索结果数据,并确定聚合后各搜索结果数据对应的医疗设备描述信息;组装搜索结果数据为列表,使用第一虚拟列表依序显示搜索结果数据为搜索结果,并通过所述聚合后各搜索结果数据对应的医疗设备描述信息对搜索结果进行筛选和再显示;响应于对显示的搜索结果对应的内容的查看,确定所述搜索结果对应的文档、文档页码和文档对应的图片格式数据,并使用第二虚拟列表从所述文档页码开始显示所述图片格式数据。2.根据权利要求1所述的医疗设备文档的搜索和浏览方法,其特征在于,所述基于各文档页整合数据的主观特征、客观特征和各文档页整合数据关于所述第一搜索词对应分词的词频特征,使用预设的排序算法对各搜索结果数据进行排序的具体步骤包括:确定文档页整合数据中各项子数据关于所述第一搜索词对应的各分词的词频特征;对文档页整合数据中各项子数据关于所述第一搜索词对应的各分词的词频特征加权整合为文档页整合数据关于第一搜索词的词特征;对所述文档页整合数据的主观特征、客观特征和所述文档页整合数据关于第一搜索词的词频特征进行加权整合,得到文档页整合数据对应的搜索结果数据的排序评分;基于各搜索结果数据的排序评分,对文档页整合数据对应的搜索结果数据进行排序。3.根据权利要求2所述的医疗设备文档的搜索和浏览方法,其特征在于,所述对文档页整合数据中各项子数据关于所述第一搜索词对应的各分词的词频特征加权整合为文档页整合数据关于第一搜索词的词特征采用如下公式:;;
;其中,S为第一搜索词,T为表示符合条件的文档页整合数据,为文档页整合数据T关...

【专利技术属性】
技术研发人员:施建卫李引刘芳王玥
申请(专利权)人:苏州阿基米德网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1