【技术实现步骤摘要】
一种医院感染数据的关键词的抓取方法及装置
[0001]本申请涉及计算机
,尤其涉及一种医院感染数据的关键词的抓取方法及装置。
技术介绍
[0002]医院感染系统中,对于医院感染预警的产生是通过对病程、体温、检查、检验、手术、影像等数据进行分析后产生的,而这些数据大部分都是非结构化数据。预警的产生需要从这些非结构化数据中提取关键词,再通过将提取到的关键词与其他数据组合判断。因此,通过病程、影像等数据中提取到关键词的准确性非常重要,而且,需要从有效数据源中提取关键词。但是提取非结构化数据中的关键词的误差很大,而且现有技术对非结构化数据抓取的关键词,不能用于区分患者是否有某一症状,也不能区分患者是否是在入院后出现某一症状或者是在入院前已经存在这种症状,因此也不能把抓取的关键词用于院感分析。
技术实现思路
[0003]本申请提供了一种医院感染数据的关键词的抓取方法及装置,以解决现有抓取关键词准确性低,不易于被采用于院感分析的问题。
[0004]第一方面,为实现上述目的,本申请提供了一种医院感染数据的关键 ...
【技术保护点】
【技术特征摘要】
1.一种医院感染数据的关键词的抓取方法,其特征在于,所述方法包括:根据目标需求获取医院感染规则和预设时间段内的数据源;从所述医院感染规则中获取目标关键词和从所述数据源中获取待分析数据;从所述待分析数据中抓取所述目标关键词,确定所述目标关键词是否可用;如果可用,对所述目标关键词处理后获取目标数据。2.根据权利要求1所述的医院感染的关键词的抓取方法,其特征在于,所述从所述待分析数据中抓取所述目标关键词,包括:查找所述待分析数据中是否包含所述目标关键词;如果包含,通过所述目标关键词切割所述待分析数据,获取目标数组,所述目标数组包括至少2条待分析子数据。3.根据权利要求1所述的医院感染数据的关键词的抓取方法,其特征在于,所述确定所述目标关键词是否可用,包括:从目标数组的第一待分析子数据中获取第一目标分析数据;对第一目标分析数据进行分析,确定目标关键词是否可用。4.根据权利要求1所述的医院感染数据的关键词的抓取方法,其特征在于,所述对第一目标分析数据进行分析,包括:确定所述第一目标分析数据是否包括预设否定前缀;如果不包括,确定所述第一目标分析数据是否包括预设可疑前缀;如果不包括,确定目标关键词所在句子是否包括预设黑名单;如果不包括,确定目标关键词所在句子是否包括预设白名单。5.根据权利要求1所述的医院感染数据的关键词的抓取方法,其特征在于,所述对第一目标分析数据进行分析,还包括:标记目标关键词位置和标记目标关键词所在句子位置。6.一种医院感染数据的关键词的抓取...
【专利技术属性】
技术研发人员:张凤尧,杨莉,薛蕊,王海,曾德星,张云,
申请(专利权)人:贵阳朗玛信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。