针对“中医毒热”研究的大数据挖掘系统技术方案

技术编号:21574368 阅读:29 留言:0更新日期:2019-07-10 16:10
本发明专利技术公开了一种针对“中医毒热”研究的大数据挖掘系统,该系统包括:表示层、业务层以及数据层;其中,所述表示层即客户端,负责为用户提供操作界面及结果反馈;所述业务层运行在服务器端,负责解析所述表示层的客户请求、处理请求并将处理结果返回给所述表示层的客户端用户;所述数据层主要负责各种异构数据的存储,并将为所述业务层提供数据支持。本发明专利技术方案引入数据挖掘技术,针对“中医毒热”研究的需求,确定其数据挖掘的目标,解决了中医科研人员分析大量数据,减轻了工作量、提高了工作效率。

Big Data Mining System for \Toxic Fever of Traditional Chinese Medicine\

【技术实现步骤摘要】
针对“中医毒热”研究的大数据挖掘系统
本专利技术属于大数据挖掘
,涉及一种针对“中医毒热”研究的大数据挖掘系统。
技术介绍
随着医学信息化建设,数据量迅速增长,产生“信息爆炸,知识贫乏”的局面。近年来,数据挖掘理论和技术的发展和应用,为医学带来新的发展潜力,特别是为医学研究、医疗诊断和医院管理提供了良好的决策支持。中医理论源远流长,荟萃几千年来众多中医学者的辛勤与智慧,积累了大量的中医文献资料和数据。由于中医理论流派众多,且在临床上依靠中医医生的经验治病,这些特点使中医走向世界带了困难。如何弘扬中医文化、如何对中医理论的继承和创新,成为当代中医学者的主要任务。
技术实现思路
本专利技术目的在于提供一种针对“中医毒热”研究的大数据挖掘系统,为了克服中医理论由于流派众多且临床治病主要依靠医生经验,导致中医走向世界困难的问题,引入数据挖掘技术,针对“中医毒热”研究的需求,确定其数据挖掘的目标,设计并实现了“中医毒热”的数据挖掘系统,有效地解决了中医科研人员分析大量数据,实现了减轻工作量、提高工作效率的目的,加快了中医走向世界。为解决上述技术问题,本专利技术采用如下的技术方案:一种针对“中医毒热”研究的大数据挖掘系统,该系统包括:表示层、业务层以及数据层;其中,所述表示层即客户端,负责为用户提供操作界面及结果反馈;所述业务层运行在服务器端,负责解析所述表示层的客户请求、处理请求并将处理结果返回给所述表示层的客户端用户;所述数据层主要负责各种异构数据的存储,并将为所述业务层提供数据支持。进一步地,所述数据层主要由有文件库、基础数据库、挖掘数据库、知识库以及算法库组成。本专利技术与现有技术相比具有以下的有益效果:本专利技术方案针对中医理论由于流派众多且临床治病主要依靠医生经验,导致中医走向世界困难的问题,引入数据挖掘技术,针对“中医毒热”研究的需求,确定其数据挖掘的目标,设计并实现了“中医毒热”的数据挖掘系统,实现了减轻工作量、提高工作效率的目的,加快了中医走向世界。附图说明图1是针对“中医毒热”研究的大数据挖掘系统的整体框架图。具体实施方式下面结合附图及具体实施例对本专利技术进行更加详细与完整的说明。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定。参照图1,本专利技术的一种针对“中医毒热”研究的大数据挖掘系统,该系统包括:表示层、业务层以及数据层;其中,所述表示层即客户端,负责为用户提供操作界面及结果反馈;所述业务层运行在服务器端,负责解析所述表示层的客户请求、处理请求并将处理结果返回给所述表示层的客户端用户;所述数据层主要负责各种异构数据的存储,并将为所述业务层提供数据支持。中医“毒热”理论是中医中的一个重要组成部分。中医“毒热”理论认为:毒邪致病广泛,凡是对机体有不利影响的因素,无论来源于外界或体内统称为“毒”;“毒”是致病原因,也是病后产生的一种病理结果,毒邪可合并火、热、风、寒、湿、燥、痰、瘀、脓等,广泛存在于多种疾病。中医“毒热”理论研究内容有:以50种中医药古代文献、各家流派的书籍为基础,开展“毒”致病因素调查、收集、整理;开展具有痈毒、肿毒、毒肿、郁毒、蕴毒、化毒、蕴积毒热等致病特点与病理转变的疾病与症状的调查、收集、整理;开展具有清热解毒、泻火解毒、清火解毒、解毒、消毒、治毒、杀毒、除毒、祛毒、散毒、排毒作用的中药、方剂的调查、收集、整理;以中医胃脘疾病相关的胃痛,开展中医胃脘病病因要素等。由上述分析,可以确定本专利技术的挖掘需求。第一、建立疾病、病因、症状、方剂和中药等数据库;第二、寻找病因与病之间的关联或相关,寻找方剂与病之间的关联,找出症状与疾病的关联,对治疗“毒热”病的药物分类等;第三、以胃病为研究重点,寻找胃病致病因素、治病特点和病理转变。系统主要提供文件上传功能和数据挖掘功能,数据挖掘功能主要有解析挖掘请求模块、调度控制模块、数据预处理模块、数据挖掘模块和知识库管理模块。1)文件上传模块为方便用户工作,特提供此功能。中医科研人员对“毒热”数据整理后,形成xml文件,通过客户端上传文件。文件处理模块主要有三个功能,一是把xml文件上传到文件库;二是形成日志文件,记录文件大小、上传时间和上传用户,讨论上传时间是因为数据预处理模块根据上传时间,确定是否要预处理数据;三是把xml数据转换成数据库记录,保存在基础数据库。2)挖掘请求解析模块主要是解析用户请求,把用户的请求数据分解,确定用户的意图,通过解析后,知道要挖掘的类型、挖掘的数据和挖掘的参数条件。比如用户请求挖掘病因和病的关联请求,可以知道挖掘类型为关联规则挖掘,挖掘数据为病因数据和疾病数据,参数是置信度、支持度及其对应值。3)调度控制模块它是数据挖掘系统中的核心模块,协调和控制其它模块的运行。接收到挖掘请求后,决定是从知识库查询还是通过数据挖掘模块获得知识,完成后返回结果给客户端用户。如果决定通过数据挖掘模块计算获得知识,那么做如下操作,首先传递参数条件给数据预处理模块,并让出控制权;其次,等数据预处理完成后,调用数据挖掘模块,并传递挖掘类型参数、挖掘数据参数和条件参数;最后,数据挖掘模块运行结束后,调用知识库管理模块,返回数据给客户端。4)其它模块数据预处理模块主要负责挖掘数据的预处理,从基础数据库获取原始数据,预处理后存放在挖掘数据库,以备挖掘模块处理。数据挖掘模块主要负责调用算法模型库中的算法进行数据挖掘工作,并返回结果给协调控制器。知识库管理模块主要负责评价新挖掘的知识和对知识库的操作,比如对知识库的更新、增加、删除等。几个关键数据库表的设计除了存储数据的数据库之外,还有文件上传日志数据表、数据预处理日志数据表和知识库更新日志数据表,文件上传日志数据表和数据预处理日志数据表决定数据是否要更新。数据表结构如下描述。文件上传日志数据表结构为:FileUploadLog(id,database,table,date,user_Id,file_Size);处理日志数据表结构为:DataPreProcessLog(id,database,table,date);知识库数据表结构为:Knowledge(id,type,content,date,source_Data,parameter,rank),其中id为知识记录序号,是主关键字,type为知识类型,content为知识内容,date处理日期,source_Data为挖掘数据源,parameter挖掘参数,rank知识评价级别。数据预处理技术1)数据预处理包括对数据的抽取、清洗、集成和转换。在数据预处理过程中主要存在以下方面的问题。中医“毒热”数据的描述存在一义多词、一词多义、词义模糊、词义交叉、不完整、不一致等现象。针对一词多义、多词一义和词义模糊,则建立标准词表进行规范化。针对词义交叉或涵盖,采用分解词、组合表达的方法。对于不完整数据可利用回归分析、贝叶斯计算公式或决策树推断最可能值并填补遗漏值。对于不一致数据时应该小心对待,因为有可能本身属于正常的同病异治,或异病同治,也有可能是数据不完整产生的,这时需要仔细参阅原始文献。数据转换主要有量化表达、重复数据的处理、模糊数据的处理等问题。比如就药物的归经属性值而言,总共有十二条经脉,但在数据挖掘中难于描述和理解,所以需要采用本文档来自技高网...

【技术保护点】
1.针对“中医毒热”研究的大数据挖掘系统,其特征在于,所述系统包括:表示层、业务层以及数据层;其中,所述表示层即客户端,负责为用户提供操作界面及结果反馈;所述业务层运行在服务器端,负责解析所述表示层的客户请求、处理请求并将处理结果返回给所述表示层的客户端用户;所述数据层主要负责各种异构数据的存储,并将为所述业务层提供数据支持。

【技术特征摘要】
1.针对“中医毒热”研究的大数据挖掘系统,其特征在于,所述系统包括:表示层、业务层以及数据层;其中,所述表示层即客户端,负责为用户提供操作界面及结果反馈;所述业务层运行在服务器端,负责解析所述表示层的客户请求、处理请求并将处理结果返回给...

【专利技术属性】
技术研发人员:徐继峰祁建明周峻松陈墩金
申请(专利权)人:广州明领基因科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1