当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种从中药复方中分析功效对应中药及其药性配伍关系的方法技术

技术编号:22222517 阅读:30 留言:0更新日期:2019-09-30 03:27
本发明专利技术公开了一种从中药复方中分析功效对应中药及其药性配伍关系的方法,该方法包括:(1)获取待处理数据集,数据集包括中药信息数据集和复方信息数据集;(2)利用预处理后的中药信息数据集对预处理后的复方信息数据集进行性味和归经的扩充;(3)抽象出扩充后的复方信息数据集中中药、功效和性味之间的多维关系,构建结合主题模型,并求解结合主题模型的模型参数;(4)抽取部分扩充后的复方信息数据集作为训练集,对结合主题模型进行训练,直至达到设定的迭代次数,并根据训练结果输出功效与中药、性味和归经的概率值矩阵。本发明专利技术能够从大量中药复方中挖掘分析出功效对应中药及其药性的多维配伍关系隐性关系,可广泛用于指导临床用药、计算机自动组方及新药发现。

A Method for Analyzing the Effectiveness Corresponding to Chinese Herbs and Their Compatibility in Compound Prescriptions of Traditional Chinese Medicine

【技术实现步骤摘要】
一种从中药复方中分析功效对应中药及其药性配伍关系的方法
本专利技术涉及文本数据挖掘分析领域,具体涉及一种从中药复方中分析功效对应中药及其药性配伍关系的方法。
技术介绍
西药的功效和作用主要体现在药物的不同化学成分。相比而言,诞生于数千年前的中药是我们的祖先在实践中不断反复验证、总结和深化获得了各种中草药药性知识。中药药性理论经过长期的发展,对单味中药的药性知识已经形成了较全面的总结,数千单味中药的具体性味、归经毒性等形成了全面详细的中药性知识库。但是,中药在使用过程中,单味中药单独使用率很低,大多数情况在复方中都采用多味药配伍形成多个功效治疗病证。根据中医相关理论,多味中药配伍产生的整体性味是形成其功效的关键。通常我们见到的中药复方说明书中罗列了该复方的几种功效及多味中药,而功效对应中药及其药性配伍关系为成为隐性知识。这种隐性知识正是中医学习者花费数十年的时间领悟、学习的关键和难题。随着数据挖掘、机器学习等相关技术的发展,从大量中药复方中分析挖掘中药配伍规律,探索药性配伍规律,揭示功效及其对应中药配伍,对完善中药配伍理论、指导临床用药、新药发现和自动方组等均具有重要的价值。当前现存的中复方分析挖掘方法多采用通用的方法,如分类、主成分分析、关联规则分析等,未能结合中医药性相关理论进行上述多维隐性关系的挖掘分析,所得的结果广泛性、实用性和准确性差。
技术实现思路
专利技术目的:为了克服现有技术的不足,本专利技术提供一种从中药复方中分析功效对应中药及其药性配伍关系的方法,该方法解决了当前未能结合中医药性相关理论进行多维隐性关系的挖掘分析,以及所得的结果广泛性、实用性和准确性差的问题。技术方案:本专利技术所述的一种从中药复方中分析功效对应中药及其药性配伍关系的方法,该方法包括:(1)获取待处理数据集,所述数据集包括中药信息数据集和复方信息数据集,并对所述中药信息数据集和复方信息数据集分别进行预处理;(2)利用预处理后的中药信息数据集对预处理后的复方信息数据集进行性味和归经的扩充;(3)抽象出所述扩充后的复方信息数据集中中药、功效和性味之间的多维关系,构建结合主题模型,并求解所述结合主题模型的模型参数;(4)抽取部分扩充后的所述复方信息数据集作为训练集,对所述结合主题模型进行训练,直至达到设定的迭代次数,并根据训练结果输出功效与中药、性味和归经的概率值矩阵。进一步地,包括:所述复方信息数据集中的每个复方信息数据包括功效和药物组成,所述中药信息数据集中的每个中药信息数据包括药名、别名、性味和归经,所述性味包括四气和五味,所述四气包括:热、温、寒、凉,五味包括辛、甘、酸、苦、咸。进一步地,包括:所述步骤(1)中,对中药信息数据集进行预处理,包括:(11)对中药信息中的性味描述信息进行过滤和替换,只保留五味和四气及其加修饰词微、大、淡、小组成的性味;(12)对中药信息中归经的描述只保留五脏六腑的直接表述词。进一步地,包括:所述对中药信息数据集进行预处理还包括:将性味中包含微、淡、小程度副词修饰的词共现频次为基准,记为1;包含程度副词大的词频次升为原词频的3倍;没有程度副词修饰的性味的词频升为原词频的2倍。进一步地,包括:所述步骤(3)中,所述抽象出扩充后的复方信息数据集中中药、功效和性味之间的多维关系,具体包括:功效与药组之间为一对一的隐性关系;药组与中药之间为一对多的隐性关系;中药与性味之间存在多对多的显性关系;药组与性味之间存在间接多对多的隐性关系;功效与性味之间存在间接多对多隐性关系。进一步地,包括:所述步骤(3)中,构建结合主题模型,包括:扩充后的复方信息数据集看作D个独立的文本生成过程,单个复方信息数据作为一个文档d,JTM的总词袋包括三个子词袋,分别为:中药词袋,包含复方信息数据集中出现的所有中药;中药性味词袋,包括四气、五味和毒性情况;归经词袋是指中药根据脏腑经络理论作用于人体部位的表述词;所述文档d的一个或多个功效视作文档d的K个主题标签,K表示功效种类;采用向量Λd=(t1,t2,...,tK)表示一系列的二进制数指示文档d中功效ti是否出现,ti∈{0,1},0表示d中出现标签l,1表示d中未出现l;Λd服从先验为Beta(γ)的伯努利分布;Λd显性约束文档d的主题分布θd;θd为文档d的功效比例,为多项式分布,其先验服从参数为α的狄里克雷分布,即:θd~Dirichlet(α);zdn由多项分布θd生成,其中,zdn∈{0,…K-1};文档d的第n个中药hdn,与其对于四气gdn,五味fdn,归经tdn,共享功效zdn;和均为多项分布,分别服从先验为βh、βf和βt的Dirichlet分布,分别表示主题下的中药、性味和归经分布。进一步地,包括:所述文档d的生成概率公式表示为:其中,Nf表示文档d中第n味中药的性味个数,Nt表示文档d中第n味中药的归经个数,Nh表示文档d中中药的总数。进一步地,包括:所述步骤(3)中,求解所述结合主题模型的模型参数,包括:在某一种类的功效k下,各参数表示为:其中,k∈{1,…,K},|H|、|F|和|T|表示数据集中出现的所有中药、性味及归经总数,表示除去当前位置i后,中药h被分配功效k的次数,i表示当前位置中药,-i表示除去当前位置i,表示出去当前位置i后,性味f被分配功效k的次数,表示出去当前位置i后,归经t被分配功效k的次数。进一步地,包括:所述步骤(4)中,抽取部分扩充后的所述复方信息数据集合作为训练集,对所述结合主题模型进行训练,包括:输入:扩充后的复方信息数据集、JTM模型超参数α、β及训练迭代次数;步骤:(1)初始化:遍历数据集中每一个文档d的每位中药hdn,从该复方的Λd的集合中随机分配一个功效编号给hdn,同时hdn对应的所有性味fdn和归经tdn共享该功效编号;(2)迭代遍历数据集中每一个复方d的每位中药hdn直至设定的迭代次数:对每个hdn计算它属于Λd的每一个功效的概率并进行相应的吉布斯采样。输出:该训练集中所有复方中的每位中药对应的功效编号二维矩阵z。进一步地,包括:所述根据训练结果输出功效与中药、性味和归经的概率值矩阵,包括:根据训练结果所得的矩阵z和公式(3)计算所得所有功效与中药的概率值矩阵其中,Nh为复方信息数据集出现的不重复的中药个数。根据训练结果所得的矩阵z和公式(4)计算所得所有功效与性味的概率值矩阵其中,Nf为复方信息数据集出现的不重复的中药性味个数。根据训练结果所得的矩阵z和公式(5)计算所得所有功效与归经的概率值矩阵其中,Nt为复方信息数据集出现的不重复的中药归经的个数。有益效果:与现有技术相比,本专利技术具有以下优点:(1)本专利技术结合中医相关理论,首次提出对中医复方进行药性知识扩充后再分析挖掘,进而抽象出了符合中医理论实际的多维隐性关系;(2)本专利技术构建了结合主题模型(JTM)对中医复方数据中功效、中药、性味及归经进行多维隐性关系建模,可同时实现它们之间的多维关系分析挖掘;(3)相比现有的方法常采用的如分类、主成分分析、关联规则分析等,本方法更加切合中医理论,所得的结果广泛性、实用性和准确性更高。附图说明图1为本专利技术所述的方法流程图;图2为本专利技术所述的复方信息数据集中中药-药性-功效的关系示意图;图3为本专利技术所述的JTM的图模本文档来自技高网...

【技术保护点】
1.一种从中药复方中分析功效对应中药及其药性配伍关系的方法,其特征在于,该方法包括:(1)获取待处理数据集,所述数据集包括中药信息数据集和复方信息数据集,并对所述中药信息数据集和复方信息数据集分别进行预处理;(2)利用预处理后的中药信息数据集对预处理后的复方信息数据集进行性味和归经的扩充;(3)抽象出扩充后的复方信息数据集中中药、功效和性味之间的多维关系,构建结合主题模型,并求解所述结合主题模型的模型参数;(4)抽取部分扩充后的所述复方信息数据集作为训练集,对所述结合主题模型进行训练,直至达到设定的迭代次数,并根据训练结果输出功效与中药、性味和归经的概率值矩阵。

【技术特征摘要】
1.一种从中药复方中分析功效对应中药及其药性配伍关系的方法,其特征在于,该方法包括:(1)获取待处理数据集,所述数据集包括中药信息数据集和复方信息数据集,并对所述中药信息数据集和复方信息数据集分别进行预处理;(2)利用预处理后的中药信息数据集对预处理后的复方信息数据集进行性味和归经的扩充;(3)抽象出扩充后的复方信息数据集中中药、功效和性味之间的多维关系,构建结合主题模型,并求解所述结合主题模型的模型参数;(4)抽取部分扩充后的所述复方信息数据集作为训练集,对所述结合主题模型进行训练,直至达到设定的迭代次数,并根据训练结果输出功效与中药、性味和归经的概率值矩阵。2.根据权利要求1所述的从中药复方中分析功效对应中药及其药性配伍关系的方法,其特征在于,所述复方信息数据集中的每个复方信息数据包括功效和药物组成,所述中药信息数据集中的每个中药信息数据包括药名、别名、性味和归经,所述性味包括四气和五味,所述四气包括:热、温、寒、凉,五味包括辛、甘、酸、苦、咸。3.根据权利要求2所述的从中药复方中分析功效对应中药及其药性配伍关系的方法,其特征在于,所述步骤(1)中,对中药信息数据集进行预处理,包括:(11)对中药信息中的性味描述信息进行过滤和替换,只保留五味和四气及其加修饰词微、大、淡、小组成的性味;(12)对中药信息中归经的描述只保留五脏六腑的直接表述词。4.根据权利要求3所述的从中药复方中分析功效对应中药及其药性配伍关系的方法,其特征在于,所述对中药信息数据集进行预处理还包括:将性味中包含微、淡、小程度副词修饰的词共现频次为基准,记为1;包含程度副词大的词频次升为原词频的3倍;没有程度副词修饰的性味的词频升为原词频的2倍。5.根据权利要求1所述的从中药复方中分析功效对应中药及其药性配伍关系的方法,其特征在于,所述步骤(3)中,抽象出所述扩充后的复方信息数据集中中药、功效和性味之间的多维关系,具体包括:功效与药组之间为一对一隐性关系;药组与中药之间为一对多的隐性关系;中药与性味之间存在多对多的显性关系;药组与性味之间存在间接多对多的隐性关系;功效与性味之间存在间接多对多隐性关系。6.根据权利要求5所述的从中药复方中分析功效对应中药及其药性配伍关系的方法,其特征在于,所述步骤(3)中,构建结合主题模型,包括:扩充后的复方信息数据集看作D个独立的文本生成过程,单个复方信息数据作为一个文档d,JTM模型的总词袋包括三个子词袋,分别为:中药词袋,包含复方信息数据集中出现的所有中药;中药性味词袋,包括四气、五味和毒性情况;归经词袋是指中药根据脏腑经络理论作用于人体部位的表述词;所述文档d的一个或多个功效视作文档d的K个主题标签,K表示功效种类;采用向量Λd=(t1,t2,...,tK)表示一系列的二进制数指示文档d中功效t...

【专利技术属性】
技术研发人员:马甲林张琳万晶晶陈伯伦
申请(专利权)人:淮阴工学院淮安市第二人民医院淮安仁慈医院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1