基于策略采样的中医方剂生成方法及相关产品技术

技术编号：36875998 阅读：29 留言：0更新日期：2023-03-15 20:35

本发明专利技术涉及自然语言生成技术领域，公开了基于策略采样的中医方剂生成方法及相关产品，通过遍历所述训练数据集中的每一条方剂数据，统计所有方剂数据中的药物标签在所述训练数据集中出现的频次；将频次低于预设频次值的药物标签对应的方剂数据，加入到备选数据集中；再利用备选数据集的数据去更新原始的训练数据集，得到目标训练数据集；使用该目标训练数据集训练上述模型。目的在于提高在模型训练时低频次的方剂数据被学习到的概率，从而解决了现有技术中中医方剂数据的药材数量存在严重分布不均，药物频次存在严重偏差的问题。药物频次存在严重偏差的问题。药物频次存在严重偏差的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于策略采样的中医方剂生成方法及相关产品

[0001]本专利技术涉及模型训练
，尤其涉及基于策略采样的中医方剂生成方法及相关产品。

技术介绍

[0002]中医方剂生成是通过输入疾病证候输出证候对应方剂。现阶段中医方剂生成的实现方法多是基于多标签分类方法。但是，由于中医方剂中的药物存在主次关系，中医方剂中药物的地位分为“君臣佐使”。医生想要开出合适的方剂，首先就要清楚病邪性质寒热虚实、分析病从何处来，而君药在处方中就是针对病因、疾病本质起主要作用的药物，辅药、佐药、使药是加强君药治疗效果、治疗次症的药物。在一个方剂中，主药是必不可少的，一些简单的方剂甚至可以只有主药。而多标签分类方法主要考虑的是标签之间的序列关系，并没有考虑中医方剂更重要的药物之间的主次关系。
[0003]采用深度序列生成的方法可以优先生成地位重要的君药，再生成地位次要的辅药，因此，采用生成的方法完成中医方剂生成任务更符合中医方剂组成的逻辑。
[0004]但是，本申请专利技术人在实现本申请实施例中专利技术技术方案的过程中，发现上述技术方案...

【技术保护点】

【技术特征摘要】
1.基于策略采样的中医方剂生成方法，其特征在于，包括：获取疾病证候数据；将所述疾病证候数据输入所述基于策略采样深度学习模型，经模型输出得到所述疾病证候数据对应的中医方剂数据；其中所述基于策略采样深度学习模型的训练方法包括：步骤1：获取用于所述基于策略采样深度学习模型训练的中医方剂数据作为训练数据集；步骤2：遍历所述训练数据集中的每一条方剂数据，统计所有方剂数据中的药物标签在所述训练数据集中出现的频次；步骤3：选取频次小于等于预设频次值的药物标签对应的方剂数据，加入到备选数据集中；步骤4：根据所述备选数据集更新所述训练数据集，得到目标训练数据集；步骤5：使用所述目标数据集对所述基于策略采样深度学习模型进行训练。2.如权利要求1所述的基于策略采样的中医方剂生成方法，其特征在于，所述步骤3具体包括：步骤3
‑
1、选取频次小于或等于预设频次值的药物标签对应的方剂数据先作为预选低频数据集；步骤3
‑
2、将所述预选低频数据集中第i条方剂数据d
i
的频次m
i
处理得到新的频次m
im
；步骤3
‑
3、通过映射关系f将方剂数据d
i
用新频次m
im
映射到所述备选数据集中；其中，n表示将归一化处理后的频次扩大的倍数，m
min
表示所述预选低频数据集中的最低频次，m
max
表示所述预选低频数据集中的最高频次，且m
max
≤预设频次值；d
s
＝f(d
i
,m
im
)，函数f表示将原频次为m
i
的方剂数据d
i
按照新频次m
im
映射进入所述备选数据集。3.如权利要求2所述的基于策略采样的中医方剂生成方法，其特征在于，所述通过映射关系f将方剂数据d
i
用新频次m
im
映射到所述备选数据集中，之后还包括：步骤3
‑
4、随机打乱所述备选数据集中方剂数据的排序位置。4.如权利要求1或2或3所述的基于策略采样的中医方剂生成方法，其特征在于，所述步骤4具体包括：步骤4
‑
1、按照长度为batch_size将所述训练数据集进行分割，得到若干训练数据子集，为了提高训练效率batch_size一般取2的次方数；步骤4
‑
2、每个训练数据子集中随机选取k条方剂数据，利用所述备选数据集中随机选取k条方剂数据进行替换，k为正整数，k≤batch_size；步骤4
‑
3、将替换后的所有训练数据子集加入到临时训练数据集中；步骤4
‑
4、判断迭代次数是否达到预设最大迭代次数，若是，则执行步骤4
‑
5，否则返回执行步骤4
‑
1；步骤4
‑
5、将所述训练数据集加入到所述临时训练数据集中，得到目标训练数据集。5.基于策略采样的中医方剂生成装置，其特征在于，所述装置包括：疾病证候数...

【专利技术属性】
技术研发人员：舒红平，贾金凤，王亚强，
申请(专利权)人：成都信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人