【技术实现步骤摘要】
一种基于BERT和融入功效信息的中药处方生成方法
本专利技术属于医药
,尤其涉及一种基于BERT和融入功效信息的中药处方生成方法。
技术介绍
我国在中医药学方面的研究具有悠久历史和深厚底蕴,至今已有数千年的历史。中医药结合东方传统哲学和古代科技文化的精髓,在诊断、治疗、预防、保健等方面积累、总结、传承了大量经验,形成了自上而下的一套完整的理论诊治体系。现在的许多中医经常在治疗患者时以过去传承下来的经典处方和治疗记录作为参考。当前,计算机技术日益成熟,渗透到了各个行业。随着人工智能与大数据技术的进一步发展,互联网技术可以为我国中医行业注入新的活力,提高其效率。方剂学在中医药研究中一直是研究的热门方向,处方是中医诊治中非常重要的一环,完整的处方包括草药成分、比例、制备方法和汤剂剂量,而草药组成是最重要的部分。由于中医处方的组成成分、作用机制非常复杂,同时本身理论存在模糊的地方,“方-症-药”关系规整化具有较大的难度,这激励我们设计一种能够通过学习过去中医药几千年来积累、总结下来的经典方剂来根据症状生成处方的模型,从中医经典方剂中挖掘出暗藏的、潜在的“方-药-症”规律,根据症状智能地生成处方,促进中医更好的治疗患者。大量古籍资料中含有的诊治方法和处方等文本数据,通过自然语言处理能够帮助我们将隐藏在文字中的规律挖掘出来,而深度学习是自然语言处理的强大工具。如图1所示,现有的处方生成方法主要由深度学习中的seq2seq网络结构组成,seq2seq模型包括编码器和解码器,编码器对症状句子进行编码,解码器对其 ...
【技术保护点】
1.一种基于BERT和融入功效信息的中药处方生成方法,其特征在于,包括以下步骤:/nS1、获取若干一一对应的症状描述和处方数据对,以及中药功效信息,并对所述数据对进行预处理,将预处理后的结果作为训练集;/nS2、将所述中药功效信息按中药字典顺序进行排序,并通过预训练好的BERT模型得到固定长度的每个中药的功效信息编码;/nS3、将预训练好的BERT模型作为编码器,将GRU作为解码器,利用所述中药功效信息的编码初始化GRU解码器的输出层参数,并利用所述训练集微调BERT编码器,同时利用所述训练集训练GRU解码器,构建中药处方生成模型;/nS4、将待预测的症状句子作为测试样本输入至训练好的中药处方生成模型,并利用中药处方生成模型生成中药处方。/n
【技术特征摘要】
1.一种基于BERT和融入功效信息的中药处方生成方法,其特征在于,包括以下步骤:
S1、获取若干一一对应的症状描述和处方数据对,以及中药功效信息,并对所述数据对进行预处理,将预处理后的结果作为训练集;
S2、将所述中药功效信息按中药字典顺序进行排序,并通过预训练好的BERT模型得到固定长度的每个中药的功效信息编码;
S3、将预训练好的BERT模型作为编码器,将GRU作为解码器,利用所述中药功效信息的编码初始化GRU解码器的输出层参数,并利用所述训练集微调BERT编码器,同时利用所述训练集训练GRU解码器,构建中药处方生成模型;
S4、将待预测的症状句子作为测试样本输入至训练好的中药处方生成模型,并利用中药处方生成模型生成中药处方。
2.根据权利要求1所述的基于BERT和融入功效信息的中药处方生成方法,其特征在于,所述步骤S1包括以下步骤:
S101、爬取网上公开的资料,得到方剂数据和中药数据,其中,所述中药数据包括中药别名以及中药功效信息;
S102、利用所述中药数据对方剂数据进行清洗,并利用自然语言处理方法去除制备方法和剂量,保留处方症状描述和中药组成,并对中药进行别名替换,构建初始化症状-处方对数据集;
S103、对所述症状-处方对数据集的句子语料进行分词处理;
S104、利用预训练好的BERT模型对症状字符进行词典数值化处理,并按照中药名出现的前后顺序统计不重复的药名,将统计的中药名组成中药词典,并根据中药词典对处方数据进行数值化处理,得到数值化编码后的症状-处方对训练集。
3.根据权利要求1所述的基于BERT和融入功效信息的中药处方生成方法,其特征在于,所述步骤S103中的分词处理具体为:
采用字符级划分症状句子,以及按中药名切分处方句子。
4.根据权利要求1所述的基于BERT和融入功效信息的中药处方生成方法,其特征在于,所述步骤S3中的编码器包括Embedding层以及堆叠的12层transformer编码单元;
每个所述transformer编码单元均包括多头自注意力层和前向反馈层。
5.根据权利要求4所述的基于BERT和融入功效信息的中药处方生成方法,其特征在于,所述中药处方生成模型的损失函数loss的表达式如下:
qt'=ξ(qt,qv)
ξ(qt,qv)=...
【专利技术属性】
技术研发人员:吕建成,李婵娟,桑永胜,蒲翊凡,孙亚楠,
申请(专利权)人:四川大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。