模型的训练方法、数据处理方法和装置、设备、介质制造方法及图纸

技术编号:33248552 阅读:12 留言:0更新日期:2022-04-27 18:05
本实施例提供一种模型的训练方法、数据处理方法和装置、设备、介质,属于人工智能技术领域,包括:获取中医疾病与证型训练集、中医诊断规则数据、第一症状实体数据和症状实体归一化数据;对中医疾病与证型训练集、中医诊断规则数据和症状实体归一化数据进行数据匹配处理,得到种子症状实体数据;根据种子症状实体数据,对第一症状实体数据进行数据提取处理,得到非种子症状实体数据;根据种子症状实体数据、非种子症状实体数据、中医疾病与证型训练集、中医诊断规则数据、第一症状实体数据和预设训练规则对预设的预测模型进行训练处理,得到目标矩阵预测模型。本实施例能够提高症状实体数据的准确性,保证中医疾病智能决策效果。保证中医疾病智能决策效果。保证中医疾病智能决策效果。

【技术实现步骤摘要】
模型的训练方法、数据处理方法和装置、设备、介质


[0001]本专利技术涉及人工智能
,尤其涉及一种模型的训练方法、数据处理方法和装置、设备、介质。

技术介绍

[0002]随着人工智能技术的发展,对中医疾病智能决策在很多领域中被广泛应用。相关技术中,通常需要将用户问诊端输入的症状实体数据(如自由文本形式)映射到标准化的症状实体数据例如症状实体列表中,但所收集的症状实体数据的数据来源通常包含用户的口语化症状实体数据和/或西医诊断对应的症状实体数据,其无法保证是在中医语境下收集的,导致标准化的症状实体数据存在较大误差。

技术实现思路

[0003]本公开实施例的主要目的在于提出一种模型的训练方法、数据处理方法和装置、设备、介质,能够提高症状实体数据的准确性,保证中医疾病智能决策效果。
[0004]为实现上述目的,本公开实施例的第一方面提出了一种模型的训练方法,用于训练目标矩阵预测模型,所述训练方法包括:
[0005]获取中医疾病与证型训练集、中医诊断规则数据、第一症状实体数据和症状实体归一化数据;
[0006]对所述中医疾病与证型训练集、所述中医诊断规则数据和所述症状实体归一化数据进行数据匹配处理,得到种子症状实体数据;
[0007]根据所述种子症状实体数据,对所述第一症状实体数据进行数据提取处理,得到非种子症状实体数据;
[0008]根据所述种子症状实体数据、所述非种子症状实体数据、所述中医疾病与证型训练集、所述中医诊断规则数据、所述第一症状实体数据和预设训练规则对预设的预测模型进行训练处理,得到所述目标矩阵预测模型,其中,所述目标矩阵预测模型用于生成目标参数矩阵。
[0009]本公开实施例的第二方面提出了一种数据处理方法,应用于由第一方面实施例所述的模型的训练方法训练得到的目标矩阵预测模型,所述目标矩阵预测模型用于生成目标参数矩阵,所述数据处理方法包括:
[0010]获取待处理的第三症状实体数据和符合预设中医规则的第四症状实体数据;
[0011]根据预设的查找函数,从所述目标参数矩阵中筛选得到与所述第三症状实体数据对应的第一向量参数数据;
[0012]根据所述查找函数,从所述目标参数矩阵中筛选得到与所述第四症状实体数据对应的第二向量参数数据;
[0013]根据语义相似度计算方法对所述第一向量参数数据和所述第二向量参数数据进行相似度处理,得到所述第一向量参数数据对应所述第二向量参数数据的语义相似度数
据;
[0014]根据所述语义相似度数据,对所述第一向量参数数据进行筛选处理,得到与所述第一向量参数数据对应的第五症状实体数据,其中,所述第三症状实体数据包括所述第五症状实体数据,且所述第五症状实体数据表征不符合所述预设中医规则;
[0015]将所述第五症状实体数据映射到所述第四症状实体数据中。
[0016]本公开实施例的第三方面提出了一种模型的训练装置,用于训练目标矩阵预测模型,所述训练装置包括:
[0017]第一获取模块,用于获取中医疾病与证型训练集、中医诊断规则数据、第一症状实体数据和症状实体归一化数据;
[0018]数据匹配模块,用于对所述中医疾病与证型训练集、所述中医诊断规则数据和所述症状实体归一化数据进行数据匹配处理,得到种子症状实体数据;
[0019]数据提取模块,用于根据所述种子症状实体数据,对所述第一症状实体数据进行数据提取处理,得到非种子症状实体数据;
[0020]模型训练模块,用于根据所述种子症状实体数据、所述非种子症状实体数据、所述中医疾病与证型训练集、所述中医诊断规则数据、所述第一症状实体数据和预设训练规则对预设的预测模型进行训练处理,得到所述目标矩阵预测模型,其中,所述目标矩阵预测模型用于生成目标参数矩阵。
[0021]本公开实施例的第四方面提出了一种数据处理装置,应用于由第一方面实施例所述的模型的训练方法训练得到的目标矩阵预测模型,所述目标矩阵预测模型用于生成目标参数矩阵,所述数据处理装置包括:
[0022]第二获取模块,用于获取待处理的第三症状实体数据和符合预设中医规则的第四症状实体数据;
[0023]第一查找模块,用于根据预设的查找函数,从所述目标参数矩阵中筛选得到与所述第三症状实体数据对应的第一向量参数数据;
[0024]第二查找模块,用于根据所述查找函数,从所述目标参数矩阵中筛选得到与所述第四症状实体数据对应的第二向量参数数据;
[0025]数据计算模块,用于根据语义相似度计算方法对所述第一向量参数数据和所述第二向量参数数据进行相似度处理,得到所述第一向量参数数据对应所述第二向量参数数据的语义相似度数据;
[0026]数据筛选模块,用于根据所述语义相似度数据,对所述第一向量参数数据进行筛选处理,得到与所述第一向量参数数据对应的第五症状实体数据,其中,所述第三症状实体数据包括所述第五症状实体数据,且所述第五症状实体数据表征不符合所述预设中医规则;
[0027]数据映射模块,用于将所述第五症状实体数据映射到所述第四症状实体数据中。
[0028]本公开实施例的第五方面提出了一种计算机设备,所述计算机设备包括存储器和处理器,其中,所述存储器中存储有程序,所述程序被所述处理器执行时所述处理器用于执行如本申请第一方面实施例任一项所述的方法或如本申请第二方面实施例任一项所述的方法。
[0029]本公开实施例的第六方面提出了一种存储介质,该存储介质为计算机可读存储介
质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如本申请第一方面实施例任一项所述的方法或如本申请第二方面实施例任一项所述的方法。
[0030]本公开实施例提出的模型的训练方法、数据处理方法和装置、设备、介质,通过获取中医疾病与证型训练集、中医诊断规则数据、第一症状实体数据和症状实体归一化数据;对中医疾病与证型训练集、中医诊断规则数据和症状实体归一化数据进行数据匹配处理,得到种子症状实体数据;根据种子症状实体数据,对第一症状实体数据进行数据提取处理,得到非种子症状实体数据;根据种子症状实体数据、非种子症状实体数据、中医疾病与证型训练集、中医诊断规则数据、第一症状实体数据和预设训练规则对预设的预测模型进行训练处理,得到目标矩阵预测模型,其中,目标矩阵预测模型用于生成目标参数矩阵。本公开实施例能够提高症状实体数据的准确性,保证中医疾病智能决策效果。
附图说明
[0031]图1为本公开实施例提供的模型的训练方法的流程图;
[0032]图2为本公开实施例提供的中医诊断规则数据的示意图;
[0033]图3为图1中的步骤S120的流程图;
[0034]图4为图1中的步骤S130的第一流程图;
[0035]图5为图4中的步骤S130的第二流程图;
[0036]图6为图1中的步骤S140的流程图;
[0037]图7为本公开实施例提供的类别症状实体数据的示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型的训练方法,其特征在于,用于训练目标矩阵预测模型,所述训练方法包括:获取中医疾病与证型训练集、中医诊断规则数据、第一症状实体数据和症状实体归一化数据;对所述中医疾病与证型训练集、所述中医诊断规则数据和所述症状实体归一化数据进行数据匹配处理,得到种子症状实体数据;根据所述种子症状实体数据,对所述第一症状实体数据进行数据提取处理,得到非种子症状实体数据;根据所述种子症状实体数据、所述非种子症状实体数据、所述中医疾病与证型训练集、所述中医诊断规则数据、所述第一症状实体数据和预设训练规则对预设的预测模型进行训练处理,得到所述目标矩阵预测模型,其中,所述目标矩阵预测模型用于生成目标参数矩阵。2.根据权利要求1所述的模型的训练方法,其特征在于,所述对所述中医疾病与证型训练集、所述中医诊断规则数据和所述症状实体归一化数据进行数据匹配处理,得到种子症状实体数据,包括:对所述症状实体归一化数据和所述中医疾病与证型训练集进行数据匹配处理,得到第一匹配数据;从所述第一匹配数据中,提取得到包含在所述中医诊断规则数据中的第二匹配数据;将所述第二匹配数据作为所述种子症状实体数据。3.根据权利要求1所述的模型的训练方法,其特征在于,所述根据所述种子症状实体数据,对所述第一症状实体数据进行数据提取处理,得到非种子症状实体数据,包括:根据所述种子症状实体数据,从所述第一症状实体数据中确定候选匹配数据;对所述候选匹配数据进行数据提取处理,得到非种子症状实体数据。4.根据权利要求3所述的模型的训练方法,其特征在于,所述对所述候选匹配数据进行数据提取处理,得到非种子症状实体数据,包括以下至少之一:根据预设的分词算法和分词字典对所述候选匹配数据进行分词提取处理,得到所述非种子症状实体数据;或者,根据所述症状实体归一化数据对所述候选匹配数据进行数据匹配处理,得到所述非种子症状实体数据;或者,根据预设的实体识别模型对所述候选匹配数据进行分类提取处理,得到所述非种子症状实体数据。5.根据权利要求1至4任一项所述的模型的训练方法,其特征在于,所述预设训练规则,包括以下至少之一:通过所述预测模型对所述种子症状实体数据和所述非种子症状实体数据进行训练处理,得到所述种子症状实体数据和所述非种子症状实体数据对应的中医疾病与证型标签;或者,通过所述预测模型根据所述中医诊断规则数据对所述种子症状实体数据进行训练处
理,得到所述种子症状实体数据对应的中医诊断规则标签,其中,所述中医诊断规则数据包括所述中医诊断规则标签,所述中医诊断规则标签包括八纲标签、病性标签或者病位标签中的至少一种;或者,通过所述预测模型根据第二症状实体数据对所述种子症状实体数据和类别症状实体数据进行训练处理,得到所述第二症状实体数据对应所述种子症状实体数据和所述类别症状实体数据的关联数据,其中,所述第二症状实体数据表征属于所述非种子症状实体数据的所述第一症状实体数据,所述类别症状实体数据表征与所述种子症状实体数据具有相同的中医诊断规则标签的中医诊断规则数据。6.一种数据处理方法,其特征在于,应用于由权利要求1至5任一项所述的模型的训练方法训练得到的目标矩阵预测模型,所述目标矩阵预测模型用于生成目标参数矩阵,所述数据处理方法包括:获取待处理的第三症状实体数据和符...

【专利技术属性】
技术研发人员:胡意仪阮晓雯陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1