基于人工智能的预测分类模型获取方法及装置、存储介质制造方法及图纸

技术编号：22643287 阅读：30 留言：0更新日期：2019-11-26 16:32

本发明专利技术提供了一种基于人工智能的预测分类模型获取方法及装置、计算机可读存储介质，该方法包括：从历史病历数据中获取训练样本，训练样本表征历史患者的病历数据与其确诊病症的对应关系；训练样本中的正负样本的配置比例为预设的配置比例；获取与训练样本对应的病症的训练疾病相关文本信息；预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息；调用设置的训练模型处理训练样本和训练疾病相关文本信息，得到训练结果；基于训练结果和训练样本，调整训练模型直至收敛，得到预测分类模型，预测分类模型表征病历数据与疾病分类的对应关系。

Acquisition method, device and storage medium of predictive classification model based on Artificial Intelligence

The invention provides a method and device for acquiring prediction classification model based on artificial intelligence and a computer-readable storage medium. The method includes: acquiring training samples from historical medical record data, representing the corresponding relationship between the medical record data of historical patients and their diagnosed diseases; the configuration proportion of positive and negative samples in training samples is preset; acquiring and training Training disease-related text information of disease-related symptoms corresponding to samples; preset disease-related text information to represent multiple disease-related symptoms descriptive language and corresponding disease crowd information; call the set training model to process training samples and training disease-related text information to get training results; based on training results and training samples, adjust the training model until it converges to get pre Test the classification model and predict the corresponding relationship between medical record data and disease classification.

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能的预测分类模型获取方法及装置、存储介质分案说明本申请基于申请号为201910177259.6、申请日为2019年03月08日、专利技术名称为一种医疗文本信息处理方法及装置、存储介质的中国专利申请提出，在该中国专利申请记载的范围内提出分案，该中国专利申请的全部内容在此引入本申请作为参考。
本专利技术涉及人工智能领域中的数据处理技术，尤其涉及一种基于人工智能的预测分类模型获取方法及装置、存储介质。
技术介绍
近年来，人工智能(AI，ArtificialIntelligence)在各个领域中的应用越来越多，成为了各个领域进行决策和预测的一种重要手段。例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。目前，采用知识图谱结合机器学习中的神经网络模型等实现医疗领域中的事件决策或预测。具体的，对疾病类的知识图谱进行特征学习得到实体向量和关系向量等低维向量，然后将这些低维向量引入神经网络模型，实现某一事件决策模型，基于模型和当前数据，完成事件决策。或者，将疾病类的知识图谱特征学习和算法的目标函数结合，使用端到端的方法进行算法模型的联合学习，将最终算法模型中的监督信号及时反馈到知识图谱特征的学习中，不断的调整，最终实现某一事件决策模型，完成事件决策。然而，算法模型只跟人力物力进行标注的知识图谱有关，对知识图谱进行的处理比较单一。>
技术实现思路
本专利技术实施例提供一种基于人工智能的预测分类模型获取方法及装置、存储介质，能够提高数据处理的多样性。本专利技术实施例的技术方案是这样实现的：本专利技术实施例提供一种基于人工智能的预测分类模型获取方法，包括：从历史病历数据中获取训练样本，所述训练样本表征历史患者的病历数据与其确诊病症的对应关系；所述训练样本中的正负样本的配置比例为预设的配置比例；获取与所述训练样本对应的病症的训练疾病相关文本信息；所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息；调用设置的训练模型处理所述训练样本和训练疾病相关文本信息，得到训练结果；基于所述训练结果和所述训练样本，调整所述训练模型直至收敛，得到所述预测分类模型，所述预测分类模型表征病历数据与疾病分类的对应关系。本专利技术实施例提供一种基于人工智能的预测分类模型获取装置，包括：获取单元，用于从历史病历数据中获取训练样本，所述训练样本表征历史患者的病历数据与其确诊病症的对应关系；所述训练样本中的正负样本的配置比例为预设的配置比例；及获取与所述训练样本对应的病症的训练疾病相关文本信息；所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息；及调用设置的训练模型处理所述训练样本和训练疾病相关文本信息，得到训练结果；以及基于所述训练结果和所述训练样本，调整所述训练模型直至收敛，得到所述预测分类模型，所述预测分类模型表征病历数据与疾病分类的对应关系。本专利技术实施例还提供一种基于人工智能的预测分类模型获取装置，包括：存储器，用于存储可执行数据处理指令；处理器，用于执行所述存储器中存储的可执行数据处理指令时，实现本专利技术实施例提供的基于人工智能的预测分类模型获取方法。本专利技术实施例提供一种计算机可读存储介质，存储有可执行数据处理指令，用于引起处理器执行时，实现本专利技术实施例提供的基于人工智能的预测分类模型获取方法。本专利技术实施例具有以下有益效果：由于基于人工智能的预测分类模型获取装置采用了简单易获取的文本信息的知识，结合患者的历史病历数据，实现了预测分类模型的训练获取过程，使得采用预测分类模型进行预测时，可以结合注意力机制组成综合的融合性特征，采用融合性特征实现疾病分类，从而提高数据处理的多样性。附图说明图1是本专利技术实施例提供的基于人工智能的预测分类模型获取系统架构的一个可选的结构示意图；图2是本专利技术实施例提供的基于人工智能的预测分类模型获取装置的一个可选的结构示意图一；图3是本专利技术实施例提供的基于人工智能的预测分类模型获取装置的一个可选的结构示意图二；图4是本专利技术实施例提供的基于人工智能的预测分类模型获取方法的一个可选的流程示意图一；图5是本专利技术实施例提供的示例性的LSTM记忆单元的结构图；图6是本专利技术实施例提供的示例性的疾病分类流程图；图7是本专利技术实施例提供的基于人工智能的预测分类模型获取方法的一个可选的流程示意图二；图8是本专利技术实施例提供的示例性的特征融合过程示意图；图9是本专利技术实施例提供的基于人工智能的预测分类模型获取方法的一个可选的流程示意图三。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚，下面将结合附图对本专利技术实施例作进一步地详细描述，所描述的实施例不应视为对本专利技术的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本专利技术实施例保护的范围。除非另有定义，本专利技术实施例所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本专利技术实施例中所使用的术语只是为了描述本专利技术实施例的目的，不是旨在限制本专利技术实施例。对本专利技术实施例进行进一步详细说明之前，对本专利技术实施例中涉及的名词和术语进行说明，本专利技术实施例中涉及的名词和术语适用于如下的解释。1)、特征提取：将原始特征转换为一组具有明显物理意义(Gabor、几何特征[角点、不变量]、纹理[LBPHOG]等)或者统计意义或核的特征。在本专利技术实施例中的特征提取是指对音频数据中提取重要音频信息的特征向量。2)、长短期记忆单元模型(LSTM，LongShortTermMemory)是一种时间递归神经网络，能选择性地记忆历史信息(历史积累特性)。在RNN模型基础上对其作进一步改进，采用LSTM单元替换RNN网络中的隐含层节点，就则形成LSTM。3)、卷积神经网络(CNN，ConvolutionalNeuralNetworks)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks)，是深度学习(deeplearning)的代表算法之一。4)、机器学习(ML，MachineLearning)：依托概率论，统计学，神经传播等理论，使计算机能够模拟人类的学习行为，以获取新的知识或者技能，重新组织已有知识结构使之不断改善自身的性能。5)、模型训练：将人工选择的样本输入给机器学习系统，通过不断调整模型参数，使最终模型对样本识别的准确率达到最优。6)、人工智能：是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。需要说明的是，人工智能是计算机科学的一个综合技术，它企图了解智能的本文档来自技高网...

【技术保护点】
1.一种基于人工智能的预测分类模型获取方法，其特征在于，包括：/n从历史病历数据中获取训练样本，所述训练样本表征历史患者的病历数据与其确诊病症的对应关系；所述训练样本中的正负样本的配置比例为预设的配置比例；/n获取与所述训练样本对应的病症的训练疾病相关文本信息；所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息；/n调用设置的训练模型处理所述训练样本和训练疾病相关文本信息，得到训练结果；/n基于所述训练结果和所述训练样本，调整所述训练模型直至收敛，得到所述预测分类模型，所述预测分类模型表征病历数据与疾病分类的对应关系。/n

【技术特征摘要】
1.一种基于人工智能的预测分类模型获取方法，其特征在于，包括：
从历史病历数据中获取训练样本，所述训练样本表征历史患者的病历数据与其确诊病症的对应关系；所述训练样本中的正负样本的配置比例为预设的配置比例；
获取与所述训练样本对应的病症的训练疾病相关文本信息；所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息；
调用设置的训练模型处理所述训练样本和训练疾病相关文本信息，得到训练结果；
基于所述训练结果和所述训练样本，调整所述训练模型直至收敛，得到所述预测分类模型，所述预测分类模型表征病历数据与疾病分类的对应关系。

2.根据权利要求1所述的方法，其特征在于，所述基于所述训练结果和所述训练样本，调整所述训练模型直至收敛，得到所述预测分类模型，包括：
根据所述训练结果、所述训练样本和预设损失函数确定误差值；
当所述误差值在预设阈值范围内时，确定所述训练模型收敛；
当所述误差值未在预设阈值范围内时，调整所述训练模型中的模型参数，直至所述误差值达到所述预设阈值范围为止，确定所述训练模型收敛；
将收敛的训练模型作为所述预测分类模型。

3.根据权利要求1或2所述的方法，其特征在于，所述训练模型中包含输入层、编码层、知识融合层和全连接层；所述调用设置的训练模型处理所述训练样本和训练疾病相关文本信息，得到训练结果，包括：
通过所述输入层将所述训练样本和所述训练疾病相关文本信息传输至编码层，进行对文字型数据的长短期记忆网络LSTM编码，以及对数值型数据的卷积神经网络CNN编码，得到训练疾病文本特征和历史病历数据特征；
将所述训练疾病文本特征和所述历史病历数据特征在知识融合层拼接后，得到训练融合特征；
采用训练融合特征传输至所述全连接层，得到最后的训练结果。

4.根据权利要求1所述的方法，其特征在于，
所述预设疾病相关文本信息包括：多种疾病症状描述文字信息和对应的易患人群信息；
所述历史病历数据包括：历史病史数据、历史体征检查数据、历史检验数据或历史患者信息中的至少一种。

5.一种基于人工智能的预测分类模型获取装置，其特征在于，包括：
获取单元，用于从历史病历数据中获取训练样本，所述训...

【专利技术属性】
技术研发人员：刘续乐，杨巍，孙钟前，胡海峰，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人