一种基于预训练模型的癌症问答交互方法技术

技术编号：37531247 阅读：9 留言：0更新日期：2023-05-12 15:57

本发明专利技术涉及一种基于预训练模型的癌症问答交互方法，其中，包括：步骤1：收集并整理癌症和诱因数据，训练关于癌症的联合意图识别和实体槽位填充的BERT模型；步骤2：设置ERNIE模型参数，进行ERNIE模型训练；步骤3：收集癌症医疗数据，并对数据进行预处理，使用Transformer

全部详细技术资料下载

【技术实现步骤摘要】
一种基于预训练模型的癌症问答交互方法

[0001]本专利技术专利涉及医疗智能问答领域，尤其涉及一种基于预训|练模型的癌症问答交互方法。

技术介绍

[0002]近些年在
″
互联网+
″
的浪潮下，智能问诊技术蓬勃发展，患者或者家属可以在与医生沟通之前，通过手机或PC端进入医院智能问诊模块中，输入患者的基本信息、症状、既往病史、过敏史等信息，系统将初步形成诊断报告，以减少医生与患者的沟通时间，大大提升医患沟通效率，同时在患者的日常维护中，智能问诊也能够帮助患者看病和解决一些疑惑，从而达到心理安抚和辅助治疗的目的。从长远来看，也能拿帮助帮助患者记录和管理病情情况，从而给医生提供更全面的信息，帮助患者更好的治疗。
[0004]预训|练语言模型(PTM)的发展将智能问诊领域的研究提升到了一个新的阶段，无需人工标签，可以从海量的语料中可以学习到通用的语言表示，并显著提升下游任务的表征。大型语料库上的预训|练模型已经可以学习通用的语言表征，这对于下游的NLP相关任务是非常有帮助的，可以避免大量从零开始训|练新模型。而随着算力的发展、深层模型出现以及训|练技能的不断提高，PTM体系结构已然从浅层发展到了深层，对于下游的任务也很难再从零开始进行训|练。

技术实现思路

[0005]本专利技术的目的在于提供一种基于预训练模型的癌症问答交互方法，用于解决癌症患者和医生之间沟通效率和患者长期维护难的问题。
[0006]本专利技术一种基于预训|练模型的癌症问答交互方法，其中，包括...

【技术保护点】

【技术特征摘要】
1.一种基于预训练模型的癌症问答交互方法，其特征在于，包括：步骤1：收集并整理癌症和诱因数据，设置BERT模型参数，训|练关于癌症的联合意图识别和实体槽位填充的BERT模型；步骤2：对步骤1收集并整理癌症和诱因数据进行分型，对于同实体和意图的问句作为相似度为1数据，对没有关系的数据，定义相似度为0；设置ERNIE模型参数，进行ERNIE模型训练，保存最好的ERNIE模型和训练后的ERNIE模型，对比在测试集上效果好的ERNIE模型作为进行癌症文本相似度计算的ERNIE模型；步骤3：收集癌症医疗数据，并对数据进行预处理，使用Transformer
‑
XL预训练模型进行微调训练，得到癌症的自然语言生成Transformer
‑
XL模型；步骤4：输入想要咨询的问题，然后将文本输入到训练好的BERT模型，进行癌症意图识别和实体槽位填充，以计算出获得的实体和意图置信度，当置信度大于一第一阈值，在数据库中获得答案并输出；当置信度小于等于该第一阈值，则从网上搜索答案，然后将句子和用户的问题进行匹配，使用训练好的文本相似度计算的ERNIE模型，计算出每一条的相似度，将相似度最高的置信度与第二阈值进行比较，如果大于该第二阈值，则获取对应网站的答案并输出；如果置信度小于等于该第二阈值，则使用癌症的自然语言生成Transformer
‑
XL模型进行回答。2.如权利要求1所述的基于预训练模型的癌症问答交互方法，其特征在于，癌症和诱因数据包括：癌症的意图和实体槽位，意图包括：买药、治疗方式、饮食注意事项以及疾病发病原因，实体槽位包括常见癌症类型；设置BERT模型参数包括：最大长度为50，批量大小为128，Adam用于优化，初始学习率为5e
‑
5，Dropout为0.1，最大训练次数epoch为20。3.如权...

【专利技术属性】
技术研发人员：童云飞，张超仁，邓天然，
申请(专利权)人：上海仰和华健人工智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人