模型的训练方法、要素解析方法、装置、设备及可读介质制造方法及图纸

技术编号：38009068 阅读：8 留言：0更新日期：2023-06-30 10:28

本发明专利技术公开了一种模型的训练方法、要素解析方法、装置、设备及可读介质；该模型的训练方法包括：基于医学文本和提示模板构建输入

全部详细技术资料下载

【技术实现步骤摘要】
模型的训练方法、要素解析方法、装置、设备及可读介质

[0001]本专利技术是关于人工智能
，特别是关于一种医学文本要素解析模型的训练方法、医学文本要素解析方法、医学文本要素装置、电子设备及计算机可读介质。

技术介绍

[0002]随着医院信息化系统以及互联网医院在线问诊的发展和普及，积累了大量医生和患者自诉的医学文本数据。如何借助人工智能中的自然语言处理(Natural Language Processing，NLP)技术，对这些医学文本中所隐含的细粒度要素信息进行准确的解析和抽取成为一个亟待解决的问题。
[0003]因此，针对上述技术问题，有必要提供一种模型的训练方法、要素解析方法、装置、设备及可读介质。

技术实现思路

[0004]本专利技术的目的在于提供一种模型的训练方法、要素解析方法、装置、设备及可读介质，其能够准确的解析和抽取医学文本中的细粒度要素信息。
[0005]为实现上述目的，本专利技术提供的技术方案如下：
[0006]第一方面，本专利技术提供了一种医学文本要素解析模型的训练方法，其包括：
[0007]基于医学文本和提示模板构建输入
‑
输出文本对，其中，所述提示模板包括细粒度分类标签，所述文本对中的输入文本缺少与所述细粒度分类标签对应的细粒度要素信息，所述文本对中的输出文本填充与所述细粒度分类标签对应的细粒度要素信息；
[0008]以所述文本对为预训练语言模型的输入和输出，基于预设的损失函数微调所述预训练语言模型中与所述提示模...

【技术保护点】

【技术特征摘要】
1.一种医学文本要素解析模型的训练方法，其特征在于，包括：基于医学文本和提示模板构建输入
‑
输出文本对，其中，所述提示模板包括细粒度分类标签，所述文本对中的输入文本缺少与所述细粒度分类标签对应的细粒度要素信息，所述文本对中的输出文本填充与所述细粒度分类标签对应的细粒度要素信息；以所述文本对为预训练语言模型的输入和输出，基于预设的损失函数微调所述预训练语言模型中与所述提示模板对应的参数，所述预训练语言模型用于预测输入文本中缺失的细粒度要素信息。2.如权利要求1所述的医学文本要素解析模型的训练方法，其特征在于，所述训练方法具体包括：构建包括细粒度分类标签的提示模板，其中，与所述细粒度分类标签对应的细粒度要素信息以掩码进行表示，所述细粒度分类标签包括疾病大类、疾病亚型、疾病分期、是否转移、转移部位、治疗方案中的至少一个；将所述医学文本与所述提示模板进行拼接，得到所述输入
‑
输出文本对中的输入文本。3.如权利要求2所述的医学文本要素解析模型的训练方法，其特征在于，所述训练方法具体包括：提取所述医学文本中与所述细粒度分类标签对应的细粒度要素信息；将所述提示模板中表示细粒度要素信息的所述掩码，替换为所述提取的细粒度要素信息；将所述医学文本与所述替换后的提示模板进行拼接，得到所述输入
‑
输出文本对中的输出文本。4.如权利要求1所述的医学文本要素解析模型的训练方法，其特征在于，所述训练方法还包括：通过病历获取原始医学文本；对所述原始医学文本进行清洗处理及纠错处理，得到所述医学文本。5.如权利要求4所述的医学文本要素解析模型的训练方法，其特征在于，所述清洗处理具体包括：英文简写替换、阿拉伯数字到中文数字的转化、中文拼音替换、罗马数字规范化、去除重复字符、遗漏字符补齐。6.如权利要求4所述的医学文本要素解析模型的训练方法，其特征在于，所述纠错处理具体包括：检测...

【专利技术属性】
技术研发人员：王永明，赵周剑，司婧，王育清，
申请(专利权)人：浙江太美医疗科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人