一种药品问答模型训练方法技术

技术编号:39720804 阅读:6 留言:0更新日期:2023-12-17 23:26
本发明专利技术公开了一种药品问答模型训练方法

【技术实现步骤摘要】
一种药品问答模型训练方法、装置、电子设备和存储介质


[0001]本专利技术涉及药品问答模型训练
,尤其涉及一种药品问答模型训练方法

装置

电子设备和存储介质


技术介绍

[0002]智能问答机器人的应用是企业节省人力成本和提高效率的重要手段之一,可以帮助企业提高客户服务的效率和质量,降低企业的成本,提升企业的竞争力

因此,智能问答机器人逐渐被应用于医疗界,即药品问答机器人,药品问答机器人基于医学大语言模型,通过知识强化训练和真实数据的训练,以灵活

智能的交互方式为医务
(
或医药
)
人员和患者提供服务

[0003]药品问答机器人的应用基于药品问答模型,但在对药品问答模型进行训练时,在训练数据中,并非所有任务都有足够的标记数据,导致药品问答机器人在各种情境下问答的泛化能力较低,难以为患者提供高质量的服务


技术实现思路

[0004]本专利技术提供了一种药品问答模型训练方法,以解决并非所有任务都有足够的标记数据,导致药品问答模型泛化能力较低,难以为患者提供高质量的服务的问题

[0005]第一方面,本专利技术提供了一种药品问答模型训练方法,包括:
[0006]获取包括多个药品问答类的数据集的训练数据,所述训练数据包括标记数据和无标记数据,所述标记数据包括上文信息和下文信息;
[0007]基于上下文关系将所述无标记数据设置为所述标记数据;
[0008]基于每个所述数据集的数据量设置所述数据集的数据的抽取概率,所述数据集的数据的抽取概率与数据量成反比;
[0009]将抽取到的所述训练数据中的上文信息输入药品问答模型,以在药品问答模型的输出层输出下文信息向量;
[0010]根据所述下文信息向量

与输入的上文信息对应的下文信息调整药品问答模型的参数

[0011]第二方面,本专利技术提供了一种药品问答模型训练装置,包括:
[0012]训练数据获取模块,用于获取包括多个药品问答类的数据集的训练数据,所述训练数据包括标记数据和无标记数据,所述标记数据包括上文信息和下文信息;
[0013]标记模块,用于基于上下文关系将所述无标记数据设置为所述标记数据;
[0014]概率设置模块,用于基于每个所述数据集的数据量设置所述数据集的数据的抽取概率,所述数据集的数据的抽取概率与数据量成反比;
[0015]训练数据输入模块,用于将抽取到的所述训练数据中的上文信息输入药品问答模型,以在药品问答模型的输出层输出下文信息向量;
[0016]参数调整模块,用于根据所述下文信息向量

与输入的上文信息对应的下文信息
调整药品问答模型的参数

[0017]第三方面,本专利技术提供了一种电子设备,所述电子设备包括:
[0018]至少一个处理器;以及
[0019]与所述至少一个处理器通信连接的存储器;其中,
[0020]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术第一方面所述的药品问答模型训练方法

[0021]第四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术第一方面所述的药品问答模型训练方法

[0022]本专利技术实施例提供的一种药品问答模型训练方法,包括:获取包括多个药品问答类的数据集的训练数据,训练数据包括标记数据和无标记数据,标记数据包括上文信息和下文信息,基于上下文关系将无标记数据设置为标记数据,则可以将无标记数据转为标记数据,提高模型的泛化能力

[0023]再基于每个数据集的数据量设置数据集中数据的抽取概率,数据集的数据的抽取概率与自身数据量成反比,则数据集的数据量越大,其抽取概率越小,可以避免用于训练的数据集中于数据量大的数据集中,而导致而对药品问答模型输出的内容偏好产生不良影响,数据集的数据平均分布,也提高模型的泛化能力,可以为患者提供高质量的服务;将训练数据中的上文信息输入药品问答模型,以在药品问答模型的输出层输出下文信息向量;根据下文信息向量

与输入的上文信息对应的下文信息调整药品问答模型的参数

这样可以训练药品问答模型学习理解药品问答类的数据,还能够对上文进行理解后输出对应的下文,则在药品问答时,可以根据病症治疗或药品使用等提问进行相应的回答

[0024]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围

本专利技术的其它特征将通过以下的说明书而变得容易理解

附图说明
[0025]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0026]图1是本专利技术实施例一提供的一种药品问答模型训练方法的流程图;
[0027]图2是本专利技术实施例二提供的一种药品问答模型训练方法的流程图;
[0028]图3是本专利技术实施例三提供的一种药品问答模型训练方法的流程图;
[0029]图4是本专利技术实施例四提供的一种药品问答模型训练装置的结构示意图;
[0030]图5是本专利技术实施例五提供的电子设备的结构示意图

具体实施方式
[0031]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是
本专利技术一部分的实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围

[0032]实施例一
[0033]图1为本专利技术实施例一提供的一种药品问答模型训练方法的流程图,本实施例可适用于药品问答模型训练的情况,该方法可以由药品问答模型训练装置来执行,该药品问答模型训练装置可以采用硬件和
/
或软件的形式实现,该药品问答模型训练装置可配置于电子设备中

如图1所示,该药品问答模型训练方法包括:
[0034]S101、
获取包括多个药品问答类的数据集的训练数据,训练数据包括标记数据和无标记数据,标记数据包括上文信息和下文信息

[0035]其中,无标记数据的数据量大于标记数据的数据量

[0036]从数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种药品问答模型训练方法,其特征在于,包括:获取包括多个药品问答类的数据集的训练数据,所述训练数据包括标记数据和无标记数据,所述标记数据包括上文信息和下文信息;基于上下文关系将所述无标记数据设置为所述标记数据;基于每个所述数据集的数据量设置所述数据集的数据的抽取概率,所述数据集的数据的抽取概率与数据量成反比;将抽取到的所述训练数据中的上文信息输入药品问答模型,以在药品问答模型的输出层输出下文信息向量;根据所述下文信息向量

与输入的上文信息对应的下文信息调整药品问答模型的参数
。2.
如权利要求1所述的药品问答模型训练方法,其特征在于,所述基于每个所述数据集的数据量设置所述数据集中数据的抽取概率,包括:确定所有待设置抽取概率的所述数据集的抽取概率的概率和值,所述概率和值的初始值为1;在待设置抽取概率的所述数据集中,将数据量最大的所述数据集作为第一数据,将剩余的所述数据集作为第二数据,基于所述第一数据

所述第二数据的数据量设置所述第一数据

所述第二数据的抽取概率,所述第一数据

所述第二数据的抽取概率与对应的数据量成反比;判断所述第二数据中所述数据集的数量是否大于2;若是,将所述第二数据的抽取概率作为所有待设置抽取概率的所述数据集的抽取概率的概率和值,返回确定所有待设置抽取概率的所述数据集的抽取概率的概率和值的步骤;若否,完成抽取概率的设置
。3.
如权利要求2所述的药品问答模型训练方法,其特征在于,所述基于所述第一数据

所述第二数据的数据量设置所述第一数据

所述第二数据的抽取概率,包括:计算所述第一数据

所述第二数据的数据量总和;计算所述第一数据的数据量在所述数据量总和中的第一占比;计算1与所述第一占比的差值,得到第二占比;将所述第二占比与所述概率和值的乘积作为所述第一数据的抽取概率,将所述第一占比与所述概率和值的乘积作为所述第二数据的抽取概率
。4.
权利要求1所述的药品问答模型训练方法,其特征在于,所述训练数据包括多个文本,每个所述文本包括多个段落,在将所述训练数据中的上文信息输入药品问答模型,以在药品问答模型的输出层输出下文信息向量之前,还包括:针对所述训练数据中的每个所述文本,对所述文本中的段落按顺序进行编号;针对每个当前编号的段落,将当前编号的段落中末端的预设数量的字节复制到下一编号的段落的首端
。5.
如权利要求1所述的药品问答模型训练方法,其特征在于,所述根据所述下文信息向量

与输入的上文信息对应的下文信息调整所述药品...

【专利技术属性】
技术研发人员:谢方敏周峰郭陟利锦轩梁加明
申请(专利权)人:广州方舟信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1