一种药品问答模型训练方法技术

技术编号：39720804 阅读：6 留言：0更新日期：2023-12-17 23:26

本发明专利技术公开了一种药品问答模型训练方法

全部详细技术资料下载

【技术实现步骤摘要】
一种药品问答模型训练方法、装置、电子设备和存储介质

[0001]本专利技术涉及药品问答模型训练
，尤其涉及一种药品问答模型训练方法
、
装置
、
电子设备和存储介质
。

技术介绍

[0002]智能问答机器人的应用是企业节省人力成本和提高效率的重要手段之一，可以帮助企业提高客户服务的效率和质量，降低企业的成本，提升企业的竞争力
。
因此，智能问答机器人逐渐被应用于医疗界，即药品问答机器人，药品问答机器人基于医学大语言模型，通过知识强化训练和真实数据的训练，以灵活
、
智能的交互方式为医务
(
或医药
)
人员和患者提供服务
。
[0003]药品问答机器人的应用基于药品问答模型，但在对药品问答模型进行训练时，在训练数据中，并非所有任务都有足够的标记数据，导致药品问答机器人在各种情境下问答的泛化能力较低，难以为患者提供高质量的服务
。

技术实现思路

[0004]本专利技术提供了一种药品问答模型训练方法，以解决并非所有任务都有足够的标记数据，导致药品问答模型泛化能力较低，难以为患者提供高质量的服务的问题
。
[0005]第一方面，本专利技术提供了一种药品问答模型训练方法，包括：
[0006]获取包括多个药品问答类的数据集的训练数据，所述训练数据包括标记数据和无标记数据，所述标记数据包括上文信息和下文信息；
[0007]基于上下文关系将所述无标记数...

【技术保护点】

【技术特征摘要】
1.
一种药品问答模型训练方法，其特征在于，包括：获取包括多个药品问答类的数据集的训练数据，所述训练数据包括标记数据和无标记数据，所述标记数据包括上文信息和下文信息；基于上下文关系将所述无标记数据设置为所述标记数据；基于每个所述数据集的数据量设置所述数据集的数据的抽取概率，所述数据集的数据的抽取概率与数据量成反比；将抽取到的所述训练数据中的上文信息输入药品问答模型，以在药品问答模型的输出层输出下文信息向量；根据所述下文信息向量
、
与输入的上文信息对应的下文信息调整药品问答模型的参数
。2.
如权利要求1所述的药品问答模型训练方法，其特征在于，所述基于每个所述数据集的数据量设置所述数据集中数据的抽取概率，包括：确定所有待设置抽取概率的所述数据集的抽取概率的概率和值，所述概率和值的初始值为1；在待设置抽取概率的所述数据集中，将数据量最大的所述数据集作为第一数据，将剩余的所述数据集作为第二数据，基于所述第一数据
、
所述第二数据的数据量设置所述第一数据
、
所述第二数据的抽取概率，所述第一数据
、
所述第二数据的抽取概率与对应的数据量成反比；判断所述第二数据中所述数据集的数量是否大于2；若是，将所述第二数据的抽取概率作为所有待设置抽取概率的所述数据集的抽取概率的概率和值，返回确定所有待设置抽取概率的所述数据集的抽取概率的概率和值的步骤；若否，完成抽取概率的设置
。3.
如权利要求2所述的药品问答模型训练方法，其特征在于，所述基于所述第一数据
、
所述第二数据的数据量设置所述第一数据
、
所述第二数据的抽取概率，包括：计算所述第一数据
、
所述第二数据的数据量总和；计算所述第一数据的数据量在所述数据量总和中的第一占比；计算1与所述第一占比的差值，得到第二占比；将所述第二占比与所述概率和值的乘积作为所述第一数据的抽取概率，将所述第一占比与所述概率和值的乘积作为所述第二数据的抽取概率
。4.
权利要求1所述的药品问答模型训练方法，其特征在于，所述训练数据包括多个文本，每个所述文本包括多个段落，在将所述训练数据中的上文信息输入药品问答模型，以在药品问答模型的输出层输出下文信息向量之前，还包括：针对所述训练数据中的每个所述文本，对所述文本中的段落按顺序进行编号；针对每个当前编号的段落，将当前编号的段落中末端的预设数量的字节复制到下一编号的段落的首端
。5.
如权利要求1所述的药品问答模型训练方法，其特征在于，所述根据所述下文信息向量
、
与输入的上文信息对应的下文信息调整所述药品...

【专利技术属性】
技术研发人员：谢方敏，周峰，郭陟，利锦轩，梁加明，
申请(专利权)人：广州方舟信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人