当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于生成式模型的中医药教材问答题生成方法及装置制造方法及图纸

技术编号:40277747 阅读:38 留言:0更新日期:2024-02-02 23:05
本发明专利技术公开了一种基于生成式模型的中医药教材问答题生成方法及装置,首先对教材习题集中源数据进行数据预处理构建习题数据集,将《中国中医药学主题词表》中源数据结构化处理后获取中医药主题词表。然后使用提示学习方法,根据中医药主题词表获取提示,与习题数据构建为模型训练样本,训练得到习题生成模型。之后计算原始文本各段落中医学文本丰富度,选取丰富度较高段落作为生成习题来源。并选取段落进行分词和过滤计算词语关键度,选取关键词作为答案文本。将选取段落和答案文本输入模型获取生成题目,与答案组成问答习题。本发明专利技术提出了一种适用于专业领域计算段落文本信息丰富度的方法,有助于选取出高质量的段落从而提升生成习题的质量。

【技术实现步骤摘要】

本专利技术涉及自然语言处理领域中的语言模型、答案抽取、问题生成领域,具体涉及一种基于生成式模型的中医药教材问答题生成方法及装置


技术介绍

1、中医学有数千年的历史,是中华民族在长期的生产与生活实践中认识生命、维护健康、战胜疾病的宝贵经验总结,是中国传统文化的结晶,中医学在长期的医疗实践中积累了丰富的防治疾病的经验,并在此基础上形成了独特的理论体系。对于初学者来说,在中医学庞大的理论体系中抓住重点知识并进行熟练掌握比较困难,通过习题训练的方式进行学习是一种有效的方法,然而,仅依靠人工去设计习题是一个费时且费力的过程。

2、习题生成就是利用自然语言处理技术实现从给定文本中自动生成习题的过程。习题生成可以分为两大方向:一是基于模板或规则的方法,其原理是通过词法分析和句法分析,利用人工设计的规则和模板将陈述句转换为疑问句,这种方法需要耗费大量人力去设计规则并且依赖于深层的语法知识,泛化性能和可扩展能力较差。二是基于神经网络模型的方法,神经网络使用编码器-解码器框架,其编码器将输入的原始文本转化为固定长度的向量表示,解码器对向量表示进行处理并输出生成的本文档来自技高网...

【技术保护点】

1.一种基于生成式模型的中医药教材问答题生成方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种基于生成式模型的中医药教材问答题生成方法,其特征在于,步骤(1)中使用的数据集构建方法,针对不同题型设计合适的模板进行数据集构建;所述题型包括单选题、多选题和问答题,所述模版包括题干、答案以及解析。

3.根据权利要求1所述的一种基于生成式模型的中医药教材问答题生成方法,其特征在于,步骤(3)中使用提示学习Prompt-learning的方法,将答案进行信息补充后的结果嵌入到提示模板,然后将提示模板与原始输入进行拼接得到完整的输入样本。

4.根...

【技术特征摘要】

1.一种基于生成式模型的中医药教材问答题生成方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种基于生成式模型的中医药教材问答题生成方法,其特征在于,步骤(1)中使用的数据集构建方法,针对不同题型设计合适的模板进行数据集构建;所述题型包括单选题、多选题和问答题,所述模版包括题干、答案以及解析。

3.根据权利要求1所述的一种基于生成式模型的中医药教材问答题生成方法,其特征在于,步骤(3)中使用提示学习prompt-learning的方法,将答案进行信息补充后的结果嵌入到提示模板,然后将提示模板与原始输入进行拼接得到完整的输入样本。

4.根据权利要求1所述的一种基于生成式模型的...

【专利技术属性】
技术研发人员:张引单诗琪
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1