当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于问题生成的教育领域知识库搜索优化方法和装置制造方法及图纸

技术编号:40378701 阅读:21 留言:0更新日期:2024-02-20 22:17
本发明专利技术公开了一种基于问题生成的教育领域知识库搜索优化方法,该方法首先获取教育知识库方向的领域语料解析得到教育领域文本;使用教育领域文本进行预训练语言模型迁移学习得到语义模型;基于知识库中已有的结构化文本信息设计固定的问答对模板,获得知识库问答对;利用知识库问答对数据和中文开源问答对数据训练问题生成模型,部署问题生成推理服务;生成问答对扩充知识库;使用语义模型对知识库结构化信息中的实体节点文本及问答对中的问题文本同时语义编码,构建向量库,待用户查询输入后进行语义相似度计算;在线语义匹配召回最佳结果;本发明专利技术极大提升用户搜索行为返回结果的召回率,提升学习效率,改善用户体验。

【技术实现步骤摘要】

本专利技术涉及教育知识库、搜索及问题生成,尤其涉及一种基于问题生成的教育领域知识库搜索优化方法和装置


技术介绍

1、教育乃国之根本,随着教育信息化的推进,互联网技术引导的教育智能化是进入发展快车道。而教育与知识具备天然的联系,知识图谱作为认知智能的关键技术基础,在教育智能化中起着决定性作用。其中,基于教育知识图谱的智能应用——知识搜索问答更是教育智能化的关键一环,也是教育者和受教育者最为依赖的功能之一。当前,仅限于知识图谱三元组数据搭建的教育领域知识库搜索却常无法满足用户的实际需求,如受教育者在不熟悉的新知识领域时,常有搜索词不准确导致难以召回,直接导致用户的直接需求无法满足。故有效提升知识库搜索效果,将极大化提升用户使用体验,辅助受教育者更好的学习、教育者更便捷的备课。

2、常见的知识库搜索优化方法,如直接使用模糊搜索、查询提示或语义匹配等技术在要求精准的教育领域收效甚微。也有通过将现有搜索技术和知识库结合,如:一、通过搜索词与知识库内容进行处理后的字符串匹配;二、通过优化后的语义模型统一编码后,对搜索词和库内知识进行相似计算;三、利用知识本文档来自技高网...

【技术保护点】

1.一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(1)具体为:获取对应学科方向的教材、课件以及专业相关的网页内容,教材和课件进行ocr识别或版面分析处理,网页内容进行爬虫解析处理,得到的完整文本内容,去除无效字符、重复内容及句法不通语料,得到教育领域文本。

3.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(2)具体为:基于BERT、ELECTRA、ALBert自然语言理解类预训练语言模型,使用教育领域文本...

【技术特征摘要】

1.一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(1)具体为:获取对应学科方向的教材、课件以及专业相关的网页内容,教材和课件进行ocr识别或版面分析处理,网页内容进行爬虫解析处理,得到的完整文本内容,去除无效字符、重复内容及句法不通语料,得到教育领域文本。

3.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(2)具体为:基于bert、electra、albert自然语言理解类预训练语言模型,使用教育领域文本进行mlm和mpnetd预训练任务,做迁移学习实验,得到语义模型。

4.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(3)中,结构化文本信息为三元组结构数据。

5.根据权利要求4所述的一种基于问题生成的教育领域知识库搜索优化方法,其特...

【专利技术属性】
技术研发人员:王琪皓黄程韦朱晓明曹柳巨然
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1