【技术实现步骤摘要】
本专利技术涉及教育知识库、搜索及问题生成,尤其涉及一种基于问题生成的教育领域知识库搜索优化方法和装置。
技术介绍
1、教育乃国之根本,随着教育信息化的推进,互联网技术引导的教育智能化是进入发展快车道。而教育与知识具备天然的联系,知识图谱作为认知智能的关键技术基础,在教育智能化中起着决定性作用。其中,基于教育知识图谱的智能应用——知识搜索问答更是教育智能化的关键一环,也是教育者和受教育者最为依赖的功能之一。当前,仅限于知识图谱三元组数据搭建的教育领域知识库搜索却常无法满足用户的实际需求,如受教育者在不熟悉的新知识领域时,常有搜索词不准确导致难以召回,直接导致用户的直接需求无法满足。故有效提升知识库搜索效果,将极大化提升用户使用体验,辅助受教育者更好的学习、教育者更便捷的备课。
2、常见的知识库搜索优化方法,如直接使用模糊搜索、查询提示或语义匹配等技术在要求精准的教育领域收效甚微。也有通过将现有搜索技术和知识库结合,如:一、通过搜索词与知识库内容进行处理后的字符串匹配;二、通过优化后的语义模型统一编码后,对搜索词和库内知识进行相
...【技术保护点】
1.一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(1)具体为:获取对应学科方向的教材、课件以及专业相关的网页内容,教材和课件进行ocr识别或版面分析处理,网页内容进行爬虫解析处理,得到的完整文本内容,去除无效字符、重复内容及句法不通语料,得到教育领域文本。
3.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(2)具体为:基于BERT、ELECTRA、ALBert自然语言理解类预训练语言模
...【技术特征摘要】
1.一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(1)具体为:获取对应学科方向的教材、课件以及专业相关的网页内容,教材和课件进行ocr识别或版面分析处理,网页内容进行爬虫解析处理,得到的完整文本内容,去除无效字符、重复内容及句法不通语料,得到教育领域文本。
3.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(2)具体为:基于bert、electra、albert自然语言理解类预训练语言模型,使用教育领域文本进行mlm和mpnetd预训练任务,做迁移学习实验,得到语义模型。
4.根据权利要求1所述的一种基于问题生成的教育领域知识库搜索优化方法,其特征在于,所述步骤(3)中,结构化文本信息为三元组结构数据。
5.根据权利要求4所述的一种基于问题生成的教育领域知识库搜索优化方法,其特...
【专利技术属性】
技术研发人员:王琪皓,黄程韦,朱晓明,曹柳,巨然,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。