一种句子扫查方法、装置及存储介质制造方法及图纸

技术编号:30317389 阅读:31 留言:0更新日期:2021-10-09 23:19
本申请实施例公开一种句子扫查方法、装置及存储介质。该方法包括:根据用户当前学习的教材文件,获取教材文件的字词元素及与单个字词元素建立映射关系的元素信息表,元素信息表包括教材文件中所有包含单个字词元素的句子的句子信息;获取扫描笔识别得到的扫描字段,对扫描字段进行分词处理,获取扫描字段包含的一个或多个关键字词;调取与关键字词相同的字词元素的元素信息表,获取关键字词的句子信息;根据关键字词的句子信息,确定扫描字段所属的句子,并将该句子进行播放或展示。采用上述技术手段,解决现有扫描笔无法根据句子部分字段对应播放或翻译完整句子的问题,提高用户使用体验。使用体验。使用体验。

【技术实现步骤摘要】
一种句子扫查方法、装置及存储介质


[0001]本申请实施例涉及智能学习
,尤其涉及一种句子扫查方法、装置及存储介质。

技术介绍

[0002]现在中小学生会要求对英语课文进行朗读,但对于刚开始学习的英语课文,学生并不能熟练朗读一些句子。此时需要学生使用扫描笔中的课本扫描朗读功能,扫描该英语课文中的句子,扫描笔播放识别到的扫描句子。
[0003]但现有扫描笔只能对识别到的扫描句子进行播放,即学生需要从头到尾对需要播放的句子进行扫描,扫描笔才能完整播放该句子。对于一些长句子,如果学生想要扫描笔完整播放或翻译该长句子,需要花费一些精力从头到尾扫描该长句子,影响学生的使用体验。

技术实现思路

[0004]本申请实施例提供一种句子扫查方法、装置及存储介质,解决现有扫描笔无法根据句子部分字段对应播放或翻译完整句子的问题。
[0005]在第一方面,本申请实施例提供了一种扫描笔的句子扫查方法,包括:
[0006]根据用户当前学习的教材文件,获取所述教材文件的字词元素及与单个字词元素建立映射关系的元素信息表,所述元素信息表包括所述教材文件中所有包含单个字词元素的句子的句子信息;
[0007]获取扫描笔识别得到的扫描字段,对所述扫描字段进行分词处理,获取所述扫描字段包含的一个或多个关键字词;
[0008]调取与所述关键字词相同的所述字词元素的所述元素信息表,获取所述关键字词的句子信息;
[0009]根据所述关键字词的句子信息,确定所述扫描字段所属的句子,并将该句子进行播放或展示。
[0010]进一步的,所述根据用户当前学习的教材文件,获取所述教材文件的元素信息表包括:
[0011]所述根据用户当前学习的教材文件,获取所述教材文件的字词元素及与单个字词元素建立映射关系的元素信息表包括:
[0012]获取扫描笔识别到的教材名称,根据所述教材名称确定对应的教材文件;
[0013]获取与所述教材文件关联保存的字词元素和与单个字词元素建立映射关系的元素信息表。
[0014]进一步的,所述获取与所述教材文件关联保存的字词元素和与单个字词元素建立映射关系的元素信息表包括:
[0015]根据扫描笔识别到的教材名称,下载所述教材名称对应的教材文件;
[0016]对所述教材文件中每页的句子进行分词处理,提取该句子包含的字词元素;
[0017]对所有提取到的字词元素进行去重处理,保留所述教材文件中不同的字词元素;
[0018]将保留的字词元素和所属句子的句子信息关联保存为所述元素信息表,并将所述元素信息表与所述教材文件关联保存,所述句子信息包括所述字词元素在所属句子中的排序和所述字词元素所属句子的教材页码。
[0019]进一步的,所述对所述扫描字段进行分词处理,获取所述扫描字段包含的一个或多个关键字词包括:
[0020]若所述扫描字段中同一字符匹配到不同的词元素,则将包含字符最多的词元素确定为所述扫描字段包含的关键词。
[0021]进一步的,所述根据所述关键字词的句子信息,确定所述扫描字段所属的句子包括:
[0022]将每个所述关键字词所属的句子进行比较,确定出包含所有关键字词的交集句子;
[0023]在确定出一个包含所有关键字词的交集句子时,确定该交集句子为所述扫描字段所属的句子。
[0024]进一步的,所述根据所述关键字词的句子信息,确定所述扫描字段所属的句子包括:
[0025]在确定出多个包含所有关键字词的交集句子时,根据所述关键字词在所述交集句子中的排序和所述关键字词在所述扫描字段中的排序,确定包含所述扫描字段的权重句子;
[0026]在确定出一个包含所述扫描字段的权重句子时,确定该权重句子为所述扫描字段所属的句子。
[0027]进一步的,所述根据所述关键字词在所述交集句子中的排序和所述关键字词在所述扫描字段中的排序,确定包含所述扫描字段的权重句子包括:
[0028]按照所述交集句子的字词元素的排序,依次将所述交集句子中的字词元素与扫描字段的关键字词进行匹配;
[0029]在匹配到相同的关键字词时,累加所述交集句子的单位权重分数,并将下一字词元素与下一关键字词进行比较;
[0030]在连续匹配到相同的关键字词时,累加上一次累加的权重分数的N倍(N>1),在匹配到不连续的关键字词时,累加单位权重分数;
[0031]在匹配到所述扫描字段的所有关键字词后,计算所述交集句子的权重分数;
[0032]确定所述权重分数满足预设权重阈值的交集句子为包含所述扫描字段的权重句子。
[0033]进一步的,所述根据所述关键字词的句子信息,确定所述扫描字段所属的句子包括:
[0034]在确定出多个包含所述扫描字段的权重句子时,获取所述教材文件的历史扫描记录,从所述历史扫描记录中获取所述扫描笔识别到的扫描内容的页码;
[0035]将所述扫描内容的页码与所述权重句子的页码进行比较,确定最接近所述扫描内容的权重句子为所述扫描字段所属的句子。
[0036]在第二方面,本申请实施例提供了一种扫描笔的句子扫查装置,包括:
[0037]信息获取模块,被配置为根据用户当前学习的教材文件,获取所述教材文件的字词元素及与单个字词元素建立映射关系的元素信息表,所述元素信息表包括所述教材文件中所有包含单个字词元素的句子的句子信息;
[0038]分词提取模块,被配置为获取扫描笔识别得到的扫描字段,对所述扫描字段进行分词处理,获取所述扫描字段包含的一个或多个关键字词;
[0039]句子获取模块,被配置为调取与所述关键字词相同的所述字词元素的所述元素信息表,获取所述关键字词的句子信息;
[0040]句子确定模块,被配置为根据所述关键字词的句子信息,确定所述扫描字段所属的句子,并将该句子进行播放或展示。
[0041]在第三方面,本申请实施例提供了一种扫描笔,包括:
[0042]一个或多个处理器;
[0043]存储器,用于存储一个或多个程序;
[0044]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的扫描笔的句子扫查方法。
[0045]在第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的扫描笔的句子扫查方法。
[0046]上述扫描笔的句子扫查方法、装置、设备及存储介质,根据用户当前学习的教材文件,获取教材文件的字词元素及与单个字词元素建立映射关系的元素信息表,元素信息表包括教材文件中所有包含单个字词元素的句子的句子信息;获取扫描笔识别得到的扫描字段,对扫描字段进行分词处理,获取扫描字段包含的一个或多个关键字词;调取与关键字词相同的字词元素的元素信息表,获取关键字词的句子信息;根据关键字词的句子信息,确定扫描字段所属的句子,并将该句子进行播放或展示。通过上述技术手段,对扫本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种扫描笔的句子扫查方法,其特征在于,包括:根据用户当前学习的教材文件,获取所述教材文件的字词元素及与单个字词元素建立映射关系的元素信息表,所述元素信息表包括所述教材文件中所有包含单个字词元素的句子的句子信息;获取扫描笔识别得到的扫描字段,对所述扫描字段进行分词处理,获取所述扫描字段包含的一个或多个关键字词;调取与所述关键字词相同的所述字词元素的所述元素信息表,获取所述关键字词的句子信息;根据所述关键字词的句子信息,确定所述扫描字段所属的句子,并将该句子进行播放或展示。2.根据权利要求1所述的方法,特征在于,所述根据用户当前学习的教材文件,获取所述教材文件的字词元素及与单个字词元素建立映射关系的元素信息表包括:获取扫描笔识别到的教材名称,根据所述教材名称确定对应的教材文件;获取与所述教材文件关联保存的字词元素和与单个字词元素建立映射关系的元素信息表。3.根据权利要求2所述的方法,其特征在于,所述获取与所述教材文件关联保存的字词元素和与单个字词元素建立映射关系的元素信息表包括:根据扫描笔识别到的教材名称,下载所述教材名称对应的教材文件;对所述教材文件中每页的句子进行分词处理,提取该句子包含的字词元素;对所有提取到的字词元素进行去重处理,保留所述教材文件中不同的字词元素;将保留的字词元素和所属句子的句子信息关联保存为所述元素信息表,并将所述元素信息表与所述教材文件关联保存,所述句子信息包括所述字词元素在所属句子中的排序和所述字词元素所属句子的教材页码。4.根据权利要求1所述的方法,其特征在于,所述对所述扫描字段进行分词处理,获取所述扫描字段包含的一个或多个关键字词包括:若所述扫描字段中同一字符匹配到不同的词元素,则将包含字符最多的词元素确定为所述扫描字段包含的关键词。5.根据权利要求1所述的方法,其特征在于,所述根据所述关键字词的句子信息,确定所述扫描字段所属的句子包括:将每个所述关键字词所属的句子进行比较,确定出包含所有关键字词的交集句子;在确定出一个包含所有关键字词的交集句子时,确定该交集句子为所述扫描字段所属的句子。6.根据权利要求5所述的方法,其特征在于,所述根据所述关键字词的句子信息,确定所述扫描字段所属的句子包括:在确定出多个包含所有关键字词的交集句子时,根据所述关键字词在所述交集句子中的排序和所述关键字词在所述扫描字段中的排序,确定包含所述扫描字段的权重句子;在确定出一个包含所述扫描...

【专利技术属性】
技术研发人员:肖远辉
申请(专利权)人:东莞市小精灵教育软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1