【技术实现步骤摘要】
一种考研词汇精准识别方法、存储装置及移动终端
本专利技术属于计算机通信领域,具体涉及一种考研单词的搜索精准识别方法、存储装置及移动终端。
技术介绍
随着全民的英语学习意识的增强,越来越多的人开始英语学习,各种各样的英语学习软件也应运而生。现有的学习软件的单词学习模式都是用户选定需要背诵的单词列表,然后软件根据用户选定的待背诵的单词列表按照单词列表的顺序或者随机向用户推荐,这种复习单词的方式往往使用户需要背诵完整个单词列表的单词才能进行复习,或者是第二天复习第一天学过的所有单词,这种复习单词的方式往往使用户在背到单词列表末尾单词时已经忘记了最开始背过的单词;对于一些考试常考的高频词汇,用户无法获知其曾经出现在哪些考试哪些试卷中,无法知道这些高频词汇的实际考点及考试场景。例如,像大学英语四六级考试、雅思托福考试、考研英语考试等,其通常会有一些常考的高频词汇。但现有的单词软件中,对于这些词汇的来源、曾经出现的考点均没有涉及,使考生难以联系该单词与实际考试之间的关联,无法在考试语句环境下进一步记住该单词。因此,针对现有技术中存在的技术问题,亟需提供一种通过搜索英语词汇,即能获知其曾经出现在考研英语中的试卷出处及相关语句的考研词汇搜索精准识别技术显得尤为重要。
技术实现思路
本专利技术的目的在于克服上述现有技术的不足,提供一种考研词汇搜索精准识别方法,该方法可根据用户输入的单词,反馈生成该单词在考研英语试卷中的出处及词汇应用,使用户能根据考试要求及其语境下,更好地记住该单词,以及获知该单词的具体应用 ...
【技术保护点】
1.一种考研词汇精准识别方法,适用于在智能终端设备中执行,其特征在于,该方法包括以下步骤:/nS1.建立考研英语试卷数据库:/n将历年考研英语试卷的内容通过图像扫描识别方式自动输入或通过键入的方式手动输入至存储单元内存储,形成考研英语试卷数据库;/nS2.建立考研高频词汇表:/n遍历统计考研英语试卷数据库中各词汇出现的次数T,抓取出现次数T≥t的词汇,将其标记为考研高频词汇,并将所有考研高频词汇记录,建立考研高频词汇表,并将每个考研高频词汇进行编码,使每个考研高频词汇具有独立的编码ID;其中,t≥2;/nS3.建立携带有考研高频词汇的考研语句数据库:/n从考研英语试卷数据库中抓取携带有考研高频词汇的语句,并建立该语句S的识别信息,所述识别信息包括该语句中涉及的所有考研高频词汇的编码,以及该语句的考核年份、考卷号、考题类型、题号、段落;/n将所有携带有考研高频词汇的语句及其识别信息保存,形成考研语句数据库;/nS4.获取搜索词汇:/n接收用户键入的搜索词汇,将搜索词汇与考研高频词汇表进行比对;/nS5.反馈词汇来源数据:/n判断搜索词汇是否为考研高频词汇表内的单词,若搜索词汇属于考研高频 ...
【技术特征摘要】
1.一种考研词汇精准识别方法,适用于在智能终端设备中执行,其特征在于,该方法包括以下步骤:
S1.建立考研英语试卷数据库:
将历年考研英语试卷的内容通过图像扫描识别方式自动输入或通过键入的方式手动输入至存储单元内存储,形成考研英语试卷数据库;
S2.建立考研高频词汇表:
遍历统计考研英语试卷数据库中各词汇出现的次数T,抓取出现次数T≥t的词汇,将其标记为考研高频词汇,并将所有考研高频词汇记录,建立考研高频词汇表,并将每个考研高频词汇进行编码,使每个考研高频词汇具有独立的编码ID;其中,t≥2;
S3.建立携带有考研高频词汇的考研语句数据库:
从考研英语试卷数据库中抓取携带有考研高频词汇的语句,并建立该语句S的识别信息,所述识别信息包括该语句中涉及的所有考研高频词汇的编码,以及该语句的考核年份、考卷号、考题类型、题号、段落;
将所有携带有考研高频词汇的语句及其识别信息保存,形成考研语句数据库;
S4.获取搜索词汇:
接收用户键入的搜索词汇,将搜索词汇与考研高频词汇表进行比对;
S5.反馈词汇来源数据:
判断搜索词汇是否为考研高频词汇表内的单词,若搜索词汇属于考研高频词汇表内的单词,则反馈包含该搜索词汇的词汇来源数据;具体步骤如下:
S5-1.发送搜索词汇的编码:
将搜索词汇与考研高频词汇表内的单词进行比对,当搜索词汇属于考研高频词汇时,将该搜索词汇所对应的考研高频词汇的编码发送至处理单元;
S5-2.抓取携带搜索词汇的考研语句:
处理单元根据接收到的搜索词汇的编码,在考研语句数据库抓取其识别信息中包含该搜索词汇编码的所有考研语句及其识别信息,形成词汇来源数据;
S5-3.显示词汇来源数据:
显示单元接收词汇来源数据,将包含该搜索词汇的所有考研语句S显示,并根据用户点击的考研语句显示其对应的识别信息,显示该考研语句的考核年份、考卷号、考题类型、题号、段落。
2.根据权利要求1所述的识别方法,其特征在于,在步骤S3中,所述考研语句的考题类型包括选择题和听力题。
3.根据权利要求2所述的识别方法,其特征在于,所述方法还包括步骤S6.建立考研英语听力数据库:
通过数据导入的方式将考研英语听力数据输入至存储单元内存储,形成考研英语听力数据库,所述听力数据包括听力音频、考核年份、考卷号、考题类型、题号、段落;
S7.匹配听力数据:
将听力数据与考研语句数据库进行数据匹配,若考研语句数据库内的语句识别信息与听力数据信息经比对后重合度达到预设阈值,则将该听力数据的听力音频发送至该语句的识别信息中保存。
4.根据权利要求3所述的识别方法,其特征在于,在步骤S7中,所述考研语句数据库内的语句识别信息与听力数据信息经比对方式如下:
S7-1.设定重合度阈值X,其中,X≥3;
S7-2.比较考研语句识别信息与听力数据的重合度:
将考研语句S的考核年份、考卷号、考题类型、题号、段落分别与听力数据的考核年份、考卷号、考题类型、题号、段落一一对应比对;经比对后,若重合个数Z=X,则将该听力数据中的听力音频发送至该考研语句的识别信息中。
5.根据权利要求4所述的识别方法,其特征在于,所述方法还包括步骤S8.播放词汇来源数据的听力音频:
所述处理单元接收用户的播放请求指令,播放用户点击的考研语句所对应的识别信息中的听力音频。
6.根据权利要求1~5任一项所述的识别方法,其特征在于,所述考研语句的识别信息还包括考题答案。
7.根据权利要求6所述的识别方法,其特征在于,所述方法还包括步骤S9.显示考题答案:
所述处理单元接收用户对考研语句S的考题答案请求显示指令,经响应后,显示该考研语句的考题答案。
8.根据权利要求5所述的识别方法,其特征在于,所述方法还包括步骤S10.播放考研语句段落或文章:
所述处理单元接收用户的播放考研语句段落或文章请求指令,经响应后,跳转至考研英语试卷数据库搜索包含该考研语句识别信息的考研...
【专利技术属性】
技术研发人员:毛小兰,谭锦钿,林楠,郑志坚,李豪横,
申请(专利权)人:清远墨墨教育科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。