一种多源信息融合的生词库自动构建方法技术

技术编号:23149911 阅读:35 留言:0更新日期:2020-01-18 13:47
本发明专利技术公开了一种多源信息融合的生词库自动构建方法,包括生词自动识别和生词库自动更新两个过程;将生词划分为阅读生词和语音生词;将生词库分为短时记忆、长时记忆两个多级生词库;本发明专利技术将用户操作、口型、语音、记忆等信息相融合,进行生词的自动识别和生词库的动态更新,实现了生词库构建过程的完全自动化,同以往用户先自行判断再手动确认的方式相比,可以提高学习效率;将生词划分为阅读生词和语音生词,同以往局限于对不认识或不熟悉的词进行记忆的方式相比,可同时对阅读能力和听说水平的提高起到促进作用;将生词库分为短时记忆、长时记忆两个多级生词库,为个性化记忆规律的研究提供了手段。

An automatic construction method of new words database based on multi-source information fusion

【技术实现步骤摘要】
一种多源信息融合的生词库自动构建方法
本专利技术涉及计算机应用
,具体涉及一种多源信息融合的生词库自动构建方法。
技术介绍
国际化是社会发展的一个重要特征。在日常生活、工作中,人们越来越多的需要用外语进行沟通交流。背生词是提高外语能力的一种有效手段,市场上也有很多辅助生词记忆的软件工具,这些工具的不足主要表现在以下几点:(1)生词库中的单词首先需要用户自己判断是否为生词,然后再通过手动确认的方式实现生词库的更新,影响学习效率的提高;(2)对“生词”的理解局限在不认识或不熟悉的词,对这类生词进行记忆,有利于阅读能力的提升,但对听说能力没有直接促进作用;(3)依据艾宾浩斯记忆遗忘曲线的共性群体规律进行生词复习,忽略了记忆遗忘速度的个体差异。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种多源信息融合的生词库自动构建方法,该方法根据用户操作信息,自动识别阅读生词;根据用户口型、语音等信息,自动识别语音生词;依据记忆遗忘规律,对多级生词库进行自动动态更新。本专利技术的目的通过下述技术方案实现:一种多源信息融合的生词库自动构建方法,生词包括阅读生词和语音生词两类,生词库分为短时记忆和长时记忆两个多级生词库,该方法包括下述步骤:S1,生词自动识别;S11,根据用户操作信息,自动识别阅读生词;所述用户操作信息包括操作反应时间和操作是否正确的信息,如果用户在规定时间内未做出操作或操作错误,则单词被识别为阅读生词;S12,根据用户口型、语音的信息,自动识别语音生词;S2,生词库自动更新;S21,识别的阅读生词、语音生词分别自动存入阅读生词库和语音生词库;S22,多级生词库的自动动态更新。优选地,所述S12还包括如下步骤:S121,如果语音识别设备在规定时间内未接收到用户语音或接收到错误的用户语音,但口型识别设备识别到用户的发音口型是正确的,则提示用户再读一遍;S122,如果语音识别设备在规定时间内未接收到用户语音或接收到错误的用户语音,同时,口型识别设备识别到用户的发音口型也是错误的,则单词被识别为语音生词。优选地,所述S22中多级生词库是根据记忆遗忘的一般规律划分的,可作为个性化记忆规律研究的基础,S22还包括如下步骤:S221,初次识别的生词自动存入需要在最短时间内进行复习的生词库;S222,生词在记忆周期内完成正确记忆,自动转入下一级记忆周期更长的生词库;S223,生词在记忆周期内未完成正确记忆,自动转入上一级记忆周期更短的生词库;S224,记忆周期最长的生词库中的生词在记忆周期内完成正确记忆后,从生词库中删除。本专利技术与现有技术相比具有以下的有益效果:(1)本专利技术将用户操作、口型、语音、记忆等信息相融合,进行生词的自动识别和生词库的动态更新,实现了生词库构建过程的完全自动化,同以往用户先自行判断再手动确认的方式相比,可以提高学习效率;(2)本专利技术将生词划分为阅读生词和语音生词,同以往局限于对不认识或不熟悉的词进行记忆的方式相比,可同时对阅读能力和听说水平的提高起到促进作用;(3)本专利技术将生词库分为短时记忆和长时记忆两个多级生词库,为个性化记忆规律的研究提供了手段。附图说明图1为本专利技术的流程示意图;图2为本专利技术的多源信息获取装置示意图;图3为本专利技术的生词自动识别流程示意图;图4为本专利技术的阅读生词自动识别界面示意图;图5为本专利技术的语音生词自动识别界面示意图;图6为本专利技术的生词库结构示意图;图7为本专利技术的生词库自动更新流程示意图;图8为本专利技术的多级生词库的自动动态更新流程示意图。具体实施方式下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。本专利技术提出了一种多源信息融合的生词库自动构建方法,包括生词自动识别和生词库自动更新两个过程;该方法面向文献阅读和语音交流两类用途,将生词划分为阅读生词和语音生词;依据记忆遗忘规律,将生词库分为短时记忆和长时记忆两个多级生词库;该方法根据用户操作信息,自动识别阅读生词;根据用户口型、语音等信息,自动识别语音生词;依据记忆遗忘规律,对多级生词库进行自动动态更新。具体来说,如图1~8所示,一种多源信息融合的生词库自动构建方法,生词包括阅读生词和语音生词两类,生词库分为短时记忆和长时记忆两个多级生词库,该方法包括下述步骤:步骤一,生词自动识别。(1)根据用户操作信息,自动识别阅读生词。所述用户操作信息包括操作反应时间和操作是否正确的信息,如果用户在规定时间内未做出操作或操作错误,则单词被识别为阅读生词。(2)根据用户口型、语音的信息,自动识别语音生词。如果语音识别设备在规定时间内未接收到用户语音或接收到错误的用户语音,但口型识别设备识别到用户的发音口型是正确的,则提示用户再读一遍;如果语音识别设备在规定时间内未接收到用户语音或接收到错误的用户语音,同时,口型识别设备识别到用户的发音口型也是错误的,则单词被识别为语音生词。步骤二,生词库自动更新。(1)识别的阅读生词、语音生词分别自动存入阅读生词库和语音生词库。(2)多级生词库的自动动态更新。多级生词库是根据记忆遗忘的一般规律划分的,可作为个性化记忆规律研究的基础,其中:初次识别的生词自动存入需要在最短时间内进行复习的生词库;生词在记忆周期内完成正确记忆,自动转入下一级记忆周期更长的生词库;生词在记忆周期内未完成正确记忆,自动转入上一级记忆周期更短的生词库;记忆周期最长的生词库中的生词在记忆周期内完成正确记忆后,从生词库中删除。如图1所示,本实施例提出了一种多源信息融合的生词库自动构建方法100,包括生词自动识别300和生词库自动更新700两个过程。所述多源信息包括用户操作、口型、语音、记忆等信息。如图2所示,多源信息获取装置200,包括但不限于摄像头201、触摸屏202、扬声器203、麦克风204以及用于计算和数据存储的软硬件系统。其中,摄像头201用于获取口型信息,触摸屏202用于获取用户操作信息,麦克风204用于获取语音信息。记忆信息随着时间的推移会逐渐遗忘,并且遵循先快后慢的一般规律。设置不同记忆周期的多级生词库,可以记录用户个性化记忆信息,为分析个性化记忆特点,形成个性化记忆规律提供了有效途径。本专利技术面向文献阅读和语音交流两类用途,将生词划分为阅读生词和语音生词两类。如图3所示,生词自动识别300包括:根据用户操作信息,自动识别阅读生词301;根据用户口型、语音等信息,自动识别语音生词302等步骤。如图4所示,为阅读生词自动识别信息的获取界面400,包括单词401、选项一403、选项二404、选项三405、选项四406。单词401和403、404、405、406四个选项之间的关系类似单项选择题,有且只有一本文档来自技高网...

【技术保护点】
1.一种多源信息融合的生词库自动构建方法,其特征在于,生词包括阅读生词和语音生词两类,生词库分为短时记忆和长时记忆两个多级生词库,该方法包括下述步骤:/nS1,生词自动识别;/nS11,根据用户操作信息,自动识别阅读生词;/n所述用户操作信息包括操作反应时间和操作是否正确的信息,如果用户在规定时间内未做出操作或操作错误,则单词被识别为阅读生词;/nS12,根据用户口型、语音的信息,自动识别语音生词;/nS2,生词库自动更新;/nS21,识别的阅读生词、语音生词分别自动存入阅读生词库和语音生词库;/nS22,多级生词库的自动动态更新。/n

【技术特征摘要】
1.一种多源信息融合的生词库自动构建方法,其特征在于,生词包括阅读生词和语音生词两类,生词库分为短时记忆和长时记忆两个多级生词库,该方法包括下述步骤:
S1,生词自动识别;
S11,根据用户操作信息,自动识别阅读生词;
所述用户操作信息包括操作反应时间和操作是否正确的信息,如果用户在规定时间内未做出操作或操作错误,则单词被识别为阅读生词;
S12,根据用户口型、语音的信息,自动识别语音生词;
S2,生词库自动更新;
S21,识别的阅读生词、语音生词分别自动存入阅读生词库和语音生词库;
S22,多级生词库的自动动态更新。


2.根据权利要求1所述的多源信息融合的生词库自动构建方法,其特征在于,所述S12还包括如下步骤:
S121,如果语音识别设备在规定时间内未接收到用户语音或接收到错误的用户...

【专利技术属性】
技术研发人员:李吉平古万荣朱凯
申请(专利权)人:华南农业大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1