当前位置: 首页 > 专利查询>何婉榕专利>正文

自动翻页方法及装置制造方法及图纸

技术编号:15799489 阅读:28 留言:0更新日期:2017-07-11 13:33
本发明专利技术公开了一种自动翻页方法及装置,该方法包括:获取用户输入的语音;对获取的语音进行语音活动检测,判断是否有语音信号;逐帧提取语音信号的声学特征;通过语音孤立词检测技术对语音信号的声学特征解码,得到语音样本;对所述语音样本进行语义识别,得到语音命令的内容;通过所述语音命令对翻页装置进行反馈控制,驱动执行系统对电子书或纸质书翻页。利用本发明专利技术的自动翻页方法和装置,用户可以通过非接触的方法进行操控,并且可以自定义的语音控制命令,方便、自然的通过语音控制机械臂翻页,提高便捷性和用户体验。

Automatic page turning method and device

The invention discloses an automatic page turning method and device, the method comprises: acquiring user input voice; voice activity detection to obtain the speech, to judge whether there is a voice signal; frame extract acoustic features of speech signal; through the acoustic characteristics of the decoded speech isolated word detection technology of speech signal, speech samples; the semantic recognition of the speech samples, get voice commands; the turning device of feedback control through the voice command, driving execution system for eBooks or printed books page. Automatic page turning method and by the device of the invention, users can operate through non-contact method, voice commands and can be customized, natural and convenient through voice control of mechanical arm flip, improve convenience and user experience.

【技术实现步骤摘要】
自动翻页方法及装置
本专利技术涉及电子终端语音控制
,尤其涉及一种带有自定义语音命令的电子终端自动翻页控制方法及装置。
技术介绍
现在社会,由于智能化电子产品的存储和携带的便捷性,很多人逐渐放弃使用过去的纸质版的书籍阅读,改为使用功能强大、方便易携的电子书阅读,包括kindle等电纸书、苹果和安卓智能手机,平板电脑等。随着智能终端技术的快速发展,用户对终端的控制方式越来越多,最初用户可以通过键盘来进行控制终端,后来触屏技术的出现,用户可以使用手指在终端的屏幕上来进行操控。例如,当用户阅读电子书时,用户可以通过手指在电子屏幕上滑动,然后智能终端确定出手指滑动的轨迹,根据滑动的轨迹获取电子书操作控制指令,电子书根据获取的控制指令执行对应的翻页操作,如此用户实现利用触屏技术来控制电子书的翻页操作。然而,很多人阅读的时间往往是晚上,尤其是睡觉前。现有的触屏技术需要用户使用手指在终端的屏幕上来实现电子书操作控制,控制电子书还不够便捷,控制效率低下。当人们躺在床上时,往往懒得去用手一页一页的去滑动电子书的屏幕,而且在滑动时还会导致屏幕所连支架的晃动,影响读书效率。这一大问题对广大的电子书阅读者产生了巨大的不便,而且在目前并未得到很好的解决。
技术实现思路
为了解决上述技术问题,使人们在阅读电子书或纸质书的时候获得便利,现有技术中也提出了一些具有语音控制翻页功能的装置。通常这些装置可以提供固定的一些词控制装置进行翻页。然而语音识别技术的一些缺陷被忽视了,即语音识别的识别能力是有限的,对于一个词条,比如“上一页”和“下一页”两个命令词,它们可能有些人可以很好的被识别,而部分人可能永远无法被识别到这两个词,因此,为用户提供可以自定义控制词条的装置是十分必要的。即用户可以尝试设置不同的控制命令,再选取对自己的声音识别效果最好的词作为控制命令。基于更好的解决方案,本专利技术的目的是带有自定义语音命令的电子终端自动翻页控制方法及装置。本专利技术提供的一种自动翻页方法,包括以下步骤:步骤101、获取用户输入的语音;步骤102、对获取的语音进行语音活动检测,判断是否有语音信号;步骤103、逐帧提取语音信号的声学特征;步骤104、通过语音孤立词检测技术对语音信号的声学特征解码,得到语音样本;步骤105、对所述语音样本进行语义识别,得到语音命令的内容;步骤106、通过所述语音命令对翻页装置进行反馈控制,驱动执行系统对电子书或纸质书翻页。优选的,步骤104中,对语音信号的声学特征的解码包括前置步骤:1041、用户自定义语音控制命令词;1042、将命令词的文本集转换为语音识别网络解码资源;其中,所述步骤1041中,用户可以根据自己的习惯设定所述控制命令词。本专利技术还提供了一种自动翻页装置,包括语音识别控制系统和执行系统,所述语音识别控制系统包括:语音检测唤醒模块11,用于获取用户输入的语音,并发出驱动信号驱动执行系统进行翻页操作;自定义唤醒词模块12,用于将用户自定义的唤醒关键词由文本数据转换成相应的资源文件;以及唤醒词资源包13,包括唤醒关键词检测模块所需的声学模型资源和由自定义唤醒关键词模块12生成的解码网络资源。优选的,所述语音检测唤醒模块11包括录音模块111、语音端点检测模块112、前端处理模块113、语音唤醒关键词检测114和反馈控制模块115;所述录音模块111通过调用智能终端的相关API接口获取录音数据;所述语音检测模块112通过基于子带谱熵的方法实时检测录音数据中是否包含语音,并将语音信号提取出来;所述前端处理模块113用来对语音信号进行分析,并提取语音特征向量;所述唤醒关键词检测模块114用于将前端处理模块113中提取的语音特征向量进行解码,检测是否包含唤醒关键词;所述反馈控制模块115用来根据识别结果判断是否发出驱动信号。优选的,所述执行系统包括驱动机构和机械臂,所述驱动机构根据所述语音识别控制系统的反馈控制模块115所发出的驱动信号来驱动机械臂进行翻页操作。优选的,所述机械臂的端部设置有电容笔头5。优选的,所述驱动机构为舵机,所述机械臂为金属可定型软管4。优选的,初始时用户手动将金属可定型软管4弯曲调整使电容笔头5距离电子书屏幕的翻页区域1cm处,这时两个舵机均处于初始的角度X度;当需要向上翻页时,用户发出“上一页”的语音命令,语音识别控制系统发出合适的PWM信号来控制左舵机304立即旋转至Y度,使与左舵机304连接的金属可定型软管4转化成前伸动作从而使电容笔头5点击到屏幕的向上翻页区域,停留200毫秒后,语音识别控制系统再行发出合适的PWM信号来控制左舵机304立即旋转回到X度,同样通过连接的金属可定型软管4转化成后缩动作使电容笔头5离开屏幕的向上翻页区域回到初始状态;当需要向下翻页时,用户发出“下一页”的语音命令,语音识别控制系统发出合适的PWM信号来控制右舵机305立即旋转至Y度,使与左舵机304连接的金属可定型软管4转化成前伸动作从而使电容笔头5点击到屏幕的向下翻页区域,停留200毫秒后,语音识别控制系统再行发出合适的PWM信号来控制右舵机305立即旋转回到X度,同样通过连接的金属可定型软管4转化成后缩动作使电容笔头5离开屏幕的向下翻页区域回到初始状态。与现有技术中的基于语音控制的翻页装置相比,本专利技术的优点包括:(1)用户通过非接触的方法,通过语音控制机械臂,是非常友好的交互方式;(2)用户可以自定义的语音控制命令,用户可以根据自己的习惯设定语音控制命令,方便、自然的通过语音控制机械臂翻页;(3)通过收集一个覆盖多地口音或不同音调的语料库,利用该语料库训练声学模型;再利用用户提供的命令词生成相应的解码资源。附图说明图1是本专利技术实施例提供的一种自动翻页方法的流程图;图2是本专利技术实施例提供的一种自动翻页装置的语音识别控制系统示意图;图3是本专利技术实施例提供的一种电子书自动翻页装置的结构示意图;图4是本专利技术实施例提供的一种电子书自动翻页装置的控制盒的结构示意图;附图标记说明:1—语音识别控制系统,11—语音检测唤醒模块,12—自定义唤醒词模块,13—唤醒词资源包,111—录音模块,112—语音端点检测模块,113—前端处理模块,114—语音唤醒关键词检测模块,115—反馈控制模块,2—支架,3—翻页操控盒,301—硬件外壳,302—电路底板,303—语音识别控制单元,304—左舵机,305—右舵机,306—充电USB接口,307—充电电池,4—金属可定型软管,5—电容笔头,6—麦克风,7—手机,8—电子屏翻页键。具体实施方式下面结合附图详细描述本专利技术的示例性实施方式。如图1所示是本专利技术实施例提供的一种自动翻页方法的流程图,该自动翻页方法,包括以下步骤:步骤101、获取用户输入的语音;步骤102、对获取的语音进行语音活动检测,判断是否有语音信号;步骤103、逐帧提取语音信号的声学特征;步骤104、通过语音孤立词检测技术对语音信号的声学特征解码,得到语音样本;步骤105、对所述语音样本进行语义识别,得到语音命令的内容;步骤106、通过所述语音命令对翻页装置进行反馈控制,驱动执行系统对电子书或纸质书翻页。步骤104中,对语音信号的声学特征的解码包括前置步骤:1041、用户自定义语音控制命令词;1042、将命令词的文本本文档来自技高网...
自动翻页方法及装置

【技术保护点】
一种自动翻页方法,其特征在于,所述方法包括以下步骤:步骤101、获取用户输入的语音;步骤102、对获取的语音进行语音活动检测,判断是否有语音信号;步骤103、逐帧提取语音信号的声学特征;步骤104、通过语音孤立词检测技术对语音信号的声学特征解码,得到语音样本;步骤105、对所述语音样本进行语义识别,得到语音命令的内容;步骤106、通过所述语音命令对翻页装置进行反馈控制,驱动执行系统对电子书或纸质书翻页。

【技术特征摘要】
1.一种自动翻页方法,其特征在于,所述方法包括以下步骤:步骤101、获取用户输入的语音;步骤102、对获取的语音进行语音活动检测,判断是否有语音信号;步骤103、逐帧提取语音信号的声学特征;步骤104、通过语音孤立词检测技术对语音信号的声学特征解码,得到语音样本;步骤105、对所述语音样本进行语义识别,得到语音命令的内容;步骤106、通过所述语音命令对翻页装置进行反馈控制,驱动执行系统对电子书或纸质书翻页。2.根据权利要求1所述的一种自动翻页方法,其特征在于:步骤104中,对语音信号的声学特征的解码包括前置步骤:1041、用户自定义语音控制命令词;1042、将命令词的文本集转换为语音识别网络解码资源;其中,所述步骤1041中,用户可以根据自己的习惯设定所述控制命令词。3.一种自动翻页装置,采用如权利要求1或2所述的翻页方法,包括语音识别控制系统和执行系统,其特征在于:所述语音识别控制系统包括:语音检测唤醒模块(11),用于获取用户输入的语音,并发出驱动信号驱动所述执行系统进行翻页操作;自定义唤醒词模块(12),用于将用户自定义的唤醒关键词由文本数据转换成相应的资源文件;以及唤醒词资源包(13),包括由其自身所需的声学模型资源和由所述自定义唤醒关键词模块(12)生成的解码网络资源。4.根据权利要求3所述的一种自动翻页装置,其特征在于:所述语音检测唤醒模块(11)包括录音模块(111)、语音端点检测模块(112)、前端处理模块(113)、语音唤醒关键词检测模块(114)和反馈控制模块(115);所述录音模块(111)通过调用智能终端的相关API接口获取录音数据;所述语音检测模块(112)通过基于子带谱熵的方法实时检测录音数据中是否包含语音,并将语音信号提取出来;所述前端处理模块(113)用来对语音信号进行分析,并提取语音特征向量;所述语音唤醒关键词检测模块(...

【专利技术属性】
技术研发人员:何婉榕
申请(专利权)人:何婉榕
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1