The invention discloses an automatic page turning method and device, the method comprises: acquiring user input voice; voice activity detection to obtain the speech, to judge whether there is a voice signal; frame extract acoustic features of speech signal; through the acoustic characteristics of the decoded speech isolated word detection technology of speech signal, speech samples; the semantic recognition of the speech samples, get voice commands; the turning device of feedback control through the voice command, driving execution system for eBooks or printed books page. Automatic page turning method and by the device of the invention, users can operate through non-contact method, voice commands and can be customized, natural and convenient through voice control of mechanical arm flip, improve convenience and user experience.
【技术实现步骤摘要】
自动翻页方法及装置
本专利技术涉及电子终端语音控制
,尤其涉及一种带有自定义语音命令的电子终端自动翻页控制方法及装置。
技术介绍
现在社会,由于智能化电子产品的存储和携带的便捷性,很多人逐渐放弃使用过去的纸质版的书籍阅读,改为使用功能强大、方便易携的电子书阅读,包括kindle等电纸书、苹果和安卓智能手机,平板电脑等。随着智能终端技术的快速发展,用户对终端的控制方式越来越多,最初用户可以通过键盘来进行控制终端,后来触屏技术的出现,用户可以使用手指在终端的屏幕上来进行操控。例如,当用户阅读电子书时,用户可以通过手指在电子屏幕上滑动,然后智能终端确定出手指滑动的轨迹,根据滑动的轨迹获取电子书操作控制指令,电子书根据获取的控制指令执行对应的翻页操作,如此用户实现利用触屏技术来控制电子书的翻页操作。然而,很多人阅读的时间往往是晚上,尤其是睡觉前。现有的触屏技术需要用户使用手指在终端的屏幕上来实现电子书操作控制,控制电子书还不够便捷,控制效率低下。当人们躺在床上时,往往懒得去用手一页一页的去滑动电子书的屏幕,而且在滑动时还会导致屏幕所连支架的晃动,影响读书效率。这一大问题对广大的电子书阅读者产生了巨大的不便,而且在目前并未得到很好的解决。
技术实现思路
为了解决上述技术问题,使人们在阅读电子书或纸质书的时候获得便利,现有技术中也提出了一些具有语音控制翻页功能的装置。通常这些装置可以提供固定的一些词控制装置进行翻页。然而语音识别技术的一些缺陷被忽视了,即语音识别的识别能力是有限的,对于一个词条,比如“上一页”和“下一页”两个命令词,它们可能有些人可以很好的被识别,而 ...
【技术保护点】
一种自动翻页方法,其特征在于,所述方法包括以下步骤:步骤101、获取用户输入的语音;步骤102、对获取的语音进行语音活动检测,判断是否有语音信号;步骤103、逐帧提取语音信号的声学特征;步骤104、通过语音孤立词检测技术对语音信号的声学特征解码,得到语音样本;步骤105、对所述语音样本进行语义识别,得到语音命令的内容;步骤106、通过所述语音命令对翻页装置进行反馈控制,驱动执行系统对电子书或纸质书翻页。
【技术特征摘要】
1.一种自动翻页方法,其特征在于,所述方法包括以下步骤:步骤101、获取用户输入的语音;步骤102、对获取的语音进行语音活动检测,判断是否有语音信号;步骤103、逐帧提取语音信号的声学特征;步骤104、通过语音孤立词检测技术对语音信号的声学特征解码,得到语音样本;步骤105、对所述语音样本进行语义识别,得到语音命令的内容;步骤106、通过所述语音命令对翻页装置进行反馈控制,驱动执行系统对电子书或纸质书翻页。2.根据权利要求1所述的一种自动翻页方法,其特征在于:步骤104中,对语音信号的声学特征的解码包括前置步骤:1041、用户自定义语音控制命令词;1042、将命令词的文本集转换为语音识别网络解码资源;其中,所述步骤1041中,用户可以根据自己的习惯设定所述控制命令词。3.一种自动翻页装置,采用如权利要求1或2所述的翻页方法,包括语音识别控制系统和执行系统,其特征在于:所述语音识别控制系统包括:语音检测唤醒模块(11),用于获取用户输入的语音,并发出驱动信号驱动所述执行系统进行翻页操作;自定义唤醒词模块(12),用于将用户自定义的唤醒关键词由文本数据转换成相应的资源文件;以及唤醒词资源包(13),包括由其自身所需的声学模型资源和由所述自定义唤醒关键词模块(12)生成的解码网络资源。4.根据权利要求3所述的一种自动翻页装置,其特征在于:所述语音检测唤醒模块(11)包括录音模块(111)、语音端点检测模块(112)、前端处理模块(113)、语音唤醒关键词检测模块(114)和反馈控制模块(115);所述录音模块(111)通过调用智能终端的相关API接口获取录音数据;所述语音检测模块(112)通过基于子带谱熵的方法实时检测录音数据中是否包含语音,并将语音信号提取出来;所述前端处理模块(113)用来对语音信号进行分析,并提取语音特征向量;所述语音唤醒关键词检测模块(...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。