一种基于智能激光笔的语音控制方法、系统、装置及可读存储介质制造方法及图纸

技术编号:23559946 阅读:25 留言:0更新日期:2020-03-25 05:05
本发明专利技术涉及语音信号处理、语音识别、语义理解处理领域,尤其为一种基于智能激光笔的语音控制方法,该方法包括:将激光笔的音频数据传回识别引擎选择模块并识别为文字信息。识别引擎选择模块包含离线命令识别和在线语音转写模块。如果用户在做语音命令操作,则将识别结果传递给语义理解模块,判断是进行计算机控制还是ppt操作。如果用户正在进行字幕操作,则将识别结果传递给字幕模块,最后进行字幕显示。本发明专利技术利用语音信号的处理技术结合硬件设备,实现智能激光笔的计算机控制、ppt控制、打开特定文件夹中的文件并可以进行字幕演示。本发明专利技术还公开了一种基于智能激光笔的语音控制系统、装置及计算机可读存储介质与上述方法具有相同的有益效果。

A voice control method, system, device and readable storage medium based on Intelligent Laser pen

【技术实现步骤摘要】
一种基于智能激光笔的语音控制方法、系统、装置及可读存储介质
本专利技术涉及语音信号处理、语音识别、语义理解
,具体为一种基于智能激光笔的语音控制方法、系统、装置及可读存储介质。
技术介绍
目前现有的激光笔虽然有极少数带有语音输入、语音翻译和语音搜索功能,但是对语音指令的实现方法并没有很好的描述。人们在使用激光笔的语音功能时,还只能进行一些粗浅的语音交互,无法做到智能交互。
技术实现思路
本专利技术的目的在于提供一种基于智能激光笔的语音控制方法、系统、装置及可读存储介质,以解决上述
技术介绍
中提出的问题。所述基于智能激光笔的语音控制方法,包括智能激光笔的整体架构、按键控制、离线命令词控制和离线命令词识别。可以让激光笔进行ppt控制、声音亮度调节、打开指定文件夹中的文件并将说话内容识别为字幕。丰富激光笔的语音交互功能。为实现上述目的,本专利技术提供如下技术方案:一种基于智能激光笔的语音控制方法,包括以下步骤:步骤1:在激光笔内集成的麦克风采集语音信息,采集到的语音通过编解码模块处理后上传至计算机,计算机内安装的激光笔驱动程序接收语音信息;步骤2:激光笔驱动程序检测激光笔上的字幕键以及控制键,当检测到字幕键时启动在线随意语音转写模块;步骤3:在线随意语音转写模块返回语音转写结果,将结果发送给字幕模块显示出最后的结果;步骤4:当检测到控制键的时候启动离线命令词识别模块,离线命令词识别模块返回结果;步骤5:将离线命令词识别结果传递给离线命令词控制模块,根据离线命令词控制模块执行相应的计算机控制或ppt操作。优选的,步骤2所述的智能激光笔的按键控制包括以下步骤:步骤21:激光笔驱动程序检测激光笔上的“字幕键”以及“控制键”,当存在按键按下时,软件右下角的状态小图标变为蓝色;步骤22:如果检测到“字幕键”被按下,程序启动录音,并启动在线语音转写,返回实时的识别结果并进行字幕显示,直到按键被松开;步骤23:如果检测到“控制键”被按下,程序启动录音,直到按键被松开后,启动离线命令词识别,并返回识别结果,将识别结果传入离线命令词控制模块。优选的,步骤4所述的智能激光笔的离线命令词识别包括以下步骤:步骤41:构建离线命令词表,即将所有的离线命令词进行汇总,并将离线命令词表加入离线命令词构建引擎;步骤42:通过离线命令词构建引擎构建离线命令词语法,并输出离线命令词识别引擎;步骤43:通过离线命令词识别引擎可以将输入的音频数据进行离线识别,形成识别结果;步骤44:最后将识别结果与已经写好的控制规则进行比对,执行相应的控制,通过模拟快捷键或者调用计算机接口的方式达到用户想要的效果。优选的,步骤5所述的智能激光笔的离线命令词控制包括以下步骤:步骤51:接收到识别引擎的识别结果后,程序检测当前的界面是否在ppt播放状态下;步骤52:若在ppt模式下,则判断离线命令词返回结果的置信度,如大于预设的值,则将离线命令词识别结果做语义理解处理,根据语义理解结果,执行相应的ppt控制操作,否则不做任何事,但做一些相应的提示;步骤53:若不在ppt模式下,则判断离线命令词模块返回的结果的置信度是否大于预设的值,若大于,则对离线命令词识别结果做语义理解处理,并根据语义理解结果做相应的计算机控制操作,否则不做任何的操作,但做一些相关的信息提示。为解决上述技术问题,本专利技术还提供一种基于智能激光笔的语音控制系统,包括:麦克风,集成在激光笔内,用于采集语音信息编解码模块,对采集到的语音信息处理,然后上传至计算机内安装的激光笔驱动程序,该程序用于检测激光笔上的字幕键以及控制键,并根据检测到字幕键、控制键,分别对应启动在线随意语音转写模块、离线命令词识别模块;在线随意语音转写模块返回语音转写结果,并将结果发送给字幕模块显示出最后的结果;离线命令词识别模块返回结果,将离线命令词识别结果做语义理解处理,根据语义理解结果,执行相应的计算机控制或PPT操作;其中:麦克风、编解码模块、激光笔驱动程序依次连接,在线随意语音转写模块、离线命令词识别模块与激光笔驱动程序连接,线随意语音转写模块连接字幕模块,离线命令词识别模块连接计算机控制或PPT操作。为解决上述技术问题,本专利技术还提供一种基于智能激光笔的语音控制装置,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述任一项所述的基于智能激光笔的语音控制方法的步骤。为解决上述技术问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的基于智能激光笔的语音控制方法的步骤。与现有技术相比,本专利技术的有益效果是:本专利技术提供一种基于智能激光笔的语音控制方法,该方法可以应用于计算机端软件,配以相应的智能激光笔。当用户按下智能激光笔中的“控制键”进行语音输入后,可以根据输入的内容进行计算机控制或者ppt控制。当用户按下智能激光笔中的“字幕键”进行语音输入后,可以将音频转化成字幕展示在计算机上。进一步实现了激光笔对电脑的智能操控。附图说明图1为本专利技术基于智能激光笔的语音控制方法流程图。图2为本专利技术实施例1基于智能激光笔的总体架构具体流程图。图3为本专利技术实施例2基于智能激光笔的按键控制具体流程图。图4为本专利技术实施例3基于智能激光笔的离线命令词控制具体流程图。图5为本专利技术实施例4基于智能激光笔的离线命令词识别具体流程图。图6为本专利技术基于智能激光笔的语音控制系统结构示意图。图7为本专利技术明基于智能激光笔的语音控制装置结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1~7,本专利技术提供一种技术方案:一种基于智能激光笔的语音控制方法,该方法包括:将激光笔的音频数据传回识别引擎选择模块并识别为文字信息。识别引擎选择模块包含离线命令识别和在线语音转写模块。如果用户在做语音命令操作,则将识别结果传递给语义理解模块,判断是进行计算机控制还是ppt操作。如果用户正在进行字幕操作,则将识别结果传递给字幕模块,最后进行字幕显示。本专利技术利用语音信号的处理技术结合硬件设备,实现智能激光笔的计算机控制、ppt控制、打开特定文件夹中的文件并可以进行字幕演示。实施例1图1-2为本专利技术基于一种智能激光笔的总体架构提供的具体实施例1的整体流程图。如图2所示,一种智能激光笔的总体架构,包括以下步骤:步骤1:在激光笔内集成的麦克风采集语音信息,采集到的语音通过编解码模块处理后上传至计算本文档来自技高网...

【技术保护点】
1.一种基于智能激光笔的语音控制方法,其特征在于,包括以下步骤:/n步骤1:在激光笔内集成的麦克风采集语音信息,采集到的语音通过编解码模块处理后上传至计算机,计算机内安装的激光笔驱动程序接收语音信息;/n步骤2:激光笔驱动程序检测激光笔上的字幕键以及控制键,当检测到字幕键时启动在线随意语音转写模块;/n步骤3:在线随意语音转写模块返回语音转写结果,将结果发送给字幕模块显示出最后的结果;/n步骤4:当检测到控制键的时候启动离线命令词识别模块,离线命令词识别模块返回结果;/n步骤5:将离线命令词识别结果传递给离线命令词控制模块,根据离线命令词控制模块执行相应的计算机控制或ppt操作。/n

【技术特征摘要】
1.一种基于智能激光笔的语音控制方法,其特征在于,包括以下步骤:
步骤1:在激光笔内集成的麦克风采集语音信息,采集到的语音通过编解码模块处理后上传至计算机,计算机内安装的激光笔驱动程序接收语音信息;
步骤2:激光笔驱动程序检测激光笔上的字幕键以及控制键,当检测到字幕键时启动在线随意语音转写模块;
步骤3:在线随意语音转写模块返回语音转写结果,将结果发送给字幕模块显示出最后的结果;
步骤4:当检测到控制键的时候启动离线命令词识别模块,离线命令词识别模块返回结果;
步骤5:将离线命令词识别结果传递给离线命令词控制模块,根据离线命令词控制模块执行相应的计算机控制或ppt操作。


2.根据权利要求1所述的一种基于智能激光笔的语音控制方法,其特征在于,步骤2所述的智能激光笔的按键控制包括以下步骤:
步骤21:激光笔驱动程序检测激光笔上的“字幕键”以及“控制键”,当存在按键按下时,软件右下角的状态小图标变为蓝色;
步骤22:如果检测到“字幕键”被按下,程序启动录音,并启动在线语音转写,返回实时的识别结果并进行字幕显示,直到按键被松开;
步骤23:如果检测到“控制键”被按下,程序启动录音,直到按键被松开后,启动离线命令词识别,并返回识别结果,将识别结果传入离线命令词控制模块。


3.根据权利要求1所述的一种基于智能激光笔的语音控制方法,其特征在于,步骤4所述的智能激光笔的离线命令词识别包括以下步骤:
步骤41:构建离线命令词表,即将所有的离线命令词进行汇总,并将离线命令词表加入离线命令词构建引擎;
步骤42:通过离线命令词构建引擎构建离线命令词语法,并输出离线命令词识别引擎;
步骤43:通过离线命令词识别引擎可以将输入的音频数据进行离线识别,形成识别结果;
步骤44:最后将识别结果与已经写好的控制规则进行比对,执行相应的控制,通过模拟快捷键或者调用计算机接口的方式达到用户想要的效果。


4.根据权利要求3所述的一种基于智...

【专利技术属性】
技术研发人员:冯海洪毛德平郑传进王行健
申请(专利权)人:安徽咪鼠科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1