A method for realizing screen control by user-defined voice includes: 1) recognizing the input voice and converting it into text; 2) intercepting the key words of the text; 3) comparing the existing key words list to determine whether the keyword intercepted is an existing key word; 4) prompting that the keyword intercepted cannot be recognized and returning to step 1); 5) screenshots the current interface and The image in the screenshot is split for recognition, and the position of each image is matched and recorded through template recognition and text recognition; 6) the input voice queue is executed serially, the script of each operation is executed successively, and the end operation is executed when the end statement is recognized. The invention relates to a method for realizing screen control by self defining voice, which can realize touch screen by voice, thereby saving more energy of users and improving user experience.
【技术实现步骤摘要】
一种自定义语音实现屏幕控制的方法
本专利技术涉及语音识别
,特别是涉及一种自定义语音实现屏幕控制的方法方法。
技术介绍
在目前已有的屏幕控制方式中,或多或少需要人为的去触摸屏幕以获得屏幕事件的反馈,为了更好的辅助用户对移动设备的屏幕控制,一种通过自定义语音来实现屏幕控制的方案应运而生。本专利技术旨在设计一种基于Android平台下的语音映射和图像识别技术以实现用户想通过语音助手来控制屏幕的技术和功能,目的是为了让用户可以选择更多更便利的方式来控制设备,极大加强用户在比如棋牌类游戏中的游戏体验,从而衍生出更多的游戏玩法,促进用户对设备的控制。在目前市场成熟的语音识别和人工智能技术加持下,通过语音实时控制触屏的方案能够正常开展,而且随着技术的日益成熟,以后会衍生出更多语音控制设备的样例。
技术实现思路
为了解决现有技术存在的不足,本专利技术的目的在于提供一种自定义语音实现屏幕控制的方法方法,通过语音的方式即可实现触屏,从而节省用户更多精力并提高用户体验。为实现上述目的,本专利技术提供的一种自定义语音实现屏幕控制的方法,包括:1)识别输入的语音并转化为文字;2)对所述文字进行截取关键词;3)对比已有的关键词列表,判断所述截取关键词是否为已有关键词;4)提示无法识别所述截取关键词,返回步骤1);5)对当前界面进行截图,并对所述截图中的图像进行拆分识别,通过模版识别和文字识别,匹配并记录每个所述图像的位置;6)将输入的语音队列串行执行,依次将每个操作的脚本执行,识别结束语时执行结束操作。进一步地,还包括,持续录制屏幕和后台语音助手监听语音。进一步地,还包括,提供模 ...
【技术保护点】
1.一种自定义语音实现屏幕控制的方法,其特征在于,包括:1)识别输入的语音并转化为文字;2)对所述文字进行截取关键词;3)对比已有的关键词列表,判断所述截取关键词是否为已有关键词;4)提示无法识别所述截取关键词,返回步骤1);5)对当前界面进行截图,并对所述截图中的图像进行拆分识别,通过模版识别和文字识别,匹配并记录每个所述图像的位置;6)将输入的语音队列串行执行,依次将每个操作的脚本执行,识别结束语时执行结束操作。
【技术特征摘要】
1.一种自定义语音实现屏幕控制的方法,其特征在于,包括:1)识别输入的语音并转化为文字;2)对所述文字进行截取关键词;3)对比已有的关键词列表,判断所述截取关键词是否为已有关键词;4)提示无法识别所述截取关键词,返回步骤1);5)对当前界面进行截图,并对所述截图中的图像进行拆分识别,通过模版识别和文字识别,匹配并记录每个所述图像的位置;6)将输入的语音队列串行执行,依次将每个操作的脚本执行,识别结束语时执行结束操作。2.根据权利要求1所述的方法,其特征在于,还包括,持续录制屏幕和后台语音助手监听语音。3.根据权利要求1所述的方法,其特征在于,还包括,提供模版化操作脚本,输入记录的自定义关键词作为语音接收的截取关键词。4.根据权利要求3所述的方法,其特征在于,所述模版化操作脚本包括记录当前屏幕位置x、y的点击,滑动以及长按的触屏操作,并将操作数据转化为json格式。5.根据权利要求3所述的方法,其特征在于,还包括,建立语音与模版化操作数据的映射关系,将所述映射关系和所述操作脚本全局存储,识别输入的语音关...
【专利技术属性】
技术研发人员:陈浩波,
申请(专利权)人:苏州蜗牛数字科技股份有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。