应用程序的语音控制方法、智能终端及计算机可读存储介质技术

技术编号:19744614 阅读:20 留言:0更新日期:2018-12-12 04:37
本发明专利技术提供了一种应用程序的语音控制方法、智能终端及计算机可读存储介质。应用程序的语音控制方法,包括以下步骤:S100:分析运行应用程序的智能终端的显示界面;S200:识别显示界面内的程序内容;S300:基于程序内容构建内容模型,并根据内容模型确定程序内容内的操作单元;S400:应用程序采集一语音输入;S500:根据预设的调制参数,将语音输入的第二语音参数转化为操作单元的第一语音参数;S600:播放具有第一语音参数的语音输入。采用上述技术方案后,在识别用户输入的语音后,自动转化为该用户当前操作人物的语音,则面向其他用户输出时,可通过隐藏真实声音提高隐私性,并更为模拟该应用程序的游戏性,提高用户体验。

【技术实现步骤摘要】
应用程序的语音控制方法、智能终端及计算机可读存储介质
本专利技术涉及智能控制领域,尤其涉及一种应用程序的语音控制方法、智能终端及计算机可读存储介质。
技术介绍
随着智能终端的普及和安装在智能设备上的娱乐类应用程序,如游戏等的火热,人们的娱乐生活也得到了极大的丰富,越来越多的游戏内容对智能终端的配置要求越来越高,同时,用户在游戏过程中对游戏的专注度也越来越高。比如,用户在体验一些竞技类游戏时,希望利用应用程序的附加功能,更智能化与与其他用户的交互。例如,当用户运行一游戏类或娱乐类的应用时,常通过语音聊天的方式进行实时地交互,以更好地在游戏类或娱乐类的应用程序中掌握游戏或娱乐的情况。当前通过语音的交互方式中,通常接收到用户的语音输入后,将直接转发至已获得可接受该用户的语音输入的其他用户所使用的智能终端上,其他用户可接收其语音输入的内容,但无法真正做到与应用程序的游戏或娱乐内容匹配,降低了真实感与娱乐性。为解决上述问题,不少制作游戏类应用程序的游戏厂家会在游戏中收集很多的用户数据,并在应用程序侧进行优化,但是这些数据并不会反馈到定制智能终端的操作系统的厂家,例如ROM厂家,在更换其他没有做过优化的应用程序运行时,将无法再次得到更佳的用户体验。因此,需要一种针对应用程序,尤其是游戏类应用程序的新型的语音控制方法,将用户的语音输入智能地变换为其当前正在操作的操作单元的语音,进一步提高娱乐社交平台上,操作此类游戏应用程序时,用户与用户间的交互性。
技术实现思路
为了克服上述技术缺陷,本专利技术的目的在于提供一种应用程序的语音控制方法、智能终端及计算机可读存储介质,在识别用户输入的语音后,自动转化为该用户当前操作人物的语音,则面向其他用户输出时,可通过隐藏真实声音提高隐私性,并更为模拟该应用程序的游戏性,提高用户体验。本专利技术公开了一种应用程序的语音控制方法,包括以下步骤:S100:分析运行所述应用程序的智能终端的显示界面;S200:识别所述显示界面内的程序内容;S300:基于所述程序内容构建内容模型,并根据所述内容模型确定所述程序内容内的操作单元;S400:所述应用程序采集一语音输入;S500:根据预设的调制参数,将所述语音输入的第二语音参数转化为所述操作单元的第一语音参数;S600:播放具有所述第一语音参数的语音输入。优选地,分析运行所述应用程序的智能终端的显示界面的步骤S100包括:S110:启动安装于所述智能终端的系统服务;S120:所述系统服务实时获取所述显示界面,并形成至少一张对应于所述显示界面的截图。优选地,所述系统服务实时获取所述显示界面,并形成至少一张对应于所述显示界面的截图的步骤S120包括:S121:所述系统服务调用所述智能终端的系统接口;S122:获取所述智能终端的缓存数据,其中所述缓存数据排除隐秘信息。优选地,识别所述显示界面内的程序内容的步骤S200包括:S210:创建一初始模型架构;S220:基于神经网络训练所述初始模型架构;S230:固化所述初始模型架构,形成推演模型。优选地,固化所述初始模型架构,形成推演模型的步骤S230后,还包括:S240:移植所述推演模型至所述智能终端内;S250:针对所述推演模型内的剪枝模型,适配形成输入节点和输出节点;S260:向所述推演模型输入程序内容,形成推演结论;S270:基于所述推演结论,缓存以转化语音输入。优选地,基于神经网络训练所述初始模型架构的步骤S220包括:S221:获取外部数据增加训练样本;S222:调用所述智能终端的GPU集群对所述初始模型架构调参中的一种优选地,所述外部数据包括:所述显示界面的当前运行场景、与所述应用程序对应的视频数据、与所述应用程序对应的截图中的一种或多种。优选地,根据预设的调制参数,将所述语音输入的第二语音参数转化为所述操作单元的第二语音参数的步骤S500包括:S510:获取所述应用程序内所有操作单元;S520:分析所有所述操作单元的语音输出,以形成每一所述操作单元的第一语音参数;S530:建立关于操作单元与第一语音参数的对应关系的所述预设的调制参数;S540:接收所述语音输入,分析所述语音输入的第二语音参数;S550:基于所述预设的调制参数,修改所述语音输入的第二语音参数为第一语音参数。本专利技术还公开了一种智能终端,所述智能终端包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的语音控制方法。本专利技术又公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的语音控制方法。采用了上述技术方案后,与现有技术相比,具有以下有益效果:1.具有上述配置后,对于定制了运行应用程序的智能终端的操作系统的ROM厂家来说,不需要额外去请求该应用程序的制作厂家定制软件后门,用来将操作系统内的配置通过软件后门植入到应用程序内,减少了外部耦合的软件成本。同时,对于应用程序的制作厂家来说,也不需要去为安装在不同智能终端上的不同操作系统额外增加软件维护成本。2.针对应用程序内,尤其是游戏类应用程序内不同的游戏场景、游戏人物、用户配置,ROM厂家可以通过长久的训练更为强大的网络来覆盖多个样本,达到一个模型兼容多个游戏的目的。3.向用户提供了更丰富的游戏体验,极大增强了游戏(软件)特性与ROM(硬件)特性的结合性;4.用户与用户间的交互更为贴合应用程序内的模拟环境,提高用户使用应用程序时的体验,增加用户对应用程序及具有上述配置的智能终端的粘性。附图说明图1为符合本专利技术一优选实施例中应用程序的语音控制方法的流程示意图;图2为符合本专利技术一优选实施例中应用程序的语音控制方法内步骤S100的流程示意图;图3为符合本专利技术一优选实施例中应用程序的语音控制方法内步骤S120的流程示意图;图4为符合本专利技术一优选实施例中应用程序的语音控制方法内步骤S200的流程示意图;图5为符合本专利技术又一优选实施例中应用程序的语音控制方法内步骤S200的流程示意图;图6为符合本专利技术又一优选实施例中应用程序的语音控制方法内步骤S500的流程示意图。具体实施方式以下结合附图与具体实施例进一步阐述本专利技术的优点。这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或本文档来自技高网...

【技术保护点】
1.一种应用程序的语音控制方法,其特征在于,包括以下步骤:S100:分析运行所述应用程序的智能终端的显示界面;S200:识别所述显示界面内的程序内容;S300:基于所述程序内容构建内容模型,并根据所述内容模型确定所述程序内容内的操作单元;S400:所述应用程序采集一语音输入;S500:根据预设的调制参数,将所述语音输入的第二语音参数转化为所述操作单元的第一语音参数;S600:播放具有所述第一语音参数的语音输入。

【技术特征摘要】
1.一种应用程序的语音控制方法,其特征在于,包括以下步骤:S100:分析运行所述应用程序的智能终端的显示界面;S200:识别所述显示界面内的程序内容;S300:基于所述程序内容构建内容模型,并根据所述内容模型确定所述程序内容内的操作单元;S400:所述应用程序采集一语音输入;S500:根据预设的调制参数,将所述语音输入的第二语音参数转化为所述操作单元的第一语音参数;S600:播放具有所述第一语音参数的语音输入。2.如权利要求1所述的语音控制方法,其特征在于,分析运行所述应用程序的智能终端的显示界面的步骤S100包括:S110:启动安装于所述智能终端的系统服务;S120:所述系统服务实时获取所述显示界面,并形成至少一张对应于所述显示界面的截图。3.如权利要求2所述的语音控制方法,其特征在于,所述系统服务实时获取所述显示界面,并形成至少一张对应于所述显示界面的截图的步骤S120包括:S121:所述系统服务调用所述智能终端的系统接口;S122:获取所述智能终端的缓存数据,其中所述缓存数据排除隐秘信息。4.如权利要求1所述的语音控制方法,其特征在于,识别所述显示界面内的程序内容的步骤S200包括:S210:创建一初始模型架构;S220:基于神经网络训练所述初始模型架构;S230:固化所述初始模型架构,形成推演模型。5.如权利要求4所述的语音控制方法,其特征在于,固化所述初始模型架构,形成推演模型的步骤S230后,还包括:S240:移植所述推演模型至所述智能终端内;S250:针对所述推演模型内的剪...

【专利技术属性】
技术研发人员:徐晖郑斌
申请(专利权)人:南昌黑鲨科技有限公司
类型:发明
国别省市:江西,36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1