语言离线识别方法、终端及可读存储介质技术

技术编号:23769036 阅读:83 留言:0更新日期:2020-04-11 21:39
本申请公开了一种语言离线识别方法、终端和计算机可读存储介质,通过获取移动终端用户输入的语音数据,基于所述移动终端中本地数据库对所述语音数据进行识别;若基于本地数据库识别失败,则连接并基于预设云平台语音库识别所述语音数据,获取语音内容;然后根据所述语音内容,分析并获取所述移动终端用户的语音识别的喜好属性;最后基于所述喜好属性,更新所述本地数据库,解决了在没有联网环境下本地数据库语音识别准确率不高、在联网环境下云平台语音识别需要耗费较多流量和手机电量的技术问题。

Language offline recognition method, terminal and readable storage medium

【技术实现步骤摘要】
语言离线识别方法、终端及可读存储介质
本申请涉及语音识别
,尤其涉及一种语言离线识别方法、终端及可读存储介质。
技术介绍
语音识别是目前应用最多的人机交互方式之一,目前大部分的智能语音系统中,智能语音交互设备通常在连接互联网的状态下工作,甚至很多是基于云端的状态下工作,也就是说,例如在语音识别过程中,可以将语言模型等多种数据设置于云端,这样,就可以在云端上进行语音识别。但是,如果在离线环境下,由于智能设备本身的性能有限,会出现诸如下述问题:一些使用场景(如导航、音乐播放等场景)所需数据(如声学模型、语言模型等)的数据量较大,并且计算过程比较复杂,离线环境下的数据无法满足语音识别的需求,因此,语音离线识别率往往无法保证,这样导致离线环境时智能语音设备基本不可用。即传统的语音交互方式通常是通过用户终端在本地完成语音识别,识别后的文本传输到云端,通过云端进行语义解析并生成指令或对话,将指令或对话传输回用户终端。这样的模式响应速度慢。本地存储离线命令库的方法能够提高响应速度,但是由于本地存储空间的有限性,本地存储离线命令库无法像云端解析一样实现各类命令的解析。由此可见,目前语音离线在没有联网环境下识别,则本地数据库语音识别准确率不高;在联网环境下云平台语音识别,则需要耗费较多流量和手机电量的技术问题。
技术实现思路
本申请的主要目的在于提出一种语音离线识别方法、装置及可读存储介质,旨在提高离线情况下语音的识别率和准确率,并且节约手机流量和电量,提升用户体验。为实现上述目的,本申请实施例提供一种语言离线识别方法,所述语言离线识别方法包括以下步骤:获取移动终端用户输入的语音数据,基于所述移动终端中本地数据库对所述语音数据进行识别;若基于本地数据库识别失败,则连接并基于预设云平台语音库识别所述语音数据,获取语音内容;根据所述语音内容,分析并获取所述移动终端用户的语音识别的喜好属性;基于所述喜好属性,更新所述本地数据库。可选地,所述基于所述移动终端中本地数据库对所述语音数据进行识别的步骤包括:获取所述语音数据的关键词;比对所述关键词与所述本地数据库中的预设关键词,获得比对结果,并将所述比对结果作为本地数据库对所述语音数据的识别结果。可选地,所述获得比对结果,并将所述比对结果作为本地数据库对所述语音数据的识别结果的步骤包括:若所述关键词与所述任一预设关键词相同,则比对结果为成功,所述本地数据库对所述语音数据的识别成功;若所述关键词与所述任一预设关键词不同,则比对结果为失败,所述本地数据库对所述语音数据的识别失败。可选地,所述连接并基于预设云平台语音库识别所述语音数据,获取语音内容的步骤包括:将所述语音数据传输至所述预设云平台语音库;基于所述预设云平台语音库,对所述语音数据进行解析识别,获取语音内容。可选地,所述根据所述语音内容,分析并获取所述移动终端用户的语音识别的喜好属性的步骤包括:按照预设模型,提取所述语音内容的关键词;基于所述关键词,分析所述移动终端用户的语音识别的喜好属性。可选地,所述按照预设模型,提取所述语音内容的关键词的步骤包括:将所述关键词和所述预设模型进行比对;提取与所述预设模型相同的关键词,作为所述语音内容的关键词。可选地,所述基于所述关键词,分析所述移动终端用户的语音识别的喜好属性的步骤包括:按照预设特征获取标准,对所述关键词进行识别,获取所述关键词的应用场景信息;基于所述应用场景信息,获取所述关键词在各所述应用场景中的高频词信息,其中,所述高频词为符合预设次数的词;基于所述应用场景信息和所述高频词信息,获得所述移动终端用户的语音识别的喜好属性。可选地,所述基于所述喜好属性,更新所述本地数据库的步骤包括:基于所述应用场景信息,对所述本地数据库的信息进行一次筛选,获得筛选结果;基于所述高频词信息,对所述筛选结果进行二次筛选,获得所述移动终端用户的相关信息和不相关信息;将所述相关信息增加到所述本地数据库,并将所述不相关信息从所述本地数据库中删去。本申请还提供一种终端,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语言离线识别程序,所述语言离线识别程序被所述处理器执行时实现如上所述的语言离线识别方法的步骤。本申请还提供一种计算机存储介质,所述计算机存储介质上存储有语言离线识别程序,所述语言离线识别程序被处理器执行时实现如上所述的语言离线识别方法的步骤。本申请在语音离线过程中,通过获取移动终端用户输入的语音数据,基于所述移动终端中本地数据库对所述语音数据进行识别;若基于本地数据库识别失败,则连接并基于预设云平台语音库识别所述语音数据,获取语音内容;然后根据所述语音内容,分析并获取所述移动终端用户的语音识别的喜好属性;最后基于所述喜好属性,更新所述本地数据库,解决了在没有联网环境下本地数据库语音识别准确率不高、在联网环境下云平台语音识别需要耗费较多流量和手机电量的技术问题。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例一个可选的终端的硬件结构示意图;图2为本申请语言离线识别方法第一实施例的流程示意图;图3为本申请语言离线识别方法第二实施例的流程示意图;图4为本申请语言离线识别方法第三实施例的流程示意图;图5为本申请语言离线识别方法第四实施例的流程示意图;图6为本申请语言离线识别方法第五实施例的流程示意图;图7为本申请语言离线识别方法第六实施例的流程示意图;图8为本申请语言离线识别方法第七实施例的流程示意图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。如图1所示,图1是本申请实施例方案涉及的硬件运行环境的终端结构示意图。本申请实施例终端可以是固定终端,如物联网智能设备,包括智能空调、智能电灯、智能电源、智能路由器等智能家居;也可以是移动终端,包括智能手机、可穿戴的联网AR/VR装置、智能音箱、自动驾驶汽车等诸多联网设备。如图1所示,该语言离线识别系统的架构设计包括节点和服务器,其设备结构可以包括:处理器1001,例如CPU,存本文档来自技高网...

【技术保护点】
1.一种语言离线识别方法,其特征在于,所述语言离线识别方法包括:/n获取移动终端用户输入的语音数据,基于所述移动终端中本地数据库对所述语音数据进行识别;/n若基于本地数据库识别失败,则连接并基于预设云平台语音库识别所述语音数据,获取语音内容;/n根据所述语音内容,分析并获取所述移动终端用户的语音识别的喜好属性;/n基于所述喜好属性,更新所述本地数据库。/n

【技术特征摘要】
1.一种语言离线识别方法,其特征在于,所述语言离线识别方法包括:
获取移动终端用户输入的语音数据,基于所述移动终端中本地数据库对所述语音数据进行识别;
若基于本地数据库识别失败,则连接并基于预设云平台语音库识别所述语音数据,获取语音内容;
根据所述语音内容,分析并获取所述移动终端用户的语音识别的喜好属性;
基于所述喜好属性,更新所述本地数据库。


2.如权利要求1所述的语言离线识别方法,其特征在于,所述基于所述移动终端中本地数据库对所述语音数据进行识别的步骤包括:
获取所述语音数据的关键词;
比对所述关键词与所述本地数据库中的预设关键词,获得比对结果,并将所述比对结果作为本地数据库对所述语音数据的识别结果。


3.如权利要求2所述的语言离线识别方法,其特征在于,所述获得比对结果,并将所述比对结果作为本地数据库对所述语音数据的识别结果的步骤包括:
若所述关键词与所述任一预设关键词相同,则比对结果为成功,所述本地数据库对所述语音数据的识别成功;
若所述关键词与所述任一预设关键词不同,则比对结果为失败,所述本地数据库对所述语音数据的识别失败。


4.如权利要求1所述的语言离线识别方法,其特征在于,所述连接并基于预设云平台语音库识别所述语音数据,获取语音内容的步骤包括:
将所述语音数据传输至所述预设云平台语音库;
基于所述预设云平台语音库,对所述语音数据进行解析识别,获取语音内容。


5.如权利要求4所述的语言离线识别方法,其特征在于,所述根据所述语音内容,分析并获取所述移动终端用户的语音识别的喜好属性的步骤包括:
按照预设模型,提取所述语音内容的关键词;
基于所述关...

【专利技术属性】
技术研发人员:彭辉黎智勇许敏强
申请(专利权)人:广州国音智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1