语音识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:20162408 阅读:21 留言:0更新日期:2019-01-19 00:15
本发明专利技术实施例公开了一种语音识别方法、装置、电子设备及存储介质。该方法包括:根据用户的语音识别请求,获取与所述用户关联的语言模型参考数据;根据所述语言模型参考数据构建所述用户的个人语言模型;根据通用语言模型与所述个人语言模型,对所述用户输入的待识别语音进行语音识别。上述方法解决了语音识别中对用户特有高频词汇的识别难题,提高了个性化语音识别的准确率。

【技术实现步骤摘要】
语音识别方法、装置、电子设备及存储介质
本专利技术实施例涉及语音识别
,特别是涉及一种语音识别方法、装置、电子设备及存储介质。
技术介绍
随着大数据、机器学习、云计算、人工智能等技术的发展,语音识别正在一步步解放用户的双手,语音输入框也大有取代鼠标、键盘之势。伴随着智能移动设备的普及,语音交互作为一种新型的人机交互方式,越来越引起整个IT(InformationTechnology,信息科技)业界的重视。鉴于说话人常常来自不同的方言区、有不同的口音,说话时又有不同的方式习惯、运用不同的情感,基于深度学习的个性化语音识别应运而生。专利技术人在具体实施过程中,发现现有技术中的个性化语音识别主要是利用用户的语音数据进行声学模型的自适应,这种方式需要用户主动提供语音数据,而不能利用其他的信息数据。与此同时,专利技术人还发现每个人说话时的高频词和低频词都不一样,用户的特有高频词可能是大数据统计模型中的低频词,而目前的语音识别主要是基于大数据统计模型,统一分析所有用户的高频词,这样导致了对低频词(或者是用户特有高频词)的识别效果明显差于高频词。
技术实现思路
有鉴于此,本专利技术实施例提供了一种语音识别方法、装置、电子设备及存储介质,主要目的在于解决语音识别中对用户特有高频词汇的识别难题。为了解决上述问题,本专利技术实施例主要提供如下技术方案:第一方面,本专利技术实施例提供了一种语音识别方法,该方法包括:根据用户的语音识别请求,获取与所述用户关联的语言模型参考数据;根据所述语言模型参考数据构建所述用户的个人语言模型;根据通用语言模型与所述个人语言模型,对所述用户输入的待识别语音进行语音识别。第二方面,本专利技术实施例还提供一种语音识别装置,该装置包括:参考数据获取模块,用于根据用户的语音识别请求,获取与所述用户关联的语言模型参考数据;个人语言模型构建模块,用于根据所述语言模型参考数据构建所述用户的个人语言模型;语音识别模块,用于根据通用语言模型与所述个人语言模型,对所述用户输入的待识别语音进行语音识别。第三方面,本专利技术实施例还提供一种电子设备,包括:至少一个处理器;以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行本专利技术任意实施例所述的语音识别方法。第四方面,本专利技术实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本专利技术任意实施例所述的语音识别方法。借由上述技术方案,本专利技术实施例提供的技术方案至少具有下列优点:本专利技术实施例通过在接收到用户的语音识别请求时获取与用户关联的语言模型参考数据,并根据语言模型参考数据构建用户的个人语言模型,然后根据通用语言模型和个人语言模型对用户输入的待识别语音进行语音识别,解决了语音识别中对用户特有高频词汇的识别难题,提高了个性化语音识别的准确率。上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术实施例的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例一提供的一种语音识别方法的流程图;图2示出了本专利技术实施例二提供的一种语音识别方法的流程图;图3示出了本专利技术实施例三提供的一种语音识别方法的流程图;图4示出了本专利技术实施例四提供的一种语音识别装置的结构示意图;图5示出了本专利技术实施例五提供的一种电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。实施例一图1是本专利技术实施例一提供的一种语音识别方法的流程图,可适用于针对不同用户的个性化语音识别,该方法可以由本专利技术实施例提供的语音识别装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在处理器中,例如可以是移动终端的处理器中。如图1所示,本专利技术实施例的方法具体包括:S110、根据用户的语音识别请求,获取与用户关联的语言模型参考数据。例如在人机对话的应用场景下,用户向例如移动终端类的电子设备发出语音信号,电子设备接收到用户的语音后会对其进行语音识别。其中,用户首先会触发电子设备上接收语音的实体按键或虚拟按键,然后发出语音信号。进而,语音识别请求具体可以是指的是例如触发指令之类的请求信号,如果电子设备接收到语音识别请求,则意味着电子设备将要接收用户随后输入的语音信号,并将其作为待识别语音进行语音识别。在本步骤中,当电子设备接收到用户的语音识别请求后,会获取与用户关联的语音模型参考数据,其中,语音模型参考数据是用来构建用户的个人语言模型的。语音模型参考数据主要包括用于指示用户个性信息的参考数据,例如用户的高频词汇数据、用户的位置信息数据、用户的操作信息数据等,其中,用户的操作信息数据可以包括用户的浏览信息数据、用户的存储信息数据等等。具体的,语音模型参考数据的获取方式可以是在电子设备的存储信息中直接获取,也可似是在与电子设备中应用程序对应的服务器端远程获取等。S120、根据语言模型参考数据构建用户的个人语言模型。基于获取的用户的语言模型参考数据,构建用户的个人语言模型。也即,个人语言模型中存储有用户的语音模型参考数据,更侧重用户的个性语言。与大规模的通用语言模型相比,个人语言模型中对用户的个性语言的识别效果会更好。S130、根据通用语言模型与个人语言模型,对用户输入的待识别语音进行语音识别。语音识别的任务是将用户语音中的连续时间信号转变为一串离散的音节单元或单词。在本步骤中,获取用户输入的待识别语音后,根据大规模的通用语言模型和个人语言模型对待识别语音进行识别,得到语音识别结果。具体的,可以使用大规模的通用语言模型和个人语言模型分别对待识别语音进行识别,结合分析两个语言模型的识别结果来确定与待识别语音对应的最终识别结果。选取其中一个语言模型对待识别语音进行语音识别时,可以采用两遍解码的方法,第一遍解码时生成与待识别语音对应的候选句子列表,然后第二遍解码在候选列表中利用语言模型对候选句子进行重新打分,选出新的最佳路径,作为最终的识别结果。本专利技术实施例提供的一种语音识别方法,通过在接收到用户的语音识别请求时获取与用户关联的语言模型参考数据,并根据语言模型参考数据构建用户的个人语言模型,然后根据通用语言模型和个人语言模型对用户输入的待识别语音进行语音识别,解决了语音识别中对用户特有高频词汇的识别难题,提高了个性化语音识别的准确率。实施例二图2是本专利技术实施例二提供的一种语音识别方法的流程图。在上述技术方案的基础上,本专利技术实施例将语言模型参考数据进行具体化:一种具体的实施方式是,将语言模型参考数据具体为个人信息参考数据本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:根据用户的语音识别请求,获取与所述用户关联的语言模型参考数据;根据所述语言模型参考数据构建所述用户的个人语言模型;根据通用语言模型与所述个人语言模型,对所述用户输入的待识别语音进行语音识别。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:根据用户的语音识别请求,获取与所述用户关联的语言模型参考数据;根据所述语言模型参考数据构建所述用户的个人语言模型;根据通用语言模型与所述个人语言模型,对所述用户输入的待识别语音进行语音识别。2.根据权利要求1所述的方法,其特征在于,所述语言模型参考数据包括个人信息参考数据;所述个人语言模型包括个人信息语言模型;所述根据所述语言模型参考数据构建所述用户的个人语言模型,包括:根据所述个人信息参考数据构建所述个人信息语言模型。3.根据权利要求1所述的方法,其特征在于,所述语言模型参考数据包括:个人信息参考数据和个人对话参考数据;所述个人语言模型包括:个人信息语言模型和个人对话语言模型;所述根据所述语言模型参考数据构建所述用户的个人语言模型,具体包括:根据所述个人信息参考数据构建所述个人信息语言模型;根据所述个人对话参考数据构建所述个人对话语言模型。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述个人信息参考数据构建个人信息语言模型,包括:获取历史构建的个人信息语言模型;根据所述个人信息参考数据更新所述个人信息语言模型。5.根据权利要求2或3所述的方法,其特征在于,所述个人信息参考数据包括下述至少一项:所述用户的足迹数据、存储数据以及历史操作数据。6.根据权利要求3所述的方法,其特征在于,所述个人对话参考数据包括下述至少一项:所述用户的历史对话数据和历史对话关联数据。7.根据权利...

【专利技术属性】
技术研发人员:邹明
申请(专利权)人:北京羽扇智信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1