一种语音识别方法、装置制造方法及图纸

技术编号:22596199 阅读:48 留言:0更新日期:2019-11-20 11:49
本发明专利技术公开了一种语音识别方法,包括:接收用户输入的语音指令;对语音指令进行初始语音识别,确定语音指令的一个或多个初始候选分词识别结果;判断是否有未识别的分词,如果有,判断该分词在所述语音指令的重要程度,如果重要,判断是否已存在针对所述未识别的分词的第一候选识别结果集,如果存在,获取第一候选识别结果集中的多个候选答案的属性信息;根据所述属性信息,确定第一候选答案;根据所述第一候选答案以及所述初始候选分词识别结果构建语音指令的识别结果;向用户反馈识别结果和/或执行所述语音指令。通过本发明专利技术的方法,能够加快对未登录词的理解,加强人机对话和自然语言理解的智能化水平,提高语音识别效率,提升用户使用体验。

A speech recognition method and device

The invention discloses a speech recognition method, which comprises: receiving the speech instruction input by the user; performing initial speech recognition on the speech instruction, determining the recognition result of one or more initial candidate participles of the speech instruction; judging whether there is an unrecognized participle, if so, judging the importance of the participle in the speech instruction, if so, judging whether there is an existing participle for the The first candidate recognition result set of the unrecognized segmentation, if any, obtains attribute information of multiple candidate answers in the first candidate recognition result set; determines the first candidate answer according to the attribute information; constructs the recognition result of the voice instruction according to the first candidate answer and the initial candidate segmentation recognition result; feeds back the recognition result to the user and / or executes the Voice command. The method of the invention can accelerate the understanding of the unregistered words, strengthen the intelligent level of man-machine dialogue and natural language understanding, improve the efficiency of speech recognition and enhance the user experience.

【技术实现步骤摘要】
一种语音识别方法、装置
本专利技术实施例涉及信息处理
,特别涉及一种语音识别方法、装置。
技术介绍
随着语音识别技术的不断发展,语音交互也在改变与智能设备的对话模式和提升日常应用的便捷度。语音交互过程不但需要基于声学的语音识别,还需要自然语言处理(NaturalLanguageProcess,NLP),但在NLP过程中,一旦用户的表述中出现未登录词,即各类没有被现有知识收录的专有名词(人名、地名、企业名等)、缩写词、新增词汇等,则会严重影响NLP的处理效果。如何加快对未登录词的理解,加强人机对话和自然语言理解的智能化水平,提高语音识别效率,提升用户使用体验成为一个亟待解决的问题。
技术实现思路
针对现有技术中的问题,本专利技术提供一种语音识别方法、装置、终端设备和计算机可读存储介质。本专利技术提供一种语音识别方法,其特征在于,所述方法包括:步骤101,接收用户输入的语音指令;步骤102,对所述用户输入的语音指令进行初始语音识别,确定所述语音指令的一个或多个初始候选分词识别结果;步骤103,判断是否有未识别的分词,如果有未识别的分词,判断该分词在所述语音指令的重要程度,如果重要,则执行步骤104;步骤104,判断是否已存在针对所述未识别的分词的第一候选识别结果集,如果存在,获取第一候选识别结果集中的多个候选答案的属性信息,所述属性信息包括候选答案的反馈值和/或反馈用户;步骤105,根据所述属性信息,确定第一候选答案;步骤106,根据所述第一候选答案以及所述初始候选分词识别结果构建语音指令的识别结果;步骤107,向用户反馈所述语音指令的识别结果和/或执行所述语音指令。本专利技术还提供一种语音识别装置,其特征在于,所述装置包括:输入单元,接收用户输入的语音指令;初始识别单元,对所述用户输入的语音指令进行初始语音识别,确定所述语音指令的一个或多个初始候选分词识别结果;词性判断单元,判断是否有未识别的分词,如果有未识别的分词,判断该分词在所述语音指令的重要程度,如果重要,则触发答案获取单元;答案获取单元,判断是否已存在针对所述未识别的分词的第一候选识别结果集,如果存在,获取所述第一候选识别结果集中的多个候选答案的属性信息,所述属性信息包括候选答案的反馈值和/或反馈用户;答案确定单元,根据所述属性信息,确定第一候选答案;结果生成单元,根据所述第一候选答案以及所述初始候选分词识别结果构建语音指令的识别结果;输出单元,向用户反馈所述语音指令的识别结果和/或执行所述语音指令。本专利技术还提供一种终端设备,其特征在于,所述终端设备包括处理器和存储器,所述存储器中存储有可在处理器上运行的计算机程序,所述计算机程序在被所述处理器执行时实现如上所述的方法。本专利技术还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如上所述的方法。通过本专利技术的方法,能够提高对未登录词的理解,提高人机对话和自然语言理解的智能化水平,提升了用户的使用体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个实施例中的一种语音识别方法。图2是本专利技术一个实施例中的一种语音识别装置。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。本专利技术的实施例以及实施例的具体特征是对本专利技术实施例技术方案的详细说明,而非对本专利技术说明书技术方案的限定,在不冲突的情况下,本专利技术的实施例以及实施例的技术特征可以相互结合。实施例一参考图1,本专利技术实施例一提供一种语音识别方法,其特征在于,所述方法包括:步骤101,接收用户输入的语音指令;步骤102,对所述用户输入的语音指令进行初始语音识别,确定所述语音指令的一个或多个初始候选分词识别结果;步骤103,判断是否有未识别的分词,如果有未识别的分词,判断该分词在所述语音指令的重要程度,如果重要,则执行步骤104;步骤104,判断是否已存在针对所述未识别的分词的第一候选识别结果集,如果存在,获取第一候选识别结果集中的多个候选答案的属性信息,所述属性信息包括候选答案的反馈值和/或反馈用户;步骤105,根据所述属性信息,确定第一候选答案;步骤106,根据所述第一候选答案以及所述初始候选分词识别结果构建语音指令的识别结果;步骤107,向用户反馈所述语音指令的识别结果和/或执行所述语音指令。优选地,所述步骤103还包括如果不重要,则忽略该分词,基于其他分词的初始候选分词识别结果,构建语音指令的识别结果,执行步骤107。优选地,步骤104还包括判断是否已存在针对所述未识别的分词的第一候选识别结果集,如果不存在,拆分所述未识别的分词为多个独立字,基于所述独立字确定所述未识别的分词的第一候选识别结果集,所述第一候选识别结果集包含多个候选答案,根据置信度对所述多个候选答案进行优先级排序。优选地,步骤105包括根据所述反馈用户信息,确定所述用户与反馈用户之间相似度,如果所述相似度大于等于第一阈值,则根据候选答案的反馈值,确定第一候选答案。优选地,步骤107之后还包括步骤108,接收用户的反馈信息,所述反馈信息包含第二语音指令和/或用户情绪数据。具体地,所述方法应用于具有语音助手或具有语音识别功能的终端,所述终端可以是移动终端,车载终端,计算机,智能家电等电子设备;所述步骤101中,可以通过终端的麦克风接收用户的语音指令。在所述步骤102中,对所述用户输入的语音指令进行初始语音识别,确定所述语音指令包含的一个或多个音素;基于所述一个或多个音素,确定所述语音指令的一个或多个初始候选分词识别结果。所述步骤103中判断是否有未识别的分词,如果有未识别的分词,判断该分词在所述语音指令的重要程度。在用户的语音指令中,可能出现无意义的未收录专有名词,例如,用户自创名词,但并未对语音指令的整体含义有影响,例如,用户发出语音指令,“xiangchi***daohangquxidandayuecheng”,通过步骤102中的初始语音识别得到初始候选分词识别结果“想吃,***,导航,去,西单大悦城”,其中“***”作为未识别的分词,在步骤103中判断该未识别的分词对用户语音指令的意图并不重要,如果此时,反馈一个***的可能答案,如果该答案错误,用户可能会对结果不满,但由于其意图也不是要终端理解具体要吃什么,而是设定导航路线,执行导航任务。此时,该分词在所述语音指令的重要程度为不重要,忽本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n步骤101,接收用户输入的语音指令;/n步骤102,对所述用户输入的语音指令进行初始语音识别,确定所述语音指令的一个或多个初始候选分词识别结果;/n步骤103,判断是否有未识别的分词,如果有未识别的分词,判断该分词在所述语音指令的重要程度,如果重要,则执行步骤104;/n步骤104,判断是否已存在针对所述未识别的分词的第一候选识别结果集,如果存在,获取所述第一候选识别结果集中的多个候选答案的属性信息,所述属性信息包括候选答案的反馈值和/或反馈用户;/n步骤105,根据所述属性信息,确定第一候选答案;/n步骤106,根据所述第一候选答案以及所述初始候选分词识别结果构建语音指令的识别结果;/n步骤107,向用户反馈所述语音指令的识别结果和/或执行所述语音指令。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
步骤101,接收用户输入的语音指令;
步骤102,对所述用户输入的语音指令进行初始语音识别,确定所述语音指令的一个或多个初始候选分词识别结果;
步骤103,判断是否有未识别的分词,如果有未识别的分词,判断该分词在所述语音指令的重要程度,如果重要,则执行步骤104;
步骤104,判断是否已存在针对所述未识别的分词的第一候选识别结果集,如果存在,获取所述第一候选识别结果集中的多个候选答案的属性信息,所述属性信息包括候选答案的反馈值和/或反馈用户;
步骤105,根据所述属性信息,确定第一候选答案;
步骤106,根据所述第一候选答案以及所述初始候选分词识别结果构建语音指令的识别结果;
步骤107,向用户反馈所述语音指令的识别结果和/或执行所述语音指令。


2.根据权利要求1所述的方法,其特征在于,所述步骤103还包括
如果不重要,则忽略该分词,基于其他分词的初始候选分词识别结果,构建语音指令的识别结果,执行步骤107。


3.根据权利要求1所述的方法,其特征在于,步骤104还包括
判断是否已存在针对所述未识别的分词的第一候选识别结果集,如果不存在,拆分所述未识别的分词为多个独立字,基于所述独立字确定所述未识别的分词的第一候选识别结果集,所述第一候选识别结果集包含多个候选答案,根据置信度对所述多个候选答案进行优先级排序。


4.根据权利要求1所述的方法,其特征在于,步骤105包括
根据所述反馈用户信息,确定所述用户与反馈用户之间相似度,如果所述相似度大于等于第一阈值,则根据候选答案的属性信息中所述反馈用户的反馈值,确定第一候选答案。


5.根据权利要求1所述的方法,其特征在于,步骤107之后还包括
接收用户的反馈信息,所述反馈信息包含第二语音指令和/或用户情绪数据。


6.一种语音识别装置,其特征在于,所述装置包括:
输入单元,接收用户输入的语音指令;
初始识别单元,对所述用户输入的语音指令进行初始语音识别,确定所述语音指令的一个或多个初始候选分词识别结果;

【专利技术属性】
技术研发人员:张伟萌戴帅湘
申请(专利权)人:北京蓦然认知科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1