确定目标识别文本的方法及装置制造方法及图纸

技术编号:15507929 阅读:162 留言:0更新日期:2017-06-04 02:25
本申请提供一种确定目标识别文本的方法及装置,该方法包括:确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,其中,确定识别文本为至少两个候选识别文本中相同的部分,待确定识别文本为至少两个候选识别文本中不相同的部分;计算待确定识别文本与目标对比文本的对应位置的文本之间的相似度,目标对比文本为预设文本库中与候选识别文本的句型结构一致的文本,且目标对比文本包括确定识别文本;进而将相似度中的最大值对应的待确定识别文本与确定识别文本组成的候选识别文本,配置为目标识别文本;实现了从候选识别文本中进一步筛选目标识别文本,提高了目标识别文本的准确性。

Method and device for determining target identification text

The present invention provides a method and apparatus for determining target text recognition, the method includes: identifying text and text recognition to be determined, which identifies at least two candidate text recognition to speech recognition data in the corresponding text, identifying at least two candidate for the same recognition of the text, text recognition is to be determined at least two candidate text recognition is not the same part; calculating to determine similarity between the text and the target text corresponding position recognition text contrast of the target text and contrast, the default candidate identification text library text sentence structure of the same, and the target text includes identifying text comparison; then the similarity in corresponding to the maximum value to be determined to identify text and identify candidate identification text recognition text, text configuration for target recognition is realized; The target recognition text is further filtered from candidate identification text, which improves the accuracy of target recognition text.

【技术实现步骤摘要】
确定目标识别文本的方法及装置
本申请涉及语音识别技术,尤其涉及一种确定目标识别文本的方法及装置。
技术介绍
随着语音控制技术的发展,目前越来越多的智能设备具备语音识别功能,示例的,具备语音控制功能的智能电视、智能冰箱、智能空调等和具备语音输入功能的智能手机智能电脑等。目前的语音识别主要包含语音预处理、声学模型解码、发音词典解析、语言模型解码等过程,其中,语音预处理是将收到的语音信号进行简单的处理,得到语音的特征文件等;声学模型解码的输入是语音的特征文件,通过声学模型解码获取概率最高的音素文件;进而,通过查询发音词典,将音素信息转为成可能的文字组合,再通过语言模型的上下文关联信息,从文字组合中获取概率较高的文字组合信息作为候选识别结果。由于语言模型中语料来源较为广泛,候选识别结果无法保证识别结果的准确性,因此需要通过一些方法从中甄别出准确的识别结果。但是,现有技术中并没有合适的甄选方法。申请内容本申请提供一种确定目标识别文本的方法及装置,用于在待识别语音数据的候选识别结果中甄选出准确的识别结果。本申请第一方面提供一种从至少两个候选识别文本中确定目标识别文本的方法,包括:确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,其中,所述确定识别文本为至少两个所述候选识别文本中相同的部分,所述待确定识别文本为至少两个所述候选识别文本中不相同的部分;计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,其中,所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本,且所述目标对比文本包括所述确定识别文本;将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本,配置为目标识别文本。本申请第二方面提供一种从候选识别文本中确定目标识别文本的装置,包括:第一确定模块,用于确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,其中,所述确定识别文本为至少两个所述候选识别文本中相同的部分,所述待确定识别文本为至少两个所述候选识别文本中不相同的部分;计算模块,用于计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,其中,所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本,且所述目标对比文本包括所述确定识别文本;第二确定模块,用于将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本,配置为目标识别文本。本申请的有益效果如下:本申请提供的确定目标识别文本的方法中,首先确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,然后针对待确定识别文本,计算待确定识别文本与目标对比文本的对应位置的文本之间的相似度,将相似度中的最大值对应的待确定识别文本确定为待识别语音数据对应的正确结果,进而将该待确定识别文本与确定识别文本组成的候选识别文本,配置为目标识别文本,实现了在获取到多个概率接近的候选识别文本时,根据与其句型结构一致的目标对比文本,进一步根据待确定识别文本与目标对比文本中对应位置的文本之间的相似度,确定出与用户输入的语音数据最接近的待确定识别文本,进而将该待确定识别文本和确定识别文本一起组成目标识别文本,反馈给用户,即通过参照目标对比文本,对多个概率接近的候选识别文本中的不同部分进一步甄选,提高了识别待识别语音数据的准确性,提高了语音识别的用户体验性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请一实施例提供的从至少两个候选识别文本中确定目标识别文本的方法流程示意图;图2为本申请另一实施例提供的从至少两个候选识别文本中确定目标识别文本的方法流程示意图;图3为本申请一实施例提供的从至少两个候选识别文本中确定目标识别文本的装置结构示意图;图4为本申请另一实施例提供的从至少两个候选识别文本中确定目标识别文本的装置结构示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。在对本专利技术实施例进行详细地解释说明之前,先对本专利技术实施例的应用环境予以介绍。本专利技术实施例提供的用于显示语音输入控制指令的显示方法应用于终端,示例的,该终端可以是具有Android操作系统或IOS操作系统的智能电视、智能手机、平板电脑等,该终端还可以是具有Window操作系统或Ios操作系统的计算机、PDA(PersonalDigitalAssistant,个人数字助理)等,本专利技术实施例对此不做具体限定。本申请中提供一从至少两个候选识别文本中确定目标识别文本的方法,在语音识别获取多个识别结果的基础上,进一步在多个识别结果中分析选择最终的语音识别文本,以提高语音识别的准确性。图1为本申请一实施例提供的从至少两个候选识别文本中确定目标识别文本的方法流程示意图,如图1所示,该方法包括:S101、确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本。具体实现过程中,当用户输入待识别语音数据后,由于发音的接近或识别精度等原因,可能识别到多个语音识别文本。例如用户说了一句“我想听高胜美的歌曲”,可能得到“我想听高盛美的歌曲”、“我想听高兴美的歌曲”、“我想听高胜美的歌曲”等多个语音识别文本。从这多个语音识别文本中先确定候选识别文本,进一步甄选准确的识别结果。候选识别文本由确定识别文本和待确定识别文本组成。其中,确定识别文本为至少两个候选识别文本中相同的部分,待确定识别文本为至少两个候选识别文本中不相同的部分。例如“我想听高兴美的歌曲”和“我想听高胜美的歌曲”中,“我想听”、“的歌曲”是确定识别文本,“高胜美”和“高兴美”是待确定识别文本。即可以认为多个候选识别文本中相同的部分是准确的结果,而不相同的部分是需要进一步确定的待确定识别文本,也即待确定识别文本还需要进一步进行识别,以便得到更准确的结果。S102、计算待确定识别文本与目标对比文本的对应位置的文本之间的相似度。其中,目标对比文本为预设文本库中与候选识别文本的句型结构一致的文本,且目标对比文本包括上述确定识别文本。预设文本库中可以包括大量预存的语句、词汇组合等,可以通过词义、词性(名词、动词)等,在预设文本库中匹配与候选识别文本句型一致的目标对比文本。例如“我想听高兴美的歌曲”可能匹配到目标对比文本“我想听周杰伦的歌曲”等。又例如“请给我一杯咖啡”可能匹配到目标对比文本“请给我一杯牛奶”。举例说明,目标对比文本包括上述确定识别文本,即“我想听周杰伦的歌曲”包含确定识别文本“我想听”、“的歌曲”。S103、将相似度中的最大值对应的待确定识别文本与确定识别文本组成的候选识别文本,配置为目标识别文本。可选地,分别计算确定待确定识别文本与目标对比文本的对应位置的文本之间的相本文档来自技高网...
确定目标识别文本的方法及装置

【技术保护点】
一种从至少两个候选识别文本中确定目标识别文本的方法,其特征在于,包括:确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,其中,所述确定识别文本为至少两个所述候选识别文本中相同的部分,所述待确定识别文本为至少两个所述候选识别文本中不相同的部分;计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,其中,所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本,且所述目标对比文本包括所述确定识别文本;将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本,配置为目标识别文本。

【技术特征摘要】
1.一种从至少两个候选识别文本中确定目标识别文本的方法,其特征在于,包括:确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本,其中,所述确定识别文本为至少两个所述候选识别文本中相同的部分,所述待确定识别文本为至少两个所述候选识别文本中不相同的部分;计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,其中,所述目标对比文本为预设文本库中与所述候选识别文本的句型结构一致的文本,且所述目标对比文本包括所述确定识别文本;将所述相似度中的最大值对应的所述待确定识别文本与所述确定识别文本组成的所述候选识别文本,配置为目标识别文本。2.根据权利要求1所述的方法,其特征在于,所述确定待识别语音数据对应的至少两个候选识别文本中的确定识别文本和待确定识别文本之前,所述方法还包括:确定所述待识别语音数据对应的多个语音识别文本中的最大概率值和第二大概率值;当所述最大概率值和所述第二大概率值之间的差值小于预设的概率阈值时,从所述多个语音识别文本中确定至少两个候选识别文本。3.根据权利要求1或2所述的方法,其特征在于,所述从所述多个语音识别文本中确定至少两个候选识别文本,包括:获取所述多个语音识别文本中概率值与所述最大概率值的差值小于预设的概率阈值的第一语音识别文本;将所述第一语音识别文本和所述最大概率值对应的语音识别文本确定为所述至少两个候选识别文本。4.根据权利要求1所述的方法,其特征在于,所述计算所述待确定识别文本与目标对比文本的对应位置的文本之间的相似度,具体为:采用预设词向量模型,确定所述待确定识别文本与所述目标对比文本的对应位置的文本之间的语义相似度,其中,所述预设词向量模型用于通过词向量距离标识词汇间的语义相似度。5.根据权利要求4所述的方法,其特征在于,所述采用预设词向量模型,确定所述待确定识别文本与所述目标对比文本中对应位置的文本之间的语义相似度,具体为:当所述待确定识别文本包括至少两个词汇,采用所述预设词向量模型,分别确定所述待确定识别文本中各个词汇与目标对比文本中对应位置的...

【专利技术属性】
技术研发人员:陈仲帅马宏
申请(专利权)人:海信集团有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1