一种语音控制指令生成方法、装置及电子设备制造方法及图纸

技术编号:22103358 阅读:82 留言:0更新日期:2019-09-14 03:49
本发明专利技术公开了一种语音控制指令生成方法、装置及电子设备,包括:根据接收到的语音信息获取待输出的文本,识别待输出的文本中的数字及数字在文本中的位置;将该位置的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本;根据每个分词的权重及分词的长度,确定候选文本的得分并确定文本识别结果,将文本识别结果及预先设定的标准文本进行匹配,根据匹配成功的标准文本生成语音控制指令。由于在本发明专利技术实施例中,通过将识别的数字在文本中的位置处的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本,并计算每个候选文本的得分,根据候选文本的得分确定到的文本识别结果更加准确,从而可以保证后续生成的语音控制指令的准确性。

A Method, Device and Electronic Equipment for Voice Control Instruction Generation

【技术实现步骤摘要】
一种语音控制指令生成方法、装置及电子设备本申请要求在2019年05月09日提交中国专利局、申请号为201910383416.9、申请名称为“一种文本识别方法、装置及电子设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本专利技术涉及自然语言处理
,尤其涉及一种语音控制指令生成方法、装置及电子设备。
技术介绍
语音识别技术可以实现从语音信息向文字信息的转化,即根据语音信的识别结果可以生成对应的语音控制指令,在转化时需要基于声学模型解码、语言模型解码等处理。语言模型是最终识别文本的一个重要参考标准,语言模型根据训练语料中中文文本的出现概率来决定识别文本的一种模型。而现有的语音识别的方法导致语音识别的准确性难以达到理想水平,语音识别的结果经常出现错误,这将会增加后续的语义理解的工作难度,并可能导致生成错误的语音控制指令。在进行语音识别时,数字识别是语音识别的一部分,数字一般包括中文数字和阿拉伯数字。因为在进行语音识别时是基于语言模型的,因此语言模型训练语料中中文数字和阿拉伯数字出现的比重大小将决定数字的识别形式。如果识别出的文本中数字形式识别错误,将导致包含数字的实体词整体无法有效提取和标注,进而影响语义的整体理解,并可能生成错误的语音控制指令。因此一种可靠的语音控制指令生成方法,将会有效的提高语音理解的准确性。
技术实现思路
本专利技术实施例提供了一种语音控制指令生成方法、装置及电子设备,用以解决现有技术生成语音控制指令的过程中,在进行文本识别时数字形式识别错误,导致生成的语音控制指令的准确性较低的问题。本专利技术实施例提供了一种语音控制指令生成方法,所述方法包括:根据接收到的语音信息获取待输出的文本,识别所述待输出的文本中的数字及所述数字在所述文本中的位置;将所述待输出的文本中所述位置的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本;根据候选文本分词后每个分词的权重及分词的长度,确定候选文本的得分,根据候选文本的得分确定文本识别结果;将所述文本识别结果及预先设定的标准文本进行匹配,根据匹配成功的标准文本生成语音控制指令。进一步地,所述识别待输出的文本中的数字及所述数字在所述文本中的位置包括:将所述待输出的文本中的第一个字符作为待检测的字符;采用当前长度的滑动窗口滑动到所述待检测的字符,判断该滑动窗口内的字符串是否为满足数字规则的字符串;如果是,对记录的所述待检测的字符对应的字符串在所述文本中的位置进行更新,并将所述滑动窗口增加设定长度,继续根据所述待检测的字符和改变长度后的滑动窗口,对对应的字符串进行判断;如果否,根据记录的所述待检测的字符对应的字符串在所述文本中的位置,将所述位置后的下一字符作为待检测字符进行判断。进一步地,所述满足数字规则的字符串包括:全部为阿拉伯数字的字符串;或由中文数字和位词构成的字符串。进一步地,所述将所述待输出的文本中所述位置的数字分别转换为中文数字和阿拉伯数字包括:将所述待输出的文本中归属于同一字符串的数字同时转换为中文数字,或阿拉伯数字。进一步地,所述根据候选文本分词后每个分词的权重及分词的长度,确定候选文本的得分包括:根据确定候选文本的得分,其中scoretext表示候选文本的得分,lengthtext为候选文本的长度,为第i个分词的长度,为第i个分词的权重。本专利技术实施例提供了一种语音控制指令生成装置,所述装置包括:识别模块,用于根据接收到的语音信息获取待输出的文本,识别所述待输出的文本中的数字及所述数字在所述文本中的位置;生成模块,用于将所述待输出的文本中所述位置的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本;确定模块,用于根据候选文本分词后每个分词的权重及分词的长度,确定候选文本的得分,根据候选文本的得分确定文本识别结果;匹配确定模块,用于将所述文本识别结果及预先设定的标准文本进行匹配,根据匹配成功的标准文本生成语音控制指令。进一步地,所述识别模块,具体用于将所述待输出的文本中的第一个字符作为待检测的字符;采用当前长度的滑动窗口滑动到所述待检测的字符,判断该滑动窗口内的字符串是否为满足数字规则的字符串;如果是,对记录的所述待检测的字符对应的字符串在所述文本中的位置进行更新,并将所述滑动窗口增加设定长度,继续根据所述待检测的字符和改变长度后的滑动窗口,对对应的字符串进行判断;如果否,根据记录的所述待检测的字符对应的字符串在所述文本中的位置,将所述位置后的下一字符作为待检测字符进行判断。进一步地,所述生成模块,具体用于将所述待输出的文本中归属于同一字符串的数字同时转换为中文数字,或阿拉伯数字。进一步地,所述确定模块,具体用于根据确定候选文本的得分,其中scoretext表示候选文本的得分,lengthtext为候选文本的长度,为第i个分词的长度,为第i个分词的权重。本专利技术实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述任一项所述方法的步骤。本专利技术实施例提供了一种语音控制指令生成方法、装置及电子设备,所述方法包括:根据接收到的语音信息获取待输出的文本,识别待输出的文本中的数字及所述数字在所述文本中的位置;将所述待输出的文本中所述位置的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本;根据候选文本分词后每个分词的权重及分词的长度,确定候选文本的得分,根据候选文本的得分确定文本识别结果,并将所述文本识别结果及预先设定的标准文本进行匹配,根据匹配成功的标准文本生成语音控制指令。由于在本专利技术实施例中,通过将识别的数字在文本中的位置处的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本,并计算每个候选文本的得分,根据候选文本的得分确定到的文本识别结果更加准确,从而可以保证后续生成的语音控制指令的准确性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例1提供的一种语音控制指令生成方法的流程示意图;图2为本专利技术实施例4提供的一种语音控制指令生成方法的结果示意图;图3为本专利技术实施例5提供的一种语音控制指令生成装置的结构示意图;图4为本专利技术实施例6提供的一种电子设备。具体实施方式下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。实施例1:图1为本专利技术实施例提供的一种语音控制指令生成方法的流程示意图,该方法包括以下步骤:S101:根据接收到的语音信息获取待输出的文本,识别所述待输出的文本中的数字及所述数字在所述文本中的位置。为了方便用户对智能设备的控制,用户可以通过语音的方式输入进行控制的语音信息。当对智能设备进行控制的设备接收到该语音信息后,根据该语音信息获取待输出的文本。具体的,可以通过对语音信息的语义本文档来自技高网...

【技术保护点】
1.一种语音控制指令生成方法,其特征在于,所述方法包括:根据接收到的语音信息获取待输出的文本,识别所述待输出的文本中的数字及所述数字在所述文本中的位置;将所述待输出的文本中所述位置的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本;根据候选文本分词后每个分词的权重及分词的长度,确定候选文本的得分,根据候选文本的得分确定文本识别结果;将所述文本识别结果及预先设定的标准文本进行匹配,根据匹配成功的标准文本生成语音控制指令。

【技术特征摘要】
2019.05.09 CN 20191038341691.一种语音控制指令生成方法,其特征在于,所述方法包括:根据接收到的语音信息获取待输出的文本,识别所述待输出的文本中的数字及所述数字在所述文本中的位置;将所述待输出的文本中所述位置的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本;根据候选文本分词后每个分词的权重及分词的长度,确定候选文本的得分,根据候选文本的得分确定文本识别结果;将所述文本识别结果及预先设定的标准文本进行匹配,根据匹配成功的标准文本生成语音控制指令。2.如权利要求1所述的方法,其特征在于,所述识别待输出的文本中的数字及所述数字在所述文本中的位置包括:将所述待输出的文本中的第一个字符作为待检测的字符;采用当前长度的滑动窗口滑动到所述待检测的字符,判断该滑动窗口内的字符串是否为满足数字规则的字符串;如果是,对记录的所述待检测的字符对应的字符串在所述文本中的位置进行更新,并将所述滑动窗口增加设定长度,继续根据所述待检测的字符和改变长度后的滑动窗口,对对应的字符串进行判断;如果否,根据记录的所述待检测的字符对应的字符串在所述文本中的位置,将所述位置后的下一字符作为待检测字符进行判断。3.如权利要求2所述的方法,其特征在于,所述满足数字规则的字符串包括:全部为阿拉伯数字的字符串;或由中文数字和位词构成的字符串。4.如权利要求1所述的方法,其特征在于,所述将所述待输出的文本中所述位置的数字分别转换为中文数字和阿拉伯数字包括:将所述待输出的文本中归属于同一字符串的数字同时转换为中文数字,或阿拉伯数字。5.如权利要求1所述的方法,其特征在于,所述根据候选文本分词后每个分词的权重及分词的长度,确定候选文本的得分包括:根据确定候选文本的得分,其中scoretext表示候选文本的得分,lengthtext为候选文本的长度,为第...

【专利技术属性】
技术研发人员:马宏
申请(专利权)人:青岛海信电器股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1