一种语音识别方法及装置制造方法及图纸

技术编号:21973147 阅读:32 留言:0更新日期:2019-08-28 01:50
本申请提供一种语音识别方法及装置,其中所述语音识别方法包括:接收待识别语音信息;根据所述待识别语音信息获取第一语音识别结果;根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词,其中,待识别词对应的确定词为根据读音确定的单一的实体或关系,待识别词对应的候选词为根据读音确定的非单一的实体或关系;计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量,选择数量最小的待识别词对应的候选词为所述待识别词的优选词;将所述确定词和所述优选词的组合确定为第二语音识别结果,并输出所述第二语音识别结果。

A Speech Recognition Method and Device

【技术实现步骤摘要】
一种语音识别方法及装置
本申请涉及互联网
,特别涉及一种语音识别方法及装置、计算设备、计算机可读存储介质和芯片。
技术介绍
近年来语音识别技术发展迅速,其应用领域不断扩大,各种各样的语音识别产品出现在市场上,通过使用语音识别转换工具将语音识别转化为文字输出。但是,实际的用户类型却是多种多样的,许多人的发音与标准发音相差甚远,所以目前在使用语音识别转换工具将语音识别转换成文字时,由于一些多音字问题的原因和识别库数据稀疏的问题,语音识别转换工具不能准确地识别这部分有问题的语音数据,并且在识别语音信息后没有具备一定的纠错能力,导致通过语音识别转换工具转换生成的文字与正确的文本内容存在不一致的情况,实际应用效果差。那么如何能将用户输入的语音准确的转换成文字就成为了目前亟待解决的问题。
技术实现思路
有鉴于此,本申请实施例提供了一种语音识别方法及装置、计算设备、计算机可读存储介质和芯片,以解决现有技术中存在的技术缺陷。根据本申请实施例的第一方面,提供了一种语音识别方法,包括:接收待识别语音信息;根据所述待识别语音信息获取第一语音识别结果;根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词,其中,待识别词对应的确定词为根据读音确定的单一的实体或关系,待识别词对应的候选词为根据读音确定的非单一的实体或关系;计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量,选择数量最小的待识别词对应的候选词为所述待识别词的优选词;将所述确定词和所述优选词的组合确定为第二语音识别结果,并输出所述第二语音识别结果。根据本申请实施例的第二方面,提供了一种语音识别装置,包括:接收模块,被配置为接收待识别语音信息;获取模块,被配置为根据所述待识别语音信息获取第一语音识别结果;确定模块,被配置为根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词,其中,待识别词对应的确定词为根据读音确定的单一的实体或关系,待识别词对应的候选词为根据读音确定的非单一的实体或关系;计算选择模块,被配置为计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量,选择数量最小的待识别词对应的候选词为所述待识别词的优选词;确定输出模块,被配置为将所述确定词和所述优选词的组合确定为第二语音识别结果,并输出所述第二语音识别结果。根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述语音识别方法的步骤。根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述语音识别方法的步骤。根据本申请实施例的第五方面,提供了一种芯片,其存储有计算机指令,该指令被芯片执行时实现所述语音识别方法的步骤。本申请实施例中,通过接收待识别语音信息;根据所述待识别语音信息获取第一语音识别结果;根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词;计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量,选择数量最小的待识别词对应的候选词为所述待识别词的优选词;将所述确定词和所述优选词的组合确定为第二语音识别结果,并输出所述第二语音识别结果,结合知识图谱的应用,利用知识图谱中实体和关系相互关联的原理,优化语音识别过程,解决了语音识别过程中由于数据稀疏性和有相同读音词导致的预测结果不准确的问题,并对初始识别结果提供了纠错的功能,提高了语音信息识别的准确率,极大的提升了用户体验。附图说明图1是本申请实施例提供的计算设备的结构框图;图2是本申请实施例提供的语音识别方法的流程图;图3是本申请实施例提供的获取第一语音识别结果方法的流程图;图4是本申请实施例提供的语音信息在知识图谱中对应实体或关系的示意图;图5是本申请实施例提供的根据待识别词的读音确定待识别词对应确定词或者候选词方法的流程图;图6是本申请实施例提供的语音识别装置的结构示意图。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。首先,对本专利技术一个或多个实施例涉及的名词术语进行解释。知识图谱又称为科学知识图谱,被称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,知识图谱旨在利用可视化的图谱形象地描述客观世界中存在的概念、实体、事件及其相互之间的关系,知识图谱也可以被看做是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。现在的知识图谱已被用来泛指各种大规模的知识库。在本申请中,提供了一种语音识别方法及装置、计算设备、计算机可读存储介质和芯片,在下面的实施例中逐一进行详细说明。图1示出了根据本申请一实施例的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。在本申请的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:接收待识别语音信息;根据所述待识别语音信息获取第一语音识别结果;根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词,其中,待识别词对应的确定词为根据读音确定的单一的实体或关系,待识别词对应的候选词为根据读音确定的非单一的实体或关系;计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量,选择数量最小的待识别词对应的候选词为所述待识别词的优选词;将所述确定词和所述优选词的组合确定为第二语音识别结果,并输出所述第二语音识别结果。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:接收待识别语音信息;根据所述待识别语音信息获取第一语音识别结果;根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词,其中,待识别词对应的确定词为根据读音确定的单一的实体或关系,待识别词对应的候选词为根据读音确定的非单一的实体或关系;计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量,选择数量最小的待识别词对应的候选词为所述待识别词的优选词;将所述确定词和所述优选词的组合确定为第二语音识别结果,并输出所述第二语音识别结果。2.如权利要求1所述的语音识别方法,其特征在于,根据所述待识别语音信息获取第一语音识别结果包括:将所述待识别语音信息输入到预先训练好的声学模型中,所述声学模型被训练于根据输入的语音信息获取发音序列;所述声学模型响应于输入的所述待识别语音信息生成与所述待识别语音信息对应的发音序列;将所述发音序列输入到预先训练好的语言模型中,所述语言模型被训练于根据输入的发音序列获取识别结果;所述语言模型响应于输入的所述发音序列生成与所述发音序列对应的第一语音识别结果。3.如权利要求1所述的语音识别方法,其特征在于,根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词包括:根据所述第一语音识别结果中每个待识别词的读音确定所述第一语音识别结果中每个待识别词的参考信息;根据所述第一语音识别结果中每个待识别词的参考信息在预设的知识图谱中确定与每个待识别词的参考信息对应的实体或关系;将根据参考信息确定的单一的实体或关系确定为待识别词对应的确定词;将根据参考信息确定的非单一的实体或关系确定为待识别词对应的候选词。4.如权利要求3所述的语音识别方法,其特征在于,根据所述第一语音识别结果中每个待识别词的读音确定所述第一语音识别结果中每个待识别词的参考信息包括:获取声调参数,所述声调参数用以标识在确定待识别词的参考信息时是否参考声调信息;若是,将待识别词的拼音和声调作为待识别词的参考信息;若否,将待识别词的拼音作为待识别词的参考信息。5.如权利要求1所述的语音识别方法,其特征在于,计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量包括:计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的最短链接路径上的实体和关系的数量,其中,待识别词对应的候选词与确定词直接相连时,数量记为0,待识别词对应的候选词与确定词无连接路径时,数量记为无穷大。6.如权利要求2所述的语音识别方法,其特征在于,将所述确定词和所述优选词的组合确定为第二语音识别结果包括:将所述确定词和所述优选词按照所述发音序列组合确定为第二语音识别结果。7.一种语音识别装置,其特征在于,包括:接收模块,被配置为接收待识别语音信息;获取模块,被配置为根据所述待识别语音信息获取...

【专利技术属性】
技术研发人员:樊骏锋李劲东李长亮汪美玲
申请(专利权)人:北京金山数字娱乐科技有限公司成都金山数字娱乐科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1