一种语音识别方法及装置制造方法及图纸

技术编号：21973147 阅读：32 留言：0更新日期：2019-08-28 01:50

本申请提供一种语音识别方法及装置，其中所述语音识别方法包括：接收待识别语音信息；根据所述待识别语音信息获取第一语音识别结果；根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词，其中，待识别词对应的确定词为根据读音确定的单一的实体或关系，待识别词对应的候选词为根据读音确定的非单一的实体或关系；计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量，选择数量最小的待识别词对应的候选词为所述待识别词的优选词；将所述确定词和所述优选词的组合确定为第二语音识别结果，并输出所述第二语音识别结果。

A Speech Recognition Method and Device

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法及装置
本申请涉及互联网
，特别涉及一种语音识别方法及装置、计算设备、计算机可读存储介质和芯片。
技术介绍
近年来语音识别技术发展迅速，其应用领域不断扩大，各种各样的语音识别产品出现在市场上，通过使用语音识别转换工具将语音识别转化为文字输出。但是，实际的用户类型却是多种多样的，许多人的发音与标准发音相差甚远，所以目前在使用语音识别转换工具将语音识别转换成文字时，由于一些多音字问题的原因和识别库数据稀疏的问题，语音识别转换工具不能准确地识别这部分有问题的语音数据，并且在识别语音信息后没有具备一定的纠错能力，导致通过语音识别转换工具转换生成的文字与正确的文本内容存在不一致的情况，实际应用效果差。那么如何能将用户输入的语音准确的转换成文字就成为了目前亟待解决的问题。
技术实现思路
有鉴于此，本申请实施例提供了一种语音识别方法及装置、计算设备、计算机可读存储介质和芯片，以解决现有技术中存在的技术缺陷。根据本申请实施例的第一方面，提供了一种语音识别方法，包括：接收待识别语音信息；根据所述待识别语音信息获取第一语音识别结果；根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词，其中，待识别词对应的确定词为根据读音确定的单一的实体或关系，待识别词对应的候选词为根据读音确定的非单一的实体或关系；计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量，选择数量最小的待识别词对应的候选词为所述待识别词的优选词；将所述确定词和所述优选词的组合确定为第二语音识别结果，并输出所述第二语...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：接收待识别语音信息；根据所述待识别语音信息获取第一语音识别结果；根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词，其中，待识别词对应的确定词为根据读音确定的单一的实体或关系，待识别词对应的候选词为根据读音确定的非单一的实体或关系；计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量，选择数量最小的待识别词对应的候选词为所述待识别词的优选词；将所述确定词和所述优选词的组合确定为第二语音识别结果，并输出所述第二语音识别结果。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：接收待识别语音信息；根据所述待识别语音信息获取第一语音识别结果；根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词，其中，待识别词对应的确定词为根据读音确定的单一的实体或关系，待识别词对应的候选词为根据读音确定的非单一的实体或关系；计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量，选择数量最小的待识别词对应的候选词为所述待识别词的优选词；将所述确定词和所述优选词的组合确定为第二语音识别结果，并输出所述第二语音识别结果。2.如权利要求1所述的语音识别方法，其特征在于，根据所述待识别语音信息获取第一语音识别结果包括：将所述待识别语音信息输入到预先训练好的声学模型中，所述声学模型被训练于根据输入的语音信息获取发音序列；所述声学模型响应于输入的所述待识别语音信息生成与所述待识别语音信息对应的发音序列；将所述发音序列输入到预先训练好的语言模型中，所述语言模型被训练于根据输入的发音序列获取识别结果；所述语言模型响应于输入的所述发音序列生成与所述发音序列对应的第一语音识别结果。3.如权利要求1所述的语音识别方法，其特征在于，根据所述第一语音识别结果中每个待识别词的读音在预设的知识图谱中确定每个待识别词对应的确定词或者候选词包括：根据所述第一语音识别结果中每个待识别词的读音确定所述第一语音识别结果中每个待识别词的参考信息；根据所述第一语音识别结果中每个待识别词的参考信息在预设的知识图谱中确定与每个待识别词的参考信息对应的实体或关系；将根据参考信息确定的单一的实体或关系确定为待识别词对应的确定词；将根据参考信息确定的非单一的实体或关系确定为待识别词对应的候选词。4.如权利要求3所述的语音识别方法，其特征在于，根据所述第一语音识别结果中每个待识别词的读音确定所述第一语音识别结果中每个待识别词的参考信息包括：获取声调参数，所述声调参数用以标识在确定待识别词的参考信息时是否参考声调信息；若是，将待识别词的拼音和声调作为待识别词的参考信息；若否，将待识别词的拼音作为待识别词的参考信息。5.如权利要求1所述的语音识别方法，其特征在于，计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的链接路径上的实体和关系的数量包括：计算每个待识别词对应的候选词与所述确定词在所述知识图谱中的最短链接路径上的实体和关系的数量，其中，待识别词对应的候选词与确定词直接相连时，数量记为0，待识别词对应的候选词与确定词无连接路径时，数量记为无穷大。6.如权利要求2所述的语音识别方法，其特征在于，将所述确定词和所述优选词的组合确定为第二语音识别结果包括：将所述确定词和所述优选词按照所述发音序列组合确定为第二语音识别结果。7.一种语音识别装置，其特征在于，包括：接收模块，被配置为接收待识别语音信息；获取模块，被配置为根据所述待识别语音信息获取...

【专利技术属性】
技术研发人员：樊骏锋，李劲东，李长亮，汪美玲，
申请(专利权)人：北京金山数字娱乐科技有限公司，成都金山数字娱乐科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人