语音识别菜品的方法及装置、存储介质、电子装置制造方法及图纸

技术编号:21432167 阅读:44 留言:0更新日期:2019-06-22 11:54
本发明专利技术提供了一种语音识别菜品的方法及装置、存储介质、电子装置,其中,该方法包括:接收语音识别模块响应语音信号输出的文本信息;以所述文本信息为检索词在菜品库中检索得到多个纠错候选菜品;分别计算所述多个纠错候选菜品的纠错得分,其中,所述纠错得分用于表征所述文本信息与所述纠错候选菜品的相似度;选择纠错得分最高的指定纠错候选菜品作为所述语音信号的识别菜品。通过本发明专利技术,解决了相关技术中语音录菜准确率低的技术问题。

【技术实现步骤摘要】
语音识别菜品的方法及装置、存储介质、电子装置
本专利技术涉及计算机领域,具体而言,涉及一种语音识别菜品的方法及装置、存储介质、电子装置。
技术介绍
相关技术中,互联网+时代,人们的生活变得越来越便捷和高效,预定、购票、出行、找房、订餐等可以通过手机轻松完成,互联网本地生活领域的发展,扩大了传统行业的服务半径,提高了传统行业的效能,节约了成本。吃喝住行,餐饮作为其中的重要环节,正在享受着互联网带来的福利,在传统餐饮店搬上手机app时,数据的数字化,标准化,是一个必经的过程,一个典型的场景就是录菜,即把商家的菜单录入app应用中。相关技术中的录菜方式是手动录菜或者是自动语音识别录菜,手动录菜即手动打字录菜,这种方式录菜效率低,而且对于一些年龄大一点的人来说,打字难度更大。语音录菜要高效和简单很多,是一种比较快捷的录菜方式。语音录菜,技术方案上,先通过ASR(AutomaticSpeechRecognition,自动语音识别)技术,将输入的语音信号转化为文字,然后,解析文字内容,比如菜名和价格,例如,公开号为CN102779178A的相关技术,公开了一种在ipad型平板电脑上利用语音搜索点餐的方法,通过语音识别并直接将识别的结果保存为菜名。对于ASR而言,存在误识别(多字,漏字和错字等)的问题,继而会影响到后续的内容解析后的结果,对于商家而言,会额外带来编辑的成本。针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
技术实现思路
本专利技术实施例提供了一种语音识别菜品的方法及装置、存储介质、电子装置。根据本专利技术的一个实施例,提供了一种语音识别菜品的方法,包括:接收语音识别模块响应语音信号输出的文本信息;以所述文本信息为检索词在菜品库中检索得到多个纠错候选菜品;分别计算所述多个纠错候选菜品的纠错得分,其中,所述纠错得分用于表征所述文本信息与所述纠错候选菜品的相似度;选择纠错得分最高的指定纠错候选菜品作为所述语音信号的识别菜品。可选的,以所述文本信息为检索词在菜品库中检索得到多个纠错候选菜品包括:解析所述文本信息,得到与所述文本信息对应的原始汉语拼音和原始字符串;在菜品库中检索与所述原始汉语拼音同音的第一纠错候选菜品集合,以及在菜品库中检索字符串与所述原始字符串相似的第二纠错候选菜品集合。可选的,分别计算所述多个纠错候选菜品的纠错得分包括:将所述文本信息和所述多个纠错候选菜品分别转换为字符串,得到原始字符串和多个候选字符串;计算所述原始字符串与每个候选字符串的编辑距离得分,所述原始字符串与每个候选字符串的差异距离得分,以及每个候选字符串的语言模型得分;对所述编辑距离得分,所述差异距离得分,以及所述语言模型得分进行加权求和,得到每个纠错候选菜品的纠错得分。可选的,计算所述原始字符串与每个候选字符串的编辑距离得分包括:计算从所述原始字符串修改到所述候选字符串或从所述候选字符串修改到所述原始字符串时,编辑单个字符所需要的最少次数;根据所述最少次数确定所述原始字符串与所述候选字符串的编辑距离得分。可选的,计算所述原始字符串与每个候选字符串的差异距离得分包括:计算所述原始字符串与候选字符串的最长公共子串;按照最长公共子串字对齐,计算所述候选字符串相对于所述原始字符串的差异字个数,其中,所述差异字包括:增字,删字,改字,同音字;根据所述差异字个数确定所述原始字符串与所述候选字符串的差异距离得分。可选的,选择纠错得分最高的指定纠错候选菜品作为所述语音信号的识别菜品包括:确定纠错得分最高的指定纠错候选菜品;对所述指定纠错候选菜品进行采纳判决;在采纳判决通过的情况下,将所述指定纠错候选菜品确定为所述语音信号的识别菜品。可选的,对所述指定纠错候选菜品进行采纳判决包括:获取所述原始字符串的第一属性特征和所述候选字符串的第二属性特征,以及所述原始字符串与所述候选字符串之间的交叉特征;将所述第一属性特征,所述第二属性特征,以及所述交叉特征输入至预设二分类模型,得到判决结果,其中,所述预设二分类模型是通过菜品样本数据通过机器学习训练得到的。可选的,获取所述原始字符串与所述候选字符串之间的交叉特征包括:计算所述候选字符串相对于所述原始字符串差异字个数,其中,所述差异字包括:增字,删字,改字,同音字,以及计算所述候选字符串与所述原始字符串之间的编辑距离;将所述差异字个数和所述编辑距离确定为所述交叉特征。可选的,获取所述原始字符串的第一属性特征和所述候选字符串的第二属性特征包括:计算所述原始字符串的字符串长度,所述原始字符串的最大trigram三元语言模型概率,所述原始字符串的最小trigram三元语言模型概率,以及所述原始字符串整体的第一语言模型概率;将所述字符串长度,所述最大trigram三元语言模型概率,所述最小trigram三元语言模型概率,以及所述第一语言模型概率确定为所述第一属性特征;计算所述候选字符串的字符串长度,所述候选字符串的最大trigram三元语言模型概率,所述候选字符串的最小trigram三元语言模型概率,以及所述候选字符串整体的第二语言模型概率;将所述字符串长度,所述最大trigram三元语言模型概率,所述最小trigram三元语言模型概率,以及所述第二语言模型概率确定为所述第二属性特征。根据本专利技术的另一个实施例,提供了一种语音识别菜品的装置,包括:接收模块,用于接收语音识别模块响应语音信号输出的文本信息;检索模块,用于以所述文本信息为检索词在菜品库中检索得到多个纠错候选菜品;计算模块,用于分别计算所述多个纠错候选菜品的纠错得分,其中,所述纠错得分用于表征所述文本信息与所述纠错候选菜品的相似度;确定模块,用于选择纠错得分最高的指定纠错候选菜品作为所述语音信号的识别菜品。可选的,所述检索模块包括:解析单元,用于解析所述文本信息,得到与所述文本信息对应的原始汉语拼音和原始字符串;检索单元,用于在菜品库中检索与所述原始汉语拼音同音的第一纠错候选菜品集合,以及在菜品库中检索字符串与所述原始字符串相似的第二纠错候选菜品集合。可选的,所述计算模块包括:转换单元,用于将所述文本信息和所述多个纠错候选菜品分别转换为字符串,得到原始字符串和多个候选字符串;第一计算单元,用于计算所述原始字符串与每个候选字符串的编辑距离得分,所述原始字符串与每个候选字符串的差异距离得分,以及每个候选字符串的语言模型得分;第二计算单元,用于对所述编辑距离得分,所述差异距离得分,以及所述语言模型得分进行加权求和,得到每个纠错候选菜品的纠错得分。可选的,所述第一计算单元包括:第一计算子单元,用于计算从所述原始字符串修改到所述候选字符串或从所述候选字符串修改到所述原始字符串时,编辑单个字符所需要的最少次数;第一确定子单元,用于根据所述最少次数确定所述原始字符串与所述候选字符串的编辑距离得分。可选的,所述第一计算单元包括:第二计算子单元,用于计算所述原始字符串与候选字符串的最长公共子串;第三计算子单元,用于按照最长公共子串字对齐,计算所述候选字符串相对于所述原始字符串的差异字个数,其中,所述差异字包括:增字,删字,改字,同音字;第二确定子单元,用于根据所述差异字个数确定所述原始字符串与所述候选字符串的差异距离得分。可选的,所述确定模块包括:第一确定单元,用本文档来自技高网...

【技术保护点】
1.一种语音识别菜品的方法,其特征在于,包括:接收语音识别模块响应语音信号输出的文本信息;以所述文本信息为检索词在菜品库中检索得到多个纠错候选菜品;分别计算所述多个纠错候选菜品的纠错得分,其中,所述纠错得分用于表征所述文本信息与所述纠错候选菜品的相似度;选择纠错得分最高的指定纠错候选菜品作为所述语音信号的识别菜品。

【技术特征摘要】
1.一种语音识别菜品的方法,其特征在于,包括:接收语音识别模块响应语音信号输出的文本信息;以所述文本信息为检索词在菜品库中检索得到多个纠错候选菜品;分别计算所述多个纠错候选菜品的纠错得分,其中,所述纠错得分用于表征所述文本信息与所述纠错候选菜品的相似度;选择纠错得分最高的指定纠错候选菜品作为所述语音信号的识别菜品。2.根据权利要求1所述的方法,其特征在于,以所述文本信息为检索词在菜品库中检索得到多个纠错候选菜品包括:解析所述文本信息,得到与所述文本信息对应的原始汉语拼音和原始字符串;在菜品库中检索与所述原始汉语拼音同音的第一纠错候选菜品集合,以及在菜品库中检索字符串与所述原始字符串相似的第二纠错候选菜品集合。3.根据权利要求1所述的方法,其特征在于,分别计算所述多个纠错候选菜品的纠错得分包括:将所述文本信息和所述多个纠错候选菜品分别转换为字符串,得到原始字符串和多个候选字符串;计算所述原始字符串与每个候选字符串的编辑距离得分,所述原始字符串与每个候选字符串的差异距离得分,以及每个候选字符串的语言模型得分;对所述编辑距离得分,所述差异距离得分,以及所述语言模型得分进行加权求和,得到每个纠错候选菜品的纠错得分。4.根据权利要求3所述的方法,其特征在于,计算所述原始字符串与每个候选字符串的编辑距离得分包括:计算从所述原始字符串修改到所述候选字符串或从所述候选字符串修改到所述原始字符串时,编辑单个字符所需要的最少次数;根据所述最少次数确定所述原始字符串与所述候选字符串的编辑距离得分。5.根据权利要求3所述的方法,其特征在于,计算所述原始字符串与每个候选字符串的差异距离得分包括:计算所述原始字符串与候选字符串的最长公共子串;按照最长公共...

【专利技术属性】
技术研发人员:吴洋杨宇陈晨刘泉魏世康田正中兰杰朱兴
申请(专利权)人:口碑上海信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1