【技术实现步骤摘要】
【国外来华专利技术】使用多标记结构的转录纠正
技术介绍
自动语音识别(ASR)中的进步已经导致对口头语言理解(SLU)的兴趣增加。大词汇口头语言理解中的挑战是补偿ASR错误的鲁棒性。语音识别并不完美,并且每个用户都理解偶尔的识别错误是现实。从用户的角度来看,当语音识别应用或程序被使用时,识别错误的纠正的容易性对用户的整体体验具有重大影响。这是关于本申请所针对的该一般技术环境。
技术实现思路
本公开的示例描述了多弧混淆网络的生成以改善例如向生成的输出返回备选的能力。包括词汇化假设和归一化假设的标记表示的混淆网络被生成。混淆网络的每个弧表示词汇化假设或归一化假设的标记。混淆网络被变换成多弧混淆网络,其中该变换包括重新对齐混淆网络的至少一个标记以跨越混淆网络的多个弧。还描述了其它示例。提供本
技术实现思路
以简化的形式介绍概念的选择,这在下面的具体实施方式中被进一步描述。本
技术实现思路
不旨在标识所要求保护的主题的主要特征或必要特征,也不旨在用于限制所要求保护的主题的范围。示例的附加方面,特征和/或优点将部分地在下面的描述中被阐述,并且部分地将从描述中显而易见,或者可以通过本公开的实践来被了解。附图说明参 ...
【技术保护点】
一种计算机实现的方法,包括:在捕获的输入上执行语音识别并根据所述捕获的输入生成词汇化假设;对所述词汇化假设进行归一化以生成针对所述词汇化假设的归一化假设,其中归一化假设包括一个或多个标记;生成包括归一化假设的标记表示的混淆网络,其中所述混淆网络的每个弧表示归一化假设的标记;以及将所生成的所述混淆网络变换成多弧混淆网络,其中所述变换包括重新对齐所述混淆网络的至少一个标记以跨越所述混淆网络的多个弧。
【技术特征摘要】
【国外来华专利技术】2015.01.27 US 14/606,7061.一种计算机实现的方法,包括:在捕获的输入上执行语音识别并根据所述捕获的输入生成词汇化假设;对所述词汇化假设进行归一化以生成针对所述词汇化假设的归一化假设,其中归一化假设包括一个或多个标记;生成包括归一化假设的标记表示的混淆网络,其中所述混淆网络的每个弧表示归一化假设的标记;以及将所生成的所述混淆网络变换成多弧混淆网络,其中所述变换包括重新对齐所述混淆网络的至少一个标记以跨越所述混淆网络的多个弧。2.根据权利要求1所述的计算机实现的方法,其中所述重新对齐还包括改变与所述标记相关联的弧的起点和终点,以跨越表示归一化假设的元素的多个弧。3.根据权利要求1所述的计算机实现的方法,其中所述混淆网络的所述生成还包括:基于时间信息和与所述归一化假设的标记相关联的书写语音信息、使用动态规划逼近来对齐归一化假设的标记。4.根据权利要求3所述的计算机实现的方法,其中所述对齐使用精确的多序列对齐算法来执行对齐。5.根据权利要求1所述的计算机实现的方法,其中:词汇化假设的所述生成还包括生成针对所述词汇化假设中的每一个的得分,并且所述归一化还包括:生成针对所述归一化假设中的每一个的得分,以及基于针对词汇化假设的所述得分与针对归一化假设的所述得分的组合来生成针对所述归一化假设的表示的最终得分。6.根据权利要求1所述的计算机实现的方法,其中:词汇化假设的所述生成还包括生成针对所述词汇化假设中的每一个的声学得分,所述归一化假设的所述生成还包括:通过将标记语言模型应用于所述词汇化假设的声学得分来对针对所述词汇化假设中的每一个的所述声学得分进行重新评分,以生成针对所述归一化假设中的每一个的得分。7.根据权利要求1所述的计算机实现的方法,还包括:从用户接收针对向所述用户呈现的响应的一个或多个标记的备选的请求,以及基于所述多弧混淆网络的评估来输出针对一个或多个标记的备选。8.一种系统,包括:存储装置;以及至少一个处理器,所述至少一个处理器与所述存储装置连接以执行操作,所述操作包括:在捕获的输入上执行语音识别并根据所述捕获的输入生成词汇化假设;对所述词汇化假设进行归一化以生成针对所述词汇化假设的归一化假设,其中归一化假设包括一个或多个标记;生成针对所述归一化假设的混淆网络,其中所述混淆网络的每个弧表示归一化假设的标记;以及将所生成...
【专利技术属性】
技术研发人员:M·莱维特,U·奥泽特姆,S·帕撒萨拉塞,P·瓦拉德哈拉简,K·拉古纳森,I·阿方索,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。