基于语音识别结果的匹配方法组成比例

技术编号:29761523 阅读:21 留言:0更新日期:2021-08-20 21:15
本发明专利技术公开了一种基于语音识别结果的匹配方法,包括:将参考文字序列转换为参考符号序列;将语音识别结果转换为识别符号序列;其中,语音识别结果为N条最优路径的词序列或者单条最优路径的词序列;参考符号序列及识别符号序列为词序列、字序列或者音子序列;将识别符号序列与参考符号序列进行序列匹配处理并计算匹配得分,将匹配得分最高的匹配路径对应的识别符号序列作为匹配结果。采用本发明专利技术的匹配方法能够避免同音误识、发音偏差以及识别错误所带来的匹配错误,有效地提高了匹配精度,并对识别错误具有一定的容错性,对于匹配序列中间存在内容不匹配的情况也能够提供相似性评估。

【技术实现步骤摘要】
基于语音识别结果的匹配方法
本专利技术涉及关键词匹配
,特别涉及一种基于语音识别结果的匹配方法。
技术介绍
现有技术中,关键词匹配技术通常采用关键词匹配算法或者基于编辑距离的模糊匹配算法来进行匹配处理;其中,关键词匹配算法具有严格约束的限制,即只有当整个字符串完全一致时才能匹配成功,只要存在不匹配的内容都会匹配失败,因此缺乏容错性;基于编辑距离的模糊匹配算法通常考虑整个字符串的模糊匹配,在口语语音识别结果与目标内容的匹配场景中匹配结果往往不能真实反映匹配程度。口语表达有随意性且跟说话人的地域、年龄以及表达习惯相关;口语语音通话过程中通常会有一些前置功能词汇、后置功能词汇或者插入功能词汇,这些功能词汇不影响整体表达内容,但会严重干扰匹配效果;同时,语音识别系统输出结果存在识别错误,识别错误包括替代错误、插入错误和删除错误,以上的识别错误也会严重影响匹配效果。
技术实现思路
基于此,为解决现有技术中的技术问题,特提出了一种基于语音识别结果的匹配方法,包括:将参考文字序列转换为参考符号序列;将语音识别结果转换为识别符号序列;其中,所述语音识别结果为N条最优路径的词序列或者单条最优路径的词序列;所述参考符号序列及所述识别符号序列为词序列、字序列或者音子序列;将所述识别符号序列与所述参考符号序列进行序列匹配处理并计算匹配得分,将匹配得分最高的匹配路径对应的识别符号序列作为序列匹配结果。在一种实施例中,所述参考符号序列及所述识别符号序列的匹配粒度包括词匹配、字匹配、音子匹配;当匹配粒度为词匹配时,所述参考符号序列为词序列,所述识别符号序列为词序列;当匹配粒度为字匹配时,所述参考符号序列为字序列,所述识别符号序列为字序列;当匹配粒度为音子匹配时,所述参考符号序列为音子序列,所述识别符号序列为音子序列,所述参考符号序列及所述识别符号序列带有声调信息。在一种实施例中,当语音识别结果为N条最优路径的词序列时,将语音识别结果转换为对应的N个识别符号序列;当语音识别结果为单条最优路径的词序列时,则将语音识别结果转换为对应的单个识别符号序列。在一种实施例中,对参考符号序列及识别符号序列进行序列匹配处理并计算匹配得分,具体包括:调用序列对齐算法,获取参考符号序列及识别符号序列的对齐信息;序列对齐算法根据对齐信息选择忽略参考符号序列及识别符号序列开始及结束位置处未对齐部分,保留参考符号序列及识别符号序列的中间对齐部分;计算参考符号序列及识别符号序列中间对齐部分的匹配得分。在一种实施例中,所述序列对齐算法为改进型Levenshtein算法,所述序列对齐算法忽略对齐序列开始位置到第一个匹配点的惩罚参数,并忽略对齐序列最后一个匹配点到结束位置的惩罚参数。在一种实施例中,所述序列对齐算法包括:初始化序列对齐算法;计算从开始位置到任意子串的匹配距离;进行回溯并找出最佳匹配路径,同时记录对齐处理过程。在一种实施例中,计算参考符号序列及识别符号序列中间对齐部分的匹配得分,具体包括:所述匹配得分包括替代得分CorrectScore、插入得分InsertScore、删除得分DeleteScore;初始化所述替代得分、所述插入得分、所述删除得分,即设置CorrectScore=0,InsertScore=0,DeleteScore=0;当参考符号序列及识别符号序列的匹配粒度为词匹配或字匹配时,逐个比对参考符号序列及识别符号序列的对齐符号单元;当比对内容一致时则替代得分加1,即CorrectScore=CorrectScore+1;当比对内容不一致,且识别符号序列相比参考符号序列插入了符号时,则插入得分加1,即InsertScore=InsertScore+1;当比对内容不一致,且识别符号序列相比参考符号序列删除了符号时,则删除得分加1,即DeleteScore=DeleteScore+1;根据替代得分、插入得分、删除得分及参考文字序列长度计算得到匹配得分,即MatchScore=(CorrectScore-DeleteScore-InsertScore)/ReferenceLength;其中,MatchScore为匹配得分,ReferenceLength为参考文字序列长度。在一种实施例中,当参考符号序列及识别符号序列的匹配粒度为音子匹配时,构造音子混淆矩阵及混淆概率矩阵;逐个比对参考符号序列及识别符号序列的对齐符号单元;当比对的两个对齐符号单元均不为空时,则查询混淆概率矩阵得到两个对齐符号单元之间的匹配距离值,将替代得分加1并减去两个对齐符号单元之间的匹配距离值,即CorrectScore=CorrectScore+(1–Distance),其中Distance为匹配距离值;当识别符号序列的对齐符号单元为空时,则将删除得分增加惩罚参数,即DeleteScore=DeleteScore+PenaltyWeight;当参考符号序列的对齐符号单元为空时,则将插入得分增加惩罚参数,即InsertScore=InsertScore+PenaltyWeight;其中,PenaltyWeight为惩罚参数。在一种实施例中,构造音子混淆矩阵,具体包括:对语音数据进行语音识别处理后输出识别音子序列;将所述语音数据对应标注的文字序列转换为标注音子序列;对所述识别音子序列与所述标注音子序列进行匹配粒度为音子匹配的对齐处理,将所述识别音子序列与所述标注音子序列的对齐部分构造为音子混淆矩阵,并去除无法对齐部分;其中,所述音子混淆矩阵的矩阵行为标注音子序列,所述音子混淆矩阵的矩阵列为识别音子序列,所述音子混淆矩阵中的单元值为对齐部分中标注音子与识别音子构成的音子对的对应频次。在一种实施例中,构造混淆概率矩阵,具体包括:所述混淆概率矩阵的矩阵行为标注音子序列,所述混淆概率矩阵的矩阵列为识别音子序列;其中,所述混淆概率矩阵中的单元值为标注音子与识别音子构成的音子对的对应频次除以该行所有单元值总和后得到的该音子对的发生概率,或称为发音混淆概率;音子对的发生概率为音子对相似度,标注音子与识别音子之间的匹配距离值由1减去音子对相似度得到。实施本专利技术实施例,将具有如下有益效果:本专利技术支持从N-best路径中去进行匹配,通过找到最佳匹配路径以提高最终的匹配准确率,降低因为语音识别取最优所带来的错误或误差;支持对前置内容和后置内容进行过滤,前置或后置内容本身并不影响句子语义,忽略之后明显提高关键内容的匹配精度;支持基于发音序列相似性的匹配,避免同音误识带来的匹配错误问题;匹配的基本单元由字词扩展至音节或者音子,匹配粒度变小,匹配判别上同音字误识不影响匹配精度;同时,匹配粒度变小之后能够准确感知部分错误,比如声母或韵母错误,匹配精度更高;支持无声调的发音序列相似性匹配,避免口语发音不准带来的匹配错误问题;由于口音影响,语音识别器会误识别为同音但不同调的文本文档来自技高网...

【技术保护点】
1.一种基于语音识别结果的匹配方法,其特征在于,包括:/n将参考文字序列转换为参考符号序列;/n将语音识别结果转换为识别符号序列;其中,所述语音识别结果为N条最优路径的词序列或者单条最优路径的词序列;/n所述参考符号序列及所述识别符号序列为词序列、字序列或者音子序列;/n将所述识别符号序列与所述参考符号序列进行序列匹配处理并计算匹配得分,将匹配得分最高的匹配路径对应的识别符号序列作为序列匹配结果。/n

【技术特征摘要】
1.一种基于语音识别结果的匹配方法,其特征在于,包括:
将参考文字序列转换为参考符号序列;
将语音识别结果转换为识别符号序列;其中,所述语音识别结果为N条最优路径的词序列或者单条最优路径的词序列;
所述参考符号序列及所述识别符号序列为词序列、字序列或者音子序列;
将所述识别符号序列与所述参考符号序列进行序列匹配处理并计算匹配得分,将匹配得分最高的匹配路径对应的识别符号序列作为序列匹配结果。


2.根据权利要求1所述的匹配方法,其特征在于,
其中,所述参考符号序列及所述识别符号序列的匹配粒度包括词匹配、字匹配、音子匹配;
当匹配粒度为词匹配时,所述参考符号序列为词序列,所述识别符号序列为词序列;当匹配粒度为字匹配时,所述参考符号序列为字序列,所述识别符号序列为字序列;当匹配粒度为音子匹配时,所述参考符号序列为音子序列,所述识别符号序列为音子序列,所述参考符号序列及所述识别符号序列带有声调信息。


3.根据权利要求1所述的匹配方法,其特征在于,
其中,当语音识别结果为N条最优路径的词序列时,将语音识别结果转换为对应的N个识别符号序列;当语音识别结果为单条最优路径的词序列时,则将语音识别结果转换为对应的单个识别符号序列。


4.根据权利要求1所述的匹配方法,其特征在于,
其中,对参考符号序列及识别符号序列进行序列匹配处理并计算匹配得分,具体包括:
调用序列对齐算法,获取参考符号序列及识别符号序列的对齐信息;
序列对齐算法根据对齐信息选择忽略参考符号序列及识别符号序列开始及结束位置处未对齐部分,保留参考符号序列及识别符号序列的中间对齐部分;
计算参考符号序列及识别符号序列中间对齐部分的匹配得分。


5.根据权利要求4所述的匹配方法,其特征在于,
其中,所述序列对齐算法为改进型Levenshtein算法,所述序列对齐算法忽略对齐序列开始位置到第一个匹配点的惩罚参数,并忽略对齐序列最后一个匹配点到结束位置的惩罚参数。


6.根据权利要求5所述的匹配方法,其特征在于,
其中,所述序列对齐算法包括:
初始化序列对齐算法;计算从开始位置到任意子串的匹配距离;进行回溯并找出最佳匹配路径,同时记录对齐处理过程。


7.根据权利要求4所述的匹配方法,其特征在于,
其中,计算参考符号序列及识别符号序列中间对齐部分的匹配得分,具体包括:
所述匹配得分包括替代得分CorrectScore、插入得分InsertScore、删除得分DeleteScore;初始化所述替代得分、所述插入得分、所述删除得分,即设置CorrectScore=0,InsertScore=0,DeleteScore=0;
当参考符号序列及识别符号序列的匹配粒度为词匹配或字匹配时,逐个比对参考符号序列及识别符号...

【专利技术属性】
技术研发人员:庞在虎高懿陈博
申请(专利权)人:北京灵伴即时智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1