一种语音识别文本与命令词文本匹配的方法及设备技术

技术编号:17009785 阅读:44 留言:0更新日期:2018-01-11 06:02
本发明专利技术提出了一种语音识别文本与命令词文本匹配的方法及设备,方法包括:获取通过语音识别得到的文本;对文本进行切词,以生成多个文本词;并对预设的命令词文本进行切词,以生成命令词;确定与各文本词相似度最高的命令词,并以此生成第一对应关系;基于各最高的相似度确定文本与命令词文本的词相似度;确定文本与命令词文本中每个字的拼音;确定与文本中每个字的拼音相似程度最高的命令词中的字的拼音,并以此生成第二对应关系;基于各最高的拼音相似度确定文本与命令词文本的拼音相似度;基于词相似度与拼音相似度确定文本与命令词文本的相似度。本方案,无需标注数据,对语音识别错误的容忍度较高,且保证后续与命令词的匹配。

【技术实现步骤摘要】
一种语音识别文本与命令词文本匹配的方法及设备
本专利技术涉及识别领域,特别涉及一种语音识别文本与命令词文本匹配的方法及设备。
技术介绍
在目前的语音交互中,首先利用语音识别技术将语音识别为文本,然后再进行相应的处理,在这个过程中,就经常需要对语音识别的文本与功能命令词进行匹配,确定用户的目标;但是在实际应用中,由于某些功能命令词过短、意义不明、不符合常规表达等问题,会造成识别出来的文本与实际有较大的差异。目前,在一般的文本匹配算法中,一般都是直接考虑文本之间的相似度,目前的文本匹配算法的方案有一些:A,字符串级别,比如根据(带权)编辑距离,检索模型等;B,浅层语义级别,比如在A的基础上,构建相似字典;或是对文本进行依存句法分析等,引入词序信息进行比较;C,深层语义级别,基于目前较火的深度学习模型,比如RNN,Bi-LSTM,GRU,CNN等进行深层语义比较。现有技术的客观缺点:目前的文本匹配算法在语音识别文本与命令词的匹配场景中,其实并不是很适用。语音识别出现一定错误的情况下,基本现有的所有方法都会出现问题;其中,就字符串级别而言,无法匹配足够的语义信息,而且在语音识别有一定的错误率的情况下,失效率就会很高;而对于浅层语义级别而言,构建依存句法分析之类的浅层语义分析,都会消耗较多的处理时间,而这个会导致整个线上环境效率的降低,并不是很实际;而且基于浅层语义分析,对于口语化(甚至语音识别错误)的表达方式的适应性也存在一定的差异性,而对于构建相似词典,然后在进行字符串级别的比较层面而言,也一样无法解决语音识别错误的问题;至于深层语义级别的方式,都需要大量的已标注数据,而在这样一个较为新兴的领域,标注数据的获取难道是极大的,甚至短时间内直接是不可能的。由此,用户在与机器人交互的过程中,需要说出功能命令词才能够匹配,也才可以进入到相应的功能,但是基于上述方式,语音识别信息不充分的情况下,语音识别的结果会有较大的偏差。
技术实现思路
针对现有技术中的缺陷,本专利技术提出了一种语音识别文本与命令词文本匹配的方法及设备,实现了能够更大程度的容忍语音识别错误,并保证后续与命令词的匹配。具体的,本专利技术提出了以下具体的实施例:本专利技术实施例提出了一种语音识别文本与命令词文本匹配的方法,应用于人机交互的场景,该方法包括:获取通过语音识别得到的文本;对所述文本进行切词,以生成多个文本词;并对预设的命令词文本进行切词,以生成命令词;确定与各所述文本词相似度最高的命令词,并以此生成第一对应关系;其中,在所述第一对应关系中,所确定的命令词只对应一个文本词;基于各最高的所述相似度确定所述文本与所述命令词文本的词相似度;确定所述文本与所述命令词文本中每个字的拼音;确定与所述文本中每个字的拼音相似程度最高的所述命令词中的字的拼音,并以此生成第二对应关系;其中,在所述第二对应关系中,所述文本中每个字的拼音只对应一个所述命令词中的字的拼音;基于各最高的拼音相似度确定所述文本与所述命令词文本的拼音相似度;基于所述词相似度与所述拼音相似度确定所述文本与所述命令词文本的相似度。在一个具体的实施例中,还包括:获取数量超过一定值的文本数据;基于word2vec确定所述文本数据中词与词的第一相似度;基于hownet确定所述文本数据中词与词的第二相似度;基于所述第一相似度与所述第二相似度,获取所述文本数据中任意两词之间的相似度并构建近义词相似词表;确定所述文本数据中所有字的所有拼音;收集发音满足预设相似条件的拼音信息;基于所获取的拼音以及拼音信息确定两个拼音之间的相似度并构建包所述文本数据中所有字拼音的拼音相似表;所述切词是基于任意两词之间的相似度来进行的;在一个具体的实施例中,所述“确定与各所述文本词相似度最高的命令词”包括:针对各所述文本词,基于近义词相似词表确定所述文本词与各所述命令词的相似度;对所述相似度进行大小排序,以确定与所述文本词相似度最高的命令词;所述“确定与所述文本中每个字的拼音相似程度最高的所述命令词中的字的拼音”包括:针对各所述文本的字,基于所述拼音相似表确定与所述文本的字的拼音与各所述命令词中的字拼音的拼音相似度;对所述拼音相似度进行大小排序,以确定与所述文本中的字的拼音的拼音相似度最高的命令词中的字的拼音。在一个具体的实施例中,所述“基于各最高的所述相似度确定所述文本与所述命令词文本的词相似度”包括:获取各最高的所述相似度以及各最高的所述相似度的词的字数;基于所述字数、所述文本的字数、各最高的所述相似度确定字长带权平均;将所述字长带权平均设置为所述文本与所述命令词文本的词相似度。在一个具体的实施例中,所述“基于各最高的拼音相似度确定所述文本与所述命令词文本的拼音相似度”包括:确定各最高的拼音相似度的平均值;将所述平均值确定为所述文本与所述命令词文本的拼音相似度。在一个具体的实施例中,所述“基于所述词相似度与所述拼音相似度确定所述文本与所述命令词文本的相似度”包括:对所述词相似度与所述拼音相似度进行加权求和,以获取所述文本与所述命令词文本的相似度;其中,所述加权求和通过下列公式来完成;sim_x_y=0.6*sim_w_x_y+0.4*pinyin_sim_x_y;其中,所述sim_x_y为所述文本与所述命令词文本的相似度;所述sim_w_x_y为所述词相似度;所述pinyin_sim_x_y为所述命令词文本的相似度。本专利技术实施例还提出了一种语音识别文本与命令词文本匹配的设备,应用于人机交互的场景,该设备包括:获取模块,用于获取通过语音识别得到的文本;切词模块,对所述文本进行切词,以生成多个文本词;并对预设的命令词文本进行切词,以生成命令词;第一生成模块,用于确定与各所述文本词相似度最高的命令词,并以此生成第一对应关系;其中,在所述第一对应关系中,所确定的命令词只对应一个文本词;词相似度确定模块,用于基于各最高的所述相似度确定所述文本与所述命令词文本的词相似度;拼音确定模块,用于确定所述文本与所述命令词文本中每个字的拼音;第二生成模块,用于确定与所述文本中每个字的拼音相似程度最高的所述命令词中的字的拼音,并以此生成第二对应关系;其中,在所述第二对应关系中,所述文本中每个字的拼音只对应一个所述命令词中的字的拼音;拼音相似度确定模块,用于基于各最高的拼音相似度确定所述文本与所述命令词文本的拼音相似度;处理模块,用于基于所述词相似度与所述拼音相似度确定所述文本与所述命令词文本的相似度。在一个具体的实施例中,还包括:预处理模块,用于获取数量超过一定值的文本数据;基于word2vec确定所述文本数据中词与词的第一相似度;基于hownet确定所述文本数据中词与词的第二相似度;基于所述第一相似度与所述第二相似度,获取所述文本数据中任意两词之间的相似度并构建近义词相似词表;确定所述文本数据中所有字的所有拼音;收集发音满足预设相似条件的拼音信息;基于所获取的拼音以及拼音信息确定两个拼音之间的相似度并构建包所述文本数据中所有字拼音的拼音相似表;所述切词是基于任意两词之间的相似度来进行的;所述第一生成模块“确定与各所述文本词相似度最高的命令词”包括:针对各所述文本词,基于近义词相似词表确定所述文本词与各所述命令词的相似度;对所述相似度进行大小排序,以确本文档来自技高网
...
一种语音识别文本与命令词文本匹配的方法及设备

【技术保护点】
一种语音识别文本与命令词文本匹配的方法,其特征在于,应用于人机交互的场景,该方法包括:获取通过语音识别得到的文本;对所述文本进行切词,以生成多个文本词;并对预设的命令词文本进行切词,以生成命令词;确定与各所述文本词相似度最高的命令词,并以此生成第一对应关系;其中,在所述第一对应关系中,所确定的命令词只对应一个文本词;基于各最高的所述相似度确定所述文本与所述命令词文本的词相似度;确定所述文本与所述命令词文本中每个字的拼音;确定与所述文本中每个字的拼音相似程度最高的所述命令词中的字的拼音,并以此生成第二对应关系;其中,在所述第二对应关系中,所述文本中每个字的拼音只对应一个所述命令词中的字的拼音;基于各最高的拼音相似度确定所述文本与所述命令词文本的拼音相似度;基于所述词相似度与所述拼音相似度确定所述文本与所述命令词文本的相似度。

【技术特征摘要】
1.一种语音识别文本与命令词文本匹配的方法,其特征在于,应用于人机交互的场景,该方法包括:获取通过语音识别得到的文本;对所述文本进行切词,以生成多个文本词;并对预设的命令词文本进行切词,以生成命令词;确定与各所述文本词相似度最高的命令词,并以此生成第一对应关系;其中,在所述第一对应关系中,所确定的命令词只对应一个文本词;基于各最高的所述相似度确定所述文本与所述命令词文本的词相似度;确定所述文本与所述命令词文本中每个字的拼音;确定与所述文本中每个字的拼音相似程度最高的所述命令词中的字的拼音,并以此生成第二对应关系;其中,在所述第二对应关系中,所述文本中每个字的拼音只对应一个所述命令词中的字的拼音;基于各最高的拼音相似度确定所述文本与所述命令词文本的拼音相似度;基于所述词相似度与所述拼音相似度确定所述文本与所述命令词文本的相似度。2.如权利要求1所述的方法,其特征在于,还包括:获取数量超过一定值的文本数据;基于word2vec确定所述文本数据中词与词的第一相似度;基于hownet确定所述文本数据中词与词的第二相似度;基于所述第一相似度与所述第二相似度,获取所述文本数据中任意两词之间的相似度并构建近义词相似词表;确定所述文本数据中所有字的所有拼音;收集发音满足预设相似条件的拼音信息;基于所获取的拼音以及拼音信息确定两个拼音之间的相似度并构建包所述文本数据中所有字拼音的拼音相似表;所述切词是基于任意两词之间的相似度来进行的;所述“确定与各所述文本词相似度最高的命令词”包括:针对各所述文本词,基于近义词相似词表确定所述文本词与各所述命令词的相似度;对所述相似度进行大小排序,以确定与所述文本词相似度最高的命令词;所述“确定与所述文本中每个字的拼音相似程度最高的所述命令词中的字的拼音”包括:针对各所述文本的字,基于所述拼音相似表确定与所述文本的字的拼音与各所述命令词中的字拼音的拼音相似度;对所述拼音相似度进行大小排序,以确定与所述文本中的字的拼音的拼音相似度最高的命令词中的字的拼音。3.如权利要求1所述的方法,其特征在于,所述“基于各最高的所述相似度确定所述文本与所述命令词文本的词相似度”包括:获取各最高的所述相似度以及各最高的所述相似度的词的字数;基于所述字数、所述文本的字数、各最高的所述相似度确定字长带权平均;将所述字长带权平均设置为所述文本与所述命令词文本的词相似度。4.如权利要求1所述的方法,其特征在于,所述“基于各最高的拼音相似度确定所述文本与所述命令词文本的拼音相似度”包括:确定各最高的拼音相似度的平均值;将所述平均值确定为所述文本与所述命令词文本的拼音相似度。5.如权利要求1所述的方法,其特征在于,所述“基于所述词相似度与所述拼音相似度确定所述文本与所述命令词文本的相似度”包括:对所述词相似度与所述拼音相似度进行加权求和,以获取所述文本与所述命令词文本的相似度;其中,所述加权求和通过下列公式来完成;sim_x_y=0.6*sim_w_x_y+0.4*pinyin_sim_x_y;其中,所述sim_x_y为所述文本与所述命令词文本的相似度;所述sim_w_x_y为所述词相似度;所述pinyin_sim_x_y为所述命令词文本的相似度。6.一种语音...

【专利技术属性】
技术研发人员:姚佳
申请(专利权)人:深圳市空谷幽兰人工智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1