基于语音识别的政务事项搜索方法及装置、介质、设备制造方法及图纸

技术编号:37701580 阅读:12 留言:0更新日期:2023-06-01 23:46
本发明专利技术提供一种基于语音识别的政务事项搜索方法及装置、介质、设备。方法包括:获取用于搜索政务事项数据的语音;对所述语音进行识别处理,得到对应的表示文本;根据所述表示文本进行全文搜索,得到多条政务事项数据;计算所述表示文本和每一条政务事项数据之间的相似度;将最高相似度对应的政务事项数据作为搜索结果进行输出。本发明专利技术可以提高查询操作的便利性,尤其是为老年人口查询数据提供便利性。而且进行全文检索,进而根据输入的表示文本进行文本相似度计算,可以提升查询的效率和准确性。性。性。

【技术实现步骤摘要】
基于语音识别的政务事项搜索方法及装置、介质、设备


[0001]本专利技术涉及语音识别
,特别是涉及一种基于语音识别的政务事项搜索方法及装置、介质、设备。

技术介绍

[0002]近年来,大力推进“互联网+政务服务”等政务服务改革,政务领域涉及广泛,政务知识条例数量巨大,无法以合适的方式展示所有政务事项,急需提高精确定位民众办理政务事项的能力,而且当下主流是手动输入查询政务事项实施清单,查询效率低、耗时长,更不便于老年人操作。

技术实现思路

[0003]针对以上至少一个技术问题,本专利技术实施例提供一种基于语音识别的政务事项搜索方法及装置、介质、设备。
[0004]根据第一方面,本专利技术实施例提供的基于语音识别的政务事项搜索方法,包括:
[0005]获取用于搜索政务事项数据的语音;
[0006]对所述语音进行识别处理,得到对应的表示文本;
[0007]根据所述表示文本进行全文搜索,得到多条政务事项数据;
[0008]计算所述表示文本和每一条政务事项数据之间的相似度;
[0009]将最高相似度对应的政务事项数据作为搜索结果进行输出。
[0010]根据第二方面,本专利技术实施例提供的基于语音识别的政务事项搜索装置,包括:
[0011]语音获取模块,用于获取用于搜索政务事项数据的语音;
[0012]文本表示模块,用于对所述语音进行识别处理,得到对应的表示文本;
[0013]事项搜索模块,用于根据所述表示文本进行全文搜索,得到多条政务事项数据;
[0014]相似计算模块,用于计算所述表示文本和每一条政务事项数据之间的相似度;
[0015]结果输出模块,用于将最高相似度对应的政务事项数据作为搜索结果进行输出。
[0016]根据第三方面,本专利技术实施例提供计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行实现第一方面提供的方法。
[0017]根据第四方面,本专利技术实施例提供的计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面提供的方法。
[0018]本专利技术实施例提供的基于语音识别的政务事项搜索方法及装置、介质、设备,首先获取用于搜索政务事项数据的语音,然后对所述语音进行识别处理,得到对应的表示文本。接着根据所述表示文本进行全文搜索,得到多条政务事项数据,再计算所述表示文本和每一条政务事项数据之间的相似度,将最高相似度对应的政务事项数据作为搜索结果进行输出。可见本专利技术实施例通过语音识别技术以优化人机交互过程,提高查询操作的便利性,尤其是为老年人口查询数据提供便利性。而且进行全文检索,进而根据输入的表示文本进行文本相似度计算,可以提升查询的效率和准确性。
附图说明
[0019]图1为本专利技术一实施例中基于语音识别的政务事项搜索方法的流程示意图。
具体实施方式
[0020]第一方面,本专利技术实施例提供一种基于语音识别的政务事项搜索方法,参见图1,该方法包括如下步骤S110~S150:
[0021]S110、获取用于搜索政务事项数据的语音;
[0022]可理解的是,上述语音为用户输入的语音,用来搜索想要的政务事项数据。
[0023]S120、对所述语音进行识别处理,得到对应的表示文本;
[0024]可理解的是,对语音进行识别处理,进而得到表示文本,这实际是将语音形式的信息转换为文本形式的信息。
[0025]在一个实施例中,S120可以具体包括如下步骤S121~S125:
[0026]S121、对所述语音进行预处理;
[0027]在一个实施例中,S121具体可以包括:将所述语音转换为频谱图。也就是说,预处理是将时域的语音信号转换为频域图,即频域信号。例如,通过分帧、加窗、预加重等预处理方式进行时域至频域的转换。
[0028]S122、对预处理后的语音进行特征提取,得到特征向量序列;
[0029]可理解的是,对预处理后的语音例如上述频谱图进行特征提取,从而得到表征语音特征的特征向量序列,在特征向量序列中包括至少一个特征向量。
[0030]在一个实施例中,S122具体可以包括:根据梅尔倒谱系数对所述频谱图进行特征提取,得到所述特征向量序列。
[0031]可理解的是,梅尔倒谱系数即梅尔频率倒谱系数,英文为Mel

Frequency CepstrumCoefficients,缩写为MFCCs,是基于声音频率的非线性梅尔刻度的对数能量频谱的线性变换。梅尔倒谱系数是组成梅尔频率倒谱的系数。它衍生自音讯片段的倒频谱。梅尔频率倒谱的频带划分是在梅尔刻度上等距划分的,它比用于正常的对数倒频谱中的线性间隔的频带更能近似人类的听觉系统。这样的非线性表示可以在多个领域中使声音信号有更好的表示。
[0032]S123、将所述特征向量序列转换为拼音序列;
[0033]可理解的是,将特征向量序列转换为拼音形式的序列。
[0034]在一个实施例中,S123具体可以包括:通过声学模型将所述特征向量序列转换为所述拼音序列;其中,所述声学模型包括隐马尔可夫模型。
[0035]其中,隐马尔可夫模型即深度神经网络

隐马尔可夫模型,英文为Deep Neural Networks

Hidden Markov Model,缩写为DNN

HMM。
[0036]其中,隐马尔可夫模型是提前训练好的,隐马尔可夫模型的输入信息为语音的特征向量序列,输出为语音的拼音序列。隐马尔可夫模型先将特征向量序列转换为至少一种可能的拼音序列,然后从多种拼音序列中选择出评分最高的拼音序列,从而输出最终的拼音序列。
[0037]其中,因为方言、说话习惯的不同,导致一段语音可能对应多种拼音序列。隐马尔可夫模型输出其中可能性最大的一种拼音序列。
[0038]S124、将所述拼音序列转换为词组序列;
[0039]可理解的是,一种拼音可能对应多种词或词组,例如,shuijiao对应的词组可能是睡觉、水饺、水窖等,词组序列还可能因为拼音序列中的停顿位置或分割位置不同而有不同的组合。
[0040]在一个实施例中,S124具体可以包括:通过语音模型将所述拼音序列转换为所述词组序列;其中,所述语音模型包括N元模型。
[0041]其中,N元模型即N

Gram统计语言模型。
[0042]可理解的是,N元模型需要把连续无空格的拼音序列转换成汉字串时,汉字串有多种可能,因此N元模型会对每一种汉字串进行评分,进而选择出评分最高的一种汉字串作为词组序列,从而实现了拼音到汉字的转换,无需用户手动选择,避开了许多汉字对应一个相同的拼音的重码问题。
[0043]其中,N元模型为提前训练得到,输入信息为拼音序列,输出信息为词组序列。
[0044]S125、对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的政务事项搜索方法,其特征在于,包括:获取用于搜索政务事项数据的语音;对所述语音进行识别处理,得到对应的表示文本;根据所述表示文本进行全文搜索,得到多条政务事项数据;计算所述表示文本和每一条政务事项数据之间的相似度;将最高相似度对应的政务事项数据作为搜索结果进行输出。2.根据权利要求1所述的方法,其特征在于,所述对所述语音进行识别处理,得到对应的表示文本,包括:对所述语音进行预处理;对预处理后的语音进行特征提取,得到特征向量序列;将所述特征向量序列转换为拼音序列;将所述拼音序列转换为词组序列;对所述词组序列进行解码,得到所述表示文本。3.根据权利要求2所述的方法,其特征在于,所述对所述语音进行预处理,包括:将所述语音转换为频谱图;对应的,所述对预处理后的语音进行特征提取,得到特征向量序列,包括:根据梅尔倒谱系数对所述频谱图进行特征提取,得到所述特征向量序列。4.根据权利要求2所述的方法,其特征在于,所述将所述特征向量序列转换为拼音序列,包括:通过声学模型将所述特征向量序列转换为所述拼音序列;其中,所述声学模型包括隐马尔可夫模型。5.根据权利要求2所述的方法,其特征在于,所述将所述拼音序列转换为词组序列,包括:通过语音模型将所述拼音序列转换为所述词组序列;其中,所述语音模型包括N元模型。6.根据权利要求1所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:邢亮张兆勇潘震
申请(专利权)人:浪潮软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1