信息查找方法、信息查找装置、电子设备及存储介质制造方法及图纸

技术编号:24331208 阅读:23 留言:0更新日期:2020-05-29 19:40
本公开提供了一种信息查找方法、信息查找装置、电子设备及计算机可读存储介质,属于计算机技术领域。该方法包括:在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;将所述待处理语音转换为对应的待处理文本;从预先配置的语料库中查找与所述待处理文本相似的语料关键词;获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。本公开可以高效、准确的进行信息查找。

Information searching method, information searching device, electronic equipment and storage medium

【技术实现步骤摘要】
信息查找方法、信息查找装置、电子设备及存储介质
本公开涉及计算机
,尤其涉及一种信息查找方法、信息查找装置、电子设备及计算机可读存储介质。
技术介绍
随着信息时代的来临,各个企业内部积累了大量的数据信息,为了进行有效决策,经常会需要在大量的信息库中进行查找和翻阅。现有的信息查找方法,通常是通过在特定的搜索界面,手动输入文本指令信息,系统根据该文本指令信息进行查找并返回查找到的内容。然而,这种信息查找方式其过程较为复杂,当文本指令信息较为复杂、冗长时,用户在输入时可能会出现输错、漏输的情况,难以保证输入信息的准确性,进而直接影响查找结果;另外,手动输入文本指令信息的方式,根据不同长度的文本指令信息,其花费的输入时间也有所不同,当文本指令信息较长时,势必会增加信息输入的时间,影响信息查找的效率。因此,如何采取高效、准确的方法进行信息查找是现有技术亟待解决的问题。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开提供了一种信息查找方法、信息查找装置、电子设备及计算机可读存储介质,进而至少在一定程度上克服现有的信息查找方法效率低且不够准确的问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种信息查找方法,包括:在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;将所述待处理语音转换为对应的待处理文本;从预先配置的语料库中查找与所述待处理文本相似的语料关键词;获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。在本公开的一种示例性实施例中,在将所述待处理语音转换为对应的待处理文本之前,所述方法还包括:检测所述待处理语音是否为有效语音;如果所述待处理语音为有效语音,则执行将所述待处理语音转换为对应的待处理文本的步骤;如果所述待处理语音为无效语音,则呈现提示信息。在本公开的一种示例性实施例中,所述检测所述待处理语音是否为有效语音,包括以下任意一条或多条:检测所述待处理语音的长度是否在预设范围内;检测所述待处理语音的声纹特征是否满足预设条件;检测所述待处理语音中是否包含预设语音。在本公开的一种示例性实施例中,所述将所述待处理语音转换为对应的待处理文本,包括:对所述待处理语音进行预处理;根据预处理后的所述待处理语音提取特征信息;将所述特征信息输入预先训练的语义识别模型,以输出对应的待处理文本。在本公开的一种示例性实施例中,所述预处理包括以下任意一种或多种:去除噪声、声道转换、预加重、语音增强、去除空白。在本公开的一种示例性实施例中,在将所述待处理语音转换为对应的待处理文本后,所述方法还包括:在所述信息查找界面显示所述待处理文本;响应于对所述待处理文本的修改操作,根据所述修改操作修改所述待处理文本。在本公开的一种示例性实施例中,所述语料库通过以下方式建立:获取多个报表;提取每个所述报表的名称,以每个所述报表的名称为一组语料关键词,以及提取每个所述报表的指标,以每个所述报表的指标为一组语料关键词,建立所述语料库;所述目标信息为所述多个报表中的目标报表。在本公开的一种示例性实施例中,所述从预先配置的语料库中查找与所述待处理文本相似的语料关键词,包括:提取所述待处理文本中的关键词,以生成所述待处理文本的关键词集;计算所述关键词集与所述语料库中每组语料关键词的相似度;分别获取与所述关键词集的相似度高于预设阈值的报表的名称和报表的指标,以作为与所述关键词集相似的语料关键词。在本公开的一种示例性实施例中,如果存在多个与所述关键词集的相似度高于预设阈值的报表的名称或报表的指标,则获取其中与所述关键词集的相似度最高的N个报表的名称以及N个报表的指标,N为预设的正整数;在确定所述目标信息后,所述方法还包括:根据所述相似度的计算结果,将所述目标报表按照所述相似度的大小进行顺序排序,并显示于所述信息查找界面。根据本公开的一个方面,提供一种信息查找装置,包括:语音获取模块,用于在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;文本转换模块,用于将所述待处理语音转换为对应的待处理文本;关键词查找模块,用于从预先配置的语料库中查找与所述待处理文本相似的语料关键词;信息查找模块,用于获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。在本公开的一种示例性实施例中,信息查找装置还包括:语音检测单元,用于在将所述待处理语音转换为对应的待处理文本之前,检测所述待处理语音是否为有效语音;检测判断单元,用于如果所述待处理语音为有效语音,则执行将所述待处理语音转换为对应的待处理文本的步骤;以及如果所述待处理语音为无效语音,则呈现提示信息。在本公开的一种示例性实施例中,所述检测所述待处理语音是否为有效语音,包括以下任意一条或多条:检测所述待处理语音的长度是否在预设范围内;检测所述待处理语音的声纹特征是否满足预设条件;检测所述待处理语音中是否包含预设语音。在本公开的一种示例性实施例中,文本转换模块包括:预处理单元,用于对所述待处理语音进行预处理;特征提取单元,用于根据预处理后的所述待处理语音提取特征信息;特征识别单元,用于将所述特征信息输入预先训练的语义识别模型,以输出对应的待处理文本。在本公开的一种示例性实施例中,所述预处理包括以下任意一种或多种:去除噪声、声道转换、预加重、语音增强、去除空白。在本公开的一种示例性实施例中,信息查找装置还包括:文本显示单元,用于在将所述待处理语音转换为对应的待处理文本后,在所述信息查找界面显示所述待处理文本;文本修改单元,用于响应于对所述待处理文本的修改操作,根据所述修改操作修改所述待处理文本。在本公开的一种示例性实施例中,所述语料库通过以下方式建立:获取多个报表;提取每个所述报表的名称,以每个所述报表的名称为一组语料关键词,以及提取每个所述报表的指标,以每个所述报表的指标为一组语料关键词,建立所述语料库;所述目标信息为所述多个报表中的目标报表。在本公开的一种示例性实施例中,关键词查找模块包括:关键词提取单元,用于提取所述待处理文本中的关键词,以生成所述待处理文本的关键词集;相似度计算单元,用于计算所述关键词集与所述语料库中每组语料关键词的相似度;语料关键词确定单元,用于分别获取与所述关键词集的相似度高于预设阈值的报表的名称和报表的指标,以作为与所述关键词集相似的语料关键词。在本公开的一种示例性实施例中,如果存在多个与所述关键词集的相似度高于预设阈值的报表的名称或报表的指标,则获取其中与所述关键词集的相似度最高的N个报表的名称以及N个报表的指标,N为预设的正整数;信息查找装置还包括:显示模块,用于在确定所述目标信息后,根据所述相似度的计算结果,将所述目标报表按照所述相似度的大小进行顺序排序,并显示于所述信息查找界本文档来自技高网...

【技术保护点】
1.一种信息查找方法,其特征在于,包括:/n在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;/n将所述待处理语音转换为对应的待处理文本;/n从预先配置的语料库中查找与所述待处理文本相似的语料关键词;/n获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。/n

【技术特征摘要】
1.一种信息查找方法,其特征在于,包括:
在信息查找界面提供语音输入控件,通过所述语音输入控件获取用户输入的待处理语音;
将所述待处理语音转换为对应的待处理文本;
从预先配置的语料库中查找与所述待处理文本相似的语料关键词;
获取与所述待处理文本相似的语料关键词所对应的信息,作为所述待处理语音所查找的目标信息。


2.根据权利要求1所述的方法,其特征在于,在将所述待处理语音转换为对应的待处理文本之前,所述方法还包括:
检测所述待处理语音是否为有效语音;
如果所述待处理语音为有效语音,则执行将所述待处理语音转换为对应的待处理文本的步骤;
如果所述待处理语音为无效语音,则呈现提示信息。


3.根据权利要求2所述的方法,其特征在于,所述检测所述待处理语音是否为有效语音,包括以下任意一条或多条:
检测所述待处理语音的长度是否在预设范围内;
检测所述待处理语音的声纹特征是否满足预设条件;
检测所述待处理语音中是否包含预设语音。


4.根据权利要求1所述的方法,其特征在于,所述将所述待处理语音转换为对应的待处理文本,包括:
对所述待处理语音进行预处理;
根据预处理后的所述待处理语音提取特征信息;
将所述特征信息输入预先训练的语义识别模型,以输出对应的待处理文本。


5.根据权利要求1所述的方法,其特征在于,所述语料库通过以下方式建立:
获取多个报表;
提取每个所述报表的名称,以每个所述报表的名称为一组语料关键词,以及提取每个所述报表的指标,以每个所述报表的指标为一组语料关键词,建立所述语料库;
所述目标信息为所述多个报表中的目标报表。

【专利技术属性】
技术研发人员:陈佩何金虎
申请(专利权)人:泰康保险集团股份有限公司泰康在线财产保险股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1