【技术实现步骤摘要】
基于语音的检索方法、服务器及计算机可读存储介质
本专利技术属于计算机
,尤其涉及一种基于语音的检索方法、服务器及计算机可读存储介质。
技术介绍
随着技术的发展,为了使得用户的检索操作更加方便,实现了用户可以通过语音的方式输入检索信息进行检索的方法,服务器通过检索信息对数据库中的文本进行检索获得检索结果,并根据关联性大小对检索结果进行排序,从而生成检索列表,以提供给用户进行查看。对于通过语音的方式输入检索信息进行检索时,服务器需要对语音进行分析得到对应的文本语句,然后将文本语句直接作为检索信息在服务器的数据库中进行检索,然而这种方式由于没有充分考虑到文本语句与数据库中的文本数据如何更好的进行匹配的问题,从而导致检索的结果不够准确。
技术实现思路
有鉴于此,本专利技术实施例提供了一种的基于语音的检索方法、服务器及计算机可读存储介质,以解决现有技术中用户以语音的方式输入检索信息进行检索时,检索的结果不够准确的问题。本专利技术实施例的第一方面提供了一种基于语音的检索方法,包括:获取检索请求,所述检索请求包括用于进行检索的语音信息;对所述检索请求中的语音信息进行处理得到对 ...
【技术保护点】
1.一种基于语音的检索方法,其特征在于,包括:获取检索请求,所述检索请求包括用于进行检索的语音信息;对所述检索请求中的语音信息进行处理得到对应所述语音信息的文本语句;基于预设的分词词典对所述文本语句进行分词处理得到拆分词组,并基于预设的停用词词典对所述拆分词组进行抽取处理得到关键词,所述停用词词典为需要进行过滤的词汇所组成;对预存的文本库中所有文本进行提取处理,得到每个文本对应的关键词列表;若预存的所述文本库中每个文本所对应的关键词列表中存在与所述关键词相匹配的目标关键词,则输出所述关键词列表所对应的结果文本作为检索结果。
【技术特征摘要】
1.一种基于语音的检索方法,其特征在于,包括:获取检索请求,所述检索请求包括用于进行检索的语音信息;对所述检索请求中的语音信息进行处理得到对应所述语音信息的文本语句;基于预设的分词词典对所述文本语句进行分词处理得到拆分词组,并基于预设的停用词词典对所述拆分词组进行抽取处理得到关键词,所述停用词词典为需要进行过滤的词汇所组成;对预存的文本库中所有文本进行提取处理,得到每个文本对应的关键词列表;若预存的所述文本库中每个文本所对应的关键词列表中存在与所述关键词相匹配的目标关键词,则输出所述关键词列表所对应的结果文本作为检索结果。2.根据权利要求1所述的基于语音的检索方法,其特征在于,所述对预存的所述文本库中所有文本进行提取处理,得到每个文本对应的关键词列表之后,包括:若预存的文本库中每个文本所对应的关键词列表中不存在与所述关键词相匹配的目标关键词,则生成无检索结果的通知。3.根据权利要求1所述的基于语音的检索方法,其特征在于,所述对预存的所述文本库中所有文本进行提取处理,得到每个文本对应的关键词列表,包括:根据所述文本库中目标文本的目标词汇与所述目标文本的所有词汇的比值,以及所述目标词汇的第一权重,确定得到所述目标词汇的第一评分值,所述目标文本为所述文本库中的任意一个文本,所述目标词汇为所述目标文本中的任意一个词汇;根据所述文本库中所有文本数量与所述文本库中存在所述目标词汇的文本数量的比值,以及所述目标词汇的第二权重,确定得到所述目标词汇的第二评分值;根据所述第一评分值与第二评分值的乘积确定得到所述目标词汇的关键词评分;若所述关键词评分大于预设值,则将所述目标词汇添加至所述目标文本对应的关键词列表中。4.根据权利要求1所述的基于语音的检索方法,其特征在于,所述对所述检索请求中的语音信息进行处理得到对应所述语音信息的文本语句,包括:对所述检索请求中的语音信息进行特征提取得到语音特征向量;将所述语音特征向量输入至预设的声学模型进行处理输出得到字符;将所述字符输入至预设的语言模型进行处理输出得到文本语句。5.根据权利要求4所述的基于语音的检索方法,其特征在于,所述对所述检索请求中的语音信息进行特征提取得到语音特征向量,包括:根据预设频率对所述检索请求中的语音信息进行采样处理得到采样语音信号;对所述采样语音信号进行预加重处理得到第一语音信号;对所述第一语音信号进行加窗处理得到第二语音信号;对所述第二语音信...
【专利技术属性】
技术研发人员:吴壮伟,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。