文本检索方法、计算机设备和存储介质技术

技术编号:35906998 阅读:52 留言:0更新日期:2022-12-10 10:45
本申请涉及人工智能领域,通过对待检索文本进行相似拼音检索,得到候选文本,可以实现在海量文本中快速筛选出候选文本,同时解决发音识别错误的问题,提高了文本检索的效率与准确性。涉及一种文本检索方法、计算机设备和存储介质,该方法包括:获取待检索文本;对所述待检索文本进行相似拼音检索,获得至少一个候选文本,并确定每个所述候选文本对应的目标权重值;基于预设的文本筛选策略,根据每个所述候选文本对应的目标权重值进行文本筛选,获得目标文本。标文本。标文本。

【技术实现步骤摘要】
文本检索方法、计算机设备和存储介质


[0001]本申请涉及人工智能领域,尤其涉及一种文本检索方法、计算机设备和存储介质。

技术介绍

[0002]随着人工智能技术的快速发展,人机交互技术已经在人们的生活中慢慢普及,越来越多的智能家居设备、车机软件开始提供语音交互功能,让用户能够通过语音指令控制以及查询信息服务,让用户的操作更加便捷。在进行语音识别时,由于说话人口音、环境噪声、同音字等影响,会导致错误识别用户表达的内容,无法满足用户的交互需求。因此,在语音交互系统中通常需要接入模糊检索系统,对语音识别结果进行模糊检索进而得到用户期望的内容结果,为后续业务提供更准确的指令输入,以及更好的人机交互体验。
[0003]现有的模糊检索方案都是直接根据文本的句子特征和语义进行检索,在海量候选数据的场景下检索计算量巨大,导致检索效率较低;同时,现有的模糊检索方案无法应对语音交互场景下发音识别错误问题,导致检索的准确性较低。
[0004]因此,如何提高文本检索的效率与准确性成为亟需解决的问题。

技术实现思路

[0005]本申请提供本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本检索方法,其特征在于,包括:获取待检索文本;对所述待检索文本进行相似拼音检索,获得至少一个候选文本,并确定每个所述候选文本对应的目标权重值;基于预设的文本筛选策略,根据每个所述候选文本对应的目标权重值进行文本筛选,获得目标文本。2.根据权利要求1所述的文本检索方法,其特征在于,所述对所述待检索文本进行相似拼音检索,获得至少一个候选文本,包括:确定所述待检索文本对应的拼音信息,所述拼音信息包括至少一个初始拼音;基于预设的拼音映射库,对每个所述初始拼音进行相似拼音转换,获得每个所述初始拼音对应的目标拼音;基于预设的命名实体索引库,根据每个所述目标拼音对应的目标索引进行文本查询,获得每个所述目标拼音对应的候选文本。3.根据权利要求1所述的文本检索方法,其特征在于,所述确定每个所述候选文本对应的目标权重值,包括:统计每个所述候选文本出现的频次,根据每个所述候选文本的频次,对应确定每个所述候选文本的目标权重值;或统计每个所述候选文本出现的频次,根据每个所述候选文本的频次,对应确定每个所述候选文本的第一权重值;获取用户反馈信息,根据所述用户反馈信息对每个所述候选文本进行加权处理,获得每个所述候选文本的第二权重值;根据所述第一权重值与所述第二权重值,确定每个所述候选文本对应的目标权重值。4.根据权利要求3所述的文本检索方法,其特征在于,所述根据所述用户反馈信息对每个所述候选文本进行加权处理,获得每个所述候选文本的第二权重值,包括:将所述用户反馈信息输入行为聚类模型进行分类,获得每个所述候选文本对应的目标行为类别;基于预设的行为类别与权重值之间的对应关系,根据每个所述候选文本对应的目标行为类别,对应确定每个所述候选文本对应的第二权重值。5.根据权利要求1所述的文本检索方法,其特征在于,所述基于预设的文本筛选策略,根据每个所述候选文本对应的目标权重值进行文本筛选,获得目标文本,包括:根据目标权重值大于预设权重阈值的候选文本,确定第一候选文本集;对所述第一候选文本集...

【专利技术属性】
技术研发人员:宁宏伟刘权
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1