一种基于多策略匹配的语音搜索方法技术

技术编号：31094649 阅读：34 留言：0更新日期：2021-12-01 13:03

本发明专利技术公开了一种基于多策略匹配的语音搜索方法。该方法包括获取用户输入的语音，并生成可能的所有文本，对所有文本分别进行通顺度评价打分，筛选K个得分最高的文本作为查询候选文本；对K个查询候选文本分别进行检索，每一查询候选文本取检索后的N个文档，利用文本匹配模型对每一查询候选文本与其对应的N个文档进行相关性打分，共得到K*N个文档及其对应的相关性得分；对K*N个文档的文本得分分别进行计算，选择文本得分最高的文档作为第一推荐文档推荐给用户。本发明专利技术扩大了搜索范围，提高搜索准确率，减少搜索空间，提高搜索速度，加强对用户问题的理解，提升用户体验。提升用户体验。提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多策略匹配的语音搜索方法

[0001]本专利技术涉及语音搜索
，具体涉及一种基于多策略匹配的语音搜索方法。

技术介绍

[0002]在人机交互环节中，语音交互一直占有重要地位。目前随着语音识别技术的发展，越来越多的移动应用都在其内部植入了语音搜索功能，极大地方便了用户的搜索与查询，显著改善用户的产品体验。
[0003]现有的语音搜索技术，往往先通过语音识别能力将语音声纹转为文本格式，再经过传统的文本匹配或检索找出与查询问题相关的文档，经过一定的策略排序后最终返回给用户。其中，语音转文本的过程主要是通过拼音匹配的方式进行的，由于存在以下原因：1）语音识别准确率受限；2）用户发音不标准；3）汉语中存在大量同音字词等，会导致转成的文本中存在识别错误的字或词，或者不符合上下文情景的词或短语，最终导致搜索结果准确性降低；同时，缺少用户历史查询信息的支持，难以准确识别用户意图，导致搜索结果即便是准确的，仍然不能满足用户需求，最终降低了用户体验。

技术实现思路

[0004]本专利技术的目的是针对现有技术...

【技术保护点】

【技术特征摘要】
1.一种基于多策略匹配的语音搜索方法，其特征在于，包括：获取用户输入的语音，所述语音经过语音识别生成文本，如所述用户输入的语音中存在同音字，则在语音识别后生成与同音字对应的所有文本，利用语言通顺度模型对所有文本分别进行通顺度评价打分，以获得每一文本的通顺度得分，根据所述通顺度得分对所有文本由高到低进行排序，筛选前K个文本作为查询候选文本；对K个查询候选文本分别进行检索，并对每一查询候选文本检索后的所有文档分别根据分词命中得分累加计算检索分数，且根据所述检索分数对每一查询候选文本检索出文档由高到低进行排序，分别取前N个文档作为每一查询候选文本的检索结果，利用文本匹配模型对每一查询候选文本对应的N个文档进行相关性打分，共得到K*N个文档及其对应的相关性得分，其中，K和N均为大于零的自然数；结合所述查询候选文本的通顺度得分，对K*N个文档的文本得分分别进行计算，其中，文本得分=文档的相关性得分*对应的查询候选文本的通顺度得分，并根据所述文本得分对K*N个文档进行排序；选择文本得分最高的文档作为第一推荐文档推荐给用户。2.根据权利要求1所述的基于多策略匹配的语音搜索方法，其特征在于，还包括：判断是否存在历史用户查询信息，若存在历史用户查询信息，则根据历史用户查询信息对K*N个文档再进行一次用户行为打分，再结合每个文档的文本...

【专利技术属性】
技术研发人员：杜振东，
申请(专利权)人：南京云问网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人