一种检索文本纠错方法、装置和存储介质制造方法及图纸

技术编号:24799612 阅读:71 留言:0更新日期:2020-07-07 21:03
本发明专利技术实施例公开了一种检索文本纠错方法、装置和存储介质,其中,通过接收输入的待检索文本,并对待检索文本进行局部替换或全部替换,得到纠错文本;然后将纠错文本以及待检索文本设为候选检索文本,得到多个候选检索文本;再调用预先训练的评分函数对候选检索文本进行评分,得到候选检索文本的评分;最后根据各候选检索文本的评分,从多个所述候选检索文本中选取出用于检索的目标检索文本。其中,从多个候选检索文本中筛选出的目标检索文本最可能为用户实际期望的检索文本,将该目标检索文本提供给检索服务器进行检索,能够提高获得期望检索结果的概率。

【技术实现步骤摘要】
一种检索文本纠错方法、装置和存储介质
本专利技术涉及检索
,具体涉及一种检索文本纠错方法、装置和存储介质。
技术介绍
目前,当需要检索信息时,用户可以访问检索服务器提供的检索界面,并在该检索界面输入需要检索的检索文本,之后,检索服务器即根据输入的检索文本进行检索,并在检索界面展示检索到的结果,呈现给用户。比如,用户可以访问音乐检索服务器提供的检索界面,进行音乐文件的检索。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,当用户无意的错误输入时,使得检索服务器面对的将是无意义的检索文本,无法返回用户期望的检索结果。
技术实现思路
本专利技术实施例提供一种检索文本纠错方法、装置和存储介质,能够提高获得期望检索结果的概率。本专利技术实施例提供一种检索文本纠错方法,包括:接收输入的待检索文本,并对所述待检索文本进行局部或全部替换,得到纠错文本;将所述纠错文本以及所述待检索文本设为候选检索文本,得到多个候选检索文本;调用预先训练的评分函数对所述候选检索文本进行评分,得到所述候选检本文档来自技高网...

【技术保护点】
1.一种检索文本纠错方法,其特征在于,所述检索文本纠错方法包括:/n接收输入的待检索文本,并对所述待检索文本进行局部或全部替换,得到纠错文本;/n将所述纠错文本以及所述待检索文本设为候选检索文本,得到多个候选检索文本;/n调用预先训练的评分函数对所述候选检索文本进行评分,得到所述候选检索文本的评分;/n根据所述候选检索文本的评分,从多个所述候选检索文本中选取出用于检索的目标检索文本。/n

【技术特征摘要】
1.一种检索文本纠错方法,其特征在于,所述检索文本纠错方法包括:
接收输入的待检索文本,并对所述待检索文本进行局部或全部替换,得到纠错文本;
将所述纠错文本以及所述待检索文本设为候选检索文本,得到多个候选检索文本;
调用预先训练的评分函数对所述候选检索文本进行评分,得到所述候选检索文本的评分;
根据所述候选检索文本的评分,从多个所述候选检索文本中选取出用于检索的目标检索文本。


2.根据权利要求1所述的检索文本纠错方法,其特征在于,调用预先训练的评分函数对所述候选检索文本进行评分,得到所述候选检索文本的评分,包括:
获得所述候选检索文本的文本特征,所述文本特征包括以下几项中的任意一项或多项:语言模型评分、替换为纠错文本的概率、历史操作行为特征、划分的文本片段个数特征、与纠错文本的发音相似度、序列转换过程中的状态特征、词向量特征;
向量化所述文本特征,得到特征向量;
将所述特征向量输入至预先训练的评分函数中,得到所述候选检索文本的评分。


3.根据权利要求2所述的检索文本纠错方法,其特征在于,所述待检索文本为用于检索音乐文件的文本,所述语言模型评分的获得方式包括:
获得基于音乐知识库构建的语言模型;
基于所述语言模型对所述待检索文本进行评分,得到语言模型评分。


4.根据权利要求1-3任一项所述的检索文本纠错方法,其特征在于,所述对所述待检索文本进行局部或全部替换,得到纠错文本的步骤包括:
获得预先构建的纠错词典,所述纠错词典记录有:检索文本中被替换文本片段与替换后文本片段的对应关系,和/或,检索文本中的文本片段及其发音信息之间的对应关系;
根据所述纠错词典,识别并替换所述待检索文本中需要替换的目标文本片段,得到所述纠错文本。


5.根据权利要求4所述的检索文本纠错方法,其特征在于,所述纠错词典的构建方式包括:
获取历史检索文本,以及获取所述历史检索文本对应的原始输入文本;
比较所述历史检索文本以及所述原始输入文本,确定出所述原始输入文本中的被...

【专利技术属性】
技术研发人员:吴上权周蓝珺潘树燊
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1