文本查询方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:23343543 阅读:25 留言:0更新日期:2020-02-15 03:56
本申请涉及信息处理技术领域,公开了一种文本查询方法、装置、电子设备及计算机可读存储介质,文本查询方法包括:接收用户输入的初始查询语句,查询预设的语句库中与初始查询语句之间匹配度高于预设阈值的第一相似语句;语句库包括相似语句和相应的答案文本;相似语句基于样本查询语句通过翻译及反向翻译得到;若得到第一相似语句,则查询语句库中与第一相似语句相应的第一答案文本;若未得到第一相似语句,则将初始查询语句输入预设的训练后的复述模型,得到相应的第二相似语句,并依据第二相似语句得到相应的第二答案文本;训练后的复述模型基于样本查询语句和对应的相似语句训练得到,可以提高向用户推送的答案文本的准确率。

Text query method, device, electronic equipment and computer readable storage medium

【技术实现步骤摘要】
文本查询方法、装置、电子设备及计算机可读存储介质
本申请涉及信息处理
,具体而言,本申请涉及一种文本查询方法、装置、电子设备及计算机可读存储介质。
技术介绍
自动问答系统,又称为人机对话系统,用户以自然语言形式描述问题,自动问答系统解答用户提出的问题,通常自动问答系统中可以预先存储有多个问答对,每一个问答对包括一个查询问题和相应的答案文本。由于自然语言的特点,同样一个意思的查询问题,可以有很多种问法,当用户提出的问题和问答系统存储的查询问题之间具有一些不同的字符时,不同的字符会干扰问答系统对查询问题所对应的查询意图的识别,使得系统识别查询意图的准确率下降,进而降低向用户推送答案文本的正确率。
技术实现思路
本申请的目的旨在至少能解决上述的技术缺陷之一,特提出以下技术方案:第一方面,提供了一种文本查询方法,包括:接收用户输入的初始查询语句,查询预设的语句库中与初始查询语句之间匹配度高于预设阈值的第一相似语句;其中,语句库包括相似语句和相应的答案文本;相似语句基于样本查询语句通过翻译及反向翻译得到;本文档来自技高网...

【技术保护点】
1.一种文本查询方法,其特征在于,包括:/n接收用户输入的初始查询语句,查询预设的语句库中与所述初始查询语句之间匹配度高于预设阈值的第一相似语句;其中,所述语句库包括相似语句和相应的答案文本;所述相似语句基于样本查询语句通过翻译及反向翻译得到;/n若得到所述第一相似语句,则查询所述语句库中与所述第一相似语句相应的第一答案文本;/n若未得到所述第一相似语句,则将所述初始查询语句输入预设的训练后的复述模型,得到相应的第二相似语句,并依据所述第二相似语句得到相应的第二答案文本;其中,所述训练后的复述模型基于所述样本查询语句和对应的所述相似语句训练得到。/n

【技术特征摘要】
1.一种文本查询方法,其特征在于,包括:
接收用户输入的初始查询语句,查询预设的语句库中与所述初始查询语句之间匹配度高于预设阈值的第一相似语句;其中,所述语句库包括相似语句和相应的答案文本;所述相似语句基于样本查询语句通过翻译及反向翻译得到;
若得到所述第一相似语句,则查询所述语句库中与所述第一相似语句相应的第一答案文本;
若未得到所述第一相似语句,则将所述初始查询语句输入预设的训练后的复述模型,得到相应的第二相似语句,并依据所述第二相似语句得到相应的第二答案文本;其中,所述训练后的复述模型基于所述样本查询语句和对应的所述相似语句训练得到。


2.根据权利要求1所述的文本查询方法,其特征在于,所述接收用户输入的初始查询语句的步骤之前,还包括:
获取所述样本查询语句,将所述样本查询语句进行翻译并反向翻译,基于得到的反向翻译语句获取与所述样本查询语句相应的相似语句;
获取与所述样本查询语句相应的答案文本,根据所述相似语句及所述答案文本之间的对应关系构建所述语句库。


3.根据权利要求2所述的文本查询方法,其特征在于,所述将所述样本查询语句进行翻译并反向翻译的步骤,包括:
将所述样本查询语句输入至少两种不同的翻译引擎中进行翻译,得到相应的翻译语句;
将所述翻译语句依据预定的输入方式输入至少两种不同的翻译引擎中进行反向翻译,得到与所述样本查询语句的语言种类相同的反向翻译语句。


4.根据权利要求2所述的文本查询方法,其特征在于,所述基于得到的反向翻译语句获取与所述样本查询语句相应的相似语句的步骤,包括:
从所述反向翻译语句中提取与所述样本查询语句相似度符合预设条件的语句设为所述相似语句。


5.根据权利要求4所述的文本查询方法,其特征在于,所述从所述反向翻译语句中提取与所述样本查询语句相似度符合预设条件的语句设为所述相似语句的步骤,包括:
获取各所述反向翻译语句与所述样本查询语句之间的相似度;
选取相似度大于预设相似度值的反向翻译语句设为所述相似语句。


6.根据权利要求4所述的文本查询方法,其特征在于,所述从所述反向翻译语句中提取与所...

【专利技术属性】
技术研发人员:陈华栋徐广庆
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1