【技术实现步骤摘要】
基于人工智能的问答文本匹配方法、装置、介质及电子设备
本专利技术涉及自然语言处理
,具体而言,涉及一种基于人工智能的问答文本匹配方法、装置、介质及电子设备。
技术介绍
传统问答系统中的问答文本排序技术通过计算问题中关键词的文本相似度来返回正确答案,但是很多时候问题关键词比较少,但语义又相符时候,这种做法就存在缺陷了。随着深度学习技术的发展,其在自然语言处理上等到广泛应用。对文本进行词向量表示,选择合适的深度学习模型对文本建模成为通用语义理解做法。在问题语义匹配过程中,提取问题文本的浅层语义信息和上下文局部特征信息,并且通过注意力机制等其他计算相互作用手段可以获取全局特征信息,保证了问答文本的语义匹配准确性。但是,该匹配方式只是考虑了用户问题文本和候选问题文本的语义特征信息,并没有考虑用户问题文本和候选问题文本的本文特征,例如,用户问题文本和候选问题文本中的词语之间的关系。因此,相关技术中以问答文本的语义来匹配候选问题的准确性较低。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此 ...
【技术保护点】
1.一种基于人工智能的问答文本匹配方法,其特征在于,包括:/n基于当前用户的问题文本检索出候选问题文本的集合;/n对所述当前用户的问题文本和所述候选问题文本的集合中每个候选问题文本分别进行分布式表示,得到所述当前用户的问题文本的词向量序列和所述候选问题文本的集合中每个候选问题文本的词向量序列;/n通过深度学习模型确定所述当前用户的问题文本的词向量序列和所述候选问题文本的集合中每个候选问题文本的词向量序列的语义相似度;/n通过预设公式确定所述当前用户的问题文本与所述候选问题文本的集合中每个候选问题文本的文本相似度;/n根据所述语义相似度和所述文本相似度确定所述当前用户的问题文 ...
【技术特征摘要】
1.一种基于人工智能的问答文本匹配方法,其特征在于,包括:
基于当前用户的问题文本检索出候选问题文本的集合;
对所述当前用户的问题文本和所述候选问题文本的集合中每个候选问题文本分别进行分布式表示,得到所述当前用户的问题文本的词向量序列和所述候选问题文本的集合中每个候选问题文本的词向量序列;
通过深度学习模型确定所述当前用户的问题文本的词向量序列和所述候选问题文本的集合中每个候选问题文本的词向量序列的语义相似度;
通过预设公式确定所述当前用户的问题文本与所述候选问题文本的集合中每个候选问题文本的文本相似度;
根据所述语义相似度和所述文本相似度确定所述当前用户的问题文本与所述候选问题文本的集合中每个候选问题文本的综合相似度;
根据所述当前用户的问题文本与所述候选问题文本的集合中每个候选问题文本的综合相似度确定与所述当前用户的问题文本匹配的候选答案文本。
2.根据权利要求1所述的方法,其特征在于,所述深度学习模型是基于预设领域的问题文本通过迁移学习对预训练模型进行调整得到的。
3.根据权利要求2所述的方法,其特征在于,在基于当前用户的问题文本检索出候选问题文本的集合之前,该方法还包括:
获取通用领域的问题文本,所述通用领域的问题文本中不包含所述预设领域的问题文本;
对所述通用领域的问题文本中的每个问题本进行分布式表示,得到所述通用领域的问题文本中的每个问题文本的词向量序列;
通过循环神经网络对每个问题文本的词向量序列进行预训练,得到所述预训练模型。
4.根据权利要求3所述的方法,其特征在于,在得到所述预训练模型之后,该方法还包括:
获取所述预设领域的问题文本;
对所述预设领域的问题文本中的每个问题本进行分布式表示,得到所述预设领域的问题文本中的每个问题文本的词向量序列;
基于所述预设领域的问题文本中的每个问题文本的词向量序列通过所述迁移学习对预训练模型进行调整,得到所述深度学习模型。
5.根据权利要求1所述的方法,其特征在于,通过深度学习模型确定所述当前用户的问题文本的词向量序列和所述候选问题文本的集合中每个候选问题文本的词向量序列的语义相似度包括:
通过循环神经网络从所述当前用户的问题文本的词向量序列提取所述当前用户的问题文本的上下文语义特征序列,以及从所述候选问题文本的集合中每个候选问题文本的词向量序列提取所述候选问题文本的集合中每个候选问题文本的上下文语义特征序列;
计算所述当前用户的问题文本的上下文语义特征序列与所述候选问题文本的集合中每个候选问题文本的上下文语...
【专利技术属性】
技术研发人员:李渊,刘设伟,
申请(专利权)人:泰康保险集团股份有限公司,泰康在线财产保险股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。