一种答案排序方法和装置制造方法及图纸

技术编号:31227908 阅读:21 留言:0更新日期:2021-12-08 09:37
本发明专利技术公开了一种答案排序方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取若干组问答数据作为训练样本;其中,每组问答数据包括问题例句和答案例句,所述答案例句包括正向答案例句和负向答案例句;计算所述问答数据的各个字的浅层混合字词向量,以训练排序模型;其中,所述排序模型包括串联的循环神经网络和卷积神经网络;采用训练后的排序模型,计算目标问题对应的各个候选答案的匹配概率,从而对所述各个候选答案进行排序。该实施方式能够解决答案排序结果不准确的技术问题。题。题。

【技术实现步骤摘要】
一种答案排序方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种答案排序方法和装置。

技术介绍

[0002]答案选择(Answer Selection)是指利用自然语言处理或深度学习等技术来衡量问题和候选答案的语义匹配程度,进而在诸多候选答案列表中选出更准确的答案。自然语言处理可与机器学习、深度学习等技术结合,应用于智能医疗系统、智能问答系统等。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0004]由于某些特殊领域(比如中文健康咨询领域)存在大量专业术语,未登录词出现频繁,而且问答数据中还会有错别字等情况,因此现有的处理方式会直接影响语义向量的计算精度,损失一定的语义精度,导致答案的排序结果不准确。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种答案排序方法和装置,以解决答案排序结果不准确的技术问题。
[0006]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种答案排序方法,包括:
[0007]获取若干组问答数据作为训练本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种答案排序方法,其特征在于,包括:获取若干组问答数据作为训练样本;其中,每组问答数据包括问题例句和答案例句,所述答案例句包括正向答案例句和负向答案例句;计算所述问答数据的各个字的浅层混合字词向量,以训练排序模型;其中,所述排序模型包括串联的循环神经网络和卷积神经网络;采用训练后的排序模型,计算目标问题对应的各个候选答案的匹配概率,从而对所述各个候选答案进行排序。2.根据权利要求1所述的方法,其特征在于,计算所述问答数据的各个字的浅层混合字词向量,以训练排序模型,包括:计算所述问答数据的各个字的浅层混合字词向量;将所述问答数据的各个字的浅层混合字词向量输入到排序模型中,并采用成对方法和最大间隔算法训练所述排序模型。3.根据权利要求2所述的方法,其特征在于,计算所述问答数据的各个字的浅层混合字词向量,包括:对所述问答数据进行切词和词向量转换,得到各个词的词向量;对所述问答数据进行切字和字向量转换,得到各个字的字向量;对于所述问答数据中的每个字,根据所述字的字向量和所述字所在词的词向量,计算所述字的浅层混合字词向量。4.根据权利要求3所述的方法,其特征在于,根据所述字的字向量和所述字所在词的词向量,计算所述字的浅层混合字词向量,包括:根据预设的词向量权重和字向量权重,对所述字的字向量和所述字所在词的词向量进行加权求和,得到所述字的浅层混合字词向量。5.根据权利要求2所述的方法,其特征在于,所述排序模型包括并联的第一神经网络、第二神经网络和第三神经网络;其中,所述第一神经网络包括串联的第一循环神经网络和第一卷积神经网络;所述第二神经网络包括串联的第二循环神经网络和第二卷积神经网络;所述第三神经网络包括串联的第三循环神经网络和第三卷积神经网络。6.根据权利要求5所述的方法,其特征在于,将所述问答数据的各个字的浅层混合字词向量输入到排序模型中,并采用成对方...

【专利技术属性】
技术研发人员:胡珅健
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1