【技术实现步骤摘要】
一种文本关联度模型的训练方法及装置、问答方法及装置
[0001]本申请涉及计算机
,特别涉及一种文本关联度模型的训练方法及装置、问答方法及装置、计算设备及计算机可读存储介质。
技术介绍
[0002]智能问答系统是信息检索系统的一种高级形式,是基于人们对快速、准确地获取信息的需求而兴起的,可以用准确、简洁的自然语言回答用户用自然语言提出的问题。
[0003]目前,现有的智能问答系统是将积累的无序语料信息进行有序和科学的整理,并建立分类模型,用以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本,基于对网站多年积累的常见问题及其解答,整理为规范的问答库形式,以支撑各种形式问题的智能问答。
[0004]但是,现有的智能问答系统训练时间长、生成的答案较为宽泛,导致整个智能问答系统的智能度不够高,这成为亟待解决的问题。
技术实现思路
[0005]有鉴于此,本申请实施例提供了一种文本关联度模型的训练方法及装置、问答方法及装置、计算设备及计算机可读存储介质,以解决现有 ...
【技术保护点】
【技术特征摘要】
1.一种文本关联度模型的训练方法,其特征在于,包括:获取样本句子集、样本问题以及所述样本句子集中的样本句子与所述样本问题之间的关联度矩阵标签;将所述样本句子和所述样本问题进行分词处理,获得至少一个样本句子词单元和至少一个样本问题词单元;分别确定所述样本句子词单元与所述样本问题词单元的词重要度,将所述样本句子词单元和所述样本句子词单元的词重要度、所述样本问题词单元和所述样本问题词单元的词重要度输入至文本关联度模型中进行处理,生成所述样本句子和所述样本问题之间的初始文本关联度权重矩阵;基于所述初始文本关联度权重矩阵与所述关联度矩阵标签对所述文本关联度模型进行迭代训练,直至达到训练停止条件,获得所述文本关联度模型输出的文本关联度权重矩阵。2.根据权利要求1所述的文本关联度模型的训练方法,其特征在于,在所述获取样本句子集之前,还包括:获取语料文本,通过主题分类算法对所述语料文本进行分类,获得具有类别标签的多个样本句子集。3.根据权利要求1所述的文本关联度模型的训练方法,其特征在于,所述分别确定所述样本句子词单元与所述样本问题词单元的词重要度,包括:分别确定所述样本句子词单元与所述样本问题词单元的词频、词性和情感极性;基于所述样本句子词单元的词频、词性和情感极性确定所述样本句子词单元的词重要度;基于所述样本问题词单元的词频、词性和情感极性确定所述样本问题词单元的词重要度。4.根据权利要求1所述的文本关联度模型的训练方法,其特征在于,所述将所述样本句子词单元和所述样本句子词单元的词重要度、所述样本问题词单元和所述样本问题词单元的词重要度输入至文本关联度模型中进行处理,生成所述样本句子和所述样本问题之间的初始文本关联度权重矩阵,包括:将所述样本句子词单元和所述样本句子词单元的词重要度、所述样本问题词单元和所述样本问题词单元的词重要度输入至文本关联度模型中;基于所述样本句子词单元和所述样本句子词单元的词重要度、所述样本问题词单元和所述样本问题词单元的词重要度确定所述样本句子词单元与所述样本问题词单元之间的关联度;基于所述样本句子词单元与所述样本问题词单元之间的关联度,生成所述样本句子与所述样本问题之间的初始文本关联度权重矩阵。5.根据权利要求1所述的文本关联度模型的训练方法,其特征在于,所述基于所述初始文本关联度权重矩阵与所述关联度矩阵标签对所述文本关联度模型进行迭代训练,包括:基于所述初始文本关联度权重矩阵与所述关联度矩阵标签确定损失值,并判断所述损失值是否大于预设阈值;若是,则基于所述损失值对所述文本关联度模型进行调整;
若否,则结束训练并输出文本关联度权重矩阵。6.一种问答方法,其特征在于,包括:获取待回答问题,对所述待回答问题进行分词处理,获得多个问题词单元;确定所述问题词单元中的关键词单元以及所述关键词单元的词重要度,并基于所述关键词单元与所述关键词单元的词重要度生成关键词矩阵;基于所述关键词矩阵与所述文本关联度权重矩阵确定目标句子,并基于所述目标句子生成所述待回答问题的答案。7.根据权利要求6所述的问答方法,其特征在于,所述确定所述问题词单元中的关键词单元,包括:确定每一个所述问题词单元的词频、词性和/或情感极性,并基于所述问题词单元的词频、词性和/或情感极性确定关键词单元。8.根据权利要求6所述...
【专利技术属性】
技术研发人员:李长亮,冯晓阳,唐剑波,
申请(专利权)人:北京金山数字娱乐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。