System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 问答质量的确定方法、装置、介质及设备制造方法及图纸_技高网

问答质量的确定方法、装置、介质及设备制造方法及图纸

技术编号:40593556 阅读:3 留言:0更新日期:2024-03-12 21:55
本发明专利技术实施例提供一种问答质量的确定方法、问答质量的确定装置、计算机可读存储介质及电子设备,涉及数据处理技术领域。该方法包括:确定目标对象,上述目标对象包含目标问题与目标答复;将上述目标对象输入评价模型,以通过上述评价模型获取上述目标对象对应的目标语义特征,以及根据上述目标语义特征预测上述目标对象对应的目标分类;根据上述评价模型输出的上述目标分类,确定上述目标对象的质量评分。本发明专利技术实施例提供的评价问答质量方案的适用范围广。

【技术实现步骤摘要】

本专利技术实施例涉及数据处理,尤其涉及一种问答质量的确定方法及装置、计算机可读存储介质及电子设备。


技术介绍

1、随着互联网技术的发展与普及,用户在很多情况下会通过网络提问问题,从而获取网友对问题的答复。还存在通过网络中已有的问答来寻找与自己疑问相似的问题,并进一步的参考该问题下的答复。在此过程中,为了提升用户使用体验,需把用户最想要的、高质量的回答内容优先展示给用户。

2、相关技术提供的评价问答质量的方法中,通常是从问答文本出发统计基础的文本信息,并综合用户反馈数据来评价出一个回答内容的质量。

3、然而,相关技术提供的评价问答质量方案的适用范围有限。

4、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术实施例的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、本专利技术实施例的目的在于提供一种问答质量的确定方法、问答质量的确定装置、计算机可读存储介质及电子设备,能够至少在一定程度上增加对问答质量进行评价的适用性。

2、本专利技术实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术实施例的实践而习得。

3、根据本专利技术实施例的一个方面,提供一种问答质量的确定方法,该方法包括:确定目标对象,上述目标对象包含目标问题与目标答复;将上述目标对象输入评价模型,以通过上述评价模型获取上述目标对象对应的目标语义特征,以及根据上述目标语义特征预测上述目标对象对应的目标分类;以及,根据上述评价模型输出的上述目标分类,确定上述目标对象的质量评分。

4、在示例性的实施例中,基于前述方案,上述评价模型为基于半监督学习框架训练得到的;

5、在上述将上述目标对象输入评价模型之前,上述方法还包括:获取监督样本,并根据上述监督样本确定关于机器学习模型的第一损失函数;获取n个无监督样本,对第i个无监督样本进行增强处理,得到上述第i个无监督样本对应的增强样本,n取值为正整数,i取值为不大于m的正整数;根据上述第i个无监督样本和上述第i个无监督样本对应的增强样本,确定关于机器学习模型的第二损失函数;根据上述第一损失函数和上述第二损失函数确定模型损失函数;以及,根据上述模型损失函数优化上述机器学习模型的模型参数,得到上述评价模型。

6、在示例性的实施例中,基于前述方案,上述获取监督样本,包括:调整上述监督样本中正样本与负样本之间的比例符合预设要求。

7、在示例性的实施例中,基于前述方案,上述获取监督样本,包括:根据日志数据,获取上述监督样本;其中,每个上述监督样本包括样本问题和样本答复,上述日志数据包括用户对上述样本答复的点集数据、收藏数据、点赞数据以及转发数据中的一种或几种。

8、在示例性的实施例中,基于前述方案,上述对第i个无监督样本进行增强处理,包括:根据以下方式中的任意一种对第i个无监督样本进行增强处理:词频-逆文本频率指数增强方式、简单数据增强方式,以及回译增强方式。

9、在示例性的实施例中,基于前述方案,上述根据上述第i个无监督样本和上述第i个无监督样本对应的增强样本,确定关于机器学习模型的第二损失函数,包括:在一次迭代过程中,将上述第i个无监督样本输入上述机器学习模型,得到第i预测标签,以及,将上述第i个无监督样本对应的增强样本输入上述机器学习模型,得到第i增强预测标签;以及,根据上述第i预测标签和上述第i增强预测标签,确定关于上述机器学习模型的第二损失函数。

10、在示例性的实施例中,基于前述方案,上述根据上述第一损失函数和上述第二损失函数确定模型损失函数,包括:根据目标超参数、上述第一损失函数和上述第二损失函数确定上述模型损失函数;上述问答质量的确定方法还包括:通过网格搜索的方式确定上述目标超参数。

11、根据本专利技术实施例的另一个方面,提供一种问答质量的确定装置,该装置包括:对象确定模块、分类确定模块,以及评分确定模块。

12、其中,上述对象确定模块,用于确定目标对象,上述目标对象包含目标问题与目标答复;上述分类确定模块,用于将上述目标对象输入评价模型,以通过上述评价模型:获取上述目标对象对应的目标语义特征,以及根据上述目标语义特征预测上述目标对象对应的目标分类;以及,上述评分确定模块,用于根据上述评价模型输出的上述目标分类,确定上述目标对象的质量评分。

13、根据本专利技术实施例的再一个方面,提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述实施例中的问答质量的确定方法。

14、根据本专利技术实施例的又一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中的问答质量的确定方法。

15、本专利技术实施例的实施例所提供的问答质量的确定方法、问答质量的确定装置、计算机可读存储介质及电子设备,具备以下技术效果:

16、本专利技术实施例所提供的技术方案中,目标对象包含目标问题与目标答复,对于待评价的目标对象,将其输入至训练评价模型,从而通过评价模型获取目标对象对应的目标语义特征,以及进一步地根据目标语义特征预测目标对象对应的目标分类,进而根据评价模型输出的目标分类,能够确定上述目标对象的质量评分。本专利技术实施例中从语义角度出发来衡量对问题答复内容的质量,相较于相关技术中基于文本衡量答复内容的质量的方式,本专利技术实施例提供的评价问答质量方案的适用范围广。

17、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术实施例。

本文档来自技高网...

【技术保护点】

1.一种问答质量的确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述评价模型为基于半监督学习框架训练得到的;

3.根据权利要求2所述的方法,其特征在于,所述获取监督样本,包括:

4.根据权利要求2所述的方法,其特征在于,所述获取监督样本,包括:

5.根据权利要求2所述的方法,其特征在于,所述对第i个无监督样本进行增强处理,包括:

6.根据权利要求2所述的方法,其特征在于,所述根据所述第i个无监督样本和所述第i个无监督样本对应的增强样本,确定关于机器学习模型的第二损失函数,包括:

7.根据权利要求2所述的方法,其特征在于,所述根据所述第一损失函数和所述第二损失函数确定模型损失函数,包括:

8.一种问答质量的确定装置,其特征在于,所述装置包括:

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在计算机或处理器上运行时,使得所述计算机或处理器执行如权利要求1至7中任意一项所述的问答质量的确定方法。

10.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的问答质量的确定方法。

...

【技术特征摘要】

1.一种问答质量的确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述评价模型为基于半监督学习框架训练得到的;

3.根据权利要求2所述的方法,其特征在于,所述获取监督样本,包括:

4.根据权利要求2所述的方法,其特征在于,所述获取监督样本,包括:

5.根据权利要求2所述的方法,其特征在于,所述对第i个无监督样本进行增强处理,包括:

6.根据权利要求2所述的方法,其特征在于,所述根据所述第i个无监督样本和所述第i个无监督样本对应的增强样本,确定关于机器学习模型的第二损失函数,包括:

...

【专利技术属性】
技术研发人员:黄简峰
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1