System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文本检测方法、设备及存储介质技术_技高网

一种文本检测方法、设备及存储介质技术

技术编号:41058793 阅读:20 留言:0更新日期:2024-04-24 11:09
本申请实施例提供了一种文本检测方法、设备及存储介质,涉及人工智能技术领域,通过提取评审文本的深度语义信息,预测评审文本与其他评审文本在多个评审维度的初步一致性向量。结合评审文本包含的评论文本和回复文本,提取评审文本在多个评审维度的第一倾向性向量;基于评审文本的属性信息提取评审文本在多个评审维度的第二倾向性向量,最后综合初步一致性向量、第一倾向性向量和第二倾向性向量,获得评审文本的综合一致性向量,从而更全面地评估评审文本的质量,提高预测评审的一致性的准确性。另外,本申请实现在多个评审维度的一致性预测,其评审粒度更细,帮助元审稿人更好地理解审稿人之间的分歧和不一致,从而做出更准确的判断和最终决定。

【技术实现步骤摘要】

本申请实施例涉及人工智能,尤其涉及一种文本检测方法、设备及存储介质


技术介绍

1、在论文评审场景中,论文的作者提交了多份评审数据,每份评审数据都来自不同的评审人。元审稿人(负责检查评审人的审稿质量,敦促进度落后的评审人,让评审人修改质量差的审稿意见,即评审人的评审人)需要对多份评审数据的观点进行分析,并决定是否接受这篇论文,其中,多份评审数据的观点是否一致是影响元审稿人的审核结果的关键因素。

2、现有技术中,预先采用样本评审数据训练输出为论文通过或论文不通过的分类模型。在论文评审场景中,接收到多份评审数据后,将每份评审数据输入训练好的分类模型中,获得该评审数据的分类结果,即论文通过或论文不通过。然后基于多个评审数据的分类结果,确定多个评审数据之间的一致性。

3、然而,在实际应用中,评审数据往往涉及评审员在研究问题、方法、实验结果、讨论等多个维度对论文的评审意见。在不同的维度,评审员的倾向性可能是不同,比如,评审员认可论文的研究问题,但是觉得论文中提及的研究方法并不好。

4、因此,现有技术中采用分类模型直接将评审数据划分为论文通过或论文不通过,其划分粒度过大,进而导致确定的多个评审数据之间的观点一致性的准确性较低。


技术实现思路

1、本申请实施例提供了一种文本检测方法、设备及存储介质,用于提高预测多个评审数据之间的观点一致性的准确性。

2、一方面,本申请实施例提供了一种文本检测方法,包括:

3、获取多个评审文本,并针对所述多个评审文本,分别执行以下操作:

4、通过深度语义组件,预测一个评审文本与其他评审文本在多个评审维度的初步一致性向量;

5、基于所述一个评审文本包含的评论文本和回复文本,提取所述一个评审文本在所述多个评审维度的第一倾向性向量;

6、基于所述一个评审文本的属性信息,提取所述一个评审文本在所述多个评审维度的第二倾向性向量;

7、基于所述初步一致性向量、所述第一倾向性向量和所述第二倾向性向量,确定所述一个评审文本的综合一致性向量,所述综合一致性向量中每个数值对应一个评审维度,表示所述一个评审文本与其他评审文本在所述一个评审维度的观点一致性程度。

8、一方面,本申请实施例提供了一种文本检测装置,包括:

9、获取模块,用于获取多个评审文本;

10、检测模块,用于针对所述多个评审文本,分别执行以下操作:

11、通过深度语义组件,预测一个评审文本与其他评审文本在多个评审维度的初步一致性向量;

12、基于所述一个评审文本包含的评论文本和回复文本,提取所述一个评审文本在所述多个评审维度的第一倾向性向量;

13、基于所述一个评审文本的属性信息,提取所述一个评审文本在所述多个评审维度的第二倾向性向量;

14、基于所述初步一致性向量、所述第一倾向性向量和所述第二倾向性向量,确定所述一个评审文本的综合一致性向量,所述综合一致性向量中每个数值对应一个评审维度,表示所述一个评审文本与其他评审文本在所述一个评审维度的观点一致性程度。

15、可选地,所述检测模块具体用于:

16、对所述评论文本进行特征提取,并基于获得的提取结果预测所述评论文本在所述多个评审维度的评论得分向量;以及对所述回复文本进行特征提取,并基于获得的提取结果预测所述回复文本在所述多个评审维度的回复得分向量;

17、基于所述评论得分向量和所述回复得分向量,获得所述一个评审文本的综合得分向量;基于所述一个评审文本的综合得分向量和其他评审文本的综合得分向量,确定所述一个评审文本与其他评审文本之间的第一相似分量和第一异相似分量;

18、基于所述评论得分向量和所述回复得分向量,确定所述评论文本与所述回复文本之间的第二相似分量和第二异相似分量;

19、基于所述第一相似分量、所述第一异相似分量、所述第二相似分量和所述第二异相似分量,确定所述初步一致性向量。

20、可选地,所述检测模块具体用于:

21、对所述评论文本中的每个句子进行特征提取,获得相应的句表征向量;

22、基于每个句子的句表征向量,预测每个所述句子在所述多个评审维度的句得分向量;

23、基于所述评论文本中多个句子的句得分向量加权求和,获得所述评论文本在所述多个评审维度的评论得分向量。

24、可选地,所述检测模块具体用于:

25、对所述回复文本中的每个句子进行特征提取,获得相应的句表征向量;

26、基于每个句子的句表征向量,预测每个所述句子在所述多个评审维度的句得分向量;

27、基于所述回复文本中多个句子的句得分向量加权求和,获得所述回复文本在所述多个评审维度的回复得分向量。

28、可选地,所述检测模块具体用于:

29、针对其他评审文本中的各个待比对文本,分别执行以下操作:确定所述一个评审文本的综合得分向量,与一个待比对文本的综合得分向量之间的相似度;并对所述相似度进行正交分解,获得初步相似分量和初步异相似分量;

30、对获得的多个初步相似分量加权平均处理,获得所述第一相似分量;

31、对获得的多个初步异相似分量加权平均处理,获得所述第一异相似分量。

32、可选地,所述检测模块具体用于:

33、确定所述评论得分向量和所述回复得分向量之间的相似度,并对所述相似度进行正交分解,获得所述第二相似分量和所述第二异相似分量。

34、可选地,所述检测模块具体用于:

35、通过预训练模型,提取所述一个评审文本中每个句子的上下文表征向量;

36、采用激活函数对每个句子的上下文表征向量进行映射,获得每个句子在所述多个评审维度的概率向量;

37、对每个句子对应的概率向量进行编码,获得每个句子在所述多个评审维度的倾向性向量;

38、采用长短记忆模型,对所述一个评审文本中多个句子的倾向性向量进行序列信息提取,获得所述第一倾向性向量。

39、可选地,还包括评估模块;所述评估模块具体用于:

40、针对所述多个评审维度,分别执行以下操作:

41、从所述多个评审文本各自的综合一致性向量中,获取所述多个评审文本在一个评审维度的数值,并确定获得的多个数值的方差;

42、基于所述方差,确定所述多个评审文本在所述一个评审维度的观点一致性程度。

43、一方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述文本检测方法的步骤。

44、一方面,本申请实施例提供了一种计算机可读存储介质,其存储有可由计算机设备执行的计算机程序,当所述程序在计算机设备上运行时,使得所述计算机设备执行上述文本检测方法的步骤。

45、本申请实本文档来自技高网...

【技术保护点】

1.一种文本检测方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述预测一个评审文本与其他评审文本在多个评审维度的初步一致性向量,包括:

3.如权利要求2所述的方法,其特征在于,所述对所述评论文本进行特征提取,并基于获得的提取结果预测所述评论文本在所述多个评审维度的评论得分向量,包括:

4.如权利要求2所述的方法,其特征在于,所述对所述回复文本进行特征提取,并基于获得的提取结果预测所述回复文本在所述多个评审维度的回复得分向量,包括:

5.如权利要求2所述的方法,其特征在于,所述基于所述一个评审文本的综合得分向量和其他评审文本的综合得分向量,确定所述一个评审文本与其他评审文本之间的第一相似分量和第一异相似分量,包括:

6.如权利要求2所述的方法,其特征在于,所述基于所述评论得分向量和所述回复得分向量,确定所述评论文本与所述回复文本之间的第二相似分量和第二异相似分量,包括:

7.如权利要求1所述的方法,其特征在于,所述基于所述一个评审文本包含的评论文本和回复文本,提取所述一个评审文本在所述多个评审维度的第一倾向性向量,包括:

8.如权利要求1至7任一所述的方法,其特征在于,还包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1~8任一所述方法的步骤。

10.一种计算机可读存储介质,其特征在于,其存储有可由计算机设备执行的计算机程序,当所述程序在计算机设备上运行时,使得所述计算机设备执行权利要求1~8任一所述方法的步骤。

...

【技术特征摘要】

1.一种文本检测方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述预测一个评审文本与其他评审文本在多个评审维度的初步一致性向量,包括:

3.如权利要求2所述的方法,其特征在于,所述对所述评论文本进行特征提取,并基于获得的提取结果预测所述评论文本在所述多个评审维度的评论得分向量,包括:

4.如权利要求2所述的方法,其特征在于,所述对所述回复文本进行特征提取,并基于获得的提取结果预测所述回复文本在所述多个评审维度的回复得分向量,包括:

5.如权利要求2所述的方法,其特征在于,所述基于所述一个评审文本的综合得分向量和其他评审文本的综合得分向量,确定所述一个评审文本与其他评审文本之间的第一相似分量和第一异相似分量,包括:

6.如权利要求2所述的方...

【专利技术属性】
技术研发人员:陈安柱谭勇慧吴泽勇
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1