System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文本质量分析方法、装置、设备及存储介质制造方法及图纸_技高网

一种文本质量分析方法、装置、设备及存储介质制造方法及图纸

技术编号:41125224 阅读:4 留言:0更新日期:2024-04-30 17:52
本申请公开了一种文本质量分析方法、装置、设备及存储介质。具体的,该方法包括:获取属于目标业务领域的待分析文本对应的多个第一子文本和参考文本对应的多个第二子文本;对目标子文本与多个第二子文本进行文本相似分析,得到目标子文本对应的文本相似信息;将目标子文本输入与目标业务领域对应的业务属性识别网络进行业务属性识别,得到目标子文本对应的业务属性信息;基于文本相似信息和业务属性信息,对目标子文本进行文本质量分析,得到目标子文本对应的子文本质量信息;对多个第一子文本对应的子文本质量信息进行融合处理,得到待分析文本的文本质量信息。利用本申请提供的技术方案,可以提升待分析文本的文本质量信息的准确性。

【技术实现步骤摘要】

本申请涉及计算机应用,尤其涉及一种文本质量分析方法、装置、设备及存储介质


技术介绍

1、目前,很多业务场景存在对业务文本进行质量分析的需求,现有的文本质量分析方案主要是基于待分析文本和参考文本之间的文本重合率来生成文本质量指标,例如bleu(bilingual evaluation understudy,双语互译质量评估指标)、rouge(recall-orientedunderstanding for gisting evaluation,基于召回率的摘要评价指标)等指标。

2、然而,现有的基于文本重合的文本质量分析方案,未考虑到文本中每个句子对文本表达的重要性不同,此外,现有方案仅适用于待分析文本与参考文本的文本用词一致的场景,在待分析文本与参考文本的文本用词不一致,但待分析文本的描述正确且流畅的情况下,文本质量指标会偏低,使得文本质量分析的准确性较低。


技术实现思路

1、本申请提供了一种文本质量分析方法、装置、设备及存储介质,在考虑待分析文本的较细粒度的子文本与参考文本之间的文本相似性的同时,也参考了子文本本身的业务属性特征对文本表达和文本质量的影响,可以提升子文本的子文本质量信息的准确性,从而提升待分析文本的文本质量信息的准确性,本申请技术方案如下:

2、一方面,提供了一种文本质量分析方法,所述方法包括:

3、获取待分析文本对应的多个第一子文本和参考文本对应的多个第二子文本,所述待分析文本为属于目标业务领域的文本;

4、对目标子文本与所述多个第二子文本进行文本相似分析,得到所述目标子文本对应的文本相似信息,所述目标子文本为所述多个第一子文本中任一第一子文本;

5、将所述目标子文本输入与所述目标业务领域对应的业务属性识别网络进行业务属性识别,得到所述目标子文本对应的业务属性信息;

6、基于所述文本相似信息和所述业务属性信息,对所述目标子文本进行文本质量分析,得到所述目标子文本对应的子文本质量信息;

7、对所述多个第一子文本对应的子文本质量信息进行融合处理,得到所述待分析文本的文本质量信息。

8、另一方面,提供了一种文本质量分析装置,所述装置包括:

9、子文本获取模块,用于获取待分析文本对应的多个第一子文本和参考文本对应的多个第二子文本,所述待分析文本为属于目标业务领域的文本;

10、文本相似分析模块,用于对目标子文本与所述多个第二子文本进行文本相似分析,得到所述目标子文本对应的文本相似信息,所述目标子文本为所述多个第一子文本中任一第一子文本;

11、业务属性识别模块,用于将所述目标子文本输入与所述目标业务领域对应的业务属性识别网络进行业务属性识别,得到所述目标子文本对应的业务属性信息;

12、子文本质量分析模块,用于基于所述文本相似信息和所述业务属性信息,对所述目标子文本进行文本质量分析,得到所述目标子文本对应的子文本质量信息;

13、融合处理模块,用于对所述多个第一子文本对应的子文本质量信息进行融合处理,得到所述待分析文本的文本质量信息。

14、另一方面,提供了一种文本质量分析设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如第一方面所述的文本质量分析方法。

15、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如第一方面所述的文本质量分析方法。

16、另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如第一方面所述的文本质量分析方法。

17、本申请提供的一种文本质量分析方法、装置、设备及存储介质,具有如下技术效果:

18、本申请在基于参考文本对待分析文本进行文本质量分析的应用场景中,对待分析文本中的目标子文本与参考文本对应的多个第二子文本进行文本相似分析,得到目标子文本对应的文本相似信息,目标子文本为待分析文本的多个第一子文本中任一第一子文本,并将目标子文本输入与待分析文本的目标业务领域对应的业务属性识别网络进行业务属性识别,得到目标子文本对应的业务属性信息,然后基于文本相似信息和业务属性信息,对目标子文本进行文本质量分析,得到目标子文本对应的子文本质量信息,在考虑较细粒度的子文本与参考文本之间的文本相似性的同时,也参考了子文本本身的业务属性特征对文本表达和文本质量的影响,可以提升子文本的子文本质量信息的准确性,从而提升待分析文本的文本质量信息的准确性,此外,在提升文本质量分析方法在文本描述多样化场景下的适用性的同时,还可以提升文本质量分析方法与实际业务场景的适配性。

本文档来自技高网...

【技术保护点】

1.一种文本质量分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述基于所述文本相似信息和所述业务属性信息,对所述目标子文本进行文本质量分析,得到所述目标子文本对应的子文本质量信息之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述目标子文本进行关键词质量分析,得到所述目标子文本的关键词质量信息包括:

4.根据权利要求1所述的方法,其特征在于,所述对目标子文本与所述多个第二子文本进行文本相似分析,得到所述目标子文本对应的文本相似信息包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述多个第二子文本分别与所述目标子文本进行文本相似分析,得到多个初始文本相似信息包括:

6.根据权利要求1所述的方法,其特征在于,所述业务属性识别网络包括:语义提取层、语义融合层和属性识别层,所述将所述目标子文本输入与所述目标业务领域对应的业务属性识别网络进行业务属性识别,得到所述目标子文本对应的业务属性信息包括:

7.根据权利要求1至6任一所述的方法,其特征在于,在所述基于所述文本相似信息和所述业务属性信息,对所述目标子文本进行文本质量分析,得到所述目标子文本对应的子文本质量信息之后,所述方法还包括:

8.一种文本质量分析装置,其特征在于,所述装置包括:

9.一种文本质量分析设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1至7任一所述的文本质量分析方法。

10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1至7任一所述的文本质量分析方法。

11.一种计算机程序产品,其特征在于,所述计算机程序产品包括至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1至7任一所述的文本质量分析方法。

...

【技术特征摘要】

1.一种文本质量分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述基于所述文本相似信息和所述业务属性信息,对所述目标子文本进行文本质量分析,得到所述目标子文本对应的子文本质量信息之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述目标子文本进行关键词质量分析,得到所述目标子文本的关键词质量信息包括:

4.根据权利要求1所述的方法,其特征在于,所述对目标子文本与所述多个第二子文本进行文本相似分析,得到所述目标子文本对应的文本相似信息包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述多个第二子文本分别与所述目标子文本进行文本相似分析,得到多个初始文本相似信息包括:

6.根据权利要求1所述的方法,其特征在于,所述业务属性识别网络包括:语义提取层、语义融合层和属性识别层,所述将所述目标子文本输入与所述目标业务领域对应的业务属性识别网络进行业务属性识别,得到所述目标子文本对应的业务属性信息...

【专利技术属性】
技术研发人员:铁瑞雪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1