一种大模型生成数据质量确定方法及系统技术方案

技术编号:43674827 阅读:44 留言:0更新日期:2024-12-18 20:59
本发明专利技术公开了一种大模型生成数据质量确定方法及系统,包括以下步骤:获取大模型的生成数据和源数据;将生成数据输入标准数据模型,获取第一质量评估等级;根据大模型的相似训练数据和对应的相似生成数据获取第二质量评估等级;根据相似历史生成数据的数据效用和第三质量评估等级;确定生成数据的初级数据质量等级和风险数据;生成数据投入应用场景后,根据生成数据效用和初级数据质量等级获取生成数据质量等级;确定异常生成数据,根据数据缺陷调整大模型的模型参数;提高了模型精度,改善了生成数据的生成过程,对投入应用场景前的生成数据进行质量评估,提高了生成数据的整体数据效用,保障了投入应用场景的生成数据的数据质量。

【技术实现步骤摘要】

本专利技术涉及数据质量评估的,尤其涉及一种大模型生成数据质量确定方法及系统


技术介绍

1、近年来,随着互联网行业的发展,所产生的数据规模逐渐扩大,如何保障这些数据的质量也成为计算机领域的重要课题;同时,随着机器学习技术的逐渐完善,越来越多的模型被用于解决各种问题,伴随着模型运用所产生的大量生成数据的质量也成为人们要考虑的重要问题。

2、目前,申请号为201811525693.0的中国专利技术专利,公开了一种数据质量确定方法、装置、电子设备及存储介质,虽然通过与待评价数据相关的各种数据在前一时间周期、并在同样的应用场景下的质量以及待评价数据在当前时间周期、同样的应用场景下的有效性反馈确定待评价数据的质量,但是没有在数据投入使用前对数据质量进行评估,也没有对不合格的数据进行处理,获取数据缺陷,并根据数据缺陷调整生成数据的过程。


技术实现思路

1、本专利技术解决的技术问题是:现有技术没有在数据投入使用前对数据质量进行评估,也没有对不合格的数据进行处理,获取数据缺陷,并根据数据缺陷调整生成数据的过程。<本文档来自技高网...

【技术保护点】

1.一种大模型生成数据质量确定方法,其特征在于,包括:

2.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

3.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

4.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

5.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

6.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

7.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

8.如权利要求7所述的一种大模型生成数据质量确...

【技术特征摘要】

1.一种大模型生成数据质量确定方法,其特征在于,包括:

2.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

3.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

4.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

5.如权利要求1所述的一种大模型生成数据质量确定方法,其特征在于:

6.如权利要求...

【专利技术属性】
技术研发人员:韩涵王甫宁何江谢开浪马文龙陈善君夏暄
申请(专利权)人:北京中数睿智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1