System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 业务数据分析验证方法技术_技高网

业务数据分析验证方法技术

技术编号:41134029 阅读:2 留言:0更新日期:2024-04-30 18:04
本发明专利技术提供的一种业务数据分析验证方法,包括以下步骤:对获取的业务数据进行完整性评价,其中,完整性评价包括数据范围完整性和数据记录完整性;基于数据范围完整性和数据记录完整性确定出完整业务数据;对完整业务数据进行分析,得出完整业务数据的结论文本,并对完整业务数据的结论文本进行词向量转换,将结论文本的词向量输入至k‑means算法中将结论文本分为n个组;对每个组内的任意两个不同的结论进行冲突验证,并进行冲突标记;按照冲突标记数量进行降序排列,形成冲突列表并导出。

【技术实现步骤摘要】

本专利技术涉及一种数据处理方法,尤其涉及一种业务数据分析验证方法


技术介绍

1、业务数据,指的是经营主体在其经营活动中所产生的数据,比如公司的营业额变动、利润增长分析等数据,这些业务数据是否准确且完整对于经营主体的下一个经营周期的生产、营业计划等具有至关重要的指导作用。

2、现有技术中,对业务数据处理的流程十分复杂,往往在多个人员或者多个部门之间传递,从而造成业务数据缺失,进而导致最终的分析结果误差巨大,难以作为经营主体的计划制定依据。另一方面,现有技术中的分析过程往往不能进行分析结论的一致性验证,特别对于多业务分析且具有多结论的情况,容易忽略结论之间的冲突,也导致最终的分析结果的准确性。

3、因此,为了解决上述技术问题,亟需提出一种新的技术手段。


技术实现思路

1、有鉴于此,本专利技术的目的是提供一种业务数据分析验证方法,能够使得业务数据在流转过程中有效识别出业务数据是否完整,从而保证最终用于分析的数据准确性,而且对业务数据的评价结论文本进行冲突验证,从而能够准确找出冲突最大的数据点并针对性解决,为后续经营计划的制定提供准确的数据支持。

2、本专利技术提供的一种业务数据分析验证方法,包括以下步骤:

3、对获取的业务数据进行完整性评价,其中,完整性评价包括数据范围完整性和数据记录完整性;

4、基于数据范围完整性和数据记录完整性确定出完整业务数据;

5、对完整业务数据进行分析,得出完整业务数据的结论文本,并对完整业务数据的结论文本进行词向量转换,将结论文本的词向量输入至k-means算法中将结论文本分为n个组;

6、对每个组内的任意两个不同的结论进行冲突验证,并进行冲突标记;

7、按照冲突标记数量进行降序排列,形成冲突列表并导出。

8、进一步,数据范围完整性评价具体包括:所述数据范围完整性包括类别字段完整性指数和时间字段完整性指数;

9、其中:类别字段完整性指数确定如下:

10、将业务数据转换为设定好规则的json格式描述性数据,并记录json格式下的类别字段和时间字段;

11、统计业务数据中类别字段i的总数a和第i个类别字段在json格式描述性数据中数量b;

12、计算第i个类别字段的完整性指数indexi=b/a;

13、计算类别字段完整性指数其中,m为类别字段的总类别数,λi为第i类别的类别字段的权重,

14、时间字段完整性指数确定如下:

15、确定业务数据输入的时间字段,时间字段集合为{t1,t2,ts};其中,t1为数据输入的起点时间,t2为数据输入的结束时间,ts为输入数据的间隔周期;

16、统计实际输入时间字段的数量nt,计算时间字段完整性指数:

17、indext=nt/ns,其中,ns表示设定的时间字段数量;

18、对类别字段完整性指数和时间字段完整性指数进行加权求和得到数据范围完整性指标。

19、进一步,所述数据记录完整性指数具体为:

20、将业务数据输入至训练完成后的lightbgm模型中进行处理,计算出业务数据记录完整性指数。

21、进一步,基于数据范围完整性和数据记录完整性确定出完整业务数据具体包括:

22、采用德尔菲法确定数据范围完整性指数和数据记录完整性指数的权重;

23、将数据范围完整性指数和数据记录完整性指数分别乘以对应的权重后计算出算出平均值,得到最终的数据完整性总指数;

24、将数据完整性总指数小于设定值的业务数据作为待处理数据;

25、对待处理数据进行修正,将修正后的待处理数据和数据完整性总指数大于设定值的业务数据作为完整业务数据。

26、进一步,将n个组的结论文本输入至chatgpt的gpt-3.5-turbo模型中进行冲突验证。

27、本专利技术的有益效果:通过本专利技术,能够使得业务数据在流转过程中有效识别出业务数据是否完整,从而保证最终用于分析的数据准确性,而且对业务数据的评价结论文本进行冲突验证,从而能够准确找出冲突最大的数据点并针对性解决,为后续经营计划的制定提供准确的数据支持。

本文档来自技高网...

【技术保护点】

1.一种业务数据分析验证方法,其特征在于:包括以下步骤:

2.根据权利要求1所述业务数据分析验证方法,其特征在于:数据范围完整性评价具体包括:所述数据范围完整性包括类别字段完整性指数和时间字段完整性指数;

3.根据权利要求1所述业务数据分析验证方法,其特征在于:所述数据记录完整性指数具体为:

4.根据权利要求1所述业务数据分析验证方法,其特征在于:基于数据范围完整性和数据记录完整性确定出完整业务数据具体包括:

5.根据权利要求1所述业务数据分析验证方法,其特征在于:将n个组的结论文本输入至ChatGPT的gpt-3.5-turbo模型中进行冲突验证。

【技术特征摘要】

1.一种业务数据分析验证方法,其特征在于:包括以下步骤:

2.根据权利要求1所述业务数据分析验证方法,其特征在于:数据范围完整性评价具体包括:所述数据范围完整性包括类别字段完整性指数和时间字段完整性指数;

3.根据权利要求1所述业务数据分析验证方法,其特征在于:所述数据记录完整...

【专利技术属性】
技术研发人员:易世洪李解
申请(专利权)人:北京大学重庆大数据研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1