数据及数据协作者推荐方法与系统技术方案

技术编号:35203626 阅读:23 留言:0更新日期:2022-10-15 10:13
本发明专利技术提供了一种数据及数据协作者推荐方法及系统,包括:步骤S1:通过记录并解析数据使用者对数据的操作历史,构建使用者与所用数据的熟悉程度,并根据熟悉程度定义数据专家;步骤S2:通过用户包括所属团队、项目以及常用数据信息生成用户标签,并进行聚类分组;步骤S3:对数据实体进行标记并进行聚类分组;步骤S4:根据用户数据使用记录推荐相应的感兴趣数据和数据专家。本发明专利技术能自动将合适的数据及数据专家推荐给数据用户,大大缩减了数据用户熟悉数据的时间,提升了数据分析的效率。提升了数据分析的效率。提升了数据分析的效率。

【技术实现步骤摘要】
数据及数据协作者推荐方法与系统


[0001]本专利技术涉及计算机数据处理
,具体地,涉及数据及数据协作者推荐方法与系统。

技术介绍

[0002]计算机和软件用户已经习惯了用于共同创作文件、文档、消息等的用户友好的软件应用。例如,存储提供商(例如,云存储提供商)提供诸如文字处理应用、电子表格应用、电子幻灯片演示应用、电子邮件应用、聊天应用、语音应用等之类的应用,其中,用户可以在所述应用内彼此共同创作或协作。协作包括识别用于共享文档和/或利用其他协作特征的协作者/用户。用于识别要进行协作的其他用户的现有技术需要手动地键入其他潜在用户的名字,并且有时需要按顺序地键入。由于需要繁重的键入,这样的技术是枯燥的并且容易出错。由此,用于识别要进行文档协作的用户的现有技术可能是繁琐的、困难的、且低效率的,这最终会引起缺少对文档协作的参与。
[0003]专利文献CN109844786A(申请号:201780064880.0)公开了使用协作图的协作者推荐,在一个方面中,可以在数据建模服务处接收与至少一个应用相关联的协作数据。可以创建用于表示与至少一个应用相关联的协作数据的协作图。可以查询所述协作图以识别用于在至少一个应用内进行协作的多个推荐的协作者。可以以基于一组标准的排名顺序来对所述多个推荐的协作者进行排名。

技术实现思路

[0004]针对现有技术中的缺陷,本专利技术的目的是提供一种数据及数据协作者推荐方法与系统。
[0005]根据本专利技术提供的一种数据及数据协作者推荐方法,包括:
[0006]步骤S1:通过记录并解析数据使用者对数据的操作历史,构建使用者与所用数据的熟悉程度,并根据熟悉程度定义数据专家;
[0007]步骤S2:通过用户包括所属团队、项目以及常用数据信息生成用户标签,并进行聚类分组;
[0008]步骤S3:对数据实体进行标记并进行聚类分组;
[0009]步骤S4:根据用户数据使用记录推荐相应的感兴趣数据和数据专家。
[0010]优选地,所述步骤S1采用:
[0011]步骤S1.1:自动采集并记录用户操作日志,包括数据的创建、调用以及查询的具体操作行为和具体操作时间;
[0012]步骤S1.2:基于记录的用户操作行为和操作时间构建用户及数据之间的熟悉度关系;
[0013]步骤S1.3:每个数据实体按照熟悉度排序后取前预设位用户并定义为数据的数据专家。
[0014]优选地,所述步骤S1.2采用:根据用户的操作频次以及操作类型信息,依据预设权重加权计算得到用户及数据之间的熟悉度关系;
[0015]S=S1*w1+S2*w2+S3*w3
ꢀꢀꢀ
(1)
[0016]其中,w1、w2、w3表示加权值;S1表示最近一次消费,指用户上次调用该数据的时间,将所有用户的最近一次消费进行排序,时间越近对应分值越高;S2表示消费频率,指用户在近一年内调用该数据的频次,将所有用户的消费频次进行排序,消费频次越高对应分值越高;S3表示消费量,指用户在近一年内调用该数据时,返回的数据量大小,将所有用户的消费量进行排序,消费量越高对应分值越高。
[0017]优选地,所述步骤S2采用:
[0018]步骤S2.1:通过用户包括所属团队、项目以及常用数据信息生成用户标签;
[0019]步骤S2.2:基于用户标签使用聚类算法进行聚类分组。
[0020]优选地,所述步骤S2.1采用:用户标签支持用户自定义身份用户标签。
[0021]优选地,所述步骤S3采用:
[0022]步骤S3.1:基于包括数据实体的数据注释、归属领域、字段信息、用途、调用频次以及使用用户组别生成数据标签;
[0023]步骤S3.2:基于数据标签使用聚类算法进行聚类分组。
[0024]优选地,所述步骤S4采用:
[0025]步骤S4.1:根据用户数据使用记录向用户推荐其他潜在感兴趣数据;
[0026]步骤S4.2:根据用户数据使用记录向用户推荐其正在使用或其他感兴趣数据的数据专家。
[0027]根据本专利技术提供的一种数据及数据协作者推荐系统,包括:
[0028]模块M1:通过记录并解析数据使用者对数据的操作历史,构建使用者与所用数据的熟悉程度,并根据熟悉程度定义数据专家;
[0029]模块M2:通过用户包括所属团队、项目以及常用数据信息生成用户标签,并进行聚类分组;
[0030]模块M3:对数据实体进行标记并进行聚类分组;
[0031]模块M4:根据用户数据使用记录推荐相应的感兴趣数据和数据专家。
[0032]优选地,所述模块M1采用:
[0033]模块M1.1:自动采集并记录用户操作日志,包括数据的创建、调用以及查询的具体操作行为和具体操作时间;
[0034]模块M1.2:基于记录的用户操作行为和操作时间构建用户及数据之间的熟悉度关系;
[0035]模块M1.3:每个数据实体按照熟悉度排序后取前预设位用户并定义为数据的数据专家;
[0036]所述模块M1.2采用:根据用户的操作频次以及操作类型信息,依据预设权重加权计算得到用户及数据之间的熟悉度关系;
[0037]S=S1*w1+S2*w2+S3*w3
ꢀꢀꢀ
(1)
[0038]其中,w1、w2、w3表示加权值;S1表示最近一次消费,指用户上次调用该数据的时间,将所有用户的最近一次消费进行排序,时间越近对应分值越高;S2表示消费频率,指用
户在近一年内调用该数据的频次,将所有用户的消费频次进行排序,消费频次越高对应分值越高;S3表示消费量,指用户在近一年内调用该数据时,返回的数据量大小,将所有用户的消费量进行排序,消费量越高对应分值越高。
[0039]优选地,所述模块M2采用:
[0040]模块M2.1:通过用户包括所属团队、项目以及常用数据信息生成用户标签;
[0041]模块M2.2:基于用户标签使用聚类算法进行聚类分组;
[0042]所述模块M2.1采用:用户标签支持用户自定义身份用户标签;
[0043]所述模块M3采用:
[0044]模块M3.1:基于包括数据实体的数据注释、归属领域、字段信息、用途、调用频次以及使用用户组别生成数据标签;
[0045]模块M3.2:基于数据标签使用聚类算法进行聚类分组;
[0046]所述模块M4采用:
[0047]模块M4.1:根据用户数据使用记录向用户推荐其他潜在感兴趣数据;
[0048]模块M4.2:根据用户数据使用记录向用户推荐其正在使用或其他感兴趣数据的数据专家。
[0049]与现有技术相比,本专利技术具有如下的有益效果:
[0050]1、本专利技术能自动将合适的数据及数据专家推荐给数据用户,大大缩减了数据用户熟悉数据的时间,提升了数据分析的效率;
[0051]2、本专利技术基于数据操作记录,自动推荐数据与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据及数据协作者推荐方法,其特征在于,包括:步骤S1:通过记录并解析数据使用者对数据的操作历史,构建使用者与所用数据的熟悉程度,并根据熟悉程度定义数据专家;步骤S2:通过用户包括所属团队、项目以及常用数据信息生成用户标签,并进行聚类分组;步骤S3:对数据实体进行标记并进行聚类分组;步骤S4:根据用户数据使用记录推荐相应的感兴趣数据和数据专家。2.根据权利要求1所述的数据及数据协作者推荐方法,其特征在于,所述步骤S1采用:步骤S1.1:自动采集并记录用户操作日志,包括数据的创建、调用以及查询的具体操作行为和具体操作时间;步骤S1.2:基于记录的用户操作行为和操作时间构建用户及数据之间的熟悉度关系;步骤S1.3:每个数据实体按照熟悉度排序后取前预设位用户并定义为数据的数据专家。3.根据权利要求2所述的数据及数据协作者推荐方法,其特征在于,所述步骤S1.2采用:根据用户的操作频次以及操作类型信息,依据预设权重加权计算得到用户及数据之间的熟悉度关系;S=S1*w1+S2*w2+S3*w3
ꢀꢀꢀꢀ
(1)其中,w1、w2、w3表示加权值;S1表示最近一次消费,指用户上次调用该数据的时间,将所有用户的最近一次消费进行排序,时间越近对应分值越高;S2表示消费频率,指用户在近一年内调用该数据的频次,将所有用户的消费频次进行排序,消费频次越高对应分值越高;S3表示消费量,指用户在近一年内调用该数据时,返回的数据量大小,将所有用户的消费量进行排序,消费量越高对应分值越高。4.根据权利要求1所述的数据及数据协作者推荐方法,其特征在于,所述步骤S2采用:步骤S2.1:通过用户包括所属团队、项目以及常用数据信息生成用户标签;步骤S2.2:基于用户标签使用聚类算法进行聚类分组。5.根据权利要求4所述的数据及数据协作者推荐方法,其特征在于,所述步骤S2.1采用:用户标签支持用户自定义身份用户标签。6.根据权利要求1所述的数据及数据协作者推荐方法,其特征在于,所述步骤S3采用:步骤S3.1:基于包括数据实体的数据注释、归属领域、字段信息、用途、调用频次以及使用用户组别生成数据标签;步骤S3.2:基于数据标签使用聚类算法进行聚类分组。7.根据权利要求1所述的数据及数据协作者推荐方法,其特征在于,所述步骤S4采用:步骤S4.1:根据用户数据使用记录向...

【专利技术属性】
技术研发人员:陈俊奇张建陈章辉尤毅丁益斌邱燕茹齐轶
申请(专利权)人:兴业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1