System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识图谱的众包数据采集方法、系统及电子设备技术方案_技高网

一种基于知识图谱的众包数据采集方法、系统及电子设备技术方案

技术编号:41255417 阅读:3 留言:0更新日期:2024-05-11 09:15
本发明专利技术提供一种基于知识图谱的众包数据采集方法、系统及电子设备,其技术要点在于:首先基于用户与众包任务的基本信息建立知识图谱,包括:获取工作任务中的元数据,对所述元数据进行提取和分析,得到工作任务的基本信息,并构建任务知识图谱;对用户与采集任务进行匹配,最后再根据用户采集结果生成绩效及时对知识图谱进行维护。本发明专利技术在进行数据采集时,尽可能地提高采集任务与众包者地匹配精度,实现高效率高质量完成数。涉及用户‑任务知识图谱构建和基于RippleNet模型运用的众包任务分配系统,以及基于相似度比较算法的结果匹配与绩效评估,用于解决众包任务覆盖率低下、任务‑用户匹配不精准、用户贡献率不易体现的问题。

【技术实现步骤摘要】

本专利技术涉及人工智能,更具体地,涉及一种基于知识图谱的众包数据采集方法、系统及电子设备


技术介绍

1、随着各种领域技术和应用的不断发展,数据的重要性越来越突出。全面多样的数据可以为广泛领域的研究、决策与服务提供有价值的数据支持和依据,比如商业智能和市场研究,搜索引擎、社交网络、电子商务等互联网服务的优化以及最近火热的人工智能开发都离不开海量标注数据的分析与应用。

2、而数据采集作为一种重要的数据获取手段,是数据分析的首要环节,后续的数据存储、数据清洗、数据分析乃至数据应用,都是以数据采集为首要前提。通过数据采集从各种信息源中获取有价值的数据,并将其结构化,为后续的研究提供数据支持和依据。

3、过去,旧的数据采集方法通常采用传统的人工方式,比如通过培养公司专用数据采集人员或直接外包专业的数据采集公司来完成。这种方式往往需要耗费大量的时间和人力成本。而使用众包进行数据采集可以帮助我们解决这个问题,让我们更快速地获取大量数据。同时,以众包的形式进行数据采集也可以大大降低数据采集所需的成本,避免因为缺乏人力资源和技术手段而无法开展数据采集的情况发生。

4、当前数据采集主要依靠众包系统,虽然解决了采集成本过高、花费时间较长等问题,但是采用的个人自主接取任务方式容易导致效率低下和贡献率不易体现等问题。此外,现有的众包方案采用人工固定分配或自由选择的方式,往往存在任务覆盖率不足、任务执行难度大、工人质量参差不齐等问题。


技术实现思路

1、本专利技术针对现有技术中存在的技术问题,提供一种基于知识图谱的众包数据采集方法、系统及电子设备,用于解决众包任务覆盖率低下、任务-用户匹配不精准、用户贡献率不易体现等问题。

2、根据本专利技术的第一方面,提供了一种基于知识图谱的众包数据采集方法,应用于众包采集系统,所述方法包括以下步骤:

3、步骤s1.基于用户与众包任务的基本信息建立任务知识图谱;包括:获取工作任务中的元数据,对所述元数据进行提取和分析,得到工作任务的基本信息,并构建任务知识图谱;

4、步骤s2.利用构建好的任务知识图谱,进行用户与采集任务的匹配,获得用户与任务的匹配结果,并将所述工作任务推荐给众包者;

5、步骤s3.对众包者的执行结果进行结果评估,生成用户的绩效数据,将所述绩效数据反馈至任务知识图谱中,对所述任务知识图谱进行维护。

6、在上述技术方案的基础上,本专利技术还可以作出如下改进。

7、可选的,所述元数据包括但不限于任务描述、要求、截止日期;所述获取工作任务中的元数据,对所述元数据进行提取和分析包括:

8、在众包采集系统接收外部的众包任务后,众包采集系统首先进行元数据提取,包括所需的关键技能、知识和能力要素,并对这些元素进行深入分析,接着,基于任务内部元数据之间的关系,有序地构建由任务组成的知识图谱。

9、可选的,所述基本信息包括但不限于任务类型、难度级别、技能要求;所述任务知识图谱采用自顶向下构建本体库与自底向上完善本体库相融合的方式进行构建。

10、可选的,所述任务知识图谱本体库里的基础本体里的属性包括人员、任务、任务描述元数据、绩效的顶层类,以及空间实体、时态实体的外部关联顶层类。

11、可选的,所述进行用户与采集任务的匹配包括:

12、基于ripplenet模型的交互矩阵包括用户、任务、用户属性、任务属性,若用户在历史记录中与某任务有关系,则将矩阵这一点的值设为1,否则就设为为空,表示目前并不知道该任务与用户之间的关系。

13、可选的,所述进行用户与采集任务的匹配还包括:

14、对众包者所参与的任务做出的任务知识图谱中进行搜索,通过基于ripplenet模型的交互矩阵的算法对二者的匹配程度进行计算,任务发布者设置任务匹配用户数n.众包系统将任务推荐给匹配度从高到低排序的前n个众包者。

15、可选的,所述对众包者的执行结果进行结果评估,生成用户的绩效数据,将所述绩效数据反馈至任务知识图谱中包括:

16、众包者在接取任务之后开始完成任务,任务完成后,对众包者的结果做结果评估,根据相似度匹配算法对用户采集结果一一比较,根据每一项指标完成的程度对绩效进行评估,得到的绩效更新到用户知识图谱中,并更新众包者知识图谱中对应的元数据,在系统下一次分配任务时,根据众包者新的知识图谱结合交互矩阵算法做任务分配。

17、可选的,所述对众包者的执行结果进行结果评估还包括:

18、在众包者提交任务后,采用特征提取将任务知识图谱的数据节点特征用于相似性比较算法,再根据矛盾识别器生成的识别结果生成结果相似度,然后运用组合赋权计算综合绩效,实时更新交互矩阵。

19、根据本专利技术的第二方面,提供一种基于知识图谱的众包数据采集系统,包括:

20、知识图谱构建模块,用于基于用户与众包任务的基本信息建立任务知识图谱;包括:获取工作任务中的元数据,对所述元数据进行提取和分析,得到工作任务的基本信息,并构建任务知识图谱;

21、任务匹配模块,用于利用构建好的任务知识图谱,进行用户与采集任务的匹配,获得用户与任务的匹配结果,并将所述工作任务推荐给众包者;

22、知识图谱维护模块,用于对众包者的执行结果进行结果评估,生成用户的绩效数据,将所述绩效数据反馈至任务知识图谱中,对所述任务知识图谱进行维护。

23、根据本专利技术的第三方面,提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机程序时实现上述所述的一种基于知识图谱的众包数据采集方法的步骤。

24、本专利技术的技术效果和优点:

25、本专利技术提出了一种基于知识图谱的众包数据采集方法、系统及电子设备,本专利技术基于一般众包系统的数据库,构造该众包系统专用的知识图谱,提高系统在任务与众包者管理过程中的可控性,并实现全众包系统智能化升级。知识图谱用以整合众包任务的属性信息、用户的行为信息、以及用户和任务之间的关系,通过调用不同的算法实现全众包流程自主可控。用于解决众包任务覆盖率低下、任务-用户匹配不精准、用户贡献率不易体现等问题。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的众包数据采集方法,应用于众包采集系统,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述元数据包括但不限于任务描述、要求、截止日期;所述获取工作任务中的元数据,对所述元数据进行提取和分析包括:

3.根据权利要求1所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述基本信息包括但不限于任务类型、难度级别、技能要求;所述任务知识图谱采用自顶向下构建本体库与自底向上完善本体库相融合的方式进行构建。

4.根据权利要求3所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述任务知识图谱本体库里的基础本体里的属性包括人员、任务、任务描述元数据、绩效的顶层类,以及空间实体、时态实体的外部关联顶层类。

5.根据权利要求1所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述进行用户与采集任务的匹配包括:

6.根据权利要求5所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述进行用户与采集任务的匹配还包括:

7.根据权利要求1所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述对众包者的执行结果进行结果评估,生成用户的绩效数据,将所述绩效数据反馈至任务知识图谱中包括:

8.根据权利要求7所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述对众包者的执行结果进行结果评估还包括:

9.一种基于知识图谱的众包数据采集系统,其特征在于,包括:

10.一种电子设备,其特征在于,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至8任一项所述的一种基于知识图谱的众包数据采集方法的步骤。

...

【技术特征摘要】

1.一种基于知识图谱的众包数据采集方法,应用于众包采集系统,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述元数据包括但不限于任务描述、要求、截止日期;所述获取工作任务中的元数据,对所述元数据进行提取和分析包括:

3.根据权利要求1所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述基本信息包括但不限于任务类型、难度级别、技能要求;所述任务知识图谱采用自顶向下构建本体库与自底向上完善本体库相融合的方式进行构建。

4.根据权利要求3所述的一种基于知识图谱的众包数据采集方法,其特征在于:所述任务知识图谱本体库里的基础本体里的属性包括人员、任务、任务描述元数据、绩效的顶层类,以及空间实体、时态实体的外部关联顶层类。

5.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员:高峰王士榤赵一鸣范智博林泽锴陆晨阳袁冲王佳兴
申请(专利权)人:武汉科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1