一种画像数据获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28559186 阅读:20 留言:0更新日期:2021-05-25 17:53
本发明专利技术实施例公开了一种画像数据获取方法、装置、电子设备及存储介质。该方法包括:根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱;其中,数据类型包括用户数据和业务数据;根据知识图谱和画像标签信息建立画像标签库;其中,画像标签信息包括画像标签等级和画像标签内容;响应于用户的标签查询请求查询画像标签库得到标签查询结果,以根据标签查询结果获取画像数据。通过运行本发明专利技术实施例所提供的技术方案,可以解决通过人工方式对行业特征进行分析并制定画像,然而由于行业更新较快以及人工采集的数据量较小等原因容易导致难以及时准确地获取画像数据的问题,实现提高画像数据获取的准确性和效率的效果。

【技术实现步骤摘要】
一种画像数据获取方法、装置、电子设备及存储介质
本专利技术实施例涉及计算机技术,尤其涉及一种画像数据获取方法、装置、电子设备及存储介质。
技术介绍
随着社会发展,灵活用工场景的“新业态”模式不断出现,然而这种“新业态”模式中的行业和从业人员画像却千差万别,难以有能够适应各地零工行业实际业务环境的画像数据的获取方法。现有技术中,往往通过人工方式对行业特征进行分析并制定画像,然而由于行业更新较快以及人工采集的数据量较小等原因容易导致难以及时准确地获取画像数据。
技术实现思路
本专利技术实施例提供一种画像数据获取方法、装置、电子设备及存储介质,以实现提高画像数据获取的准确性和效率。第一方面,本专利技术实施例提供了一种画像数据获取方法,该方法包括:根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱;其中,所述数据类型包括用户数据和业务数据;根据所述知识图谱和画像标签信息建立画像标签库;其中,所述画像标签信息包括画像标签等级和画像标签内容;响应于用户的标签查询请求查询所述画像标签库得到标签查询结果,以根据所述标签查询结果获取画像数据。第二方面,本专利技术实施例还提供了一种画像数据获取装置,该装置包括:知识图谱确定模块,用于根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱;其中,所述数据类型包括用户数据和业务数据;画像标签库建立模块,用于根据所述知识图谱和画像标签信息建立画像标签库;其中,所述画像标签信息包括画像标签等级和画像标签内容;标签查询结果获取模块,用于响应于用户的标签查询请求查询所述画像标签库得到标签查询结果,以根据所述标签查询结果获取画像数据。第三方面,本专利技术实施例还提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的画像数据获取方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的画像数据获取方法。本专利技术实施例通过根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱;其中,所述数据类型包括用户数据和业务数据;根据所述知识图谱和画像标签信息建立画像标签库;其中,所述画像标签信息包括画像标签等级和画像标签内容;响应于用户的标签查询请求查询所述画像标签库得到标签查询结果,以根据所述标签查询结果获取画像数据,解决通过人工方式对行业特征进行分析并制定画像,然而由于行业更新较快以及人工采集的数据量较小等原因容易导致难以及时准确地获取画像数据的问题,实现提高画像数据获取的准确性和效率的效果。附图说明图1为本专利技术实施例一提供的一种画像数据获取方法的流程图;图2为本专利技术实施例二提供的一种画像数据获取装置的结构示意图;图3为本专利技术实施例三提供的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种画像数据获取方法的流程图,本实施例可适用于获取行业中画像数据的情况,该方法可以由本专利技术实施例所提供的画像数据获取装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的画像数据获取方法,包括:步骤110、根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱;其中,所述数据类型包括用户数据和业务数据。其中,单个数据类型的数据为用户数据或业务数据,可以对指定数据类型通过大数据等技术进行采集,并通过实体识别、关系抽取以及属性抽取等技术获取用户实体集和业务实体集。通过用户实体集和业务实体集中实体和实体之间的关系分别构建该数据类型的知识图谱。其中,用户数据可以为个人数据,也可以为企业数据,本实施例对此不作限制。本实施例中,可选的,在确定该数据类型的知识图谱之前,还包括:根据所述数据类型从至少两个预设数据渠道中获取候选数据;根据所述候选数据确定目标数据;相应的,则根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱,包括:根据单个数据类型的所述目标数据中实体和实体之间的关系,确定该数据类型的知识图谱。其中,预设数据渠道可以包括数据主动收集渠道、用户主动提交渠道、相关部门提供渠道等,本实施例对此不作限制。通过至少两个预设数据渠道可以对同一用户或业务进行数据采集,获取候选数据。根据候选数据确定目标数据可以为对候选数据中的重复数据进行剔除,异常数据判定,缺失数据填充等,本实施例对此不作限制。根据单个数据类型的目标数据中实体和实体之间的关系,确定该数据类型的知识图谱,从而提高数据获取的广泛性和准确性,以提高知识图谱建立的准确性。步骤120、根据所述知识图谱和画像标签信息建立画像标签库;其中,所述画像标签信息包括画像标签等级和画像标签内容。其中,画像标签等级可以分为一级标签和单项标签,其中一级标签用于区分标签对应的标签类型,例如用户中的企业或个人。单项标签用于区分一级标签下数据的种类,例如对于企业,单项标签可以包括注册地址、注册资本等;对于个人,单项标签可以包括年龄、性别、月收入等。画像标签内容为画像标签对应的具体内容。可以通过人工定义标签与机器学习结合的方式建立画像标签库,并通过大数据技术对数据的广泛、快速、大量的数据积累,实现对画像标签库的动态更新。步骤130、响应于用户的标签查询请求查询所述画像标签库得到标签查询结果,以根据所述标签查询结果获取画像数据。其中,标签查询请求可以通过用户在指定平台中通过搜索等方式发出,平台可以为网站、应用程序(Application,APP)以及微信小程序等任何能提供标签查询服务的对象。根据标签查询请求对画像标签库进行查询,实现对不同与查询的标签对应的画像数据的高效、准确的检索。可选的,可以通过数据可视化技术,建立画像中心,通过分析统计画像数据的使用场景、使用频次等对标签查询结果对应的画像数据进行排行、图表展示,以提高标签查询体验。本实施例中,可选的,响应于用户的标签查询请求查询所述画像标签库得到标签查询结果,包括:响应于用户的标签查询请求获取标签查询内容;判断所述标签查询内容是否存在组合关系,若存在则根据所述组合关系查询所述画像标签库得到所述标签查询结果。其中,组合关系可以为预先设定的关系,例如性别标签内容为女性,工作标签内容为搬运工作,收入标签内容为年收入超过6万,年龄标签内容为大于65,若以上存在组合关系,则根据组合关系查询画像标签库得到标签查询结果,标签查询结果可以为风险等级的标签,例如上述组合内本文档来自技高网...

【技术保护点】
1.一种画像数据获取方法,其特征在于,包括:/n根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱;其中,所述数据类型包括用户数据和业务数据;/n根据所述知识图谱和画像标签信息建立画像标签库;其中,所述画像标签信息包括画像标签等级和画像标签内容;/n响应于用户的标签查询请求查询所述画像标签库得到标签查询结果,以根据所述标签查询结果获取画像数据。/n

【技术特征摘要】
1.一种画像数据获取方法,其特征在于,包括:
根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱;其中,所述数据类型包括用户数据和业务数据;
根据所述知识图谱和画像标签信息建立画像标签库;其中,所述画像标签信息包括画像标签等级和画像标签内容;
响应于用户的标签查询请求查询所述画像标签库得到标签查询结果,以根据所述标签查询结果获取画像数据。


2.根据权利要求1所述的方法,其特征在于,响应于用户的标签查询请求查询所述画像标签库得到标签查询结果,包括:
响应于用户的标签查询请求获取标签查询内容;
判断所述标签查询内容是否存在组合关系,若存在则根据所述组合关系查询所述画像标签库得到所述标签查询结果。


3.根据权利要求1所述的方法,其特征在于,在根据所述标签查询结果获取画像数据之后,还包括:
获取所述画像标签库中画像标签的查询频率;
根据所述查询频率确定所述画像标签库中是否存在冗余画像标签;
若存在,则根据所述冗余画像标签更新所述画像标签库。


4.根据权利要求3所述的方法,其特征在于,根据所述冗余画像标签更新所述画像标签库,包括:
判断所述冗余画像标签占所有画像标签的比例是否大于预设比例;
若是,则更新所述画像标签库。


5.根据权利要求1所述的方法,其特征在于,在确定该数据类型的知识图谱之前,还包括:
根据所述数据类型从至少两个预设数据渠道中获取候选数据;
根据所述候选数据确定目标数据;
相应的,则根据单个数据类型的数据中实体和实体之间的关系,确定该数据类型的知识图谱,包括:
根据单个数据类型的所述目标数据中实体和实体之间的关系,确定该数据类型的知识图谱。

...

【专利技术属性】
技术研发人员:蔡俊蒋祎
申请(专利权)人:好活昆山网络科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1