一种业务对象的数据抽取方法及装置制造方法及图纸

技术编号:15822647 阅读:29 留言:0更新日期:2017-07-15 04:52
本申请公开一种业务对象的数据抽取方法及装置,该方法包括:接收变量表达式,所述变量表达式是针对业务对象中需要进行抽取的属性名称的表达;根据变量表达式建立变量表达式树,所述变量表达式树中的每个节点对应所述需要进行抽取的属性名称;当接收到所述业务对象的源数据后,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值。上述方法及装置用于提供一种可以按需抽取数据的方法。

【技术实现步骤摘要】
一种业务对象的数据抽取方法及装置
本申请涉及计算机
,尤其涉及一种业务对象的数据抽取方法及装置。
技术介绍
随着大数据时代的到来,数据分析,数据挖掘等课题得到了越来越多的关注,但无论哪个课题,都需要先从业务对象中进行数据抽取,有了抽取到的数据才能够进行分析、挖掘等。数据抽取就是从业务对象源数据中抽取属性名称对应的属性值的过程,比如,想要分析某个业务对象(用户)的兴趣,就需要抽取该用户中包含的个人资料、历史行为等数据。现有技术,实现对业务对象源数据进行抽取的方法可以先对源数据进行json(JavaScriptObjectNotation)格式化,再获取格式化后的数据。json是一种轻量级的数据交换格式,并且采用了类似于C语言(包括C、C++、C#、Java、JavaScript、Perl、Python等)家族的一些习惯,所以易于程序解析和生成。比如,应用程序A内有业务对象源数据,如果应用程序B需要这些源数据,就可以先用json化工具对业务对象源数据进行json格式化,再获取格式化后的数据,从而达到抽取的目的。然而,现有技术在抽取过程中会将一个业务对象中包含的源数据全部进行json本文档来自技高网...
一种业务对象的数据抽取方法及装置

【技术保护点】
一种业务对象的数据抽取方法,其特征在于,包括:接收变量表达式,所述变量表达式是针对业务对象中需要进行抽取的属性名称的表达;根据变量表达式建立变量表达式树,所述变量表达式树中的每个节点对应所述需要进行抽取的属性名称;当接收到所述业务对象的源数据后,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值。

【技术特征摘要】
1.一种业务对象的数据抽取方法,其特征在于,包括:接收变量表达式,所述变量表达式是针对业务对象中需要进行抽取的属性名称的表达;根据变量表达式建立变量表达式树,所述变量表达式树中的每个节点对应所述需要进行抽取的属性名称;当接收到所述业务对象的源数据后,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值。2.如权利要求1所述的方法,其特征在于,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值,包括:当需要抽取的属性名称对应的节点在所述变量表达式树中为叶子节点时,抽取所述叶子节点对应的属性名称的属性值。3.如权利要求1所述的方法,其特征在于,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值,包括:当需要抽取的属性名称对应的节点在所述变量表达式树中为包含数据集合的叶子节点,建立叶子节点数据表;抽取所述叶子节点对应的属性名称的所有属性值;将所述所有属性值中的每一个存入所述叶子节点数据表中。4.如权利要求1所述的方法,其特征在于,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值,包括:当需要抽取的属性名称对应的节点在所述变量表达式树中为中间节点时,查找所述中间节点下的子节点;调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述子节点对应的属性名称的属性值。5.如权利要求1所述的方法,其特征在于,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值,包括:当需要抽取的属性名称对应的节点在所述变量表达式树中为包含数据集合的中间节点时,建立中间节点数据表;抽取所述中间节点对应的属性名称的所有属性值;查找所述中间节点下的子节点,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述子节点对应的属性名称的属性值;将所述所有属性值以及所述子节点对应的属性名称的属性值,按照对应关系存入所述中间节点数据表中。6.如权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:方波周家英郑高超
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1