【技术实现步骤摘要】
数据源的确定方法、装置、服务器和存储介质
本专利技术涉及数据处理
,尤其涉及一种数据源的确定方法、装置、服务器和存储介质。
技术介绍
在进行业务分析时,通常需要对业务数据进行统计运算并以报表的形式展示给用户。在生成报表时,需要为报表中的各项指标定义数据源。然而,由于企业大部分业务报表所需的数据往往来自于不同的系统和/或不同领域,数据存在结构化、半结构化和非结构化等多种类型,以及所面对的数据消费场景不同时,同一数据在报表中的描述方式也往往是不相同的等原因,使得生成报表时需要面对较复杂的取数环境。现有技术在报表建模时,会通过专业人员手工定义报表中各项指标的数据源。然而,人工定义数据源的方式数据源定义过程需要花费很多的工作量,使得报表生成需要花费较多的时间。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据源的确定方法、装置、服务器和存储介质,以提高定义数据源的效率,减少生成报表所花费的时间。第一方面,本专利技术实施例提供了一种数据源的确定方法,包括:获取业务报表中需要 ...
【技术保护点】
1.一种数据源的确定方法,其特征在于,包括:/n获取业务报表中需要定义数据源的目标指标的属性信息;/n根据所述属性信息确定所述目标指标的相似指标;/n将所述相似指标发送给目标用户端,以使所述目标用户端基于所述相似指标的相似数据源定义所述目标指标的目标数据源。/n
【技术特征摘要】
1.一种数据源的确定方法,其特征在于,包括:
获取业务报表中需要定义数据源的目标指标的属性信息;
根据所述属性信息确定所述目标指标的相似指标;
将所述相似指标发送给目标用户端,以使所述目标用户端基于所述相似指标的相似数据源定义所述目标指标的目标数据源。
2.根据权利要求1所述的方法,其特征在于,所述根据所述属性信息确定所述目标指标的相似指标,包括:
根据所述属性信息生成所述目标指标的目标特征向量;
依据所述目标特征向量以及指标库中各待选指标的待选特征向量对所述目标指标以及各所述待选指标进行聚类运算,确定所述目标指标所属的目标类;
按照与所述目标指标之间的相似度由大到小的顺序自所述目标类中获取设定数量的待选指标,作为所述目标指标的相似指标。
3.根据权利要求2所述的方法,其特征在于,所述属性信息包括目标指标名称信息、报表名称信息以及关联指标名称信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述属性信息生成所述目标指标的目标特征向量,包括:
针对所述属性信息中的每一项名称信息,依据所述业务报表所属业务领域的领域词库对所述名称信息进行分词处理,并根据分词得到的每个词语的词性确定所述名称信息对应的分特征向量;
将各所述分特征向量组合为一个总特征向量,作为所述目标指标的目标特征向量。
5.根据权利要求1-4任一所述的方法,其特征在于,在所述将所述相似指标发送给目标用户端之后,还包括:
针对监测到目标用户端未采用所述相似数据源作为目标数据源的情况,获取定义目标数据源...
【专利技术属性】
技术研发人员:王继业,杨志,程志华,王宏刚,刘识,任征东,李贤慧,彭放,张海峰,
申请(专利权)人:国家电网有限公司大数据中心,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。