一种智能报表的数据处理方法、装置及存储介质制造方法及图纸

技术编号:20745344 阅读:47 留言:0更新日期:2019-04-03 10:25
本发明专利技术公开了一种智能报表的数据处理方法、装置及存储介质,所述方法包括:根据报表模板,设置取数范围及参数;根据所述取数范围及所述参数,采用分布式引擎和自然处理技术进行数据搜索,采用余弦相似度算法和个性化推荐算法,将搜索的数据按多维度进行匹配度综合运算,并根据数据的切合度从高到低推荐到初始报表;对所述初始报表的数据进行二次处理,以筛除辨识度相近或辨识度低的数据,得到目标报表。本发明专利技术能够提高报表数据的辨识度,快速定位用户所需资源,从而提高用户的工作效率和效能。

【技术实现步骤摘要】
一种智能报表的数据处理方法、装置及存储介质
本专利技术涉及智能报表
,尤其涉及一种智能报表的数据处理方法、装置及存储介质。
技术介绍
目前在政府单位,有大量的Excel报表数据来自各预算单位或部门,由于缺乏规范性及结构化的支撑,在这些报表中进行数据提取需要做大量的人工识别,导致人力及物力资源的浪费。而当前市场主流报表大多数都是基于结构化数据,进行统计分析查询,并不能有效解决上述问题。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种智能报表的数据处理方法、装置及存储介质,能够提高报表数据的辨识度,快速定位用户所需资源,从而提高用户的工作效率和效能。。为解决上述问题,本专利技术的一个实施例提供的一种智能报表的数据处理方法,包括:根据报表模板,设置取数范围及参数;根据所述取数范围及所述参数,采用分布式引擎和自然处理技术进行数据搜索;采用余弦相似度算法和个性化推荐算法,将搜索的数据按多维度进行匹配度综合运算,并根据数据的切合度从高到低推荐到初始报表;对所述初始报表的数据进行二次处理,以筛除辨识度相近或辨识度低的数据,得到目标报表。进一步地,所述二次处理,指通过人工干预方式对本文档来自技高网...

【技术保护点】
1.一种智能报表的数据处理方法,其特征在于,包括:根据报表模板,设置取数范围及参数;根据所述取数范围及所述参数,采用分布式引擎和自然处理技术进行数据搜索;采用余弦相似度算法和个性化推荐算法,将搜索的数据按多维度进行匹配度综合运算,并根据数据的切合度从高到低推荐到初始报表;对所述初始报表的数据进行二次处理,以筛除辨识度相近或辨识度低的数据,得到目标报表。

【技术特征摘要】
1.一种智能报表的数据处理方法,其特征在于,包括:根据报表模板,设置取数范围及参数;根据所述取数范围及所述参数,采用分布式引擎和自然处理技术进行数据搜索;采用余弦相似度算法和个性化推荐算法,将搜索的数据按多维度进行匹配度综合运算,并根据数据的切合度从高到低推荐到初始报表;对所述初始报表的数据进行二次处理,以筛除辨识度相近或辨识度低的数据,得到目标报表。2.根据权利要求1所述的智能报表的数据处理方法,其特征在于,所述二次处理,指通过人工干预方式对标识度相近或辨识度低的数据进行筛选。3.根据权利要求1所述的智能报表的数据处理方法,其特征在于,在所述得到目标报表之后,还包括:自动将所述目标报表存储于大数据仓库。4.根据权利要求1所述的智能报表的数据处理方法,其特征在于,在所述根据报表模板,设置取数范围及参数之前,还包括:获取用户的需求数据,并根据所述需求数据生成报表模板。5.根据权利要求4所述的智能报表的数据处理方法,其特征在于,在所述获取用户的需求数据,并根据所述需求数据生成报表模板之前,还包括:采集原始数据,并对所述原始数据进行预处理,得到结构化原始数据;根据所述结构化原始数据的结构进行语义提取,得到数据特征值;根据所述数据特征值,进行不同维度的数据拆解,得到特征值数据项;根据所...

【专利技术属性】
技术研发人员:韦天瀚廖涛黄震廷吴桂兵张文静
申请(专利权)人:广东港鑫科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1