基于多数据源生成图表的方法、系统、设备及存储介质技术方案

技术编号：29054836 阅读：21 留言：0更新日期：2021-06-26 06:24

本发明专利技术提供了基于多数据源生成图表的方法、系统、设备及存储介质，该方法包括：数据采集，接收第一文本信息集合或非文本信息集合；将非文本信息集合转化为第二文本信息；将第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库；对第三文本信息集合根据文本分析，添加标签，标签至少包括观点类标签和情感类标签；基于标签进行聚合计算；响应查询维度集合采集展示数据，并匹配对应的预设数据图表模板；以及将展示数据导入预设数据图表模板，生成展示图表。本发明专利技术能够对各类型的数据源进行信息提取和聚类计算，最后通过智能图表的方式呈现，加强了大数据的兼容性，提高了数据统计的准确性。提高了数据统计的准确性。提高了数据统计的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于多数据源生成图表的方法、系统、设备及存储介质

[0001]本专利技术涉及多数据源的信息整合领域，具体地说，涉及基于多数据源生成图表的方法、系统、设备及存储介质。

技术介绍

[0002]信息化是当今时代发展的大趋势，代表着先进的生产力，计算机的诞生推动了一次“信息革命”，而随着计算机软硬件的发展，人类可能会爆发第二次第三次“信息革命”；而在信息化的背后，离不开的就是数据，古人结绳记事是数据，而现在不管你做什么，无时无刻都在生产数据，上班乘坐交通、打卡、使用手机或电脑，在这个信息爆炸的时代，怎么使用数据，就成为关键。
[0003]用户对平台的反馈不再仅限于文本，很多用户习惯于使用语音、图片(表情包)等来回复，这加大了数据聚类、合并的难度，难以准确评价客服的服务表现。
[0004]因此，本专利技术提供了一种基于多数据源生成图表的方法、系统、设备及存储介质。

技术实现思路

[0005]针对现有技术中的问题，本专利技术的目的在于提供基于多数据源生成图表的方法、系统、设备及存储介质，克服了现有技术的困难，能够对各类型的数据源进行信息提取和聚类计算，最后通过智能图表的方式呈现，加强了大数据的兼容性，提高了数据统计的准确性。
[0006]本专利技术的实施例提供一种基于多数据源生成图表的方法，包括以下步骤：
[0007]S110、数据采集，接收第一文本信息集合或非文本信息集合；
[0008]S120、将所述非文本信息集合转化为第二文本信息；
[0009]S130、将所...

【技术保护点】

【技术特征摘要】
1.一种基于多数据源生成图表的方法，其特征在于，包括以下步骤：S110、数据采集，接收第一文本信息集合或非文本信息集合；S120、将所述非文本信息集合转化为第二文本信息；S130、将所述第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库；S140、对所述第三文本信息集合根据文本分析，添加标签，所述标签至少包括观点类标签和情感类标签；S150、基于所述标签进行聚合计算；S160、响应查询维度集合采集展示数据，并匹配对应的预设数据图表模板；以及S170、将所述展示数据导入所述预设数据图表模板，生成展示图表。2.根据权利要求1所述的基于多数据源生成图表的方法，其特征在于：所述步骤S110中，包括通过数据直连或者数据代理接收第一文本信息集合或非文本信息集合。3.根据权利要求2所述的基于多数据源生成图表的方法，其特征在于：所述步骤S110中，包括通过SAAS端口接收第一文本信息集合或非文本信息集合，并同步到所述数据仓库；或者，通过数据适配器接收第一文本信息集合或非文本信息集合。4.根据权利要求1所述的基于多数据源生成图表的方法，其特征在于：所述步骤S120中，所述非文本信息集合包括图片信息和音频信息，通过ORC图文识别自所述图片信息中获取第四文本信息，通过语音识别自所述音频信息获取第五文本信息，合并所述第四文本信息和第五文本信息为第二文本信息。5.根据权利要求1所述的基于多数据源生成图表的方法，其特征在于：所述步骤S150中，通过分析所述第三文本信息集合的标签，获得所述第三文本信息中包含的维度信息和度量信息，根据所述维度信息和度量信息进行聚合计算。6.根据权利要求5所述的基于多数据源生成图表的...

【专利技术属性】
技术研发人员：王长春，陈丹，陈旭伟，郭春雷，
申请(专利权)人：上海华客信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人