当前位置: 首页 > 专利查询>潍坊学院专利>正文

一种大数据平台的数据汇集方法及装置制造方法及图纸

技术编号:37628875 阅读:8 留言:0更新日期:2023-05-18 12:20
本发明专利技术涉及数据统计技术领域,公开了一种大数据平台的数据汇集方法及装置,所述方法包括查询产品的销售渠道,获取各销售渠道中的评论信息,对所述评论信息进行识别,得到内部评价信息;查询产品的推广渠道,获取推广渠道中的反馈信息,对所述反馈信息进行识别,得到外部评价信息;基于预设的关键词提取模型提取关键词;将所述关键词向预设的搜索引擎中发送,获取搜索引擎反馈的相关评价信息;本发明专利技术通过销售渠道中的评论数据确定内部评价数据,通过推广渠道中的反馈数据确定外部评价数据,对内部评价数据和外部评价数据进行关键词提取,根据提取到的关键词获取相关信息,全面且有序的获取了产品数据,极大地提高了工作人员的分析便捷性。便捷性。便捷性。

【技术实现步骤摘要】
一种大数据平台的数据汇集方法及装置


[0001]本专利技术涉及数据统计
,具体是一种大数据平台的数据汇集方法及装置。

技术介绍

[0002]市场营销分析,是指企业在规定时间内,对各个营销区域的各项销售工作进行的总结、分析、检讨及评估,并对下阶段的营销工作提出修正建议,对某些区域的营销策略进行局部调整,甚至对某些区域的销售目标予以重新制定。因此,市场营销分析工作,是企业营销管理工作中一项极其重要的主体内容。
[0003]在当今的大数据时代,营销数据的数据量极大,获取到的营销数据非常繁琐,分析过程较为困难,分析人员的分析压力极大,对分析人员的要求极高;如何全面的、有顺序的获取营销数据,降低工作人员的工作压力是本专利技术技术方案想要解决的技术问题。

技术实现思路

[0004]本专利技术的目的在于提供一种大数据平台的数据汇集方法及装置,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种大数据平台的数据汇集方法,所述方法包括:查询产品的销售渠道,获取各销售渠道中的评论信息,对所述评论信息进行识别,得到内部评价信息;查询产品的推广渠道,获取推广渠道中的反馈信息,对所述反馈信息进行识别,得到外部评价信息;统计内部评价信息和所述外部评价信息,基于预设的关键词提取模型提取所述内部评价信息和所述外部评价信息中的关键词;将所述关键词向预设的搜索引擎中发送,获取搜索引擎反馈的相关评价信息。
[0006]以下是本专利技术对上述技术方案的进一步优化:所述查询产品的销售渠道,获取各销售渠道中的评论信息,对所述评论信息进行识别,得到内部评价信息的步骤包括:查询产品的销售渠道,获取各销售渠道中的评论信息,并根据销售渠道对评论信息进行分类,得到以销售渠道为索引的评论信息库;根据评论信息的长度对所述评论信息库中的内容进行排序;所述排序基准为长度升序;依次选取评论信息作为基准信息,根据所述基准信息遍历对应的评论信息库,确定基准信息的出现频数;根据出现频数删除重复评论,得到待检评论信息;对待检评论信息进行识别,得到内部评价信息。
[0007]进一步优化:所述对待检评论信息进行识别,得到内部评价信息的步骤包括:
将所述待检评论信息输入训练好的比对模型,标记相同字词;计算相同字词的字词数,根据所述字词数计算两个待检评论信息的相关度;根据所述相关度对待检评论信息进行二次分类;统计二次分类结果,得到内部评价信息。
[0008]进一步优化:所述查询产品的推广渠道,获取推广渠道中的反馈信息,对所述反馈信息进行识别,得到外部评价信息的步骤包括:查询产品的推广渠道,获取推广渠道中的反馈信息,提取反馈信息中的文本内容,建立文本库;获取所述反馈信息的信息格式,当所述信息格式为视频时,将视频转换为音频和图像,输入音频库和图像库;对音频库和图像库进行文本转换,得到反馈文本,输入文本库;对文本库进行识别,得到外部评价信息。
[0009]进一步优化:所述对文本库进行识别,得到外部评价信息的步骤包括:根据预设的评价词库遍历所述文本库,在文本库中确定目标词;以目标词为中心,预设的数值为截取半径获取目标语段;统计所述目标语段,对所述目标语段进行重复性筛选,得到外部评价信息。
[0010]进一步优化:所述将所述关键词向预设的搜索引擎中发送,获取搜索引擎反馈的相关评价信息的步骤包括:将所述关键词向预设的搜索引擎中发送,接收搜索引擎反馈的词条信息;查询搜索引擎的词条陈列规则,基于所述词条陈列规则对词条信息进行筛选;其中,所述词条陈列规则用于表征词条信息的类型;统计筛选后的词条信息,建立词条信息与关键词所在的评价信息的连接,得到对应评价信息的相关评价信息。
[0011]本专利技术技术方案还提供了一种大数据平台的数据汇集装置,所述装置包括:销售信息分析模块,用于查询产品的销售渠道,获取各销售渠道中的评论信息,对所述评论信息进行识别,得到内部评价信息;推广信息分析模块,用于查询产品的推广渠道,获取推广渠道中的反馈信息,对所述反馈信息进行识别,得到外部评价信息;关键词提取模块,用于统计内部评价信息和所述外部评价信息,基于预设的关键词提取模型提取所述内部评价信息和所述外部评价信息中的关键词;相关信息获取模块,用于将所述关键词向预设的搜索引擎中发送,获取搜索引擎反馈的相关评价信息。
[0012]进一步优化:所述销售信息分析模块包括:评论信息分类单元,用于查询产品的销售渠道,获取各销售渠道中的评论信息,并根据销售渠道对评论信息进行分类,得到以销售渠道为索引的评论信息库;内容排序单元,用于根据评论信息的长度对所述评论信息库中的内容进行排序;所述排序基准为长度升序;频数确定单元,用于依次选取评论信息作为基准信息,根据所述基准信息遍历对应的评论信息库,确定基准信息的出现频数;
重复判定单元,用于根据出现频数删除重复评论,得到待检评论信息;第一识别执行单元,用于对待检评论信息进行识别,得到内部评价信息。
[0013]进一步优化:所述推广信息分析模块包括:文本库建立单元,用于查询产品的推广渠道,获取推广渠道中的反馈信息,提取反馈信息中的文本内容,建立文本库;格式转换单元,用于获取所述反馈信息的信息格式,当所述信息格式为视频时,将视频转换为音频和图像,输入音频库和图像库;文本提取单元,用于对音频库和图像库进行文本转换,得到反馈文本,输入文本库;第二识别执行单元,用于对文本库进行识别,得到外部评价信息。
[0014]进一步优化:所述相关信息获取模块包括:词条信息接收单元,用于将所述关键词向预设的搜索引擎中发送,接收搜索引擎反馈的词条信息;词条信息筛选单元,用于查询搜索引擎的词条陈列规则,基于所述词条陈列规则对词条信息进行筛选;其中,所述词条陈列规则用于表征词条信息的类型;信息统计单元,用于统计筛选后的词条信息,建立词条信息与关键词所在的评价信息的连接,得到对应评价信息的相关评价信息。
[0015]与现有技术相比,本专利技术的有益效果是:本专利技术通过销售渠道中的评论数据确定内部评价数据,通过推广渠道中的反馈数据确定外部评价数据,对内部评价数据和外部评价数据进行关键词提取,根据提取到的关键词获取相关信息,全面且有序的获取了产品数据,极大地提高了工作人员的分析便捷性。
附图说明
[0016]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例。
[0017]图1为大数据平台的数据汇集方法的流程框图。
[0018]图2为大数据平台的数据汇集方法的第一子流程框图。
[0019]图3为大数据平台的数据汇集方法的第二子流程框图。
[0020]图4为大数据平台的数据汇集方法的第三子流程框图。
[0021]图5为大数据平台的数据汇集装置的组成结构框图。
具体实施方式
[0022] 为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大数据平台的数据汇集方法,其特征在于,所述方法包括:查询产品的销售渠道,获取各销售渠道中的评论信息,对所述评论信息进行识别,得到内部评价信息;查询产品的推广渠道,获取推广渠道中的反馈信息,对所述反馈信息进行识别,得到外部评价信息;统计内部评价信息和所述外部评价信息,基于预设的关键词提取模型提取所述内部评价信息和所述外部评价信息中的关键词;将所述关键词向预设的搜索引擎中发送,获取搜索引擎反馈的相关评价信息。2.根据权利要求1所述的大数据平台的数据汇集方法,其特征在于,所述查询产品的销售渠道,获取各销售渠道中的评论信息,对所述评论信息进行识别,得到内部评价信息的步骤包括:查询产品的销售渠道,获取各销售渠道中的评论信息,并根据销售渠道对评论信息进行分类,得到以销售渠道为索引的评论信息库;根据评论信息的长度对所述评论信息库中的内容进行排序;所述排序基准为长度升序;依次选取评论信息作为基准信息,根据所述基准信息遍历对应的评论信息库,确定基准信息的出现频数;根据出现频数删除重复评论,得到待检评论信息;对待检评论信息进行识别,得到内部评价信息。3.根据权利要求2所述的大数据平台的数据汇集方法,其特征在于,所述对待检评论信息进行识别,得到内部评价信息的步骤包括:将所述待检评论信息输入训练好的比对模型,标记相同字词;计算相同字词的字词数,根据所述字词数计算两个待检评论信息的相关度;根据所述相关度对待检评论信息进行二次分类;统计二次分类结果,得到内部评价信息。4.根据权利要求1所述的大数据平台的数据汇集方法,其特征在于,所述查询产品的推广渠道,获取推广渠道中的反馈信息,对所述反馈信息进行识别,得到外部评价信息的步骤包括:查询产品的推广渠道,获取推广渠道中的反馈信息,提取反馈信息中的文本内容,建立文本库;获取所述反馈信息的信息格式,当所述信息格式为视频时,将视频转换为音频和图像,输入音频库和图像库;对音频库和图像库进行文本转换,得到反馈文本,输入文本库;对文本库进行识别,得到外部评价信息。5.根据权利要求4所述的大数据平台的数据汇集方法,其特征在于,所述对文本库进行识别,得到外部评价信息的步骤包括:根据预设的评价词库遍历所述文本库,在文本库中确定目标词;以目标词为中心,预设的数值为截取半径获取目标语段;统计所述目标语段,对所述目标语段进行重复性筛选,得到外部评价信息。
6.根据权利要求1所述的大数据平台的数据汇集方法,其特征在于,所述将所述关键词向预设的搜索引擎中发送,获取搜索引擎反馈的相关评价信息的步骤包括:将所述关键词向预设的搜索引擎中发送,接...

【专利技术属性】
技术研发人员:史智臣王军华侯金奎陈少纯
申请(专利权)人:潍坊学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1