【技术实现步骤摘要】
一种大数据信息热度分析方法及系统
[0001]本专利技术涉及数据分析
,具体是一种大数据信息热度分析方法及系统。
技术介绍
[0002]在当今社会,网络媒体逐渐成为了大部分人获取信息的主要途径,因此,出现了很多资讯类软件。这些资讯类软件中大都会具备文件上传功能,也会实时的推送一些热度数据,用以获取流量;但是,文件推送过程是需要消耗推广资源的,比如,C位只有一个,在接收到新的文件时,如何判断它的推广资源,就需要借助热度分析,现有的技术方案中,大都是根据不同账户来确定推广资源,粉丝量多的账户,推广资源就多,粉丝量少的账户,推广资源就少,可以想到,这么做的结果是很容易漏掉一些原创的高流量内容。
技术实现思路
[0003]本专利技术的目的在于提供一种大数据信息热度分析方法及系统,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种大数据信息热度分析方法,所述方法包括:实时获取传播文件的传播指数,将所述传播指数与预设的至少一个指数阈值进行比对,当所述传播指数达到所 ...
【技术保护点】
【技术特征摘要】
1.一种大数据信息热度分析方法,其特征在于,所述方法包括:实时获取传播文件的传播指数,将所述传播指数与预设的至少一个指数阈值进行比对,当所述传播指数达到所述指数阈值时,将所述传播文件拷贝至参考文件库;其中,每一个参考文件库与一个指数阈值对应;接收用户发送的上传文件,根据指数阈值的降序读取相应的参考文件库,根据所述参考文件库确定所述上传文件的预测热度;根据所述预测热度分配推广资源,并实时监测该文件的实际热度,根据所述实际热度与所述预测热度修正推广资源;其中,所述推广资源包括推送范围和推送频率。2.根据权利要求1所述的大数据信息热度分析方法,其特征在于,所述实时获取传播文件的传播指数的步骤包括:获取传播文件的操作记录,根据预设的转换公式将所述操作记录转换为等价浏览数;所述操作记录至少包括含有数量的点赞操作、收藏操作、下载操作和分享操作;获取传播文件的实际浏览数,根据所述实际浏览数和所述等价浏览数计算传播指数;其中,所述传播指数为时间的减函数。3.根据权利要求1所述的大数据信息热度分析方法,其特征在于,所述接收用户发送的上传文件,根据指数阈值的降序读取相应的参考文件库,根据所述参考文件库确定所述上传文件的预测热度的步骤包括:接收用户发送的上传文件,根据指数阈值的降序读取相应的参考文件库;遍历所述参考文件库,比对所述上传文件与所述参考文件库中的参考文件,得到相似度;根据所述相似度生成相似度数组,对所述相似度数组进行特征分析,根据特征分析结果查询相应的指数阈值;根据所述指数阈值确定预测热度。4.根据权利要求3所述的大数据信息热度分析方法,其特征在于,所述遍历所述参考文件库,比对所述上传文件与所述参考文件库中的参考文件,得到相似度的步骤包括:依次读取所述参考文件库中的参考文件,将所述参考文件转换为参考图像和参考文本;将所述上传文件转换待检图像和待检文本,将所述待检文本和所述参考文本进行比对,得到文本相似度;当所述文本相似度达到预设的相似度阈值时,将所述文本相似度作为该参考文件的相似度;当所述文本相似度未达到预设的相似度阈值时,以所述待检图像为单位遍历所述参考图像,得到图像相似度,根据所述图像相似度和所述文本相似度计算参考文件的相似度。5.根据权利要求4所述的大数据信息热度分析方法,其特征在于,将所述参考文件或所述上传文件转换为参考图像和参考文本的步骤包括:获取文件后缀名,根据所述文件后缀名确定文件类型;当文件为音频文件时,对所述音频文件进行内容识别,得到参考文本;当文件为视频文件时,将所述视频文件转换为音频文件和图像组;
剔除所述图像组中的重复图像,连接剩余图像,得到与视频文件为映射关系的参考图像。6.根据权利要求5所述的大数据信息热度分析方法,...
【专利技术属性】
技术研发人员:廖继勇,
申请(专利权)人:安徽电信规划设计有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。