社交信息分析方法、装置、终端设备及存储介质制造方法及图纸

技术编号:22847750 阅读:26 留言:0更新日期:2019-12-17 23:02
本发明专利技术提出了一种社交信息分析方法、装置、终端设备及存储介质。包括:获取用户社交网站浏览记录以及网络上社交网站中不同兴趣论坛的名称,建立比重值算法,通过比重值算法计算用户社交网站浏览记录中各个兴趣论坛名称的比重值,并根据比重值确定用户的偏好兴趣论坛,获取网络上社交网站中同一兴趣论坛中不同版块的名称,获取用户兴趣论坛中的各个兴趣词的词频,建立信息熵算法,根据用户兴趣论坛中的各个兴趣词的词频计算信息熵,根据该信息熵确定用户的兴趣,并对用户推送对应的资讯,本发明专利技术通过比重值算法先确定用户的兴趣论坛,先缩小用户的兴趣范围,然后通过信息熵算法精确对用户的兴趣进行锁定,节省了时间,大大提高了工作效率。

Social information analysis methods, devices, terminal devices and storage media

【技术实现步骤摘要】
社交信息分析方法、装置、终端设备及存储介质
本专利技术涉及社交信息领域,尤其涉及一种社交信息分析方法、装置、终端设备及存储介质。
技术介绍
现代的社会是一个高速发展的社会,科技信息的发展越来越发达,信息与信息之间的传递也越来越快捷、方便,在人工智能引领时代发展的阶段,各行各业都需要通过不同的领域对用户的需求进行分析,用来对自身的产品做进一步推广,特别是对于社交媒体,社交媒体中往往存在大量的用户数据,用户的兴趣论坛往往可以提现一个用户的喜好与需求,现有的社交媒体都是根据用户的兴趣论坛来推送相关的资讯,因为兴趣论坛中包含的兴趣有很多,所以推送的资讯往往范围过大,用户从中查找自己需要的东西往往要耗费大量的时间,所以,如何对用户的社交信息进行分析,确定用户的兴趣论坛以及兴趣,精确的对用户推送资讯,成为各社交媒体平台亟待解决的问题。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
有鉴于此,本专利技术提出了一种社交信息分析方法、装置、终端设备及存储介质,旨在解决现有技术无法确定用户的兴趣论坛以及兴趣,精确的对用户推送资讯的技术问题。本专利技术的技术方案是这样实现的:一方面,本专利技术提供了一种社交信息分析方法,所述社交信息分析方法包括以下步骤:S1,获取用户社交网站浏览记录以及网络上社交网站中不同兴趣论坛的名称,所述社交网站中不同兴趣论坛的名称包括:生活、购物、娱乐以及游戏,根据网络上不同的兴趣论坛名称对用户社交网站浏览记录中出现的兴趣论坛名称进行标记,获取用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率;S2,建立比重值算法,通过比重值算法,根据用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率计算该用户社交网站浏览记录中对应的各个兴趣论坛名称的比重值,根据用户社交网站浏览记录中各个兴趣论坛名称的比重值的大小确定用户的偏好兴趣论坛;S3,获取网络上社交网站中同一兴趣论坛中不同版块的名称,将社交网站中同一兴趣论坛中不同版块的名称作为兴趣词,所述社交网站中同一论坛中不同版块的名称包括:房产、音乐、八卦以及财经,获取用户兴趣论坛中的评论信息主题,根据网络上同一兴趣论坛中各个兴趣词对用户兴趣论坛中的评论信息主题中出现的兴趣词进行标记,获取用户兴趣论坛中的评论信息主题中已标记的各个兴趣词的词频;S4,设定预设信息熵,建立信息熵算法,通过信息熵算法,根据用户兴趣论坛中的评论信息主题中各个兴趣词的词频计算评论信息主题中出现的各个兴趣词的信息熵,将用户评论信息主题中出现的各个兴趣词的信息熵与预设信息熵进行比较,根据比较结果确定用户的兴趣,并对用户推送对应的资讯。在以上技术方案的基础上,优选的,还包括以下步骤,设定预设时间,获取用户社交网站浏览记录、用户社交网站浏览记录对应的时间以及网络上社交网站中不同兴趣论坛的名称,所述社交网站中不同兴趣论坛的名称包括:生活、购物、娱乐以及游戏,将用户社交网站浏览记录对应的时间与预设时间进行比较,当用户社交网站浏览记录对应的时间大于预设时间时,根据网络上不同的兴趣论坛名称对用户社交网站浏览记录中出现的兴趣论坛名称进行标记,获取用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率;当用户社交网站浏览记录对应的时间小于预设时间时,将该时间对应的用户社交网站浏览记录删除。在以上技术方案的基础上,优选的,还包括以下步骤,建立比重值算法,通过比重值算法,根据用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率计算该用户社交网站浏览记录中对应的各个兴趣论坛名称的比重值,将各个兴趣论坛名称的比重值两两进行比较,筛选出最大比重值对应的兴趣论坛名称,并将该兴趣论坛名称确定为用户的偏好兴趣论坛。在以上技术方案的基础上,优选的,比重值算法为:其中,p代表用户社交网站浏览记录中各个兴趣论坛名称的比重值,ni代表用户社交网站浏览记录中各个兴趣论坛名称出现频率,Σni代表代表用户社交网站浏览记录中所有兴趣论坛名称出现总频率,i代表用户社交网站浏览记录中各个兴趣论坛名称的个数。在以上技术方案的基础上,优选的,还包括以下步骤,获取网络社交网站不同的评论文本信息中的评论无效词以及网络上同一兴趣论坛中各个兴趣词,所述评论无效词包括:转发动态、已关注以及加一,根据网络无效词建立无效词查找表,获取用户兴趣论坛对应的评论文本信息,根据无效词查找表对该兴趣论坛对应的评论文本信息进行查找,当该兴趣论坛对应的评论文本信息中存在无效词查找表中的无效词时,删除该兴趣论坛对应的评论文本信息;当该兴趣论坛对应的评论文本信息中不存在无效词查找表中的无效词时,获取用户兴趣论坛中的评论信息主题,根据网络上同一兴趣论坛中各个兴趣词对用户兴趣论坛中的评论信息主题中出现的兴趣词进行标记,获取用户兴趣论坛中的评论信息主题中已标记的各个兴趣词的词频。在以上技术方案的基础上,优选的,还包括以下步骤,设定预设信息熵,建立信息熵算法,通过信息熵算法,根据用户兴趣论坛中的评论信息主题中各个兴趣词的词频计算评论信息主题中出现的各个兴趣词的信息熵,将用户评论信息主题中出现的兴趣词的信息熵与预设信息熵进行比较,当用户评论信息主题中出现的兴趣词的信息熵大于预设信息熵时,将该用户评论信息主题中出现的兴趣词作为用户的兴趣偏好,并推送对应的资讯;当用户评论信息主题中出现的兴趣词的信息熵小于预设信息熵时,将该用户评论信息主题中出现的兴趣词删除。在以上技术方案的基础上,优选的,信息熵算法为:其中,H(U)代表用户评论信息主题中出现的各个兴趣词的信息熵,p代表用户兴趣论坛中的评论信息主题中各个兴趣词的词频,n代表用户评论信息主题中出现的兴趣词的总数。更进一步优选的,所述社交信息分析装置包括:第一获取模块,用于获取用户社交网站浏览记录以及网络上社交网站中不同兴趣论坛的名称,所述社交网站中不同兴趣论坛的名称包括:生活、购物、娱乐以及游戏,根据网络上不同的兴趣论坛名称对用户社交网站浏览记录中出现的兴趣论坛名称进行标记,获取用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率;确定模块,用于建立比重值算法,通过比重值算法,根据用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率计算该用户社交网站浏览记录中对应的各个兴趣论坛名称的比重值,根据用户社交网站浏览记录中各个兴趣论坛名称的比重值的大小确定用户的偏好兴趣论坛;第二获取模块,用于获取网络上社交网站中同一兴趣论坛中不同版块的名称,将社交网站中同一兴趣论坛中不同版块的名称作为兴趣词,所述社交网站中同一论坛中不同版块的名称包括:房产、音乐、八卦以及财经,获取用户兴趣论坛中的评论信息主题,根据网络上同一兴趣论坛中各个兴趣词对用户兴趣论坛中的评论信息主题中出现的兴趣词进行标记,获取用户兴趣论坛中的评论信息主题中已标记的各个兴趣词的词频;推送模块,用于建立信息熵算法,通过信息熵算法,根据用户兴趣论坛中的评论信息主题中各个兴趣词的词频计算评论信息主题中出现的各个本文档来自技高网...

【技术保护点】
1.一种社交信息分析方法,其特征在于:/nS1,获取用户社交网站浏览记录以及网络上社交网站中不同兴趣论坛的名称,所述社交网站中不同兴趣论坛的名称包括:生活、购物、娱乐以及游戏,根据网络上不同的兴趣论坛名称对用户社交网站浏览记录中出现的兴趣论坛名称进行标记,获取用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率;/nS2,建立比重值算法,通过比重值算法,根据用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率计算该用户社交网站浏览记录中对应的各个兴趣论坛名称的比重值,根据用户社交网站浏览记录中各个兴趣论坛名称的比重值的大小确定用户的偏好兴趣论坛;/nS3,获取网络上社交网站中同一兴趣论坛中不同版块的名称,将社交网站中同一兴趣论坛中不同版块的名称作为兴趣词,所述社交网站中同一论坛中不同版块的名称包括:房产、音乐、八卦以及财经,获取用户兴趣论坛中的评论信息主题,根据网络上同一兴趣论坛中各个兴趣词对用户兴趣论坛中的评论信息主题中出现的兴趣词进行标记,获取用户兴趣论坛中的评论信息主题中已标记的各个兴趣词的词频;/nS4,设定预设信息熵,建立信息熵算法,通过信息熵算法,根据用户兴趣论坛中的评论信息主题中各个兴趣词的词频计算评论信息主题中出现的各个兴趣词的信息熵,将用户评论信息主题中出现的各个兴趣词的信息熵与预设信息熵进行比较,根据比较结果确定用户的兴趣,并对用户推送对应的资讯。/n...

【技术特征摘要】
1.一种社交信息分析方法,其特征在于:
S1,获取用户社交网站浏览记录以及网络上社交网站中不同兴趣论坛的名称,所述社交网站中不同兴趣论坛的名称包括:生活、购物、娱乐以及游戏,根据网络上不同的兴趣论坛名称对用户社交网站浏览记录中出现的兴趣论坛名称进行标记,获取用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率;
S2,建立比重值算法,通过比重值算法,根据用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率计算该用户社交网站浏览记录中对应的各个兴趣论坛名称的比重值,根据用户社交网站浏览记录中各个兴趣论坛名称的比重值的大小确定用户的偏好兴趣论坛;
S3,获取网络上社交网站中同一兴趣论坛中不同版块的名称,将社交网站中同一兴趣论坛中不同版块的名称作为兴趣词,所述社交网站中同一论坛中不同版块的名称包括:房产、音乐、八卦以及财经,获取用户兴趣论坛中的评论信息主题,根据网络上同一兴趣论坛中各个兴趣词对用户兴趣论坛中的评论信息主题中出现的兴趣词进行标记,获取用户兴趣论坛中的评论信息主题中已标记的各个兴趣词的词频;
S4,设定预设信息熵,建立信息熵算法,通过信息熵算法,根据用户兴趣论坛中的评论信息主题中各个兴趣词的词频计算评论信息主题中出现的各个兴趣词的信息熵,将用户评论信息主题中出现的各个兴趣词的信息熵与预设信息熵进行比较,根据比较结果确定用户的兴趣,并对用户推送对应的资讯。


2.如权利要求1所述的社交信息分析方法,其特征在于:步骤S1中,还包括以下步骤,设定预设时间,获取用户社交网站浏览记录、用户社交网站浏览记录对应的时间以及网络上社交网站中不同兴趣论坛的名称,所述社交网站中不同兴趣论坛的名称包括:生活、购物、娱乐以及游戏,将用户社交网站浏览记录对应的时间与预设时间进行比较,当用户社交网站浏览记录对应的时间大于预设时间时,根据网络上不同的兴趣论坛名称对用户社交网站浏览记录中出现的兴趣论坛名称进行标记,获取用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率;当用户社交网站浏览记录对应的时间小于预设时间时,将该时间对应的用户社交网站浏览记录删除。


3.如权利要求1所述的社交信息分析方法,其特征在于:步骤S2中,还包括以下步骤,建立比重值算法,通过比重值算法,根据用户社交网站浏览记录中已标记的各个兴趣论坛名称的出现频率计算该用户社交网站浏览记录中对应的各个兴趣论坛名称的比重值,将各个兴趣论坛名称的比重值两两进行比较,筛选出最大比重值对应的兴趣论坛名称,并将该兴趣论坛名称确定为用户的偏好兴趣论坛。


4.如权利要求3所述的社交信息分析方法,其特征在于:比重值算法为:



其中,p代表用户社交网站浏览记录中各个兴趣论坛名称的比重值,ni代表用户社交网站浏览记录中各个兴趣论坛名称出现频率,∑ni代表代表用户社交网站浏览记录中所有兴趣论坛名称出现总频率,i代表用户社交网站浏览记录中各个兴趣论坛名称的个数。


5.如权利要求1所述的社交信息分析方法,其特征在于:步骤S3中,还包括以下步骤,获取网络社交网站不同的评论文本信息中的评论无效词以及网络上同一兴趣论坛中各个兴趣词,所述评论无效词包括:转发动态、已关注以及加一,根据网络无效词建立无效词查找表,获取用户兴趣论坛对应的评论文本信息,根据无效词查找表对该兴趣论坛对应的评论文本信息进行查...

【专利技术属性】
技术研发人员:陈浙良黄浩卢燉煜卢则强
申请(专利权)人:武汉赛可锐信息技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1