社交网络信息转发次数预测方法、装置及存储介质制造方法及图纸

技术编号:35900991 阅读:14 留言:0更新日期:2022-12-10 10:37
本发明专利技术公开了一种社交网络信息转发次数预测方法、计算机装置及存储介质,社交网络信息转发次数预测方法包括获取通过社交网络传播的发布信息,使用语义网络,从发布信息提取得到情绪词汇,确定发布信息的情绪词汇数量和转发数量,使用朴素贝叶斯分类器,根据情绪词汇数量和转发数量对发布信息进行分类,根据分类结果,确定发布信息的转发次数预测范围等步骤。本发明专利技术通过使用朴素贝叶斯分类器根据发布信息中的情绪词汇数量和转发数量对发布信息进行分类,最后根据分类结果确定发布信息的转发次数预测范围,能够通过情绪词汇确定发布信息的作者的情绪,能够获得偏差较小的预测结果。本发明专利技术广泛应用于计算机技术领域。本发明专利技术广泛应用于计算机技术领域。本发明专利技术广泛应用于计算机技术领域。

【技术实现步骤摘要】
社交网络信息转发次数预测方法、装置及存储介质


[0001]本专利技术涉及计算机
,尤其是一种社交网络信息转发次数预测方法、计算机装置及存储介质。

技术介绍

[0002]随着社交网络的应用普及,单向弱关注类社交网络以其及时性强、信息资源丰富、用户面广、传播广泛迅速等传播特点,逐渐改变人们日常的生活方式,为人们获取信息提供了极大的方便。目前,政府部门积极开通官方微博,收集群众意见与建议,开展网络问卷调查;大量企业建设了官方微博和社交网络应用等平台营销产品,反馈用户意见。日常生活中的八卦新闻传播、社会工作中的舆论监督等等都依赖对社交网络的舆论演进和信息传播的研究。
[0003]根据研究,约60%的用户每天要访问社交网络,其中38%每天访问多次,20%每天至少访问一次。在单向弱关注类社交网络中,如微博和微信朋友圈,约8%的用户每天都会更新状态或签名,而接近50%的用户没有这一行为;只有1.5%的用户平均至少每周发表一次日志或日记。大量的用户在社交网络上的行为是点赞、评论及转发。由此可见,信息分享和转发是社交网络中重要的信息增量传递方式;个体对信息内容的阅读和理解,是引发群体传播的中继。研究发现,大量引发群体传播的信息内容中,均包含有个体对该信息内容的支持或否定等情绪性的导向。因此,预测社交网络发布的信息的转发次数,对信息的传播以及社交网络的运营等方面具有重要意义。
[0004]目前,对社交网络信息转发次数的预测技术,主要是获取同一发布者之前发布的信息的历史转发次数,通过统计获得历史转发次数的变化趋势,从而获得对新发布的信息转发次数的预测结果。目前的技术单纯研究历史转发次数的变化规律,忽略了被发布的信息本身的内容影响,因此预测结果与实际转发次数存在较大的偏差。
[0005]术语解释:
[0006]HowNet:HowNet是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库,是这一知识系统向中文研究延伸的具体体现。已公布的HowNet中文信息结构库包含268种信息结构模式,附带着一万多实例,总字数六万余。中文信息结构库将是中文信息处理的重要的甚至是不可或缺的资源之一,被称为袖珍型经典语料库,因为它的素材来源于实际语料,而另一方面又是经过人工精心筛选整理的,它覆盖面宽但又能避免统计价值不高的重复数据。数据文件(HowNet.txt)由223,767个以中英文词和词组所代表的概念构成,HowNet为每个概念标注了基于义原的定义以及词性、情感倾向、例句等信息。HowNet认为词汇/词义可以用更小的语义单位来描述。这种语义单位被称为“义原”(Sememe),顾名思义就是原子语义,即最基本的、不宜再分割的最小语义单位。在不断标注的过程中,HowNet逐渐构建出了一套精细的义原体系(约2000个义原)。HowNet基于该义原体系累计标注了数十万词汇/词义的语义信息。

技术实现思路

[0007]针对目前的社交网络信息转发次数预测技术预测结果偏差较大的技术问题,本专利技术的目的在于提供一种社交网络信息转发次数预测方法、计算机装置及存储介质。
[0008]一方面,本专利技术实施例包括一种社交网络信息转发次数预测方法,包括:
[0009]获取通过社交网络传播的发布信息;
[0010]使用语义网络,从所述发布信息提取得到情绪词汇;
[0011]确定所述发布信息的情绪词汇数量和转发数量;
[0012]使用朴素贝叶斯分类器,根据所述情绪词汇数量和所述转发数量对所述发布信息进行分类;
[0013]根据分类结果,确定所述发布信息的转发次数预测范围。
[0014]进一步地,所述获取通过社交网络传播的发布信息,包括:
[0015]获取目标用户通过社交网络传播的第一信息和第二信息;所述第一信息的传播时间和所述第二信息的传播时间之间的时间差小于时间差阈值;
[0016]以所述第一信息和所述第二信息作为所述发布信息。
[0017]进一步地,所述使用语义网络,从所述发布信息提取得到情绪词汇,包括:
[0018]运用所述语义网络构建所述第一信息和所述第二信息的知识表示;
[0019]通过所述语义网络中的语义联系,表示所述第一信息和所述第二信息的抽象对象关系;
[0020]构造结论求解网络;所述结论求解网络中的第一变量表示所述第一信息和所述第二信息中,作者的行为目的;所述结论求解网络中的第二变量表示所述第一信息和所述第二信息中,作者流露的情绪结论或者情绪倾向程度;
[0021]根据所述第一变量,从所述语义网络抽取得到所述发布信息对应的目的结论;
[0022]根据所述第二变量,从所述语义网络抽取得到所述情绪词汇和疑似情绪词语。
[0023]进一步地,所述使用语义网络,从所述发布信息提取得到情绪词汇,还包括:
[0024]确定所述情绪词汇与所述疑似情绪词语表达的情绪结论相似的可信度;
[0025]当所述可信度大于可信度阈值,将所述疑似情绪词语确定为与所述情绪词汇属于同一类词汇。
[0026]进一步地,所述确定所述情绪词汇与所述疑似情绪词语表达的情绪结论相似的可信度,包括:
[0027]设源节点社交网络的初始可信度为所有社交网络可信度的平均值T,根据CF模型,设E为社交信息的证据;
[0028]设QF(E)是社交网络自然语言理解过程的证据E的可信度因子,

1≤QF(E)≤1;QF(E)的数值来源为:证据的可信度是发布信息的源节点给出的,如果对该社交网络的所有对象观察S都为真,则QF(E)=1,反之0<QF(E)<1;相反,如果所有的观察S都肯定为假,则QF(E)=

1,反之

1<QF(E)<0;如果观察S无法确定真假,则QF(E)=0;
[0029]如果当前推理的证据是上次推理的结论,当前推理的证据的可信度由上次的证据通过不确定性传递算法计算得到;
[0030]设E为结论的条件,H为信息总结的结论;H结论可以设定为:所述第一信息词语表达的情绪结论等同所述第二信息词语表达的情绪结论,或者与词语表达的情绪结论相似度
大于相似度阈值;E则为证明所述第一信息词语与所述第二信息词语的情绪结论相似的证据,可以设E为词语相似度、义项相似度和义原距离;
[0031]设QF(H,E)为规则的可信度因子,当证据E为真,结论H为真的可信程度;
[0032]设MB(H,E)是由证据E得到结论H的信任增加测度,0≤MB≤1;MD(H,E)是由证据E得到结论H的不信任增加测度,0≤MD≤1;其中,当P(H)为结论A与B表达相同的情绪结论,当结论为真时,P(H|E)=1,MB=01,MD=0,CF=1;当结论为假时,P(H|E)=1,MB=0,MD=1,QF=

1;QF(H,E)=MB(H,E)

MD(H,E),QF(H,E)的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种社交网络信息转发次数预测方法,其特征在于,所述社交网络信息转发次数预测方法包括:获取通过社交网络传播的发布信息;使用语义网络,从所述发布信息提取得到情绪词汇;确定所述发布信息的情绪词汇数量和转发数量;使用朴素贝叶斯分类器,根据所述情绪词汇数量和所述转发数量对所述发布信息进行分类;根据分类结果,确定所述发布信息的转发次数预测范围。2.根据权利要求1所述的社交网络信息转发次数预测方法,其特征在于,所述获取通过社交网络传播的发布信息,包括:获取目标用户通过社交网络传播的第一信息和第二信息;所述第一信息的传播时间和所述第二信息的传播时间之间的时间差小于时间差阈值;以所述第一信息和所述第二信息作为所述发布信息。3.根据权利要求2所述的社交网络信息转发次数预测方法,其特征在于,所述使用语义网络,从所述发布信息提取得到情绪词汇,包括:运用所述语义网络构建所述第一信息和所述第二信息的知识表示;通过所述语义网络中的语义联系,表示所述第一信息和所述第二信息的抽象对象关系;构造结论求解网络;所述结论求解网络中的第一变量表示所述第一信息和所述第二信息中,作者的行为目的;所述结论求解网络中的第二变量表示所述第一信息和所述第二信息中,作者流露的情绪结论或者情绪倾向程度;根据所述第一变量,从所述语义网络抽取得到所述发布信息对应的目的结论;根据所述第二变量,从所述语义网络抽取得到所述情绪词汇和疑似情绪词语。4.根据权利要求3所述的社交网络信息转发次数预测方法,其特征在于,所述使用语义网络,从所述发布信息提取得到情绪词汇,还包括:确定所述情绪词汇与所述疑似情绪词语表达的情绪结论相似的可信度;当所述可信度大于可信度阈值,将所述疑似情绪词语确定为与所述情绪词汇属于同一类词汇。5.根据权利要求4所述的社交网络信息转发次数预测方法,其特征在于,所述确定所述情绪词汇与所述疑似情绪词语表达的情绪结论相似的可信度,包括:设源节点社交网络的初始可信度为所有社交网络可信度的平均值T,根据CF模型,设E为社交信息的证据;设QF(E)是社交网络自然语言理解过程的证据E的可信度因子,

1≤QF(E)≤1;QF(E)的数值来源为:证据的可信度是发布信息的源节点给出的,如果对该社交网络的所有对象观察S都为真,则QF(E)=1,反之0<QF(E)<1;相反,如果所有的观察S都肯定为假,则QF(E)=

1,反之

1<QF(E)<0;如果观察S无法确定真假,则QF(E)=0;如果当前推理的证据是上次推理的结论,当前推理的证据的可信度由上次的证据通过不确定性传递算法计算得到;设E为结论的条件,H为信息总结的结论;H结论可以设定为:所述第一信息词语表达的
情绪结论等同所述第二信息词语表达的情绪结论,或者与词语表达的情绪结论相似度大于相似度阈值;E则为证明所述第一信息词语与所述第二信息词语的情绪结论相似的证据,可以设E为词语相似度、义项相似度和义原距离;设QF(H,E)为规则的可信度因子,当证据E为真,结论H为真的可信程度;设MB(H,E)是由证据E得到结论H的信任增加测度,0≤MB≤1;MD(H,E)是由证据E得到结论H的不信任增加测度,0≤MD≤1;其中,当P(H)为结论A与B表达相同的情绪结论,当结论为真时,P(H|E)=1,MB...

【专利技术属性】
技术研发人员:黄昊晶陈晓勤陆飞曹德安黄华赋黄英超黄振波刘茂俐
申请(专利权)人:广东开放大学广东理工职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1