【技术实现步骤摘要】
一种基于D
‑
S证据理论的社交网络信息可信度评价方法
[0001]本专利技术涉及社交网络信息可信度评价方法领域,特别涉及一种基于D
‑
S证据理论的社交网络信息可信度评价方法。
技术介绍
[0002]基于D
‑
S证据理论的社交网络信息可信度评价方法是指通过将社交网络中信息内容(文字、图像)的特征转化为证据后,利用D
‑
S证据理论将其进行融合得到判定信息真伪的概率,即信息可信度。
[0003]目前,现有的社交网络信息可信度评价方法是基于“正文文本特征+图文一致性特征”的特征组合,结合深度学习的特征融合方法实现的。然而目前信息可信度评价方法使用的特征组合有效性低,未能充分挖掘文章标题和文章正文内容的相似性联系;且现有基于深度学习的特征融合方法较依赖先验知识,在特定的小样本数据集上评价准确率低。因此,社交网络信息可信度评价方法的准确率有可提升的空间。
技术实现思路
[0004]针对现有基于深度学习的特征融合方法较依赖先验知识,且在特定的小 ...
【技术保护点】
【技术特征摘要】
1.一种基于D
‑
S证据理论的社交网络信息可信度评价方法,其特征在于,包括以下步骤:步骤1:特征抽取,使用BERT预训练模型、ResNet50神经网络、TF
‑
IDF算法以及余弦相似度的方法抽取正文文本特征、图文一致性特征以及标题
‑
正文一致性特征;步骤2:证据生成,使用基本概率分配方法及相关公式将原始证据转化为对应的BPA;步骤3:证据融合,计算证据清晰度、证据可信度、证据权重,并结合证据合成规则,实现证据融合。2.根据权利要求1所述的一种基于D
‑
S证据理论的社交网络信息可信度评价方法,其特征在于,步骤1包括以下内容:步骤11:正文文本特征抽取;首先将原始数据经过数据预处理,其中设置字符数为512,字符数低于512进行字符补充,多余512的进行字符截断,然后使用BERT预训练模型抽取文本特征:其中,t
i
代表输入的第i个句子,是一个768维向量,表示经BERT嵌入之后的文本特征向量,完成正文文本特征的抽取;步骤12:图文一致性特征抽取;将卷积神经网络的输出作为图像底层特征,并结合ResNet50预训练模型对输入的图像进行编码,在预训练的ResNet50模型中,使用2048维的全连通层对图像特征编码,用2048维向量表示图像:h
v
=ResNet50(v)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,v表示输入ResNet50的原始图像,h
v
表示经ResNet50网络提取的后的视觉特征向量;使用BiGRU对BERT提取的特征进行再次提取,即使用BiGRU进一步提取文本特征中的时态属性,用以将文本特征转化为文本特征序列:其中,表示经BERT嵌入之后的文本特征向量,表示经BiGRU提取后的文本特征序列;使用相似性度量的方法计算文本和图像信息的相似性,为将两种信息的特征用于共同的表示空间,将一个完全连接层用在每个特征提取网络的最后一层中,并使两种网络共享最后一层的权重,得到文本和图像的语义表示s
t
和s
v
,并使用余弦相似度来度量文本和图像之间的相似度:其中,s
t
和s
v
分别表示文本特征序列和图像语义序列,s
tv
表示两者之间的相似度,s
tv
的取值范围为[
‑
1,1],s
tv
值越大表示两者之间的相似度越高,至此,完成图文一致性特征的抽取;步骤13:标题
‑
正文一致性特征抽取;
使用TF
‑
IDF算法计算标题t
h
和正文t
m
的文本相似度,以抽取标题
‑
正文一致性特征,首先使用jieba分词分别对数据中t
h
和t
m
内容做分词处理,并找出二者各自的关键词,并转化为对应的向量t
h1
,t
h2
…
t
hi
和t
m1
,t
m2
…
t
mj
(i,j均为正整数),然后将所有关键词组成一个集合k:其中,k不为空集;分别计算标题和正文相对于集合k中关键词的TF
‑
IDF值d
h
、d
m
、f
h
和f
m
;分别计算标题和文本的TF
‑
IDF向量和计算公式如下;计算公式如下;计算公式如下;和的余弦相似度计算公式如下;其中,和分别表示标题和文本的TF
‑
IDF向量,表示两者之间的相似度,即标题
‑
正文一致性特征,至此,完成图文一致性特征的抽取。3.根据权利要求1所述的一种基于D
‑
S证据理论的社交网络信息可信度评价方法,其特征在于,步骤2包括以下内容:步骤21:获取原始证据;在特征选取任务中,分别对三种特征进行抽取后获得对应的特征的向量:正文文本特征向量图文一致性特征向量s
tv
和标题正文一致性特征向量然后分别使用三种特征向量评价信息可信度,基于三种特征的可信度评价方法;基于正文文本特征的可信度评价方法是将送入分类器后,得到分类结果,然后将结果转化为百分数R
a
,R
a
即为使用文本特征进行可信度评价的结果;基于图文一致性特征的可信度评价方法是将s
tv
通过Sigmoid函数映射在[0,1]之间得到百分数R
b
并作为基于图文一致性特征的评价方法的最终结果;基于标题正文一致性特征的可信度评价方法是将通过Sigmoid函数映射在[0,1]之间得到百分数R
c
并作为基于标题
‑
正文特征的评价方法的最终结果;步骤22:生成原始BPA;考虑到D
‑
S证据理论是处理不确定性问题的理想办法,在使用证据理论融合不同特征的评价结果时,计算出将评价结果转化为...
【专利技术属性】
技术研发人员:王剑,王明慧,王京岭,张革,郭世元,庾桂铭,王章全,安镇宙,杨健,
申请(专利权)人:郑州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。