一种基于写作风格的文本内容真实性评估方法及设备技术

技术编号:38376028 阅读:30 留言:0更新日期:2023-08-05 17:37
本发明专利技术提供一种基于写作风格的文本内容真实性评估方法及设备,该方法包括:对待评估文本进行预处理,以对待评估文本进行分词、构建句法树、实体词提取、情感分析及事件触发词、主题和相似信息簇获取;基于预处理结果,计算待评估文本的多个维度的写作风格特征;根据待评估文本所属平台特征和语种特征,基于多个维度的待评估文本的写作风格特征,经过加权计算,得到待评估文本内容的真实性评估结果。本发明专利技术解决了现有技术中的文本内容真实性评估方法依赖于文本涉及的实体、事件,不适用于跨平台应用的问题。平台应用的问题。平台应用的问题。

【技术实现步骤摘要】
一种基于写作风格的文本内容真实性评估方法及设备


[0001]本专利技术属于自然语言处理
,尤其涉及一种基于写作风格的文本内容真实性评估方法及设备。

技术介绍

[0002]随着社交网络被大众广泛使用,信息的数字化传播方式潜移默化地改变了公共媒体空间的整体结构。人们可以通过微信、微博、自媒体等各种网络平台便捷地获取大量信息。但在享受这些便利的同时,大众也必须面对一些别有目的的信息传播所带来的一系列问题,如过滤气泡,虚假信息等。在网络与社会现实的不断交互下,“后真相”现象也不断增多,反映着当前网络舆论存在一种不信任、无法形成共识的状态。针对数字化信息的定量分析与自动检测成为一个亟待解决的社会问题。为了实现对虚假信息的高效检测,已有许多研究着眼于开发自动虚假信息检测系统。
[0003]按照研究关注点不同,国内外自动检测虚假信息内容的方法大致可分为两种:第一类是基于内容的检测方法,这类方法关注于虚假信息本身是“如何写”的,即不同虚假信息所携带的情感因素、语言运用偏好、心理暗示等;第二类是基于社交行为的方法,这类方法利用用户的社交参与信息,比本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于写作风格的文本内容真实性评估方法,其特征在于,包括:对待评估文本进行预处理,以对所述待评估文本进行分词、构建句法树、实体词提取、情感分析及事件触发词、主题和相似信息簇获取;基于预处理结果,计算所述待评估文本的多个维度的写作风格特征;根据所述待评估文本所属平台特征和语种特征,基于多个维度的所述待评估文本的写作风格特征,经过加权计算,得到待评估文本内容的真实性评估结果。2.根据权利要求1所述的基于写作风格的文本内容真实性评估方法,其特征在于,多个维度的所述写作风格特征包括:专业性、交互性、趣味性、完整性、逻辑性、动人性、可信性和可读性特征。3.根据权利要求2所述的基于写作风格的文本内容真实性评估方法,其特征在于,所述专业性特征基于所述待评估文本中的新闻六要素及叙述句法框架,通过下述公式得到:;其中,为所述待评估文本的专业性特征,为待评估文本的新闻六要素的one

hot编码;为基于叙述句法框架构建的向量矩阵,包括待评估文本的主题和事件、事件参与者、事件发生时间和地点的向量表示,其中事件、事件参与者、事件发生时间和地点基于预处理得到的事件触发词,在所述待评估文本中匹配得到。4.根据权利要求2所述的基于写作风格的文本内容真实性评估方法,其特征在于,所述交互性特征基于风景模型的复杂度和情感分析结果的均值,通过下述公式得到:;其中,为所述待评估文本的交互性特征,、为权重参数,为风景模型,为基于固定节点的动态图,所述节点为基于隐性语义分析LSA模型赋值后的所述待评估文本的经过分词得到的词和句,边为通过群组激活得到的是否可以构成语义网络的表征;为风景模型的复杂度,EMW为文本预处理得到的文本传达的情感,EIW为文本传达的情感强度,所述情感和情感强度通过将文本分词结果与多语言情感词典进行匹配计算得到,为情感分析结果的均值;所述趣味性特征基于概念整合空间的复杂度和词共现网络的密度,通过下述公式得到:;其中,为所述待评估文本的趣味性特征,、为权重参数,为概念整合空间网络,为根据待评估文本的内容,动态构建的包含基于类属空间的多个输入空间的整合网络;类属空间为包括待评估文本的主题、事件触发词、事件参与者、发生时间和地点的概念元素,其中事件参与者、发生时间和地点基于预处理得到的事件触发词,在所述待评估文本中匹配得到;输入空间为类属空间的具象化表示,整合网络的节点为不同输入空间的具象化表示,边为不同输入空间的映射,概念整合空间网络的复杂度;为词共现网络,其节点为分词得到的词,边为词在文本内的共现关系,为词共现网络的密度。5.根据权利要求2所述的基于写作风格的文本内容真实性评估方法,其特征在于,所述
逻辑性特征基于情境模型的一致性和修辞结构理论框架的复杂度,通过下述公式得到:;其中,为所述待评估文本的逻辑性特征,、为权重参数,为情境模型图,其节点包括预处理中实体词提取及映射得到的人物、行为、事件、意图,边为不同节点间的关系,基于句法树和事件触发词得到,为情境模型的一致性;为基于句法树的修辞关系图得到修辞结构理论框架图,节点为对待评估文本进行分词得到的词,边为修辞关系和叙述手段,基于句法树和修辞映射词典得到,为修辞结构理论框架图的复杂度;所述文本完整性特征基于音素网络、句法网络以及随...

【专利技术属性】
技术研发人员:王永滨范伟健
申请(专利权)人:中国传媒大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1