【技术实现步骤摘要】
基于价值量表的文本价值计算方法及装置
[0001]本专利技术实施例涉及人工智能
,具体涉及一种基于价值量表的文本价值计算方法及装置。
技术介绍
[0002]随着科技的发展,进入自媒体时代,自媒体与传统的媒体生态不同,传统的媒体生态主要由专业主体生产和发布信息,信息具有较高的公信力和严格的内容把关等特征。自媒体时代,任何人都能够通过互联网创作和发布内容,使得网络中传播的信息质量严重缺乏保障。各个媒体平台的内容良莠不齐,存在大量价值取向不高的内容。由于这类内容生产成本低,接受门槛低,网络中存在着大量低价值内容,易导致低价值内容的过度传播,对主流价值观内容的传播构成挑战。如果不加引导地任由低价值内容自由生长,无用、不良等信息将会在网络中泛滥,污染网络空间,对社会风气也会产生负面影响,潜移默化地带偏公众的价值观。
[0003]现有的网络信息引导方法主要包括如谣言检测、舆情监测、标准制定、流行度预测等。以上各方法的主要目的是鉴别伪造信息、监测热点事件的发展态势等。如标准制定是通过制定相关的标准和规范,明确发布网络信息的内 ...
【技术保护点】
【技术特征摘要】
1.一种基于价值量表的文本价值计算方法,其特征在于,方法包括:对文本进行分词处理,得到包含多个关键词的关键词集合;基于预设价值量表,遍历所述关键词集合,查询与所述关键词匹配的节点关键词,得到不同级别的匹配节点集合;其中,所述预设价值量表包括预设多个级别节点;每个节点包括节点关键词;根据不同级别的匹配节点集合的数量及权重,计算得到所述文本的价值数据。2.根据权利要求1所述的方法,其特征在于,所述预设多个级别节点包括:核心节点、次核心节点、外围节点;每个节点还包括:节点编号、节点频率、相关节点和相似节点。3.根据权利要求2所述的方法,其特征在于,所述基于预设价值量表,遍历所述关键词集合,查询与所述关键词匹配的节点关键词,得到不同级别的匹配节点集合进一步包括:遍历所述关键词集合,针对任一关键词,查询所述预设价值量表,得到与所述关键词匹配的节点关键词;将所述节点关键词按照所属节点的级别进行归类,得到不同级别的匹配节点集合;所述匹配节点集合包括核心节点集合、次核心节点集合、外围节点集合。4.根据权利要求3所述的方法,其特征在于,所述根据不同级别的匹配节点集合的数量及权重,计算得到所述文本的价值数据进一步包括:计算得到核心节点集合的数量与核心节点权重的第一乘积、次核心节点集合的数量与次核心节点权重的第二乘积、外围节点集合的数量与外围节点权重的第三乘积,以及,所述关键词集合的数量与核心节点权重的第四乘积;其中,所述核心节点权重根据对所述核心节点集合中各个节点关键词的第一和值进行归一化处理得到;所述第一和值根据累加所述核心节点集合中各个节点关键词的相关节点和相似节点的数量及预设权重的乘积与节点关键词的节点频率之和得到;所述次核心节点权重根据对所述次核心节点集合中各个节点关键词的第二和值进行归一化处理得到;所述第二和值根据累加所述次核心节点集合中各个节点关键词的相关节点和相似节点的数量及预设权重的乘积与节点关键词的节点频率之和得到;所述外围节点权重根据对所述外围节点集合中各个节点关键词的第三和值进行归一化处理得到;所述第三和值根据累加所述外围节点集合中各个节点关键词的相关节点和相似节点的数量及预设权重的乘积与节点关键词的节点频率之和得到;累加所述第一乘积、第二乘积及第三乘积,计算累加结果与所述第四乘积的比值,并根据预设指数对所述比值进行修正,得到所述文本的价值数据。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:若查询所述预设价值量表,未得到与所述关键词匹配的节点关键词,将所述关键词归类至非价值匹配节点集合。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:若匹配节点集合为非价值匹配节点集合,则确定所述文本的价值数据为0。7.根据权利要求1所述的方法,其特征在于,所述对文本进行分词处理,得到包含多个关键词的关键词集合进一步包括:对所述文本进行预处理;所述预处理包括格式过滤处理和停用词过滤处理;根据标点符号对所述文本进行处理,将所述文本拆分为多个句子...
【专利技术属性】
技术研发人员:张勇东,毛震东,刘毅,郭俊波,陈伟东,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。