一种基于文章结构树的文章评价方法及系统技术方案

技术编号:24574413 阅读:47 留言:0更新日期:2020-06-21 00:10
本发明专利技术公开了一种基于文章结构树的文章评价方法及系统。该方法包括:读取用户输入的待评价文章,构建待评价文章的文章结构树;构建包含多个样本文章及对应评价信息的样本库,构建样本文章的文章结构树;获取待评价文章的文章结构树与样本文章的文章结构树的相似度,根据该相似度获取与待评价文章最相似的样本文章;根据最近似的样本文章的评价信息获取待评价文章的评价信息。本发明专利技术中电子辅助编辑系统会比较待评价文章和样本文章的文章结构树模型来评价文章结构是否合理,可以大大提高文章评价的准确度,提高电子辅助编辑系统的效率。

An article evaluation method and system based on article structure tree

【技术实现步骤摘要】
一种基于文章结构树的文章评价方法及系统
本专利技术属于电子文本辅助编辑
,更具体地,涉及一种基于文章结构树的文章评价方法及系统。
技术介绍
电子文本辅助编辑中,智能的文字推荐分为三个阶段,编辑前、编辑中和编辑后。专题文章结构整理的主要目的是服务于编辑后的文章核查,即文章完成编辑后系统根据文章结构判断是否合理。现有的电子文本辅助编辑系统的文章评价中,一般是将文章的词频做统计,根据词做向量分析,通过文章向量相似度匹配到一组近似的文章上去,根据近似的已知文章的已有评分或评价综合给出待评价的文章。但是这种方法存在两个比较显著的问题,从而导致文章评价的不准确性,进而影响文章辅助编辑的效率。问题一,文章样本比较少,文章样本个体间结构差异较大的情况下,这种评价方法会导致很难比较准确地对待评价文章进行评价;问题二,由于文章编辑前、编辑中都会推送与主题相关的近似文章,那么到了编辑后文章评价阶段,其评价很可能与其推送的文章结果近似,最后所得到的评价缺乏对编辑文章的文字内容以外的评价建议,从而导致评价不准确,进而导致电子文本辅助编辑系统的效率低下。...

【技术保护点】
1.一种基于文章结构树的文章评价方法,其特征在于,包括;/n读取用户输入的待评价文章,构建待评价文章的文章结构树;/n构建包含多个样本文章及对应评价信息的样本库,构建样本文章的文章结构树;/n获取待评价文章的文章结构树与样本文章的文章结构树的相似度,根据该相似度获取与待评价文章相似的样本文章;/n根据该相似的样本文章的评价信息获取待评价文章的评价信息。/n

【技术特征摘要】
1.一种基于文章结构树的文章评价方法,其特征在于,包括;
读取用户输入的待评价文章,构建待评价文章的文章结构树;
构建包含多个样本文章及对应评价信息的样本库,构建样本文章的文章结构树;
获取待评价文章的文章结构树与样本文章的文章结构树的相似度,根据该相似度获取与待评价文章相似的样本文章;
根据该相似的样本文章的评价信息获取待评价文章的评价信息。


2.如权利要求1所述的一种基于文章结构树的文章评价方法,其特征在于,所述构建文章结构所述树具体是:
生成一棵空的文章结构树,将文章标题作为文章结构树的根节点,将文章的子标题和/或段落按层级关系添加到根节点下作为子节点,为每个子节点赋值。


3.如权利要求2所述的一种基于文章结构树的文章评价方法,其特征在于,根据以下公式为每个子节点赋值,



其中,P为子节点的赋值,m为该子节点下所有的文字数量,n为该文章的所有文字数量,Cm为该子节点下所有文字与文章标题的近似度。


4.如权利要求3所述的一种基于文章结构树的文章评价方法,其特征在于,从文章结构树的叶子节点到根节点的路径上将叶子节点下的所有文字数累加到路径上所有子节点上,获取m和n的值,对子节点的文字进行分词,计算所有分词与文章标题的相似度,计算平均相似度,即为Cm的值。


5.如权利要求1所述的一种基于文章结构树的文章评价方法,其特征在于,所述获取待评价文章的文章结构树与样本文章的文章结构树的相似度具体是:逐层计算待评价文章的文章结构树与样本文章...

【专利技术属性】
技术研发人员:董喆何双江秦威
申请(专利权)人:武汉烽火信息集成技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1