一种辅助写作系统及方法技术方案

技术编号:16500013 阅读:30 留言:0更新日期:2017-11-04 11:20
本发明专利技术提供了一种辅助写作系统及方法,包括:数据存储模块,用于存储不同类型文章的文章标题、内容及文章语义特征数据模型;文章获取模块,获取待测评文章,并提取待测评文章的标题及内容;特征提取模块,用于提取待测评文章的文章语义特征数据模型;相似性分析模块,用于将待测评文章的文章标题、内容及文章语义特征数据模型与数据存储模块中存储的不同类型文章的标题、内容及文章语义特征数据模型进行相似性对比分析,获取相似度值;文章测评模块,用于根据相似度值对待测评文章的进行测评打分,并提供修改建议。由上,本申请通过分析用户提交的文章,评判文章的质量,并提出修改建议,有利于提高作者的作品质量,从而提升被平台推荐的机率。

Auxiliary writing system and method

The present invention provides an auxiliary writing system and method includes: a data storage module for storing different types of article title, content and the semantic features of the data model; the acquisition module, obtain the test articles, and extract the title and content for the evaluation; feature extraction module is used to extract the semantic features of the data. The model for evaluation; similarity analysis module, the article will be stored for different types of evaluation the article title, the content and the semantic features of the data model and data storage module in the title, the content and the semantic features of the data model for similarity analysis, obtain the similarity value; the evaluation module, according to treat the similarity value evaluation evaluation score, and provide suggestions. From the above, this application analyzes the articles submitted by users, judges the quality of the article, and puts forward the modification suggestions, which is helpful to improve the quality of the author's works, so as to improve the recommended probability of the platform.

【技术实现步骤摘要】
一种辅助写作系统及方法
本专利技术涉及辅助领域,尤其涉及一种辅助写作系统及方法。
技术介绍
当今社会手机、平板电脑取代了电视、纸媒成为人们主要的获取信息方式,这要归功于移动互联网时代的蓬勃发展,其最大特点是海量的信息聚集在各类信息流平台中。以微博、微信、今日头条、百度百家等为首的自媒体平台,自身的文章产量很小,甚至不生产文章,完全依靠大量的入驻写手、组织、机构发文,这些写手、机构按照行业、兴趣、侧重点等聚集了丰富而精彩的信息。而巨量的文章为读者提供了近乎无穷尽的选择,但是对于文章的生产者来说是一种巨大的挑战。写作、发文的门槛降低了,但是从海量文章中脱颖而出的难度越来越大,为此各平台也建立标准,只有符合一定要求的才会得到平台的推荐,从而大大提升了用户阅读量以及作者自身的关注度。因此,目前亟需一种技术以帮助作者提高其作品质量,也以提升其被平台推荐的机率。
技术实现思路
有鉴于此,本申请提供一种辅助写作系统及方法,通过分析用户提交的文章,评判文章的“质量”,并提出修改建议,有利于提高作者的作品质量,从而提升被平台推荐的机率。本申请提供的一种辅助写作系统,包括:数据存储模块,用于存储现有的不同类型样本文章的文章标题、内容及文章语义特征数据模型;文章获取模块,用于获取待测评的文章,并提取所述待测评文章的标题及内容;特征提取模块,用于提取所述待测评的样本文章的文章语义特征数据模型;相似性分析模块,用于将待测评文章的文章标题、内容及文章语义特征数据模型与数据存储模块中存储的不同类型样本文章的文章标题、内容及文章语义特征数据模型进行相似性对比分析,获取相似度值;文章测评模块,用于根据所述相似度值对所述待测评文章的进行测评打分,并提供修改建议。由上,通过分析用户提交的文章,评判文章的“质量”,并提出修改建议,有利于提高作者的作品质量,从而提升被平台推荐的机率。优选地,所述文章测评模块还用于:推荐相关文章以供用户参考。优选地,所述系统,还包括:信息流抓取模块,用于对现有的媒体平台的信息流进行定时爬取,并将爬取的文章存储到所述数据存储模块,以形成按时间版本存储的语料库;信息流聚合模块,用于将所述语料库中的文章按照指定的聚类标准聚合,获取聚合后的不同类别的文章,并将其存储到数据存储模块。由上,通过定时抓取现有的不同的媒体平台的文章,例如,针对不同时间段的热门度/关注度超过设定值的信息进行爬取,并对其进行聚类分析,有利于后续将其与带测评的文章进行比对,评判文章的“质量”,并作者提供建议及参考。优选地,所述特征提取模块还用于:提取所述语料库中的样本文章的文章语义特征数据模型并将其存储到数据存储模块中。优选地,所述相似性分析模块还用于对语料库中的不同样本文章之间的文章语义特征数据模型的进行相似性对比分析,并将分析结果提供给所述信息流聚合模块。由上,有利于为对样本文章的聚类提供相似度参考。优选地,所述相似性分析模块还用于将待测评文章的文章语义特征数据模型、文章标题及内容与数据存储模块中存储的聚合后样本文章集合中的样本文章语义特征数据模型、文章标题及内容的进行相似性对比分析。优选地,所述数据存储模块还用于:存储用户信息和用户使用日志;其中,所述数据存储模块存储的数据按日进行备份,按指定时间进行历史清理。优选地,所述文章获取模块还用于自动将已提交的待测评的文章的标题、内容提取后生成系统需要的标准格式文本;所述文章获取模块还用于记录并显示用户的上传及浏览的文章的记录。优选地,所述测评结果包括:对于文章标题的评价、对于文章内容的评价、对于文章整体的测评分数;所述修改建议包括:建议文章标题中添加的关键词、建议标题的造句方式、建议文章内容中增加或减少的信息点要素、建议文章中的段落的安排及造句方式。其中,所述对于文章标题的评价包括:标题中包含的关键字的热度的评价,标题的造句方式的可读性的评价;对于文章内容的评价包括但不限于:文章内容的信息量密度和丰富度的评价、文章中的段落的安排及造句方式的评价。本申请还提供一种基于前述系统的辅助写作方法,包括步骤:A、获取用于与待测评文章比对用的评测比对文章语料库:A1、对现有的媒体平台的信息流进行定时爬取,并将爬取的文章存储到所述数据存储模块,以形成按时间版本存储的语料库,并存储;A2、将所述语料库中的样本文章中出现的所有词语分隔提取,获取每篇文章的文章语义特征数据模型并将其存储。A3、对语料库中的不同样本文章之间的文章语义特征数据模型进行相似性对比分析,获取分析结果,并存储;A4、根据所述相似性分析模块的分析结果将所述语料库中的样本文章按照聚类标准聚合,并将聚合结果存储;B、基于步骤A中获取的语料库对待测评的文章测评:B1、将待测评的文章标题、内容自动提取后生成系统需要的标准格式文本;B2、将待测评文章的标题和内容中出现的词语分隔提取,获取所述待测评的文章的文章语义特征数据模型;B3、将待测评文章的标题、内容、文章语义特征数据模型与数据存储模块中存储的聚类后的样本文章集合中的样本文章标题、内容、文章语义特征数据模型进行相似性对比分析,获取相似度值;B4、根据所述相似度值对待测评文章的进行测评打分,并提供修改建议以及推荐相关文章以供用户参考。综上所述,本申请提供的一种辅助写作系统及方法,定时获取的现有的媒体平台的文章信息,据此分析用户提交的文章,评判用户提交的文章的“质量”,并提出修改建议,以及推荐相关文章以供用户参考,有利于提高作者的作品质量,从而提升被平台推荐的机率。附图说明图1为本申请实施例的语料库获取子系统的示意图;图2为本申请实施例的文章测评子系统的示意图;图3为本申请实施例的一种辅助写作方法的示意图。具体实施方式下面将结合本申请实施例中的附图对本申请进行说明。实施例一有鉴于此,本申请提供一种辅助写作系统及方法,通过分析用户提交的文章,评判文章的“质量”,以及提出修改建议,有利于提高作者的作品质量,从而提升被平台推荐的机率。本实施例提供一种辅助写作系统,包括:语料库获取子系统及文章测评子系统。其中,语料库获取子系统用于获取与待测评的文章比对的评测比对文章语料库,如图1所述,语料库获取子系统包括:信息流抓取模块,用于对现有的媒体平台(包括主流自媒体平台,微博、论坛等)的信息流进行定时爬取,并将爬取的文章(包括文章标题及内容)存储到所述数据存储模块,以形成按时间版本存储的语料库;另外,其也可以按一定算法、策略的进行爬取,例如,针对不同时间段的热门度/关注度超过设定值的信息进行爬取。特征提取模块,用于将所述语料库中的文章中出现的所有词语分隔提取,获取每篇文章的文章语义特征数据模型并将其存储到数据存储模块中。相似性分析模块,用于对语料库中的不同文章之间的文章语义特征数据模型的进行相似性对比分析,获取分析结果。例如,假设有3篇文章:A、B、C,将3篇文章的文章语义特征数据模型进行相似性对比,获取两两相似性对比的相似度,并记录。例如A、B的相似度为90%,B、C的相似度为20%,A、C的相似度为30%。信息流聚合模块,用于根据所述相似性分析模块的分析结果将所述语料库中的文章按照聚类标准聚合,并将聚合结果存储到数据存储模块。此处的聚类标准可以是但不限于样本文章的类型,例如,按照读者年龄划分的文章类型(儿童、青本文档来自技高网...
一种辅助写作系统及方法

【技术保护点】
一种辅助写作系统,其特征在于,包括:数据存储模块,用于存储现有的不同类型文章的文章标题、内容及文章语义特征数据模型;文章获取模块,用于获取待测评的文章,并提取所述待测评文章的标题及内容;特征提取模块,用于提取所述待测评的文章的文章语义特征数据模型;相似性分析模块,用于将待测评文章的文章标题、内容及文章语义特征数据模型与数据存储模块中存储的不同类型文章的文章标题、内容及文章语义特征数据模型进行相似性对比分析,获取相似度值;文章测评模块,用于根据所述相似度值对所述待测评文章的进行测评打分,并提供修改建议。

【技术特征摘要】
2017.06.22 CN 20171048235671.一种辅助写作系统,其特征在于,包括:数据存储模块,用于存储现有的不同类型文章的文章标题、内容及文章语义特征数据模型;文章获取模块,用于获取待测评的文章,并提取所述待测评文章的标题及内容;特征提取模块,用于提取所述待测评的文章的文章语义特征数据模型;相似性分析模块,用于将待测评文章的文章标题、内容及文章语义特征数据模型与数据存储模块中存储的不同类型文章的文章标题、内容及文章语义特征数据模型进行相似性对比分析,获取相似度值;文章测评模块,用于根据所述相似度值对所述待测评文章的进行测评打分,并提供修改建议。2.根据权利要求1所述的系统,其特征在于,所述文章测评模块还用于:推荐相关文章以供用户参考。3.根据权利要求1所述的系统,其特征在于,还包括:信息流抓取模块,用于对指定的媒体平台的文章信息流进行定时爬取,并将爬取的样本文章的标题及内容存储到所述数据存储模块,以形成按时间版本存储的语料库;信息流聚合模块,用于将所述语料库中的样本文章按照指定的聚类标准聚合,获取聚合后的不同类别的文章,并将其存储到数据存储模块。4.根据权利要求3所述的系统,其特征在于,所述特征提取模块还用于:提取所述语料库中的样本文章的文章语义特征数据模型并将其存储到数据存储模块中。5.根据权利要求4所述的系统,其特征在于,所述相似性分析模块还用于对语料库中的不同样本文章之间的文章语义特征数据模型进行相似性对比分析,并将分析结果提供给所述信息流聚合模块。6.根据权利要求5所述的系统,其特征在于,所述相似性分析模块还用于将待测评文章的文章语义特征数据模型、文章标题及内容与数据存储模块中存储的聚合后的样本文章的文章语义特征数据模型、文章标题及内容的进行相似性对比分析。7.根据权利要求1所述的系统,其特征在于,所述数据存储模块还用于:存储用户信息和用户使用日志;其中,所述数据存储模块存储的数据按日进行备份,按...

【专利技术属性】
技术研发人员:金利杰亢保星孙雪宁王海晗高荣威刘熹娜曹静逯久月
申请(专利权)人:云天弈北京信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1