【技术实现步骤摘要】
一种文本可读性的评价方法和装置
[0001]本申请涉及文本可读性评价的
,尤其涉及一种文本可读性的评价方法和装置。
技术介绍
[0002]可读性是指书报杂志或文章的文本可理解程度,对于外文文献经机器翻译后,但由于翻译过程的影响,不能确保实证研究结论能够准确代表其中文版本的可读性。目前的评价方法多通过对应领域的知名专家或学者阅读后进行主观评价,没有统一的评价标准,评价结果易受个人的主观感受出现偏差,导致评价的准确性较差。
[0003]因此,如何提高文本可读性评价的准确性,是目前亟待解决的技术问题。
技术实现思路
[0004]本专利技术的一种文本可读性的评价方法和装置,提高了对文本可读性评价的准确性。
[0005]本专利技术实施例提供了以下方案:
[0006]第一方面,本专利技术实施例提供了一种文本可读性的评价方法,所述方法包括:
[0007]获取目标文本和历史文本库,其中,所述目标文本为外文经机器翻译为中文的文本,所述历史文本库为搜索引擎的历史搜索记录的文本集合;
...
【技术保护点】
【技术特征摘要】
1.一种文本可读性的评价方法,其特征在于,所述方法包括:获取目标文本和历史文本库,其中,所述目标文本为外文经机器翻译为中文的文本,所述历史文本库为搜索引擎的历史搜索记录的文本集合;根据所述历史文本库中搜索词的热度,获得第一评分标准;根据所述历史文本库中搜索语句的语句向量,获得第二评分标准;根据所述第一评分标准和所述第二评分标准,确定所述目标文本的可读性。2.根据权利要求1所述的文本可读性的评价方法,其特征在于,所述获取历史文本库,包括:获取所述搜索引擎在第一时间段的历史搜索信息;根据所述历史搜索信息中目标领域的所有所述搜索词和所述搜索语句,获得所述历史文本库,其中,所述目标领域为与所述目标文本分类相同的领域。3.根据权利要求1所述的文本可读性的评价方法,其特征在于,所述根据所述历史文本库中搜索词的热度,获得第一评分标准,包括:根据所述搜索词的搜索频次,确定词热度序列;将所述词热度序列中含义相同的所述搜索词按预设规则排列,获得所述第一评分标准。4.根据权利要求1所述的文本可读性的评价方法,其特征在于,所述根据所述历史文本库中搜索语句的语句向量,获得第二评分标准,包括:将所有的所述搜索语句输入预设的Word2vec模型,对应获得所有的所述语句向量;根据大于预设搜索频次的所述语句向量,获得所述第二评分标准。5.根据权利要求4所述的文本可读性的评价方法,其特征在于,所述搜索引擎为语义搜索引擎,将所有的所述搜索语句输入预设的Word2vec模型,对应获得所有的所述语句向量之前,还包括:根据所述语义搜索引擎的搜索用户在第二时间段的历史搜索信息,更新所述搜索语句。6.根据权利要求1所述的文本可读性...
【专利技术属性】
技术研发人员:胡楠,
申请(专利权)人:武汉文构数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。