【技术实现步骤摘要】
文本简洁明晰程度评价方法及相关设备
[0001]本申请实施例涉及数据处理领域,具体涉及一种文本简洁明晰程度评价方法及相关设备。
技术介绍
[0002]在金融证券领域,信息披露是进行交易决策的基础,信息披露文本是否简洁明晰是可读性的重要指标之一。在国内资本市场中,有很多学者研究认为信息披露的质量影响着股票发行、交易、上市公司经营等各个方面。同时,《证券法》也要求信息披露的信息应当真实、准确、完整,简明清晰,通俗易懂。文本是否简洁明晰的判定可以应用于商业领域,为投资交易、上市审核以及公司经营提供判断依据,具有良好的社会效益和商业用途。
[0003]然而,目前对文本是否简洁明晰的判定是由人员执行的,在判定过程中难免受到人员的主观因素影响,例如人员的知识水平、人员的主观看法、阅读习惯等等,这可能导致不同人员对同一文本的简洁明晰程度有不同的评价,评价结论各有不同,文本简洁明晰程度的评价标准也会因人而异,无法统一,难以客观地评价文本的简洁明晰程度。
技术实现思路
[0004]本申请实施例提供了一种文本简洁明晰程度 ...
【技术保护点】
【技术特征摘要】
1.一种文本简洁明晰程度评价方法,其特征在于,所述方法包括:获得预先训练完成的目标文本内容评分模型,所述目标文本内容评分模型由机器学习算法对多组第一训练样本训练得到,且每组所述第一训练样本包括第一训练文本以及所述第一训练文本的标准内容评分;获得预先训练完成的目标文本视觉评分模型,所述目标文本视觉评分模型由机器学习算法对多组第二训练样本训练得到,且每组所述第二训练样本包括训练文本图像以及所述训练文本图像的标准视觉评分;将待评价文本输入至所述目标文本内容评分模型,以得到所述目标文本内容评分模型输出的所述待评价文本的内容评分;将所述待评价文本的文本图像输入至所述目标文本视觉评分模型,以得到所述目标文本视觉评分模型输出的所述待评价文本的视觉评分;根据所述待评价文本的内容评分和视觉评分确定所述待评价文本的简洁明晰程度。2.根据权利要求1所述的方法,其特征在于,所述目标文本内容评分模型的训练步骤包括:获得初始文本内容评分模型;将多组所述第一训练样本输入所述初始文本内容评分模型,以使得所述初始文本内容评分模型提取第一批次的第一训练文本的文本内容特征,根据所述第一训练文本的文本内容特征输出预测内容评分,根据所述预测内容评分与所述标准内容评分之间的差值调整所述初始文本内容评分模型的模型参数,若所述差值未满足收敛条件,则返回执行提取下一批次的第一训练文本的文本内容特征,直至所述差值满足收敛条件时停止训练,得到所述目标文本内容评分模型。3.根据权利要求2所述的方法,其特征在于,所述将待评价文本输入至所述目标文本内容评分模型,以得到所述目标文本内容评分模型输出的所述待评价文本的内容评分,包括:将所述待评价文本输入至所述目标文本内容评分模型,以使所述目标文本内容评分模型执行下述分类步骤:从所述待评价文本中提取所述待评价文本的文本内容特征;根据所述训练步骤获得的文本内容特征与内容评分的函数关系计算所述待评价文本的文本内容特征对应的内容评分,输出所述待评价文本的内容评分。4.根据权利要求3所述的方法,其特征在于,文本内容特征包括句号数量在文本的标点符号总数中的占比、数值型字符数量在文本的总字数中的占比、目录层次与目录标题计数、表格数、形容词数量在文本的实词总数中的占比、定语从句数量、省略的主语数量、简单句数量中的一项或多项,所述简单句为只含有一个主谓结构且句子各成分只由单词或短语构成的独立句子或分句。5.根据权利要求1所述的方法,其特征在于,所述目标文本视觉评分模型的训练步骤包括:获得初始文本视觉评分模型;将多组所述第二训练样本输入所述...
【专利技术属性】
技术研发人员:毛瑞彬,朱菁,杨雯雯,邓永翠,潘斌强,张大千,尚东东,孙德旺,张俊,杨建明,
申请(专利权)人:深圳证券信息有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。