文档流畅度的检测方法、装置、电子设备及介质制造方法及图纸

技术编号:26066589 阅读:19 留言:0更新日期:2020-10-28 16:39
本申请公开了文档流畅度的检测方法、装置、电子设备及介质,涉及云计算和自然语言处理技术领域。具体实现方案为:通过计算待检测文档的优美度值、通顺度值和错误度值,进而根据计算得到的优美度值、通顺度值和错误度值,生成待检测文档的流畅度值,由此,实现了文档优美度、通顺度和错误度的自动检测,从而实现了文档流畅度的检测。当本申请的方案应用于作文评阅时,实现了作文的自动评阅,能够从优美度、通顺度和错误度多个方面对作文进行评分,相较于基于教师人工对作文进行打分的方式,能够节省人力和时间,提高作文审阅效率,且评阅标准统一,能够提高作文评分的准确率。

【技术实现步骤摘要】
文档流畅度的检测方法、装置、电子设备及介质
本申请的实施例总体上涉及计算机
,并且更具体地,涉及云计算和自然语言处理

技术介绍
作文是学生语文和英语考试的必备题型,通过作文可以综合考察学生运用语言的能力和水平。目前,对于作文的评阅多是基于教师人工打分的方式实现的,人工打分方式存在一些问题。从阅卷者的角度来说,作文的评阅需要耗费大量的人力和时间,并且评阅标准无法统一,主观性强,导致评分的准确率较低。因此,如何实现作文的自动评阅以使教师得到解放,提高作文评分的准确率,成为亟待解决的课题。
技术实现思路
本申请提供了一种文档流畅度的检测方法、装置、电子设备及介质。根据第一方面,提供了一种文档流畅度的检测方法,包括:获取待检测文档;计算所述待检测文档的优美度值;计算所述待检测文档的通顺度值和错误度值;以及根据所述待检测文档的优美度值、所述通顺度值和所述错误度值生成所述待检测文档的流畅度值。根据第二方面,提供了一种文档流畅度的检测装置,包括:获取模块,用于获取待检测文档;第一计算模块,用于计算所述待检测文档的优美度值;第二计算模块,用于计算所述待检测文档的通顺度值;第三计算模块,用于计算所述待检测文档的错误度值;以及生成模块,用于根据所述待检测文档的优美度值、所述通顺度值和所述错误度值生成所述待检测文档的流畅度值。根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的文档流畅度的检测方法。根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面所述的文档流畅度的检测方法。本申请提供的文档流畅度的检测方法、装置、电子设备及介质,存在如下有益效果:通过计算待检测文档的优美度值、通顺度值和错误度值,进而根据计算得到的优美度值、通顺度值和错误度值,生成待检测文档的流畅度值,由此,实现了文档优美度、通顺度和错误度的自动检测,从而实现了文档流畅度的检测。当本申请的方案应用于作文评阅时,实现了作文的自动评阅,能够从优美度、通顺度和错误度多个方面对作文进行评分,相较于基于教师人工对作文进行打分的方式,能够节省人力和时间,提高作文审阅效率,且评阅标准统一,能够提高作文评分的准确率。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的文档流畅度的检测方法的流程示意图;图2是根据本申请第二实施例的文档流畅度的检测方法的流程示意图;图3是对句子进行依存句法分析的示例图;图4是根据本申请第三实施例的文档流畅度的检测方法的流程示意图;图5是根据多个特征进行优美度检测的过程示例图;图6是根据本申请第四实施例的文档流畅度的检测方法的流程示意图;图7是根据本申请第五实施例的文档流畅度的检测方法的流程示意图;图8是错误检测模型的网络结构示例图;图9是根据本申请第六实施例的文档流畅度的检测装置的结构示意图;图10是根据本申请第七实施例的文档流畅度的检测装置的结构示意图;图11是根据本申请第八实施例的文档流畅度的检测装置的结构示意图;图12是根据本申请第九实施例的文档流畅度的检测装置的结构示意图;图13是根据本申请第十实施例的文档流畅度的检测装置的结构示意图;图14是用来实现本申请实施例的文档流畅度的检测方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。下面参考附图描述本申请的文档流畅度的检测方法、装置、电子设备及介质。作文的语言表达是作文评阅中主要检测的方面,语言表达检测包括检测语言的表达是否优美和语言表达是否流畅两个方面。其中,语言表达优美主要体现在情感和语言美感上,而语言流畅主要体现在语句的通顺度和是否有语法和错别字错误上。目前,对于作文的自动审阅,仅能实现对作文中的文本进行纠错,且仅能对固定模板的错别字错误或较低级的语法错误进行纠错,可解决的错误类型单一,对于作文中经常出现的病句错误、逻辑性错误,或用词不当等错误,缺乏有效的成熟技术,检测准确率和召回率较低。针对上述问题,本申请公开了一种文档流畅度的检测方法,通过计算待检测文档的优美度值、通顺度值和错误度值,进而根据计算得到的优美度值、通顺度值和错误度值,生成待检测文档的流畅度值,由此,实现了文档优美度、通顺度和错误度的自动检测,从而实现了文档流畅度的检测。当本申请的方案应用于作文评阅时,实现了作文的自动评阅,能够从优美度、通顺度和错误度多个方面对作文进行评分,且评阅标准统一,能够提高作文评分的准确率。图1是根据本申请第一实施例的文档流畅度的检测方法的流程示意图,该方法可以由本申请提供的文档流畅度的检测装置执行,也可以由本申请提供的电子设备执行,其中,电子设备可以是服务器,也可以是台式电脑、笔记本电脑、智能手机、可穿戴式设备等终端设备。下面以由本申请提供的文档流畅度的检测装置来执行本申请提供的文档流畅度的检测方法为例来解释说明本申请。如图1所示,该文档流畅度的检测方法,可以包括以下步骤:步骤101,获取待检测文档。其中,待检测文档比如可以是学生的作文、用户创作的文章等。本实施例中,可以通过不同的方式获取待检测文档。作为一种示例,当待检测文档为学生手写的作文时,教师可以对学生手写的作文进行拍照,得到包含用户的作文的图片,并将图片上传至文档流畅度的检测装置,文档流畅度的检测装置通过对教师上传的图片进行光学字符识别(OpticalCharacterRecognition,OCR),获取得到学生的作文,将获得的作文作为待检测文档。作为一种示例,当学生需要对所作的作文进行自检,或者其他用户需要检测创作的文章时,可以在文档流畅度的检测装置提供的输入界面中直接录入文本文字,在录入完成后,文档流畅度的检测装置即获得待检测文档。步骤102,计算待检测文档的优美度值。美的语言作用于创作者的语感,语感包括通顺感、分寸感、韵律感等。具体地说,语感就是规范用字、文从字顺。能引起美感的语言通常是表情达意清楚、连贯得体、绘声绘色、有质感而本文档来自技高网...

【技术保护点】
1.一种文档流畅度的检测方法,包括:/n获取待检测文档;/n计算所述待检测文档的优美度值;/n计算所述待检测文档的通顺度值和错误度值;以及/n根据所述待检测文档的优美度值、所述通顺度值和所述错误度值生成所述待检测文档的流畅度值。/n

【技术特征摘要】
1.一种文档流畅度的检测方法,包括:
获取待检测文档;
计算所述待检测文档的优美度值;
计算所述待检测文档的通顺度值和错误度值;以及
根据所述待检测文档的优美度值、所述通顺度值和所述错误度值生成所述待检测文档的流畅度值。


2.如权利要求1所述的文档流畅度的检测方法,其中,所述计算所述待检测文档的优美度值,包括:
对所述待检测文档进行切分以形成多个子句;
获取所述多个子句的主体结构特征;
获取所述多个子句的基础语句特征;以及
根据所述多个子句的主体结构特征和基础语句特征生成所述待检测文档的优美度值。


3.如权利要求2所述的文档流畅度的检测方法,其中,还包括:
获取所述多个子句的修饰依赖特征,其中,根据所述多个子句的主体结构特征、所述基础语句特征和所述修饰依赖特征生成所述待检测文档的优美度值。


4.如权利要求3所述的文档流畅度的检测方法,其中,还包括:
获取所述多个子句的子句特征;
根据所述多个子句的子句特征生成所述多个子句之间的子句相关性特征,其中,根据所述多个子句的主体结构特征、所述基础语句特征、所述修饰依赖特征和所述子句相关性特征生成所述待检测文档的优美度值。


5.如权利要求4所述的文档流畅度的检测方法,其中,所述根据所述多个子句的主体结构特征、所述基础语句特征、所述修饰依赖特征和所述子句相关性特征生成所述待检测文档的优美度值,包括:
将所述多个子句的主体结构特征、所述基础语句特征、所述修饰依赖特征和所述子句相关性特征进行拼接以生成输入特征;以及
将所述输入特征输入至随机森林模型以生成所述待检测文档的优美度值。


6.如权利要求1所述的文档流畅度的检测方法,其中,所述计算所述待检测文档的通顺度值,包括:
获取所述待检测文档的每个段落;
计算所述每个段落的段落混淆度值;
计算所述每个段落的短句搭配异常值;
根据所述每个段落的段落混淆度值和所述短句搭配异常值生成所述每个段落的通顺度值;以及
根据所述每个段落的通顺度值生成所述待检测文档的通顺度值。


7.如权利要求6所述的文档流畅度的检测方法,其中,所述计算所述每个段落的短句搭配异常值,包括:
获取所述每个段落之中的句子;
获取所述句子之中的多个短句;
计算所述多个短句之间的搭配度值;
如果所述多个短句之间的搭配度值大于预设困惑度阈值,则将所述句子标记为异常句子;以及
获取所述每个段落之中异常句子的数量,并根据所述异常句子的数量生成所述短句搭配异常值。


8.如权利要求6所述的文档流畅度的检测方法,其中,所述计算所述每个段落的段落混淆度值,包括:
获取所述每个段落之中的多个句子;
分别计算所述多个句子的多个语言困惑度值;以及
根据所述段落之中所述多个句子对应的多个语言困惑度值生成所述段落对应的段落混淆度值。


9.如权利要求6所述的文档流畅度的检测方法,其中,通过以下公式生成所述段落的通顺度值:



其中,epi为第i个段落的所述短句搭配异常值,pplmax为所述第i个段落之中所述多个语言困惑度值之中的最大值,ppli为所述第i个段落的段落混淆度值。


10.如权利要求1所述的文档流畅度的检测方法,其中,所述计算所述待检测文档的错误度值,包括:
获取所述待检测文档之中每个句子的错误类型,其中,所述错误类型包括错别字错误和搭配错误;以及
根据所述每个句子的错误类型生成所述待检测文档的错误度值。


11.如权利要求10所述的文档流畅度的检测方法,其中,在所述获取所述待检测文档之中每个句子的错误类型之后,还包括:
根据所述错误类型判断是否属于可纠正错误类型;以及
如果属于所述可纠正错误类型,则获取对应的纠正结果并进行提示。


12.一种文档流畅度的检测装置,包括:
获取模块,用于获取待检测文档;
第一计算模块,用于计算所述待检测文档的优美度值;
第二计算模块,用于计算所述待检测文档的通顺度值;
第三计算模块,用于计算所述待检测文档的错误度值;以及
生成模块,用于根据所述待检测文档的优美度值、所述通顺度值和所...

【专利技术属性】
技术研发人员:甘昆鹭薛璐影
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1