【技术实现步骤摘要】
一种语义错误检测方法、装置、设备及可读存储介质
[0001]本专利技术涉及神经网络
,特别涉及一种语义错误检测方法、语义错误检测装置、语义错误检测设备及计算机可读存储介质。
技术介绍
[0002]为了减少在语言学习或应用过程中对文章、语句等进行正确与否的审核所需的人力和时间,相关技术采用了深度学习等技术对文章等语料进行纠错检测。然而,相关技术仅针对语法层面的问题进行检测,即判断语法是否正确。但是诸如词语搭配不当、近义词混淆、中式英语问题等语义错误的问题同样是语言学习者在学习和应用语言的过程中面临的较大问题,也是语言学习者希望能够解决的问题。而相关技术仅能对语法错误进行检测,对语义错误的检测能力较弱。
[0003]因此,如何解决相关技术存在的对语义错误检测能力较弱的问题,是本领域技术人员需要解决的技术问题。
技术实现思路
[0004]有鉴于此,本专利技术的目的在于提供一种语义错误检测方法、语义错误检测装置、语义错误检测设备及计算机可读存储介质,解决了相关技术存在的对语义错误检测能力较弱的问题。r/>[0005]为本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语义错误检测方法,其特征在于,包括:获取多个初始训练语料,并确定各个所述初始训练语料中的目标词;基于所述目标词对所述初始训练语料进行训练语料生成处理,得到训练语料集;利用所述训练语料集对初始模型进行训练,得到语义错误检测模型;获取待检测语料和待测词信息并输入所述语义错误检测模型,根据所述待测词信息利用所述语义错误检测模型对所述待检测语料进行检测,得到检测结果。2.根据权利要求1所述的语义错误检测方法,其特征在于,所述获取多个初始训练语料,并确定各个所述初始训练语料中的目标词,包括:获取多个所述初始训练语料,并对所述初始训练语料中的各个词语进行词性识别,得到词性识别结果;当所述词性识别结果为实词时,将对应的所述词语确定为所述目标词。3.根据权利要求1所述的语义错误检测方法,其特征在于,所述基于所述目标词对所述初始训练语料进行训练语料生成处理,得到训练语料集,包括:对所述初始训练语料进行目标词删除处理,得到第一训练语料;获取各个所述目标词对应的混淆词集合,利用所述混淆词集合对所述初始训练语料进行替换处理,得到第二训练语料;利用所述初始训练语料、所述第一训练语料和所述第二训练语料构建所述训练语料集。4.根据权利要求1所述的语义错误检测方法,其特征在于,所述利用所述训练语料集对初始模型进行训练,得到语义错误检测模型,包括:对所述初始模型进行参数随机化处理,并生成所述训练语料集对应的词表;基于所述词表,利用反向传播算法对所述初始模型进行训练,直至所述反向传播算法对应的损失函数值最小,得到所述语义错误检测模型。5.根据权利要求4所述的语义错误检测方法,其特征在于,所述获取待检测语料和待测词信息并输入所述语义错误检测模型,根据所述待测词信息利用所述语义错误检测模型对所述待检测语料进行检测,得到检测结果,包括:根据所述待测词信息确定所述待检测语料中的待测词,并利用所述词表获取所述...
【专利技术属性】
技术研发人员:王永杰,
申请(专利权)人:上海流利说信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。