【技术实现步骤摘要】
本申请涉及自然语言处理,尤其涉及一种基于机器学习的文本检测方法、装置、计算机设备及存储介质。
技术介绍
1、随着人工智能技术的发展和普遍性应用,利用人工智能识别获得的文本普遍出现,例如,从用户语音中识别出文本或从图像中识别出文本。然而,由于识别模型的缺陷,通过人工智能识别获得的文本会出现错误,如语法错误和拼写错误等。目前虽然存在一些自动语法检查工具,但这些自动语法检查工具大多关注于英文语法,而对中文和英文混合的文本则无法实现准确的语法检查。因此如何提高中英文混合文本检测的准确度成为了亟需解决的问题。
技术实现思路
1、本申请提供了一种基于机器学习的文本检测方法、装置、计算机设备及存储介质,以提高中英文混合文本检测的准确度。
2、第一方面,本申请提供了一种基于机器学习的文本检测方法,所述方法包括:
3、获取待检测文本,并对所述待检测文本进行预处理,获得待检测中文文本和/或待检测英文文本,其中,所述待检测文本包括待检测网页中的文本或用户输入的文本;
4、在所
...【技术保护点】
1.一种基于机器学习的文本检测方法,其特征在于,包括:
2.根据权利要求1所述的基于机器学习的文本检测方法,其特征在于,所述对所述待检测文本进行预处理,获得待检测中文文本和/或待检测英文文本,包括:
3.根据权利要求2所述的基于机器学习的文本检测方法,其特征在于,所述当所述中文分词的位置不相邻时,将与所述中文分词相邻的英文分词进行翻译,获得所述英文分词对应的中文翻译分词,和/或当所述中文分词的位置不相邻时,将与所述中文分词相邻的英文分词进行翻译,获得所述英文分词对应的中文翻译分词之后,还包括:
4.根据权利要求1所述的基于机器学习的
...【技术特征摘要】
1.一种基于机器学习的文本检测方法,其特征在于,包括:
2.根据权利要求1所述的基于机器学习的文本检测方法,其特征在于,所述对所述待检测文本进行预处理,获得待检测中文文本和/或待检测英文文本,包括:
3.根据权利要求2所述的基于机器学习的文本检测方法,其特征在于,所述当所述中文分词的位置不相邻时,将与所述中文分词相邻的英文分词进行翻译,获得所述英文分词对应的中文翻译分词,和/或当所述中文分词的位置不相邻时,将与所述中文分词相邻的英文分词进行翻译,获得所述英文分词对应的中文翻译分词之后,还包括:
4.根据权利要求1所述的基于机器学习的文本检测方法,其特征在于,所述基于所述第一检测结果和所述第二检测结果,生成所述待检测文本的检测结果之后,还包括:
5.根据权利要求4所述的基于机器学习的文本检测方法,其特征在于,所述在所述检测结果为存在语法错误和/...
【专利技术属性】
技术研发人员:周兆丰,
申请(专利权)人:深圳市瑞云科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。