标点符号检测和纠错方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40935152 阅读:16 留言:0更新日期:2024-04-18 14:54
本申请提供一种标点符号检测和纠错方法、装置、电子设备及存储介质,该方法基于构建的标点纠错词典,包括:调用第一函数,对输入文本进行检测,判断是否包含半角标点,并将半角标点转换为全角标点。调用第二函数,检测输入文本是否包含连续的多个相同标点符号,并对其进行纠错。调用第三函数,对输入文本进行检测,识别是否存在汉字标点字符错误,并进行相应的纠错处理。调用第四函数,检测输入文本中是否存在不匹配的成对标点符号,并对不匹配的成对标点进行纠错。本申请,能够有效地改进文本中标点符号的错误,并提高文本质量。

【技术实现步骤摘要】

本申请涉及标点符号检测,尤其涉及一种标点符号检测和纠错方法、装置、电子设备及存储介质


技术介绍

1、目前基于规则的中文文本标点检测和纠错方法面临一些挑战和局限性。首先,由于中文语言的特殊性和标点符号的特定搭配较多,现有规则未充分考虑这些细节,导致在实际应用中效果不佳。例如,在一些表达方式、省略语或成语等特定语境下,标点符号的具体用法可能会有所变化,但现有方法很难准确捕捉这种细微差别。

2、其次,对于复杂的语境和句子结构,现有规则可能无法准确处理,导致误用和纠错效果不够细致。由于句子结构多样且灵活,存在大量的从句、分句以及各种修饰成分,现有的规则往往无法完全覆盖所有情况。例如,存在长句、倒装句、省略句等特殊句式时,规则可能无法准确捕捉到标点符号的位置和使用方式,导致误用和错误纠错的效果不够细致。


技术实现思路

1、本申请提供一种标点符号检测和纠错方法、装置、电子设备及存储介质,用以解决如何提高标点符号检测及纠错的准确率问题。

2、第一方面,本申请提供一种标点符号检测和纠错方法,该方法应本文档来自技高网...

【技术保护点】

1.一种标点符号检测和纠错方法,其特征在于,该方法应用于一标点纠错词典,其包括中英文成对标点和单个标点的使用规则、预设的标点错误类型以及其相应的纠错规则,所述方法包括:

2.根据权利要求1所述的标点符号检测和纠错方法,其特征在于,所述调用所述标点纠错词典的第一函数对输入文本进行检测,以判断是否包含半角标点,并将包含的半角标点转换为全角标点的步骤包括:

3.根据权利要求1所述的标点符号检测和纠错方法,其特征在于,所述调用所述标点纠错词典的第二函数对所述输入文本进行检测,以查找是否包含连续的多个相同标点符号,并将包含连续的多个相同标点符号进行纠错的步骤包括:

<...

【技术特征摘要】

1.一种标点符号检测和纠错方法,其特征在于,该方法应用于一标点纠错词典,其包括中英文成对标点和单个标点的使用规则、预设的标点错误类型以及其相应的纠错规则,所述方法包括:

2.根据权利要求1所述的标点符号检测和纠错方法,其特征在于,所述调用所述标点纠错词典的第一函数对输入文本进行检测,以判断是否包含半角标点,并将包含的半角标点转换为全角标点的步骤包括:

3.根据权利要求1所述的标点符号检测和纠错方法,其特征在于,所述调用所述标点纠错词典的第二函数对所述输入文本进行检测,以查找是否包含连续的多个相同标点符号,并将包含连续的多个相同标点符号进行纠错的步骤包括:

4.根据权利要求1所述的标点符号检测和纠错方法,其特征在于,所述调用所述标点纠错词典的第三函数对所述输入文本进行检测,以识别是否存在汉字标点字符错误,并将存在的汉字标点字符错误进行纠错的步骤包括:

5.根据权利要求4所述的标点符号检测和纠错方法,其特征在于,所述调用所述标点纠错词典的第三函数对所述输入文本进行检测,以识别是否存在汉字标点字符错误,并将存在的汉字标点字符...

【专利技术属性】
技术研发人员:武子茜伍大勇王士进
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1