用于处理文本的方法和装置制造方法及图纸

技术编号:27227688 阅读:30 留言:0更新日期:2021-02-04 11:50
本公开的实施例公开了用于处理文本的方法和装置。该方法的一具体实施方式包括:获取用户书写的内容对应的文本作为用户文本;确定用户文本对应的语音的语音特征,以及利用语音特征进行语音识别以得到识别文本;从用户文本中选取与识别文本中对应的字不同的字作为差异字,得到差异字集;根据差异字集,确定用户书写的内容的处理结果,其中,处理结果用于指示用户书写的内容中出现的疑似错别字。该实施方式实现了有助于实现对用户书写的内容中的错别字的便捷检测。别字的便捷检测。别字的便捷检测。

【技术实现步骤摘要】
用于处理文本的方法和装置


[0001]本公开的实施例涉及计算机
,具体涉及用于处理文本的方法和装置。

技术介绍

[0002]随着计算机技术的快速发展和广泛应用。在日常生活中,用户可以直接利用所使用的电子设备所提供的打字、语音、视频等功能与其它用户进行交流,而用户手写一些字的机会越来也少。这也直接导致用户会淡忘掉许多字的正确写法。因此,用户在通过手写完成一些内容(如手写报告、手写文稿等等)时,容易出现错别字。
[0003]另外,对于许多学生来说,尤其是中小学生,由于其本身对汉字的书写可能就还不熟练,因此,这些用户在在书写作业时,也同样会出现错别字。
[0004]针对以上示例的各种用户书写时容易出现错别字的情况,通常需要用户自身或用户的朋友、家长等仔细检查才可能发现错别字,而且还很容易出现遗漏的错别字。有些情况下,如果用户书写的内容包括的字数太多,这样检查也会非常耗时。

技术实现思路

[0005]本公开的实施例提出了用于处理文本的方法和装置。
[0006]第一方面,本公开的实施例提供了一种用于处理文本的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于处理文本的方法,包括:获取用户书写的内容对应的文本作为用户文本;确定所述用户文本对应的语音的语音特征,以及利用所述语音特征进行语音识别以得到识别文本;从所述用户文本中选取与所述识别文本中对应的字不同的字作为差异字,得到差异字集;根据所述差异字集,确定所述用户书写的内容的处理结果,其中,所述处理结果用于指示所述用户书写的内容中出现的疑似错别字。2.根据权利要求1所述的方法,其中,所述根据所述差异字集,确定所述用户书写的内容的处理结果,包括:对于所述差异字集中的差异字,从所述用户文本中提取该差异字所在的词组成该差异字对应的词集;根据该差异字对应的词集,确定该差异字是否为疑似错别字。3.根据权利要求2所述的方法,其中,所述根据该差异字对应的词集,确定该差异字是否为疑似错别字,包括:确定预设的词库中是否包括该差异字对应的词集中的词;响应于确定所述词库不包括该差异字对应的词集中的词,确定该差异字作为疑似错别字。4.根据权利要求1所述的方法,其中,所述方法还包括:从所述用户文本中选取属于预设的常错字词库中的字和词作为候选字词,得到候选字词集;对于所述候选字词集中的候选字词,确定该候选字词是否为疑似错别字;响应于确定该候选字词为疑似错别字,更新所述处理结果。5.根据权利要求4所述的方法,...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1