文本校正方法和装置制造方法及图纸

技术编号：13164173 阅读：47 留言：0更新日期：2016-05-10 10:09

本申请公开了文本校正方法和装置。所述方法的一具体实施方式包括：接收用户输入的文本信息；通过第一语言模型确定出文本信息中的至少一个出错词；基于预定规则确定出与出错词对应的候选词；使用候选词替换出错词，得到校正后的文本信息。该实施方式可以进行准确的文本校正。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机
，具体涉及文本处理
，尤其涉及文本校正方法和装置。
技术介绍
随着人工智能技术的不断发展，越来越多的服务或商品提供商开始建立智能服务交互系统，以便24小时不间断的为用户提供所需要的咨询或业务服务。通常用户可以通过输入文字信息与这类智能系统进行交互。但是，用户所输入的文字信息经常会因为各种原因(例如，拼写错误或按键错误)出现词不达意的情况，而使得用户无法从智能系统中获取有效的帮助信息。因此，对用户在智能交互系统中输入的语句进行纠错，是所有智能交互系统都必须解决的问题。在现有技术中，主要通过预先配置的纠错规则，对用户输入的文本进行校正。具体可以将所有命中纠错规则的词，全都校正为纠错后的词，例如，只要用户输入“优惠卷”，就将其校正为“优惠券”。由于这种纠错规则中只能包括一定数量的固定词汇，因此只能对部分特定词汇进行校正。例如，只能将“ipone6”校正为“Iphone6”，而无法将“ipone6”校正为“Iphone”，也无法对“iphne6”、“iphon6”、“ipone6”等进行校正，因此导致文本校正的准确率和召回率都比较低。
技术实现思路
本申请的目的在于提出一种文本校正方法和装置，来解决以上
技术介绍
部分提到的技术问题。第一方面，本申请提供了一种文本校正方法，所述方法包括:接收用户输入的文本信息;通过第一语言模型确定出所述文本信息中的至少一个出错词;基于预定规则确定出与所述出错词对应的候选词;使用所述候选词替换所述出错词，得到校正后的文本信息。在一些实施例中，所述通过第一语言模型确定出所述文本信息中的至少一个出...

【技术保护点】
一种文本校正方法，其特征在于，包括：接收用户输入的文本信息；通过第一语言模型确定出所述文本信息中的至少一个出错词；基于预定规则确定出与所述出错词对应的候选词；使用所述候选词替换所述出错词，得到校正后的文本信息。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘佳，俞晓光，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人