【技术实现步骤摘要】
一种文本纠错的方法、装置、设备和可读存储介质
[0001]本申请涉及计算机信息技术的领域,具体而言,涉及一种文本纠错的方法、装置、设备和可读存储介质。
技术介绍
[0002]随着计算机信息技术的高速发展,语音输入、手写输入、扫描输入等经常还与自动化系统相结合,进而完成更复杂的任务。但这也对输入的准确性提出了更高的要求,错误的输入将导致下游自动化系统无法正常工作。
[0003]不区分编辑内容对应的领域,盲目的进行文本纠错导致在机器输入和特定场景下纠错效果差。而且现有方案普遍采用概率模型,纠错效果与上下文有关,不能支持对特定词语必须纠错为特定内容的要求。
[0004]因此,如何提高文本纠错结果的正确性,成为亟需解决的技术问题。
技术实现思路
[0005]本申请实施例的目的在于提供一种文本纠错的方法,通过本申请的实施例的技术方案可以达到提高文本纠错结果正确性的效果。
[0006]第一方面,本申请提供了一种文本纠错的方法,该方法通过获取待纠错文本的描述信息,其中描述信息用于表示待纠错文本的领域 ...
【技术保护点】
【技术特征摘要】
1.一种文本纠错的方法,其特征在于,包括:获取待纠错文本的描述信息,其中所述描述信息用于表示所述待纠错文本的领域信息和识别信息;根据所述描述信息确定纠错字典,其中所述纠错字典是由源词语和目标词语构成的有向词对集合,不同的所述描述信息对应的所述纠错字典不同;根据所述纠错字典,对所述待纠错文本进行文本纠错。2.根据权利要求1所述的方法,其特征在于,所述获取待纠错文本的描述信息,包括:根据所述待纠错文本的领域信息和所述识别信息确定所述描述信息。3.根据权利要求1或2所述的方法,其特征在于,所述描述信息,包括:应用信息和内容信息,所述应用信息用于表示所述待纠错文本的文本归属和使用场景,所述内容信息用于表示所述待纠错文本在输入来源中通过时间分割和空间分割得到的内容。4.根据权利要求1或2所述的方法,其特征在于,在所述获取待纠错文本的描述信息之前,所述方法还包括:将人工输入的所述有向词对和/或对已有的所述有向词对推导出的新的有向词对构建成所述纠错字典。5.根据权利要求1或2所述的方法,其特征在于,所述根据所述纠错字典,对所述待纠错文本进行文本纠错,包括:根据所述纠错字典生成文本纠错的方法;根据所述文本纠错的方法,对所述待纠错文本进行文本纠错。6.根据权利要求5所述的方法,其特征在于,所述根据所述文本纠错的方法,对所述待纠错文本进行文本纠错,包括:根据...
【专利技术属性】
技术研发人员:王建辉,杜新凯,吕超,刘广鹏,郑志敏,
申请(专利权)人:阳光保险集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。