使用互联网语料库的自动的上下文相关的语言校正和增强制造技术

技术编号:5375104 阅读:216 留言:0更新日期:2012-04-11 18:40
一种计算机辅助语言校正系统,其包括使用互联网语料库的利用上下文特征序列功能的拼写校正功能、误用词校正功能、语法校正功能和词汇增强功能。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及计算机辅助语言校正。
技术介绍
认为以下公开代表技术的当前状态 美国专利号为5,659,771;5,907,839;6,424,983;7,296,019;5,956,73925和4,674,065的专利 美国公开专利申请号为2006/0247914和2007/0106937的申请。
技术实现思路
本专利技术尝试提供用于计算机辅助语言校正的改进的系统和功能。 因此,根据本专利技术的优选实施例提供了一种计算机辅助语言校正系统,其包括备选词生成器,基于输入句子,生成为所述句子中的多个词的中每一个提供多个备选词的基于文本的表示,选择器,用于至少部分地基于互联网语料库,针对所述句子中的所述多个词的每一个,在至少所述多个备选词中进行选择,以及校正生成器,用于基于所述选择器做出的选择来提供校正输出。 优选地,所述选择器用于,基于以下校正功能中的至少一个来做出所述选择拼写校正、误用词校正、语法校正和词汇增强。 根据本专利技术的优选实施例,所述选择器用于,基于以下校正功能中的至少两个来做出所述选择拼写校正、误用词校正、语法校正和词汇增强。此外,所述选择器用于,基于校正的以下时间顺序中的至少一项来做出所述选择先于误用词校正、语法校正和词汇增强的至少一个的拼写校正,以及先于词汇增强的误用词校正和语法校正。 此外或可选地,由以下功能中的一个来提供所述输入句子词处理器功能、机器翻译功能、语音到文本转换功能、光学字符识别功能,以及即时通信功能,并且所述选择器用于,基于以下校正功能中的至少一个来做出所述选择误用词校正、语法校正以及词汇增强。 优选地,所述校正生成器包括校正语言输入生成器,用于在不需要用户干预的情况下,基于所述选择器做出的选择,提供校正语言输出。此外或可选地,所述语法校正功能包括标点、动词变形、单数/复数、冠词和介词校正功能中的至少一个。 根据本专利技术的优选实施例,所述语法校正功能包括替换、插入和省略校正功能中的至少一个。 优选地,所述选择器包括基于上下文计分功能,用于至少部分地基于在互联网语料库中上下文特征序列(CFS)出现的频率,排序所述多个备选词。此外,所述基于上下文计分功能,还用于至少部分地基于在所述互联网语料库中标准化CFS出现的频率,排序所述多个备选词。 根据本专利技术的另一个优选实施例还提供了一种计算机辅助语言校正系统,其包括以下中的至少一个拼写校正功能、误用词校正功能、语法校正功能、词汇增强功能,以及与以下各项中的至少一个协作并且使用互联网语料库的上下文特征序列功能所述拼写校正功能;所述误用词校正功能、语法校正功能和所述词汇增强功能。 优选地,所述语法校正功能包括标点、动词变形、单数/复数、冠词和介词校正功能中的至少一个。此外或可选地,所述语法校正功能包括替换、插入和省略校正功能中的至少一个。 根据本专利技术的优选实施例,所述计算机辅助语言校正系统包括以下各项中的至少两个所述拼写校正功能、所述误用词校正功能、所述语法校正功能、所述词汇增强功能,并且所述上下文特征序列功能与以下各项中的至少两个进行协作并且使用互联网语料库所述拼写校正功能、所述误用词校正功能、所述语法校正功能和所述词汇增强功能。 优选地,所述计算机辅助语言校正系统还包括以下各项中的至少三个所述拼写校正功能、所述误用词校正功能、所述语法校正功能、所述词汇增强功能,并且所述上下文特征序列功能与以下各项中的至少三个进行协作并且使用互联网语料库所述拼写校正功能;所述误用词校正功能,所述语法校正功能和所述词汇增强功能。 根据本专利技术的优选实施例,所述的计算机辅助语言校正系统还包括所述拼写校正功能、所述误用词校正功能、所述语法校正功能,和所述词汇增强功能,并且所述上下文特征序列功能与以下各项功能进行协作并且使用互联网语料库所述拼写校正功能;所述误用词校正功能,所述语法校正功能和所述词汇增强功能。 优选地,所述校正生成器包括校正语言生成器,用于在不需要用户干预的情况下,基于所述选择器做出的选择,用于提供校正语言输出。 根据本专利技术的另一个优选实施例,还提供了一种计算机辅助语言校正系统,其包括备选词生成器,基于语言输入,生成为所述句子中的多个词中的每一个提供多个备选词的基于文本的表示;选择器,用于至少部分地基于为所述语言输入中的所述多个词中的至少一些选择的所述多个备选词中的多个之间的关系,为所述语言输入中的所述多个词中的每一个,在至少所述多个备选词之间进行选择;校正生成器,用于基于由所述选择器做出的选择,来提供校正输出。 优选地,所述语言输入包括输入句子和输入文本中的至少一个。此外或可选地,所述语言输入是语音并且所述生成器将语音中的所述语言输入转换为为所述语言输入中的多个词提供多个备选词的基于文本的表示。 根据本专利技术的优选实施例,所述语言输入是以下各项中的至少一个文本输入、光学字符识别功能的输出、机器翻译功能的输出,以及词处理功能的输出,并且所述生成器将文本中的所述语言输入转换为为语言输入中的多个词提供多个备选词的基于文本的表示。 优选地,所述选择器,用于至少基于以下校正功能中的两个,做出所述选择拼写错误、误用词校正、语法校正,以及词汇增强。此外,所述选择器用于,基于校正的以下时间顺序中的至少一个来做出所述选择先于误用词校正、语法校正和词汇增强中的至少一个的拼写校正,以及先于词汇增强的误用词校正和语法校正。 根据本专利技术的优选实施例,所述语言输入是语音并且所述选择器用于基于以下校正功能中的至少一个来做出所述选择误用词校正、语法校正,以及词汇增强。 优选地,所述选择器用于通过执行以下功能中的至少两个来做所述选择选择包括比初始选择的所述语言输入中的所有所述多个词少的第一组词或词的组合;之后对所述第一组词或词的组合的元素进行排序以建立选择的优先级;之后为了所述第一组词的元素,当在所述多个备选词之间选择时,选择其它词而不是所有所述多个词作为上下文来影响所述选择。此外或可选地,所述选择器用于通过执行以下功能来做所述选择当选择具有至少两个词的元素时,结合用于所述至少两个词彼此的所述多个备选词的每一个来评估用于所述至少两个词的每一个的所述多个备选词的每一个。 根据本专利技术的优选实施例,所述校正生成器包括校正语言输入生成器,用于在不需要用户干预的情况下,基于所述选择器做出的选择,提供校正语言输出。 根据本专利技术的另一个优选实施例,还提供了一种计算机辅助语言校正系统,其包括误用词怀疑器,基于所述语言输入的上下文中词的合适度来评估语言输入中的至少大部分词;校正生成器,用于至少部分地基于由所述怀疑器执行的评估,提供校正输出。 优选地,所述的计算机辅助语言校正系统还包括备选词生成器,基于所述语言输入,生成为所述语言输入中的所述至少大部分词的至少一个提供多个备选词的基于文本的表示;选择器,用于为所述语言输入中的所述至少大部分的词中的所述至少一个的每一个,在至少所述多个备选词中进行选择,并且其中,所述校正生成器,用于基于所述检测器做出的选择,提供所述校正输出。此外或可选地,所述的计算机辅助语言校正系统还包括怀疑词输出指示器,其指示所述语言输入中的所述词的所述至少大部分的至少一些被怀疑为误用词的程度。 根据本专利技术的优选实施例,所述校正生成器包括自动校正语言生成本文档来自技高网...

【技术保护点】
一种计算机辅助语言校正系统,包括:备选词生成器,基于输入句子,生成为所述句子中的多个词中的每一个提供多个备选词的基于文本的表示;选择器,用于至少部分地基于互联网语料库,针对所述句子中的所述多个词中的每一个,在至少所述多个备选词中进行选择;以及校正生成器,用于基于所述选择器做出的选择来提供校正输出。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:Y卡罗夫赞格威尔A赞格威尔
申请(专利权)人:金格软件有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1