当前位置: 首页 > 专利查询>埃里阿博专利>正文

知识系统方法和装置制造方法及图纸

技术编号:2856616 阅读:143 留言:0更新日期:2012-04-11 18:40
对关联概念知识库的获取、重建和生成进行自动化并在很多应用中使用这样的知识库的方法和装置,所述应用包括基于概念搜索、语音识别、数据压缩和人工智能系统进行的人类语言的机器翻译、无组织文本或其他数据的搜索和检索。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及知识系统,更特别地,涉及知识系统在机器翻译、自然语言处理和人工智能系统方面的应用。
技术介绍
I.简介几十年以来,计算机科学各领域中的研究者一直在尝试开发使机器能够以可伸缩的自动方式理解人类所说写的自然语言(如,英语、汉语、阿拉伯语)的方法。虽然可以通过编程让计算机执行特定的任务,目前的技术发展水平还不能提供自动理解单词和短语在上下文中的意义的通用方法或系统。很多应用,包括人类语言的机器翻译(或MT)、语音识别技术、搜索、检索和文本挖掘系统以及人工智能应用,都需要以自动化方式理解自然语言才能实现最佳效果。这样的应用在广泛支持下的显著优点促使大学、政府和企业投资几十年的时间和几十亿以上美元的资本来找寻使得计算机能够处理和理解书面或口头自然语言的方法。由于在这些领域中投入了巨大努力却没有取得突破,科学界中的很多人开始怀疑是否可能实现对自然语言的真实机器理解。甚至很多相信计算机有一天将能够广泛地实现人类理解的支持者也认为那一天仍然很遥远。II.机器翻译的技术发展水平迄今为止,很多语言翻译都是由熟练的翻译人员进行的,而这样做的成本很高。对语言翻译处理进行自动化带来显著的经济效本文档来自技高网...

【技术保护点】
一种获取关联概念知识库的方法,其特征在于,所述方法包括步骤:提供以两种不同的语言表示相同概念的文档配对,其中所述文档配对中的第一个以第一种语言表达,所述文档配对中的第二个以第二种语言表达;接收要分析的查询,所述查询以所述第一 种语言表达,所述查询由单词或单词串组成;分析所述文档配对中的所述第一个来识别所述查询在所述文档配对中的所述第一个中的所有出现;在所述文档配对中的所述第二个中选择多个单词范围,所述选择的范围对应于所述查询在所述文档配对中的所述 第一个中的出现;计算包含在所述选择的范围中单词和单词串的频率;基于通过所述计算步骤得到的...

【技术特征摘要】
US 2002-10-29 10/281,997;US 2003-9-11 10/659,7921.一种获取关联概念知识库的方法,其特征在于,所述方法包括步骤提供以两种不同的语言表示相同概念的文档配对,其中所述文档配对中的第一个以第一种语言表达,所述文档配对中的第二个以第二种语言表达;接收要分析的查询,所述查询以所述第一种语言表达,所述查询由单词或单词串组成;分析所述文档配对中的所述第一个来识别所述查询在所述文档配对中的所述第一个中的所有出现;在所述文档配对中的所述第二个中选择多个单词范围,所述选择的范围对应于所述查询在所述文档配对中的所述第一个中的出现;计算包含在所述选择的范围中单词和单词串的频率;基于通过所述计算步骤得到的所有唯一单词和单词串的出现,用表格列出所述频率;及如果使用所述用表格列出的频率,所述唯一单词和单词串出现在不止一个选择的范围中,则返回所有唯一单词和单词串的出现的列表。2.如权利要求1所述的方法,其特征在于,如果某单词或单词串是出现在不止一个选择的范围中的较长单词串的子集,则所述计算步骤忽略该单词或单词串的出现。3.一种获取关联概念知识库的方法,其特征在于,所述方法包括步骤提供以两种不同的语言表示相同概念的多个文档配对,其中多个所述文档配对中的一组以第一种语言表达,所述多个文档配对中的第二组以第二种语言表达;接收要分析的查询,所述查询以所述第一种语言表达,所述查询由单词或单词串组成;分析所述多个配对中的所述第一组来识别所述查询在所述第一组中的所有出现;在所述多个配对中的所述第二组中选择多个单词范围,所述选择的范围对应于所述查询在所述第一组中的出现;计算包含在所述选择的范围中单词和单词串的频率;基于通过所述计算步骤得到的所有唯一单词和单词串的出现,用表格列出所述频率;及如果使用所述用表格列出的频率,所述唯一单词和单词串出现在不止一个选择的范围中,则返回所有唯一单词和单词串的出现的列表。4.如权利要求3所述的方法,其特征在于,如果某单词或单词串是出现在不止一个选择的范围中的较长单词串的子集,则所述计算步骤忽略该单词或单词串的出现。5.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤提供以两种不同的语言表示相同概念的文档配对,其中所述文档配对中的第一个以第一种语言表达,所述文档配对中的第二个以第二种语言表达;接收要分析的查询,所述查询以所述第一种语言表达,所述查询由单词或单词串组成;分析所述文档配对中的所述第一个来识别所述查询在所述文档配对中的所述第一个中的所有出现;在所述文档配对中的所述第二个中选择多个单词范围,所述选择的范围对应于所述查询在所述文档配对中的所述第一个中的出现;计算包含在所述选择的范围中单词和单词串的频率;基于通过所述计算步骤得到的所有唯一单词和单词串的出现,用表格列出所述频率;及如果使用所述用表格列出的频率,所述唯一单词和单词串出现在不止一个选择的范围中,则返回所有唯一单词和单词串的出现的列表。6.如权利要求5所述的计算机设备,其特征在于,如果某单词或单词串是出现在不止一个选择的范围中的较长单词串的子集,则所述计算步骤忽略该单词或单词串的出现。7.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤提供以两种不同的语言表示相同概念的多个文档配对,其中多个所述文档配对中的一组以第一种语言表达,所述多个文档配对中的第二组以第二种语言表达;接收要分析的查询,所述查询以所述第一种语言表达,所述查询由单词或单词串组成;分析所述多个配对中的所述第一组来识别所述查询在所述第一组中的所有出现;在所述多个配对中的所述第二组中选择多个单词范围,所述选择的范围对应于所述查询在所述第一组中的出现;计算包含在所述选择的范围中单词和单词串的频率,所述频率基于所有唯一单词和单词串的出现;基于通过所述计算步骤得到的所有唯一单词和单词串的出现,用表格列出所述频率;及如果使用所述用表格列出的频率,所述唯一单词和单词串出现在不止一个选择的范围中,则返回所有唯一单词和单词串的出现的列表。8.如权利要求7所述的计算机设备,其特征在于,如果某单词或单词串是出现在不止一个选择的范围中的较长单词串的子集,则所述计算步骤忽略该单词或单词串的出现。9.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤提供以两种不同的语言表示相同概念的文档配对,其中所述文档配对中的第一个以第一种语言表达,所述文档配对中的第二个以第二种语言表达;接收要分析的查询,所述查询以所述第一种语言表达,所述查询由单词或单词串组成;分析所述文档配对中的所述第一个来识别所述查询在所述文档配对中的所述第一个中的所有出现;在所述文档配对中的所述第二个中选择多个单词范围,所述选择的范围对应于所述查询在所述文档配对中的所述第一个中的出现;计算包含在所述选择的范围中单词和单词串的频率;基于通过所述计算步骤得到的所有唯一单词和单词串的出现,用表格列出所述频率;及如果使用所述用表格列出的频率,所述唯一单词和单词串出现在不止一个选择的范围中,则返回所有唯一单词和单词串的出现的列表。10.如权利要求9所述的计算机可读存储媒体,其特征在于,如果某单词或单词串是出现在不止一个选择的范围中的较长单词串的子集,则所述计算步骤忽略该单词或单词串的出现。11.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤提供以两种不同的语言表示相同概念的多个文档配对,其中多个所述文档配对中的一组以第一种语言表达,所述多个文档配对中的第二组以第二种语言表达;接收要分析的查询,所述查询以所述第一种语言表达,所述查询由单词或单词串组成;分析所述多个配对中的所述第一组来识别所述查询在所述第一组中的所有出现;在所述多个配对中的所述第二组中选择多个单词范围,所述选择的范围对应于所述查询在所述第一组中的出现;计算包含在所述选择的范围中单词和单词串的频率;基于通过所述计算步骤得到的所有唯一单词和单词串的出现,用表格列出所述频率;及如果使用所述用表格列出的频率,所述唯一单词和单词串出现在不止一个选择的范围中,则返回所有唯一单词和单词串的出现的列表。12.如权利要求11所述的计算机可读存储媒体,其特征在于,如果某单词或单词串是出现在不止一个选择的范围中的较长单词串的子集,则所述计算步骤忽略该单词或单词串的出现。13.一种对关联进行记号化,以便进行高效的信息传输的方法,其特征在于,所述方法包括下面的步骤创建关联;及通过指定等价于所述关联的记号来记号化所述关联;所述创建关联包括提供以两种不同的语言表示相同概念的文档配对,其中所述文档配对中的第一个以第一种语言表达,所述文档配对中的第二个以第二种语言表达;接收要分析的查询,所述查询以所述第一种语言表达,所述查询由单词或单词串组成;分析所述文档配对中的所述第一个来识别所述查询在所述文档配对中的所述第一个中的所有出现;在所述文档配对中的所述第二个中选择多个单词范围,所述选择的范围对应于所述查询在所述文档配对中的所述第一个中的出现;计算包含在所述选择的范围中单词和单词串的频率,如果某单词或单词串是出现在不止一个选择的范围中的较长单词串的子集,则所述计算步骤忽略该单词或单词串的出现;基于通过所述计算步骤得到的所有唯一单词和单词串的出现,用表格列出所述频率;及如果使用所述用表格列出的频率,所述唯一单词和单词串出现在不止一个选择的范围中,则返回所有唯一单词和单词串的出现的列表。14.如权利要求13所述的方法,其特征在于,还包括将所述记号从一个位置发送到第二位置或多个第二位置;在所述第二位置或多个第二位置,分析所述指定的记号来识别所述关联;及向用户提供所述关联。15.一种对关联进行记号化,以便进行高效的信息传输的方法,其特征在于,所述方法包括下面的步骤创建关联;及通过指定等价于所述关联的记号来记号化所述关联;所述创建关联包括提供以两种不同的语言表示相同概念的多个文档配对,其中多个所述文档配对中的一组以第一种语言表达,所述多个文档配对中的第二组以第二种语言表达;接收要分析的查询,所述查询以所述第一种语言表达,所述查询由单词或单词串组成;分析所述多个配对中的所述第一组来识别所述查询在所述第一组中的所有出现;在所述多个配对中的所述第二组中选择多个单词范围,所述选择的范围对应于所述查询在所述第一组中的出现;计算包含在所述选择的范围中单词和单词串的频率,如果某单词或单词串是出现在不止一个选择的范围中的较长单词串的子集,则所述计算步骤忽略该单词或单词串的出现;基于通过所述计算步骤得到的所有唯一单词和单词串的出现,用表格列出所述频率;及如果使用所述用表格列出的频率,所述唯一单词和单词串出现在不止一个选择的范围中,则返回所有唯一单词和单词串的出现的列表。16.如权利要求15所述的方法,其特征在于,还包括将所述记号从一个位置发送到第二位置或多个第二位置;在所述第二位置或多个第二位置,分析所述指定的记号来识别所述关联;及向用户提供所述关联。17.一种创建包括源语言、目标语言和一种第三语言的关联概念知识库的方法,其特征在于,所述方法包括下面的步骤接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;将所述查询翻译为以所述第三语言表达的结果;将所述结果翻译为以所述目标语言表达的第二结果;及在所述目标语言中关联所述查询与所述第二结果。18.一种创建包括源语言、目标语言和多种第三语言的关联概念知识库的方法,其特征在于,所述方法包括下面的步骤a.接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;b.将所述查询翻译为以所述第三语言表达的结果;c.将所述结果翻译为以所述目标语言表达的第二结果;d.对所述多种第三语言中的每一种,重复步骤b和c;e.返回所述第二结果中的每一个;及f.对通过所述多种语言中的两种或多种产生的所有第二结果,将一个或多个所述第二结果与所述查询关联。19.如权利要求17或15所述的方法,其特征在于,包括下述步骤使用现有的一种或多种翻译方案,将所述查询为翻译所述目标语言中的第三结果;返回所述第三结果,并将所述返回的结果添加到所述返回的所述目标语言中的第二结果中;及对产生不止一次的所有第二或第三结果,关联搜索查询的一个或多个所述第二结果和第三结果。20.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;将所述查询翻译为以所述第三语言表达的结果;将所述结果翻译为以所述目标语言表达的第二结果;及在所述目标语言中关联所述查询与所述第二结果。21.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤a.接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;b.将所述查询翻译为以所述第三语言表达的结果;c.将所述结果翻译为以所述目标语言表达的第二结果;d.对所述多种第三语言中的每一种,重复步骤b和c;e.返回所述第二结果中的每一个;及f.对通过所述多种语言中的两种或多种产生的所有第二结果,将一个或多个所述第二结果与所述查询关联。22.如权利要求20或21所述的计算机设备,其特征在于,还配置为执行下面的步骤使用现有的一种或多种翻译方案,将所述查询为翻译所述目标语言中的第三结果;返回所述第三结果,并将所述返回的结果添加到所述返回的所述目标语言中的第二结果中;及对产生不止一次的所有第二或第三结果,关联搜索查询的一个或多个所述第二结果和第三结果。23.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;将所述查询翻译为以所述第三语言表达的结果;将所述结果翻译为以所述目标语言表达的第二结果;及在所述目标语言中关联所述查询与所述第二结果。24.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤a.接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;b.将所述查询翻译为以所述第三语言表达的结果;c.将所述结果翻译为以所述目标语言表达的第二结果;d.对所述多种第三语言中的每一种,重复步骤b和c;e.返回所述第二结果中的每一个;及f.对通过所述多种语言中的两种或多种产生的所有第二结果,将一个或多个所述第二结果与所述查询关联。25.如权利要求23或24所述的计算机媒体,其特征在于,还配置为执行下面的步骤使用现有的一种或多种翻译方案,将所述查询为翻译所述目标语言中的第三结果;返回所述第三结果,并将所述返回的结果添加到所述返回的所述目标语言中的第二结果中;及对产生不止一次的所有第二或第三结果,关联搜索查询的一个或多个所述第二结果和第三结果。26.一种对关联进行记号化,以便进行高效的信息传输的方法,其特征在于,所述方法包括下面的步骤使用下面的步骤,创建包括源语言、目标语言及一种第三语言的关联接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;将所述查询翻译为以所述第三语言表达的结果;将所述结果翻译为以所述目标语言表达的第二结果;在所述目标语言中关联所述查询与所述第二结果;及通过指定等价于所述关联的记号来记号化所述关联。27.如权利要求26所述的方法,其特征在于,还包括;将所述记号从一个位置发送到第二位置或多个第二位置;在所述第二位置或多个第二位置,分析所述指定的记号来识别所述关联;及向用户提供所述关联。28.一种对关联进行记号化,以便进行高效的信息传输的方法,其特征在于,所述方法包括下面的步骤使用下面的步骤,创建包括源语言、目标语言及多种第三语言的关联a.接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;b.将所述查询翻译为以所述第三语言表达的结果;c.将所述结果翻译为以所述目标语言表达的第二结果;d.对所述多种第三语言中的每一种,重复步骤b和c;e.返回所述第二结果中的每一个;f.对通过所述多种语言中的两种或多种产生的所有第二结果,将一个或多个所述第二结果与所述查询关联;及通过指定等价于所述关联的记号来记号化所述关联。29.如权利要求28所述的方法,其特征在于,还包括;将所述记号从一个位置发送到第二位置或多个第二位置;在所述第二位置或多个第二位置,分析所述指定的记号来识别所述关联;及向用户提供所述关联。30.一种创建关联概念知识库的方法,其特征在于,所述方法包括步骤使用以第二种语言表达的单词和/或单词串,提供以第一种言表达的单词串的翻译;提供以所述第二种语言表达的文档语料库;接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;对所述查询,使用所述提供的翻译,识别组成所述单词串查询的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述识别步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;及从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为单词串结果。31.如权利要求30所述的方法,其特征在于,以所述第二种语言表达的所述单词串至少具有第一部分和第二部分,且所述列表表示所述第一种语言的查询与所述第二种语言的表达的关联,所述方法还包括下面的步骤检查返回的单词串结果的所述列表,查找任何两个具有重叠的所述第一部分和第二部分的所述返回的单词串结果的出现;将所有所述两个重叠的返回的单词串组合为第三单词串,其中所述第三单词串是所述第一单词串和所述第二单词串合并所述重叠的单词之后的组合;及将所有所述第三单词串添加到所述单词串结果的所述列表中。32.如权利要求30所述的方法,其特征在于,以第一种语言表达的单词包括第一种语言中的特定单词串,如习语和搭配。33.如权利要求30、31和32所述的方法,其特征在于,还包括基于用户定义的准则对所述单词串结果列表进行分级。34.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤使用以第二种语言表达的单词和/或单词串,提供以第一种言表达的单词串的翻译;提供以所述第二种语言表达的文档语料库;接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;对所述查询,使用所述提供的翻译,识别组成所述单词串查询的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述识别步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;及从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为单词串结果。35.如权利要求34所述的方法,其特征在于,以所述第二种语言表达的所述单词串至少具有第一部分和第二部分,且所述列表表示所述第一种语言的查询与所述第二种语言的表达的关联,所述方法还包括下面的步骤检查返回的单词串结果的所述列表,查找任何两个具有重叠的所述第一部分和第二部分的所述返回的单词串结果的出现;将所有所述两个重叠的返回的单词串组合为第三单词串,其中所述第三单词串是所述第一单词串和所述第二单词串合并所述重叠的单词之后的组合;及 将所有所述第三单词串添加到所述单词串结果的所述列表中。36.如权利要求34所述的方法,其特征在于,以第一种语言表达的单词包括第一种语言中的特定单词串,如习语和搭配。37.如权利要求34所述的方法,其特征在于,还包括基于用户定义的准则对所述单词串结果列表进行分级。38.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤使用以第二种语言表达的单词和/或单词串,提供以第一种言表达的单词串的翻译;提供以所述第二种语言表达的文档语料库;接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;对所述查询,使用所述提供的翻译,识别组成所述单词串查询的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述识别步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;及从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为单词串结果。39.如权利要求38所述的计算机媒体,其特征在于,以所述第二种语言表达的所述单词串至少具有第一部分和第二部分,且所述列表表示所述第一种语言的查询与所述第二种语言的表达的关联,所述方法还包括下面的步骤检查返回的单词串结果的所述列表,查找任何两个具有重叠的所述第一部分和第二部分的所述返回的单词串结果的出现;将所有所述两个重叠的返回的单词串组合为第三单词串,其中所述第三单词串是所述第一单词串和所述第二单词串合并所述重叠的单词之后的组合;及将所有所述第三单词串添加到所述单词串结果的所述列表中。40.如权利要求38所述的计算机媒体,其特征在于,以第一种语言表达的单词包括第一种语言中的特定单词串,如习语和搭配。41.如权利要求38所述的计算机媒体,其特征在于,还包括基于用户定义的准则对所述单词串结果列表进行分级。42.一种对关联进行记号化,以便进行高效的信息传输的方法,其特征在于,所述方法包括下面的步骤创建关联;及通过指定等价于所述关联的记号来记号化所述关联;所述创建关联包括使用以第二种语言表达的单词和/或单词串,提供以第一种语言表达的单词串的翻译;提供以所述第二种语言表达的文档语料库;接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;对所述查询,使用所述提供的翻译,识别组成所述单词串查询的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述识别步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;及从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为单词串结果。43.如权利要求42所述的方法,其特征在于,还包括;将所述记号从一个位置发送到第二位置或多个第二位置;在所述第二位置或多个第二位置,分析所述指定的记号来识别所述关联;及向用户提供所述关联。44.如权利要求42所述的方法,其特征在于,以第一种语言表达的单词包括第一种语言中的特定单词串,如习语和搭配。45.如权利要求30所述的方法,其特征在于,还包括提供以所述第一种语言表达的文档语料库;在以所述第一种语言表达的所述文档语料库中,识别所述查询的用户定义数量的出现;分析在所述查询的每次所述出现左边和右边的用户定义数量的单词和/或单词串,并识别组成在所述查询左边的用户定义数量的单词和/或单词串、所述查询,及在所述查询右边的用户定义数量的单词和/或单词串的单词串;创建组成所述分析步骤的结果的返回的单词串的列表;单独分析每个返回的单词串,并使用所述提供的翻译识别组成每个所述返回的单词串的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述创建步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为单词串结果;分析所述单词串列表和所述第二单词串列表来识别所述单词串列表上的每个单词串作为在所述第二单词串列表上的单词串的子集单词串出现的次数;及基于所述分析所述单词串列表和所述第二单词串列表的步骤,返回一个列表。46.如权利要求45所述的方法,其特征在于,所述分析所述单词串列表和所述第二单词串列表的步骤包括,如果单词串是处于相同返回列表上的较长单词串的子集,则忽略该单词串的每次出现来修改所述出现次数。47.如权利要求45所述的方法,其特征在于,以第一种语言表达的单词包括第一种语言中的特定单词串,如习语和搭配。48.如权利要求45或46所述的方法,其特征在于,还包括基于用户定义的准则对所述单词串结果列表进行分级。49.如权利要求34所述的计算机设备,其特征在于,还配置为执行下面的步骤提供以所述第一种语言表达的文档语料库;在以所述第一种语言表达的所述文档语料库中,识别所述查询的用户定义数量的出现;分析在所述查询的每次所述出现左边和右边的用户定义数量的单词和/或单词串,并识别组成在所述查询左边的用户定义数量的单词和/或单词串、所述查询,及在所述查询右边的用户定义数量的单词和/或单词串的单词串;创建组成所述分析步骤的结果的返回的单词串的列表;单独分析每个返回的单词串,并使用所述提供的翻译识别组成每个所述返回的单词串的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述创建步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为单词串结果;分析所述单词串列表和所述第二单词串列表来识别所述单词串列表上的每个单词串作为在所述第二单词串列表上的单词串的子集单词串出现的次数;及基于所述分析所述单词串列表和所述第二单词串列表的步骤,返回一个列表。50.如权利要求49所述的计算机设备,其特征在于,所述分析所述单词串列表和所述第二单词串列表的步骤包括,如果单词串是处于相同返回列表上的较长单词串的子集,则忽略该单词串的每次出现来修改所述出现次数。51.如权利要求49所述的计算机设备,其特征在于,以第一种语言表达的单词包括第一种语言中的特定单词串,如习语和搭配。52.如权利要求49或50所述的计算机设备,其特征在于,还配置为执行下面的步骤基于用户定义的准则对所述单词串结果列表进行分级。53.如权利要求38所述的计算机可读存储媒体,其特征在于,还配置为执行下面的步骤提供以所述第一种语言表达的文档语料库;在以所述第一种语言表达的所述文档语料库中,识别所述查询的用户定义数量的出现;分析在所述查询的每次所述出现左边和右边的用户定义数量的单词和/或单词串,并识别组成在所述查询左边的用户定义数量的单词和/或单词串、所述查询,及在所述查询右边的用户定义数量的单词和/或单词串的单词串;创建组成所述分析步骤的结果的返回的单词串的列表;单独分析每个返回的单词串,并使用所述提供的翻译识别组成每个所述返回的单词串的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述创建步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为单词串结果;分析所述单词串列表和所述第二单词串列表来识别所述单词串列表上的每个单词串作为在所述第二单词串列表上的单词串的子集单词串出现的次数;及基于所述分析所述单词串列表和所述第二单词串列表的步骤,返回一个列表。54.如权利要求53所述的计算机媒体,其特征在于,所述分析所述单词串列表和所述第二单词串列表的步骤包括,如果单词串是处于相同返回列表上的较长单词串的子集,则忽略该单词串的每次出现来修改所述出现次数。55.如权利要求53所述的计算机媒体,其特征在于,以第一种语言表达的单词包括第一种语言中的特定单词串,如习语和搭配。56.如权利要求53所述的计算机媒体,其特征在于,还配置为执行下面的步骤基于用户定义的准则对所述单词串结果列表进行分级。57.一种对关联进行记号化,以便进行高效的信息传输的方法,其特征在于,所述方法包括下面的步骤创建关联;及通过指定等价于所述关联的记号来记号化所述关联;所述创建关联包括使用以第二种语言表达的单词和/或单词串,提供以第一种言表达的单词串的翻译;提供以所述第二种语言表达的文档语料库;接收要分析的查询,所述查询以源语言表达,所述查询由单词或单词串组成;对所述查询,使用所述提供的翻译,识别组成所述单词串查询的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述识别步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为结果;提供以所述第一种语言表达的文档语料库;在以所述第一种语言表达的所述文档语料库中,识别所述查询的用户定义数量的出现;分析在所述查询的每次所述出现左边和右边的用户定义数量的单词和/或单词串,并识别组成在所述查询左边的用户定义数量的单词和/或单词串、所述查询,及在所述查询右边的用户定义数量的单词和/或单词串的单词串;创建组成所述分析步骤的结果的返回的单词串的列表;单独分析每个返回的单词串,并使用所述提供的翻译识别组成每个所述返回的单词串的每个单词在所述第二种语言中的所有翻译;分析所述文档语料库,查找以所述第二种语言表达的单词串,其中所述分析只识别具有用户定义的最大单词数的单词串,所述分析只识别具有在所述创建步骤中通过用户定义的最少数量的以第一种语言表达的单词获取的翻译的单词串,且所述分析只对以第一种语言表达的所述单词中的每个的一个翻译进行计数;从对所述文档语料库进行的所述分析中,返回以所述第二种语言表达的所述单词串的列表作为单词串结果;分析所述单词串列表和所述第二单词串列表来识别所述单词串列表上的每个单词串作为在所述第二单词串列表上的单词串的子集单词串出现的次数;及基于所述分析所述单词串列表和所述第二单词串列表的步骤,返回一个列表。58.如权利要求57所述的方法,其特征在于,还包括将所述记号从一个位置发送到第二位置或多个第二位置;在所述第二位置或多个第二位置,分析所述指定的记号来识别所述关联;及向用户提供所述关联。59.如权利要求57所述的方法,其特征在于,以第一种语言表达的单词包括第一种语言中的特定单词串,如习语和搭配。60.一种获取关联概念知识库的方法,其特征在于,所述方法包括步骤使用以目标语言表达的单词串,提供以源语言表达的单词串的翻译;接收以所述源语言表达的两个内容片段,其中所述第一片段和所述第二片段具有所述内容的重叠部分;使用所述单词串的翻译,翻译所述第一内容片段,从而返回以所述目标语言表达的第三片段;使用所述单词串的翻译,翻译所述第二内容片段,从而返回以所述目标语言表达的第四片段;分析所述第三片段和所述第四片段,确定所述第三片段和所述第四片段是否具有重叠部分;如果所述第三片段和所述第四片段具有重叠部分,则关联所述第三片段和所述第四片段的重叠部分与所述第一片段和所述第二片段的重叠部分;及如果所述第三片段和所述第四片段具有重叠部分,则关联所述第三片段和所述第四片段合并所述重叠部分组合得到的单个目标语言单词串与所述第一片段和所述第二片段合并所述重叠部分组合得到的单个源语言单词串。61.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤使用以目标语言表达的单词串,提供以源语言表达的单词串的翻译;接收以所述源语言表达的两个内容片段,其中所述第一片段和所述第二片段具有所述内容的重叠部分;使用所述单词串的翻译,翻译所述第一内容片段,从而返回以所述目标语言表达的第三片段;使用所述单词串的翻译,翻译所述第二内容片段,从而返回以所述目标语言表达的第四片段;分析所述第三片段和所述第四片段,确定所述第三片段和所述第四片段是否具有重叠部分;如果所述第三片段和所述第四片段具有重叠部分,则关联所述第三片段和所述第四片段的重叠部分与所述第一片段和所述第二片段的重叠部分;及如果所述第三片段和所述第四片段具有重叠部分,则关联所述第三片段和所述第四片段合并所述重叠部分组合得到的单个目标语言单词串与所述第一片段和所述第二片段合并所述重叠部分组合得到的单个源语言单词串。62.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤使用以目标语言表达的单词串,提供以源语言表达的单词串的翻译;接收以所述源语言表达的两个内容片段,其中所述第一片段和所述第二片段具有所述内容的重叠部分;使用所述单词串的翻译,翻译所述第一内容片段,从而返回以所述目标语言表达的第三片段;使用所述单词串的翻译,翻译所述第二内容片段,从而返回以所述目标语言表达的第四片段;分析所述第三片段和所述第四片段,确定所述第三片段和所述第四片段是否具有重叠部分;如果所述第三片段和所述第四片段具有重叠部分,则关联所述第三片段和所述第四片段的重叠部分与所述第一片段和所述第二片段的重叠部分;及如果所述第三片段和所述第四片段具有重叠部分,则关联所述第三片段和所述第四片段合并所述重叠部分组合得到的单个目标语言单词串与所述第一片段和所述第二片段合并所述重叠部分组合得到的单个源语言单词串。63.一种对关联进行记号化,以便进行高效的信息传输的方法,其特征在于,所述方法包括下面的步骤创建关联;及通过指定等价于所述关联的记号来记号化所述关联;所述创建关联包括使用以目标语言表达的单词串,提供以源语言表达的单词串的翻译;接收以所述源语言表达的两个内容片段,其中所述第一片段和所述第二片段具有所述内容的重叠部分;使用所述单词串的翻译,翻译所述第一内容片段,从而返回以所述目标语言表达的第三片段;使用所述单词串的翻译,翻译所述第二内容片段,从而返回以所述目标语言表达的第四片段;分析所述第三片段和所述第四片段,确定所述第三片段和所述第四片段是否具有重叠部分;如果所述第三片段和所述第四片段具有重叠部分,则关联所述第三片段和所述第四片段的重叠部分与所述第一片段和所述第二片段的重叠部分;及如果所述第三片段和所述第四片段具有重叠部分,则关联所述第三片段和所述第四片段合并所述重叠部分组合得到的单个目标语言单词串与所述第一片段和所述第二片段合并所述重叠部分组合得到的单个源语言单词串。64.如权利要求63所述的方法,其特征在于,还包括将所述记号从一个位置发送到第二位置或多个第二位置;在所述第二位置或多个第二位置,分析所述指定的记号来识别所述关联;及向用户提供所述关联。65.一种转换内容和重建知识库的方法,其特征在于,所述方法包括下面的步骤a.接收以第一种语言表达的内容;b.将所述以第一种语言表达的内容解析为多个片段;c.选择第一片段和第二片段,所述第一片段与所述第二片段具有所述内容的重叠部分;d.访问以第二种语言表达的所述内容中的第一目标片段,所述第一目标片段对应于所述第一片段和第二片段中的一个;e.访问以第二种语言表达的所述内容中的第二目标片段,所述第二目标片段对应于所述第一片段和第二片段中的另一个,并且与所述第一个目标片段具有重叠部分;f.基于所述第一目标片段和第二目标片段合并重叠部分得到的组合,确定以第二种语言表达的所述内容;g.提供以所述第二种语言表达的所述内容;及h.对多个片段中的全部,重复步骤c至g,其中将所述第二片段指定为第一片段,且将与所述第二片段具有重叠部分的下一片段指定为第二片段;及i.对所述多个片段中的所有下一片段,重复步骤h,直到将所述内容全部转换为所述第二种语言。66.一种通过重建知识库来转换文档内容的方法,其特征在于,所述方法包括下面的步骤利用第一种语言和第二种语言的内容之间的片段关联数据库,其中所述转换包括用它们在所述第二种语言中具有重叠内容片段的对应翻译来解析和检查所述第一种语言的文档内容的重叠片段;通过所述检查的第一种语言内容和所述检查的第二种语言的内容,合并重叠的片段,及在合并重叠片段之后关联所述第一种语言的内容与所述第二种语言的内容。67.一种转换文档和重建知识库的方法,其特征在于,所述方法包括下面的步骤a.提供包括第一种语言的数据片段及与其关联的第二种语言的数据片段的内容;b.从要翻译的文档中,选择开始于文档的第一个单词并存在于数据库中的第一种语言的数据片段;c.从数据库中检索与所定位的第一种语言的第一片段关联的第二种语言的片段;d.选择至少一个与先前划分出的第一种语言的片段具有一个或多个重叠部分的在第一种语言中划分出的第二片段;e.从数据库中检索与选择的第一种语言的第二片段关联的第二种语言的第二片段;f.返回第一种语言中的两个数据片段,并合并重叠部分,使它们成为第一种语言的单个数据片段;g.如果第二种语言的两个数据片段具有重叠部分,则返回,第二种语言中通过合并重叠部分得到的单个数据片段;及h.关联所述第一种语言的所述单个数据片段与所述第二种语言的所述单个数据片段,从而返回所述单个数据片段从所述第一种语言到所述第二种语言的转换。68.如权利要求67所述的方法,其特征在于,还包括指定第一种语言的文档中与第一种语言的前一个数据片段重叠的下一个数据片段作为第一种语言中划分出的第二片段,重复步骤d至h。69.如权利要求68所述的方法,其特征在于,还包括对第一种语言的文档中与第一种语言的前一个数据片段重叠的所有下一个数据片段,重复步骤d至h,直到转换完整个文档。70.如权利要求67所述的方法,其特征在于,所述片段以一个单词或多个单词的形式出现。71.如权利要求67所述的方法,其特征在于,所述片段以多个单词的形式出现。72.一种转换文档的方法,其特征在于,所述方法包括下面的步骤a.提供包括第一种语言的数据片段及与其关联的第二种语言的数据片段的内容;b.从要翻译的文档中,选择开始于文档的第一个单词并存在于数据库中的第一种语言的数据片段;c.从数据库中检索与所定位的第一种语言的第一片段关联的第二种语言的片段;d.选择至少一个与先前划分出的第一种语言的片段具有一个或多个重叠部分的在第一种语言中划分出的第二片段;e.从数据库中检索与选择出的第一种语言的第二片段关联的第二种语言的第二片段,所述选择出的第一种语言的第二片段与该片段在第二种语言中具有重叠部分;及f.合并重叠部分组合第二种语言的两个片段来构成第一种语言的两个片段合并重叠部分之后的翻译。73.如权利要求72所述的方法,其特征在于,还包括指定下一个片段作为划分出的第二片段,重复步骤d至f,直到将文档完全转换为第二种语言。74.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤a.接收以第一种语言表达的内容;b.将所述以第一种语言表达的内容解析为多个片段;c.选择第一片段和第二片段,所述第一片段与所述第二片段具有所述内容的重叠部分;d.访问以第二种语言表达的所述内容中的第一目标片段,所述第一目标片段对应于所述第一片段和第二片段中的一个;e.访问以第二种语言表达的所述内容中的第二目标片段,所述第二目标片段对应于所述第一片段和第二片段中的另一个,并且与所述第一个目标片段具有重叠部分;f.基于所述第一目标片段和第二目标片段合并重叠部分得到的组合,确定以第二种语言表达的所述内容;g.提供以所述第二种语言表达的所述内容;及h.对多个片段中的全部,重复步骤c至g,其中将所述第二片段指定为第一片段,且将与所述第二片段具有重叠部分的下一片段指定为第二片段;及i.对所述多个片段中的所有下一片段,重复步骤h,直到将所述内容全部转换为所述第二种语言。75.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤a.提供包括第一种语言的数据片段及与其关联的第二种语言的数据片段的内容;b.从要翻译的文档中,选择开始于文档的第一个单词并存在于数据库中的第一种语言的数据片段;c.从数据库中检索与所定位的第一种语言的第一片段关联的第二种语言的片段;d.选择至少一个与先前划分出的第一种语言的片段具有一个或多个重叠部分的在第一种语言中划分出的第二片段;e.从数据库中检索与选择的第一种语言的第二片段关联的第二种语言的第二片段;f.返回第一种语言中的两个数据片段,并合并重叠部分,使它们成为第一种语言的单个数据片段;g.如果第二种语言的两个数据片段具有重叠部分,则返回,第二种语言中通过合并重叠部分得到的单个数据片段;及h.关联所述第一种语言的所述单个数据片段与所述第二种语言的所述单个数据片段,从而返回所述单个数据片段从所述第一种语言到所述第二种语言的转换。76.如权利要求75所述的计算机设备,其特征在于,还配置为指定第一种语言的文档中与第一种语言的前一个数据片段重叠的下一个数据片段作为第一种语言中划分出的第二片段,重复步骤d至h。77.如权利要求76所述的计算机设备,其特征在于,还配置为对第一种语言的文档中与第一种语言的前一个数据片段重叠的所有下一个数据片段,重复步骤d至h,直到转换完整个文档的内容。78.如权利要求75所述的计算机设备,其特征在于,所述片段以一个单词或多个单词的形式出现。79.如权利要求75所述的计算机设备,其特征在于,所述片段以多个单词的形式出现。80.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤a.接收以第一种语言表达的内容;b.将所述以第一种语言表达的内容解析为多个片段;c.选择第一片段和第二片段,所述第一片段与所述第二片段具有所述内容的重叠部分;d.访问以第二种语言表达的所述内容中的第一目标片段,所述第一目标片段对应于所述第一片段和第二片段中的一个;e.从数据库中检索与选择出的第一种语言的第二片段关联的第二种语言的第二片段,所述选择出的第一种语言的第二片段与该片段在第二种语言中具有重叠部分;及f.合并重叠部分组合第二种语言的两个片段来构成第一种语言的两个片段合并重叠部分之后的翻译。81.如权利要求80所述的计算机设备,其特征在于,还配置为指定下一个片段作为划分出的第二片段,重复步骤d至f,直到将文档完全转换为第二种语言。82.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤a.接收以第一种语言表达的内容;b.将所述以第一种语言表达的内容解析为多个片段;c.选择第一片段和第二片段,所述第一片段与所述第二片段具有所述内容的重叠部分;d.访问以第二种语言表达的所述内容中的第一目标片段,所述第一目标片段对应于所述第一片段和第二片段中的一个;e.访问以第二种语言表达的所述内容中的第二目标片段,所述第二目标片段对应于所述第一片段和第二片段中的另一个,并且与所述第一个目标片段具有重叠部分;f.基于所述第一目标片段和第二目标片段合并重叠部分得到的组合,确定以第二种语言表达的所述内容;g.提供以所述第二种语言表达的所述内容;及h.对多个片段中的全部,重复步骤c至g,其中将所述第二片段指定为第一片段,且将与所述第二片段具有重叠部分的下一片段指定为第二片段;及i.对所述多个片段中的所有下一片段,重复步骤h,直到将所述内容全部转换为所述第二种语言。83.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤a.提供包括第一种语言的数据片段及与其关联的第二种语言的数据片段的内容;b.从要翻译的文档中,选择开始于文档的第一个单词并存在于数据库中的第一种语言的数据片段;c.从数据库中检索与所定位的第一种语言的第一片段关联的第二种语言的片段;d.选择至少一个与先前划分出的第一种语言的片段具有一个或多个重叠部分的在第一种语言中划分出的第二片段;e.从数据库中检索与选择的第一种语言的第二片段关联的第二种语言的第二片段;f.返回第一种语言中的两个数据片段,并合并重叠部分,使它们成为第一种语言的单个数据片段;g.如果第二种语言的两个数据片段具有重叠部分,则返回,第二种语言中通过合并重叠部分得到的单个数据片段;及h.关联所述第一种语言的所述单个数据片段与所述第二种语言的所述单个数据片段,从而返回所述单个数据片段从所述第一种语言到所述第二种语言的转换。84.如权利要求83所述的计算机媒体,其特征在于,还配置为指定第一种语言的文档中与第一种语言的前一个数据片段重叠的下一个数据片段作为第一种语言中划分出的第二片段,重复步骤d至h。85.如权利要求84所述的计算机媒体,其特征在于,还配置为对第一种语言的文档中与第一种语言的前一个数据片段重叠的所有下一个数据片段,重复步骤d至h,直到转换完整个文档的内容。86.如权利要求84所述的计算机媒体,其特征在于,所述片段以一个单词或多个单词的形式出现。87.如权利要求83所述的计算机媒体,其特征在于,所述片段以多个单词的形式出现。88.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤a.提供包括第一种语言的数据片段及与其关联的第二种语言的数据片段的内容;b.从要翻译的文档中,选择开始于文档的第一个单词并存在于数据库中的第一种语言的数据片段;c.从数据库中检索与所定位的第一种语言的第一片段关联的第二种语言的片段;d.选择至少一个与先前划分出的第一种语言的片段具有一个或多个重叠部分的在第一种语言中划分出的第二片段;e.从数据库中检索与选择出的第一种语言的第二片段关联的第二种语言的第二片段,所述选择出的第一种语言的第二片段与该片段在第二种语言中具有重叠部分;及f.合并重叠部分组合第二种语言的两个片段来构成第一种语言的两个片段合并重叠部分之后的翻译。89.如权利要求88所述的计算机媒体,其特征在于,还配置为指定下一个片段作为划分出的第二片段,重复步骤d至f,直到将文档完全转换为第二种语言。90.一种转换内容和重建知识库的计算机系统,其特征在于,所述系统包括a.接收以第一种语言表达的内容,并将所述内容解析为至少一个第一片段和第二片段的计算设备,所述第一片段具有第一部分,所述第二片段具有第二部分,所述第一部分和所述第二部分具有所述内容的重叠部分;b.所述计算设备访问所述内容中以第二种语言表达的第三和第四片段,所述第三片段对应于所述第一片段和第二片段中的一个,所述第四片段对应于另一个,并且具有与所述第三片段重叠的部分;及c.所述计算设备基于具有重叠部分的所述第三和第四片段确定以第二种语言表达的所述内容,并以第二种语言提供所述内容。91.如权利要求90所述的计算机系统,其特征在于,还包括存储所述第三和第三片段的数据库系统,其中所述计算机设备通过所述数据库系统访问所述第三和第四片段。92.如权利要求90所述的计算机系统,其特征在于,指定内容的所述第二片段作为内容在第一种语言中的第一个片段,且指定在第一种语言中具有与指定的第一种语言的第一片段重叠部分的下一内容片段为内容在第一种语言中的第二片段,并对内容的每个下一片段重复步骤a至c,直到转换完整个内容。93.一种创建单种语言的频率关联数据库的方法,其特征在于,所述方法包括提供一组文档,其中所述文档包括至少一个文档;从用户处接收要分析的单词或单词串查询;搜索所述的这组文档,查找所述查询的出现;创建出现在距所述查询达用户定义单词数的范围内的单词和单词串的列表;及用表格列出出现距所述查询达用户定义单词数的范围内的所有重现单词和单词串的出现频率。94.如权利要求93所述的方法,其特征在于,还包括创建所述出现在距所述查询达用户定义单词数的范围内的单词和单词串的邻近程度列表的步骤。95.如权利要求93所述的方法,其特征在于,还包括关联所述单词列表上的两个或多个单词或单词串或两者。96.如权利要求93或94所述的方法,其特征在于,向用户返回所述单词和单词串列表、所述出现频率列表,及所述单词和单词串邻近程度列表中的一个或多个。97.一种计算机设备,所述计算机设备包括处理器、连接到所述处理器的存储器,及存储在所述存储器中的程序,其特征在于,所述计算机配置为执行所述程序并执行下面的步骤提供一组文档,其中所述文档包括至少一个文档;从用户处接收要分析的单词或单词串查询;搜索所述的这组文档,查找所述查询的出现;创建出现在距所述查询达用户定义单词数的范围内的单词和单词串的列表;及用表格列出出现距所述查询达用户定义单词数的范围内的所有重现单词和单词串的出现频率。98.如权利要求97所述的计算机设备,其特征在于,还配置为创建所述出现在距所述查询达用户定义单词数的范围内的单词和单词串的邻近程度列表。99.如权利要求97所述的计算机设备,其特征在于,还包括关联所述单词列表上的两个或多个单词或单词串或两者。100.如权利要求97或98所述的计算机设备,其特征在于,向用户返回所述单词和单词串列表、所述出现频率列表,及所述单词和单词串邻近程度列表中的一个或多个。101.一种计算机可读的存储媒体,可由计算机处理器执行的程序存储在其上,其特征在于,所述程序用于执行下面的步骤提供一组文档,其中所述文档包括至少一个文档;从用户处接收要分析的单词或单词串查询;搜索所述的一组文档,查找所述查询的出现;创建出现在距所述查询达用户定义单词数的范围内的单词和单词串的列表;及用表格列出出现距所述查询达用户定义单词数的范围内的所有重现单词和单词串的出现频率。102.如权利要求101所述的计算机媒体,其特征在于,还包括执行创建所述出现在距所述查询达用户定义单...

【专利技术属性】
技术研发人员:埃里阿博
申请(专利权)人:埃里阿博
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1