一种基于网络的词典查询方法及词典查询系统技术方案

技术编号:2914915 阅读:284 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于网络的词典查询方法,该方法包括:客户端获取鼠标指向位置的词语及包含该词语的语句,发送到网络服务器,网络服务器将上述语句进行分词,以鼠标指向位置的词语为中心,前后分别延伸预设个数的词语,组成备选查询词,网络服务器在内置的数据库中查询各备选查询词的译文,并选择上述备选查询词中较长的词组的译文作为主查询结果,返回客户端,客户端显示该译文。同时,本发明专利技术还提供一种用于网络的词语查询系统。本发明专利技术只需占用用户计算机极少的硬件资源,并能提供相对较为准确的译文。

【技术实现步骤摘要】

本专利技术涉及网络词典领域,特别是涉及一种基于网络的词典查询方法及词典查询系统
技术介绍
网络词典是基于网页搜索技术和机器学习技术的一种网络应用,网络词典内置庞大的数据库,对获取的词语进行翻译、解释,便于用户阅读理解。现有的网络词典在客户端安装,应用时,点击网络词典的桌面标识,激活网络词典。当用户把鼠标指向文档或网页的某个词语时,网络词典获取鼠标指向位置的词语,遍历本地的数据库,查找该词语对应的翻译或解释,并将查找结果显示在客户端,用户根据显示结果理解该词语。参阅图1,展示了现有的网络词典的内部系统结构,网络词典包括取词模块11、查找模块12、显示模块13和本地数据库14,取词模块11获取鼠标指向的词语,并将获取的词语发送到查找模块12;查找模块12在本地数据库14内查找该词语的译文,并将该译文发送到显示模块13;显示模块13显示该译文。在现有网络词典中,本地数据库14存在本地客户端,即用户所使用的计算机中,由于数据库要存储大量数据信息,数据量庞大,要占用用户计算机较多的硬盘资源和内存资源,对用户计算机的硬件资源有较高的要求。用户计算机因受体积和价格的限制,其硬件资源毕竟有限,安装在用户计算机的数据库无法根据需要存储大量词汇的多种译文,否则将导致数据库的数据量过于庞大,不适用于用户计算机。并且使用本地数据库还将导致无法即时更新最新的词汇或旧有词汇的最新译文。现有的网络词典多为中英文翻译词典,词典内置的数据库往往只包含中英文词典的数据信息,因此,显示的翻译结果也只是该词语本身的基本、直接的含义。例如,鼠标指向词语“the matrix”,网络词典会显示该词语的中文译文是“矩阵”。但是,有时同一词语在不同的语境下其含义会有所不同,例如,“the matrix”在只得是某部电影的名字的时候应译为“黑客帝国”,因而只显示给用户的该词语的基本释义,可能不是该词语在文中的最佳译文。-->
技术实现思路
本专利技术所要解决的技术问题是提供一种基于网络的词典查询方法,以解决现有技术中对用户计算机的硬件资源要求过高,及译文不够准确的问题,该方法只需占用用户较少的硬件资源,且能够提供相对较为准确的译文。本专利技术提供一种在基于网络的词典查询方法,该方法包括:客户端获取鼠标指向位置的词语及包含该词语的语句,发送到网络服务器;网络服务器将上述语句进行分词,以鼠标指向位置的词语为中心,前后分别延伸预设个数的词语,组成备选查询词;网络服务器在内置的数据库中查询各备选查询词的译文,并选择上述备选查询词中较长的词组的译文作为主查询结果,返回客户端,客户端显示该译文。优选的,所述译文包括的基本含义对应的基本释义译文和词语引申含义对应的网络释义译文。优选的,网络服务器选择部分词语的网络释义译文在客户端显示。优选的,网络服务器在内置的数据库中查询各备选查询词的译文之前,还包括:网络服务器采用哈希表方式将具有基本释义的词语载入内存。优选的,网络服务器在内置的数据库中查询各备选查询词的译文之前,还包括:网络服务器采用哈希表的方式将具有网络释义的词语载入内存。优选的,还包括:丢弃不具有基本释义和网络释义的词语。本专利技术还包括一种基于网络的词典查询系统,包括客户端,所述客户端包括取词模块和显示模块,所述系统还包括网络服务器,所述网络服务器包括数据库和分词模块、查询模块、及选择模块;所述取词模块,用于获取鼠标指向位置的词语及包含该词语的语句,发送到所述分词模块;所述分词模块,用于将上述语句进行分词,以鼠标指向位置的词语为中心,前后分别延伸预设个数的词语,组成备选查询词;所述查询模块,用于在所述数据库中查询各备选查询词的译文;所述选择模块,用于选择上述备选查询词中较长的词组的译文作为主查询结果,返回所述显示模块;所述显示模块,用于显示该译文。优选的,所述数据库包括存储词语基本释义信息的基本释义数据库和存储词语网络释义信息的网络释义数据库。与现有技术相比,本专利技术具有以下优点:-->本专利技术将数据库设置在网络服务器内,网络服务器硬件资源强大,可以不受客户端硬件资源的限制,能够根据需要设置内容丰富、数据量庞大的数据库,使查询结果更丰富。在网络服务器设置数据库,由网络服务器完成主要查询功能,客户端仅需实现词语获取和查询结果的显示功能,该部分功能只需要数据量较小的功能系统完成,把对客户端的硬件资源消耗降至最低。本专利技术选取包含该词语且较长的词组对应译文作为主查询结果,因为词语的真实含义往往取决于上下文语境,所以该查询结果更接近于用户需要的真实结果。附图说明图1现有网络词典的内部系统结构示意图;图2为本专利技术词典查询方法流程图;图3为本专利技术的词典查询系统示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。本专利技术将数据库设置在网络服务器上,客户端将在鼠标附近获取的词语发送到网络服务器,由网络服务器查找该词语的译文,并将译文返回到客户端显示。这样,就可以充分利用网络服务器硬件资源强大的优势,设置内容丰富、信息量庞大的数据库,并对获取词语的多种译文进行比较、比较后,选择最佳的译文返回客户端,提高词语翻译的精度。本专利技术可应用在任何形式的网络词典中,包括中英文互译的网络词典,中俄互译的网络词典,英法互译翻译的网络词典,以及单语言词典,如汉语词典、百科词典等。参见图2,示出本专利技术词典查询方法,具体步骤如下。步骤S201、启动客户端,客户端获取准备翻译的词语。用户在浏览中外文文档或网页时,需要查看某个词语的译文,可将鼠标指向该词语。客户端获取鼠标指向位置的词语,作为鼠标位置字符串,同时获取包含该词语的语句作为原始查询字符串。例如:鼠标指向“我是中国人”的“中”上,鼠标位置字符串为“中”,原始查询字符串为“我是中国人”。-->在词语释义中,一个词语往往会有多种翻译方法,有不同的译文,哪种译文最适合,取决于该词语的上下文语境,因此,本专利技术将包含该词语的语句一同获取,以便后续翻译时,可根据该语句选择恰当的译文。步骤S202、客户端将获取的原始字符串和鼠标位置字符串发送到网络服务器,请求网络服务器查询上述词语的准确译文。步骤S203、网络服务器对查询请求进行预处理。网络服务器对接受到的原始查询字符串进行分词,将分词后各词语整理成分词列表,例如,“我是中国人”分词后分为“我、是、中国、人”,其中“中国”是包含鼠标位置字符串“中”的词语,将“中国”作为该分词列表的核心词。步骤S204、以核心词为中心,向分词列表中各分词前后分别延伸一定个数的词语,组成备选查询词语,并将上述备选查询词语按从长到短的顺序排列,组成备选查询列表。例如,从核心词“中国”开始,向前延伸2个词语,组成“是中国”、“我是中国”两个备选查询词语,向后延伸2个词语,只能组成“中国人”一个备选查询词语,将上述各备选查询词语按从长到短的顺序排列,组成的备选查询列表为“我是中国人、我是中国、是中国人、是中国、中国人、中国”。以核心词为中心,组成的备选查询词语将核心词与语句中的上下词语联系在一起,该备选查询词语能够更好的表示该核心词的上下文语境,为后续选择恰当译文提供方便。按从长到短的顺序排列各备选查询词语,是因为相对较长的备选查询词语能更全面、更好的反映核心词的语本文档来自技高网
...

【技术保护点】
一种基于网络的词典查询方法,其特征在于,该方法包括: 客户端获取鼠标指向位置的词语及包含该词语的语句,发送到网络服务器; 网络服务器将上述语句进行分词,以鼠标指向位置的词语为中心,前后分别延伸预设个数的词语,组成备选查询词;   网络服务器在内置的数据库中查询各备选查询词的译文,并选择上述备选查询词中较长的词组的译文作为主查询结果,返回客户端,客户端显示该译文。

【技术特征摘要】
1、一种基于网络的词典查询方法,其特征在于,该方法包括:客户端获取鼠标指向位置的词语及包含该词语的语句,发送到网络服务器;网络服务器将上述语句进行分词,以鼠标指向位置的词语为中心,前后分别延伸预设个数的词语,组成备选查询词;网络服务器在内置的数据库中查询各备选查询词的译文,并选择上述备选查询词中较长的词组的译文作为主查询结果,返回客户端,客户端显示该译文。2、如权利要求1所述的方法,其特征在于,所述译文包括的基本含义对应的基本释义译文和词语引申含义对应的网络释义译文。3、如权利要求2所述的方法,其特征在于,网络服务器选择部分词语的网络释义译文在客户端显示。4、如权利要求1所述的方法,其特征在于,网络服务器在内置的数据库中查询各备选查询词的译文之前,还包括:网络服务器采用哈希表方式将具有基本释义的词语载入内存。5、如权利要求1所述的方法,其特征在于,网络服务器在内置的数据库中查询各备选查询词的译文之前,还包括:网络服务器采用哈希表的方式将具有网络释义的词语载入内存。6、如权利要求4或5所述的方法,其特征在于,还包括:丢...

【专利技术属性】
技术研发人员:周杨李志恒詹晓文包塔周枫
申请(专利权)人:网易有道信息技术北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1