当前位置: 首页 > 专利查询>刘改琳专利>正文

一种基于语料库的双语检索统计翻译系统技术方案

技术编号:12255263 阅读:137 留言:0更新日期:2015-10-28 18:22
本发明专利技术公开了一种基于语料库的双语检索统计翻译系统,包括数据库,用于储存各类相关词表、语句、单词以及每个单词、语句对应的解释和应用案例数据;数据库更新模块、人机操作模块,包括键盘输入模块、手写输入模块以及语音输入模块,用于输入需要查询的英语数据或汉语数据,并将数据发送到数据识别单元;同时还用于输入信息调用命令;数据识别单元,数据分割单元,数据翻译模块,检索功能模块,词表功能模块,搭配词功能模块,词簇功能模块,主题性功能模块,词汇分类功能模块和自学功能模块。本发明专利技术可以选择不同的输入模式,检索过程简单快速,在得到检索结果时,可以得到该文本数据的分类、词句以及应用案例等数据,减省了用户的时间,使用方便。

【技术实现步骤摘要】

本专利技术涉及搜索引擎领域,具体涉及一种基于语料库的双语检索统计翻译系统
技术介绍
随着互联网应用的发展、以及各种类型的数字化内容(文本、图片、音频和视频等)以指数级的形式呈现出爆炸性的增长,如何根据用户的输入在海量信息中准确地查找相关内容,是一个非常基础而又具有重大意义的技术挑战。目前,以Google、百度等为代表的通用搜索引擎在一定程度上已经较好地解决了这一难题。然而以通用搜索引擎为代表及其他基于传统的文本检索系统的软件、网络应用等,在针对各类双语搜索上仍然具有很大的局限性,一方面其单单存在翻译功能,而不具备检索功能,另一方面,相关词句的介绍以及应用案例等,都需要重新去查询,这无疑增加了用户的工作量。且,在具体使用过程中,由于单词由均为多个字母构成,很容易导致使用者在检索时,拼写错误,或者无法拼写的情况的发生,而导致无法进行检索。
技术实现思路
为解决上述问题,本专利技术提供了一种基于语料库的双语检索统计翻译系统,命名为Word Smart语料库教学与研究系统。为实现上述目的,本专利技术采取的技术方案为:一种基于语料库的双语检索统计翻译系统,包括数据库,用于储存各类相关词表、语句、单词以及每个单词、语句对应的解释和应用案例数据;数据库更新模块,用于通过3G网络、W1-Fi网络方式更新数据库;人机操作模块,包括键盘输入模块、手写输入模块以及语音输入模块,用于输入需要查询的英语数据或汉语数据,并将数据发送到数据识别单元;同时还用于输入信息调用命令;数据识别单元,用于接收人机操作模块发送来的数据,并判断数据属于英语还是汉语,并将汉语数据发送到数据分割单元,将英语数据发送到检索模块;数据分割单元,用于将接收的汉语数据进行分割,识别所述汉语数据中的标点,以句号为分割位置,得到以句子为单位的文本信息并将该文本信息发送到数据翻译模块;数据翻译模块,用于将获取的文本信息进行数据库搜索,查找是否有对应或类似的翻译目标语句,并将翻译结果通过电子显示屏显示,若未查询到,文本信息会传送到联网模块,通过联网模块进行翻译结果查询,并将翻译结果储存在数据库内,且通过电子显示屏显不;检索处理模块,包括检索功能模块,用于接收数据识别模块以及数据翻译模块发来的文本数据,将文本数据与公式数据库中的公式数据进行类似度对比,并将比对结果按照相似度进行升序或降序排序后,通过电子显示屏显示;词表功能模块,对导入文件进行词表统计与显示;搭配词功能模块,用于实现对某一词的搭配信息的统计与显示功能;词簇功能模块,用于实现多词词表的统计与显示;主题性功能模块,用于通过词表对比,可以统计出导入文本的主题性信息;词汇分类功能模块,用于实现对导入文本的词性、水平级别其它形式的统计与分类;中央处理器,用于根据信息调用命令,从数据库中调用人们所需的数据信息,并用于添加用户、删除用户、密码修改、权限管理;液晶显示屏,用于显示检索模块的检索结果以及输入的文本数据;语音单元,用于语音播放检索模块的检索结果;自学功能模块,用于就某一文件,自动生成具有交互性的测试内容,供学生练习。其中,还包括资源共享模块,用于下载检索结果。其中,所述语音输入模块采用麦克风。其中,所述联网模块包括一网络爬虫进程,用于在网络中查找与输入文本相关的网页或文档。其中,所述电子显不屏为触摸屏。本专利技术具有以下有益效果:可以选择不同的输入模式,检索过程简单快速,在得到检索结果时,可以得到该文本数据的分类、词句以及应用案例等数据,减省了用户的时间,使用方便。【附图说明】图1为本专利技术实施例一种基于语料库的双语检索统计翻译系统的结构示意图。【具体实施方式】为了使本专利技术的目的及优点更加清楚明白,以下结合实施例对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,本专利技术实施例提供了一种基于语料库的双语检索统计翻译系统,包括数据库,用于储存各类相关词表、语句、单词以及每个单词、语句对应的解释和应用案例数据;数据库更新模块,用于通过3G网络、W1-Fi网络方式更新数据库;人机操作模块,包括键盘输入模块、手写输入模块以及语音输入模块,用于输入需要查询的英语数据或汉语数据,并将数据发送到数据识别单元;同时还用于输入信息调用命令;数据识别单元,用于接收人机操作模块发送来的数据,并判断数据属于英语还是汉语,并将汉语数据发送到数据分割单元,将英语数据发送到检索模块;数据分割单元,用于将接收的汉语数据进行分割,识别所述汉语数据中的标点,以句号为分割位置,得到以句子为单位的文本信息并将该文本信息发送到数据翻译模块;数据翻译模块,用于将获取的文本信息进行数据库搜索,查找是否有对应或类似的翻译目标语句,并将翻译结果通过电子显示屏显示,若未查询到,文本信息会传送到联网模当前第1页1 2 本文档来自技高网...

【技术保护点】
一种基于语料库的双语检索统计翻译系统,其特征在于,包括数据库,用于储存各类相关词表、语句、单词以及每个单词、语句对应的解释和应用案例数据;数据库更新模块,用于通过3G网络、Wi‑Fi网络方式更新数据库;人机操作模块,包括键盘输入模块、手写输入模块以及语音输入模块,用于输入需要查询的英语数据或汉语数据,并将数据发送到数据识别单元;同时还用于输入信息调用命令;数据识别单元,用于接收人机操作模块发送来的数据,并判断数据属于英语还是汉语,并将汉语数据发送到数据分割单元,将英语数据发送到检索模块;数据分割单元,用于将接收的汉语数据进行分割,识别所述汉语数据中的标点,以句号为分割位置,得到以句子为单位的文本信息并将该文本信息发送到数据翻译模块;数据翻译模块,用于将获取的文本信息进行数据库搜索,查找是否有对应或类似的翻译目标语句,并将翻译结果通过电子显示屏显示,若未查询到,文本信息会传送到联网模块,通过联网模块进行翻译结果查询,并将翻译结果储存在数据库内,且通过电子显示屏显示;检索处理模块,包括检索功能模块,用于接收数据识别模块以及数据翻译模块发来的文本数据,将文本数据与公式数据库中的公式数据进行类似度对比,并将比对结果按照相似度进行升序或降序排序后,通过电子显示屏显示;词表功能模块,对导入文件进行词表统计与显示;搭配词功能模块,用于实现对某一词的搭配信息的统计与显示功能;词簇功能模块,用于实现多词词表的统计与显示;主题性功能模块,用于通过词表对比,可以统计出导入文本的主题性信息;词汇分类功能模块,用于实现对导入文本的词性、水平级别其它形式的统计与分类;中央处理器,用于根据信息调用命令,从数据库中调用人们所需的数据信息,并用于添加用户、删除用户、密码修改、权限管理;液晶显示屏,用于显示检索模块的检索结果以及输入的文本数据;语音单元,用于语音播放检索模块的检索结果;自学功能模块,用于就某一文件,自动生成具有交互性的测试内容,供学生练习。...

【技术特征摘要】

【专利技术属性】
技术研发人员:刘改琳李定顺张永强王瑛张静华潘婉莹杨薇高业艳
申请(专利权)人:刘改琳
类型:发明
国别省市:陕西;61

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1