一种跨语言文本检索系统及其方法技术方案

技术编号:28202446 阅读:21 留言:0更新日期:2021-04-24 14:24
本发明专利技术涉及信息处理技术,具体涉及跨语言文本检索系统及其方法,包括机器翻译模块多个、目标语言检索请求构造模块、检索词列表形成模块、权值计算模块、云数据服务模块、翻译可信度计算模块和目标语言检索结果构造模块,所述机器翻译模块与目标语言检索请求构造模块通信连接,目标语言检索请求构造模块与检索词列表形成模块通信连接,检索词列表形成模块与权值计算模块通信连接,所述检索词列表形成模块和权值计算模块均与检索式生成模块通信连接,所述检索式生成模块与云数据服务模块通信连接,云数据服务模块与翻译可信度计算模块通信连接,云数据服务模块还与目标语言检索结果构造模块通信连接。构造模块通信连接。构造模块通信连接。

【技术实现步骤摘要】
一种跨语言文本检索系统及其方法


[0001]本专利技术涉及信息处理技术,具体涉及跨语言文本检索系统及其方法。

技术介绍

[0002]随着网络的普及,网络上的信息资源日益丰富且用户对于网络信息资 源的需求也在逐渐提高。但是,在网络信息资源日益丰富的同时,却又存 在着阻碍这些资源为用户所广泛共享的一个主要障碍一多语种问题。其原 因在于,目前网络用户获得网络信息资源的一个主要途径是通过信息检索 系统,但传统的信息检索系统主要是针对于单一语种的文档集而实现的。 也就是说,传统的信息检索系统一般允许用户选择某一语种作为查询语言, 但仅向用户返回符合其查询条件的、与该查询语言相同的语种的文档。
[0003]目前,由于用户需要查询多语种文本的情形已变得越来越普遍,所以, 为了满足人们对于不同语种的网络信息资源的共享需求,跨语言信息检索 技术正在受到广泛的关注及普遍的应用。
[0004]跨语言信息检索技术是结合了传统文本信息检索技术和机器翻译 (machine translation,MT)技术的一门热点技术。跨语言信息检索系统 使得用户能够以其选定的源语言提交检索请求,而对目标语言地文档进行 检索。具体地,在跨语言信息检索系统中,广泛地使用基于机器翻译系统 的查询翻译方法来实现上述跨语言的信息检索。也就是说,跨语言信息检 索系统首先利用基于机器翻译系统的查询翻译方法自动地将用户的检索请 求从其源语言翻译到目标语言,从而得到该检索请求的目标语言译文,然 后再根据该目标语言译文来构造与该检索请求对应的目标语言检索请求, 从而使该跨语言信息检索系统能够利用该目标语言检索式对符合查询条件 的目标语言的文档进行单语检索。
[0005]但是,在以往的跨语言信息检索系统中,通常都直接使用单个机器翻 译系统来生成检索请求的目标语言译文、进而构造检索式,从而这样的跨 语言信息检索系统的检索性能极大地取决于机器翻译系统所生成的检索请 求译文的质量。从而,当机器翻译系统的译文质量较差时,直接使用该机 器翻译系统所生成的检索请求的译文来构造检索式,通常也会使得跨语言 信息检索系统得到质量较差的检索结果。
[0006]因此,需要设计出一种新的跨语言检索请求的转换技术以及跨语言信 息检索技术,来提高跨语言信息检索系统的检索性能。

技术实现思路

[0007]本专利技术的目的是为了解决上述技术不足,提供了一种跨语言文本检索系统及其方法。
[0008]为解决上述技术问题,本专利技术所采用的技术方案为:一种跨语言文本检索系统,包括机器翻译模块多个、目标语言检索请求构造模块、检索词列表形成模块、权值计算模块、 云数据服务模块、翻译可信度计算模块和目标语言检索结果构造模块,所述机器翻译模块与目标语言检索请求构造模块通信连接,目标语言检索请求构造模块与检索词列表形成模
块通信连接,检索词列表形成模块与权值计算模块通信连接,所述检索词列表形成模块和权值计算模块均与检索式生成模块通信连接,所述检索式生成模块与云数据服务模块通信连接,云数据服务模块与翻译可信度计算模块通信连接,云数据服务模块还与目标语言检索结果构造模块通信连接。
[0009]作为优选,所述翻译可信度计算模块还和目标语言检索结果构造模块通信连接。
[0010]为解决上述技术问题,本专利技术所采用的技术方案为:一种跨语言文本检索方法,包括如下步骤:步骤一:机器翻译模块对文本进行编码收集,从而实现对目标语言进行收集,进而对目标语言的文字进行翻译;步骤二:目标语言翻译模块,对目标语言进行翻译后,通过目标语言检索请求构造模块对目标语言的检索进行请求构造编码;步骤三:目标语言检索请求构造模块,对目标语言进行请求构造编码后,通过检索词列表形成模块,形成检索词列表,并通过权值计算模块计算出列表语言中的各项语言词组的权值;步骤四:将目标语言检索请求构造模块形成的检索词列表以及权值计算模块计算出的权值向与云数据服务模块进行通信;步骤五:云数据服务模块,通过对于数据库内存储的目标语言检索式进行检索比对,同时对该检索的结果进行翻译可信度计算;步骤六:云数据服务模块进行检索比对的结果以及翻译可信度计算的结果,发送到目标语言检测结果构造模块中;步骤七:目标语言检索结果构造模块通过机器翻译模块,对目标语言结果结果进行翻译表达。
[0011]作为优选,云数据服务模块同时对目标语言翻译可信度查询结果同时通过语言翻译模块进行表达。
[0012]本专利技术所达到的有益效果:本专利技术的跨语言文本检索系统,不仅可以通过机器翻译与互联网数据进行通讯,形成目标语言检索请求构架,还可以形成检索式列表以及权值计算结果,更通过云数据服务与过去用户对跨语言文字进行检索架构以及检索式的比对,从而可以形成更人性化,可信度更高的检索结果,再者通过检索结果的可信度计算,还可以对可信度进行显示,从而使得用户得到检索结果时,同时显示出检索可信度的数据。
附图说明
[0013]图1为本专利技术的跨语言文本检索系统的架构示意图。
具体实施方式
[0014]下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0015]如图1所示:一种跨语言文本检索系统,包括机器翻译模块多个、目标语言检索请求构造模块、检索词列表形成模块、权值计算模块、 云数据服务模块、翻译可信度计算模块和目标语言检索结果构造模块,所述机器翻译模块与目标语言检索请求构造模块通信连接,目标语言检索请求构造模块与检索词列表形成模块通信连接,检索词列表形成模块与
权值计算模块通信连接,所述检索词列表形成模块和权值计算模块均与检索式生成模块通信连接,所述检索式生成模块与云数据服务模块通信连接,云数据服务模块与翻译可信度计算模块通信连接,云数据服务模块还与目标语言检索结果构造模块通信连接。所述翻译可信度计算模块还和目标语言检索结果构造模块通信连接。
[0016]一种跨语言文本检索方法,包括如下步骤:步骤一:机器翻译模块对文本进行编码收集,从而实现对目标语言进行收集,进而对目标语言的文字进行翻译;步骤二:目标语言翻译模块,对目标语言进行翻译后,通过目标语言检索请求构造模块对目标语言的检索进行请求构造编码;步骤三:目标语言检索请求构造模块,对目标语言进行请求构造编码后,通过检索词列表形成模块,形成检索词列表,并通过权值计算模块计算出列表语言中的各项语言词组的权值;步骤四:将目标语言检索请求构造模块形成的检索词列表以及权值计算模块计算出的权值向与云数据服务模块进行通信;步骤五:云数据服务模块,通过对于数据库内存储的目标语言检索式进行检索比对,同时对该检索的结果进行翻译可信度计算;步骤六:云数据服务模块进行检索比对的结果以及翻译可信度计算的结果,发送到目标语言检测结果构造模块中;步骤七:目标语言检索结果构造模块通过机器翻译模块,对目标语言结果结果进行翻译表达。
[0017]云数据服务模块同时对目标语言翻译可信度查询结果同时通过语言翻译模块进行表达。
[0018本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种跨语言文本检索系统,其特征在于:包括机器翻译模块多个、目标语言检索请求构造模块、检索词列表形成模块、权值计算模块、 云数据服务模块、翻译可信度计算模块和目标语言检索结果构造模块,所述机器翻译模块与目标语言检索请求构造模块通信连接,目标语言检索请求构造模块与检索词列表形成模块通信连接,检索词列表形成模块与权值计算模块通信连接,所述检索词列表形成模块和权值计算模块均与检索式生成模块通信连接,所述检索式生成模块与云数据服务模块通信连接,云数据服务模块与翻译可信度计算模块通信连接,云数据服务模块还与目标语言检索结果构造模块通信连接。2.根据权利要求1所述的跨语言文本检索系统,其特征在:所述翻译可信度计算模块还和目标语言检索结果构造模块通信连接。3.一种跨语言文本检索方法,其特征在于:包括如下步骤:步骤一:机器翻译模块对文本进行编码收集,从而实现对目标语言进行收集,进而对目标语言的文字进行翻译;步骤二...

【专利技术属性】
技术研发人员:郭庆
申请(专利权)人:南京莱科智能工程研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1