当前位置: 首页 > 专利查询>吉林大学专利>正文

一种跨语言科技文献检索方法及系统技术方案

技术编号:15391736 阅读:78 留言:0更新日期:2017-05-19 04:55
本发明专利技术具体涉及一种跨语言科技文献检索方法及系统,包括:建立科技文献本体库,其中,所述科技文献本体库中存储有同类关键词、同类关键词所对应的科技文献信息本体链接及该科技文献信息本体链接指向源科技文献的索引;所述同类关键词为同义或近义的中文关键词和英文关键词集合;读取用户输入的检索词,并在所述科技文献本体库中查找与该检索词相匹配的同类关键词所对应的科技文献信息本体链接;通过同类关键词所对应的科技文献信息本体链接及该科技文献信息本体链接指向源科技文献的索引,查找出相关文献,并按预设排序显示给用户。通过本发明专利技术提供的技术方案,可提高科技文献检索的精确度。

Cross language science and technology document retrieval method and system

The invention relates to a method of cross language document retrieval technology and system, including: the establishment of scientific literature ontology, which stores the scientific literature ontology in the scientific literature information ontology links corresponding to similar keywords, keywords and the similar literature of science and technology information ontology link pointing to the source of science and technology literature index; the similar keywords is synonymous or nearly Chinese English keywords and keyword sets; read search terms, and find the similar keywords in the scientific literature ontology and the search term matches on the science and technology literature information ontology link should be; science and technology literature information ontology through the corresponding link similar keywords and the science and Technology Literature information ontology link to the source of science and technology literature index, find out the relevant literature, and according to the preset order is displayed to the user. The technical proposal provided by the invention can improve the accuracy of scientific and technical document retrieval.

【技术实现步骤摘要】
一种跨语言科技文献检索方法及系统
本专利技术涉及计算机检索
,具体涉及一种跨语言科技文献检索方法及系统。
技术介绍
随着信息技术的发展,人们越来越普遍地利用检索电子文档的方式来获取知识。但是用户所需的知识可能存在不同语言的文档中,而用户更愿意用母语进行检索,这就产生了跨语言知识检索和抽取的需求。跨语言检索指用户使用某种自然语言(源语言)的检索词汇去检索另一种自然语言(目标语言)表达的文档。但现有的知识库在中英文的跨语言检索时,都是先将关键词翻译为英文,再参照英文翻译在数据库中进行检索。由于中英文之间常常存在一词多译的情况,这就导致在跨语言检索时,检索精确度大大降低。
技术实现思路
有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种跨语言科技文献检索方法及系统,提高科技文献检索的精确度。为实现以上目的,本专利技术采用如下技术方案:一种跨语言科技文献检索方法,包括:步骤S1、建立科技文献本体库,其中,所述科技文献本体库中存储有同类关键词、同类关键词所对应的科技文献信息本体链接及该科技文献信息本体链接指向源科技文献的索引;所述同类关键词为同义或近义的中文关键词和英文关键词集合;所本文档来自技高网...
一种跨语言科技文献检索方法及系统

【技术保护点】
一种跨语言科技文献检索方法,其特征在于,包括:步骤S1、建立科技文献本体库,其中,所述科技文献本体库中存储有同类关键词、同类关键词所对应的科技文献信息本体链接及该科技文献信息本体链接指向源科技文献的索引;所述同类关键词为同义或近义的中文关键词和英文关键词集合;所述源科技文献为同类关键词中各中文关键词和英文关键词所源自的科技文献集合;步骤S2、读取用户输入的检索词,并在所述科技文献本体库中查找与该检索词相匹配的同类关键词所对应的科技文献信息本体链接;步骤S3、通过同类关键词所对应的科技文献信息本体链接及该科技文献信息本体链接指向源科技文献的索引,查找出相关文献,并按预设排序显示给用户。

【技术特征摘要】
1.一种跨语言科技文献检索方法,其特征在于,包括:步骤S1、建立科技文献本体库,其中,所述科技文献本体库中存储有同类关键词、同类关键词所对应的科技文献信息本体链接及该科技文献信息本体链接指向源科技文献的索引;所述同类关键词为同义或近义的中文关键词和英文关键词集合;所述源科技文献为同类关键词中各中文关键词和英文关键词所源自的科技文献集合;步骤S2、读取用户输入的检索词,并在所述科技文献本体库中查找与该检索词相匹配的同类关键词所对应的科技文献信息本体链接;步骤S3、通过同类关键词所对应的科技文献信息本体链接及该科技文献信息本体链接指向源科技文献的索引,查找出相关文献,并按预设排序显示给用户。2.根据权利要求1所述的跨语言科技文献检索方法,其特征在于,所述步骤S1具体为:对收录到数据库中的每一篇科技文献,执行以下步骤:步骤S11、提取科技文献中的中文关键词和英文关键词;步骤S12、将相同的中文关键词或英文关键词进行合并,同义或近义的中文关键词和英文关键词归为一类;步骤S13、对每一类关键词,建立一个科技文献信息本体链接,同时,建立一个该科技文献信息本体链接指向源科技文献的索引;步骤S14、集合步骤S13中的科技文献信息本体链接及该科技文献信息本体链接指向源科技文献的索引,形成科技文献本体库;其中,所述科技文献信息...

【专利技术属性】
技术研发人员:徐昊
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1