根据有含义中心词检索信息的方法和系统技术方案

技术编号：2876622 阅读：272 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及从询问词中提取有含义中心词的方法和系统，并且公开了据此检索信息的方法和系统。检索系统提取词条的有含义中心词，扩充词条，和根据扩充的词条检索文本，从而提高了检索系统的性能和使用的便利性。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及提取有含义中心词和根据有含义中心词检索信息的方法和系统，尤其涉及从词条中提取中心词，即词干或派生词的方法和系统、其性能提高了的和便于使用中心词提取方法的信息检索系统、和记录方法和使方法具体化的程序的计算机可读记录介质，以及记录中心词词典的数据的计算机可读记录介质。
技术介绍
众所周知，为了适应迅速、准确和容易地搜索信息的需要，人们已经着手开发称为信息搜索的技术。为了满足需要而开发出来的信息检索系统把最适合用户需要的信息提供给他或她。随着信息量不断增加，信息检索系统不是从每个数据中直接找出信息，而是采用索引系统，在这种索引系统中，以适合于数据搜索的容易方式，事先处理和存储数据，以便可以实时搜索信息。从上面可以看出，信息搜索分三步进行询问、编索引和搜索。在编索引步骤中，事先把数据收集起来，处理成较容易搜索的，然后存储起来。在询问步骤中，用户请求信息，和在搜索步骤中，提供与他或她的询问相对应的信息。在许多情形中都可以使用信息搜索。例如，存在如下一些情况计算机操作系统从硬盘或辅助存储单元的数据中搜索某个文件或文件夹；从文字处理器的一个文件中搜索某个词或词组；从电子日程表的电子词典或作为离线应用软件的电子词典中搜索某个词；和电子词典的在线服务器程序搜索和提供与客户计算机请求的某个词相关的信息。现今，计算机相关存储介质的容量越来越大，和因特网的普及使全世界所有计算机连接成一个大型网络，因此，信息量成几何级数增长。因此，从巨大的信息中迅速和容易地找出所需的正确信息变得越来越难。搜索的性能由两个因子来衡量。一个是再现率，另一个是精确率。再现率是搜索到的适...

【技术保护点】
一种基于中心词词典的信息检索系统，包括：中心词词典存储单元，用于存储找出含有词条的中心含义的词（下文称之为“中心词”）的信息；匹配单元，用于从用户那里接收询问词；信息搜索单元，用于根据询问词设置至少一个词条，利用词条从中心词词典存储单元中提取中心词，和利用词条和中心词作为关键词搜索相关信息；和输出单元，用于输出信息搜索单元搜索的结果。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：郑一亨，
申请(专利权)人：韩国电气通信公社，
类型：发明
国别省市：KR[韩国]

全部详细技术资料下载我是这个专利的主人