基于用户意图的信息搜索方法以及信息提供方法技术

技术编号:7162324 阅读:258 留言:0更新日期:2012-04-11 18:40
提供了基于用户意图的信息搜索方法以及信息供应方法。所述信息搜索方法包括:通过使用对被搜索的关键字的分析结果,来提供与所确认的搜索者的意图相匹配的编辑装置;以及,对具有与通过该编辑装置输入的元数据相关的元数据的内容进行搜索。以此方式,可根据搜索者输入的信息来确认搜索者的意图,可基于所确认的意图来导出详细元数据,并可通过使用输入的元数据来执行搜索。

【技术实现步骤摘要】
【国外来华专利技术】基于用户意图的信息搜索方法以及信息提供方法
本专利技术涉及能够基于自然语言的作为关键字的单词、短语以及句子来提供并搜索信息以及能够基于用户的意图来更为精确地提供并搜索信息的多功能搜索方法及系统。
技术介绍
近年来,开发对信息及内容提供者、消费者的扩大以及各种信息提供媒体进行融合的技术的需求正在加大。典型的融合技术的示例可包括对有线和无线广播及通信技术、综合信息网络服务技术以及便于各个用户层的用户接口技术开发进行融合的融合技术。在该技术的详细内容中,期望开发信息市场技术,以满足信息内容的用户的口味和意图,并通过自动分析特性以及对所提供的内容及信息或将由计算机提供的内容及信息进行语意分析,通过方便和不同的方法来建议和提供信息内容。例如,公开号为10-2006-0043333的韩国专利申请(SYSTEMANDMETHODFORDETERMININGINTENTIONOFDATAANDRESPONDINGTODATABASEDONINTENTION)公开了一种便于数据处理的系统。该系统是包括数据管理器和用于接收数据的组件的系统,所述数据管理器用于确定所述数据的意图、基于该意图来至少对数据子集进行重新系统化以及将重新系统化后的数据自动提供给用户。该数据管理器为用于分析所述数据、将所述数据分类成具有相关特征的至少一个组、从至少一个数据组中提取特征以形成数据子集的系统。可选地,所述数据管理器是使用元数据、属性、内容、上下文、关键字、历史、试探法、推理、规则、划分(damarcation)、时间、日期、相关处理成本、相关处理收益以及数据源中的至少一者来促成数据分析的系统,其中至少部分地基于语法结构、语法属性、语言结构以及语言属性来提取所述特征。所述语言特征是包括根据句子生成的单词、根据句子生成的双单词(wordbigram)以及根据句子生成的三单词(wordtrigram)中的至少一者的系统。公开号为2002-0028593的韩国专利申请(METHODFORISOLATINGHARMFULWORD)公开了一种用于隔离有害单词(harmfulword)的方法,该方法包括:允许计算机用户输入会员信息并访问管理服务器,允许计算机用户输入用于注册/传送的信息至所述管理服务器所显示的信息输入屏幕,允许用于将有害单词与管理服务器相隔离的模块确定有害单词是否包含在计算机用户输入的信息中,以及允许管理服务器根据用于隔离有害单词的模块的判断结果来隔离与计算机用户的连接或注册/传送信息。假定所述有害单词指的是行话(jargon)、俚语、涉及性隔离或性格隔离的单词,则公开号为2002-0028593的韩国专利申请包括在所传送的消息不包括这些有害单词时连续执行聊天的处理模块。公开号为的2002-0028593的韩国专利申请是以聊天中的消息是否包括有害单词为基础的。公开号为10-2006-0062300的韩国专利申请(MULTISTAGETEXTFILTERINGMETHODFORISOLATINGHARMFULSITE)公开了一种用于隔离有害站点的多级文本过滤方法,该方法包括:根据淫秽程度及文本将要被用作用于隔离色情站点的数据的所述文本划分为至少一个组,之后对所述文本进行数据库处理;从访问网站收集所述文本;以及通过将所述文本与所述组内的文本进行比较以确定所述访问网站是否被隔离,来执行至少一个多级过滤,从而根据所述文本中的淫秽程度对有害站点进行隔离。公开号为10-2006-0062300的韩国专利申请(ASYSTEMANDMETHODFORPROVIDINGIMPROVEDSPAMMESSAGEFILTERING)公开了一种用于提供垃圾消息过滤的方法,该方法包括:无线网络服务器接收将从呼叫方终端传送到用户终端的消息;语料库DB存储自然语言句子及其附属信息的使用示例,且为大型语言DB(数据库);词汇分析单元检测所述无线网络服务器内的消息的接收,并从包含在接收到的消息中的句子中提取至少一个名词型关键字;语料库搜索装置选择被提取的名词型关键字中的至少一个名词型关键字,并搜索在包含在所述语料库DB的每个用户类别中的每个句子内的垃圾信息使用频率以及在包含在用户类别之外的类别中的句子中的基本使用频率;当至少一个垃圾信息使用频率以及基本使用频率被输入时,概率计算单元计算包含所选名词型关键字的句子被包含于用户类别中的概率;以及过滤控制器控制所述词汇分析单元和语料库搜索装置以使得所述概率计算单元计算每一名词型关键字被包含于垃圾消息内的概率,判断接收到的消息是否为垃圾消息,并将判断结果传送至无线电网络服务器。公开号为10-2008-0000416的韩国专利申请(FILTERINGSYSTEMFORHARMFULMESSAGEANDMETHODTHEREOFANDRECORDINGMEDIUMTHEREOF)公开了一种利用用于对网络社区上的有害消息进行过滤的过滤系统来对有害消息进行分类的
该专利申请提供的方法能够通过提供智能垃圾过滤技术,来在反垃圾市场内实现高的适销性。针对有害消息的过滤系统包括:数据库,用于存储接收自客户端的消息;消息接收器,用于接收所述消息;单词提取单元,用于从接收到的消息中提取多个单词;以及评估单元,用于通过使用所提取的单词来判断所述消息是否有害,并将其存储于数据库中,并且所述评估单元使用存储在所述数据库中的单词评估值来判断所述消息是否为有害消息,之后该消息被分类为多个有害消息。注册号为10-0484944的韩国专利(SYSTEMFORAUTOMATICALLYTAGGINGSEMANTICSOFMORPHEMEBASEDONLOCALSYNTAXRELATIONANDSEMANTICCO-OCCURRENCEDICTIONARY)公开了一种基于本地短语关系以及语义共现(cooccurrence)目录的自动语素语义标记系统,该系统包括:短句识别器,用于通过使用基本语法生成规则、从属语法规则、电子语素语意目录、语义框架以及经由对原始句子的语素分析生成的可变格短语共现目录,来对短句进行识别;助词格恢复模块,用于通过使用语义框架以及可变格短语语义共现目录,来执行针对助词的格恢复;争议名词(argumentnoun)语意确定模块,用于通过使用可变格短语语义共现目录来确定争议名词的语意;名词短语语意确定模块,用于通过使用名词短语语意共现目录(由名词/介词/名词以及名词/名词共现信息配置而成)来确定名词短语和复合名词内的名词的语意。自动语素语义标记系统使用语言方面的语法结构信息来使用语法上下文信息(其是比现有的其他语义歧义装置更为精确的共现信息),从而提出了一种用于解决名词的语意歧义的方法。注册号为10-0757951的韩国专利(SEARCHMETHODUSINGMORPHEMEANALYZINGINWEBPAGE)公开了一种通过对网页进行语素分析的搜索方法,该方法包括:如果客户端用户通过分页式浏览器(tabbrowser)连接至网站,则将所连接的网站的内容显示给该分页式浏览器;通过由分析服务器对显示至客户端的分页式浏览器的内容执行上下文语素分析,来辨别重复句子或单词的频率;从被识别的单词中选择具有预定频率值或更高频率值的句子及单词本文档来自技高网
...
基于用户意图的信息搜索方法以及信息提供方法

【技术保护点】
1.一种用于搜索信息的方法,该方法包括:通过使用针对关键字的分析结果来检测搜索者的意图;向所述搜索者提供符合所述搜索者的意图的编辑器;以及搜索具有与通过所述编辑器的输入项输入的元数据相关联的元数据的内容。

【技术特征摘要】
【国外来华专利技术】KR10-2008-01257672008年12月11日1.一种用于搜索信息的方法,该方法包括:通过使用针对关键字的分析结果来检测搜索者的意图;向所述搜索者提供符合所述搜索者的意图的编辑器;以及搜索具有与通过所述编辑器的输入项输入的元数据相关联的元数据的内容;该方法进一步包括提取符合所述搜索者的意图的内容的元数据,其中编辑器的提供提供作为符合所述搜索者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。2.根据权利要求1所述的方法,该方法进一步包括:将输入的关键字分离为语意单词;以及对分离后的语意单词执行语法分析,其中,对搜索者的意图的检测通过使用执行所述语法分析时的语法分析结果来检测所述搜索者的意图。3.根据权利要求2所述的方法,其中所述语法分析的执行将语法表达式输出作为所述语法分析结果,其中通过分析句子内分离后的语意单词是否具有任何文法关系以及语义关联来获取所述语法表达式。4.根据权利要求3所述的方法,其中所述语法表达式为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一者。5.根据权利要求3所述的方法,其中语法分析的执行参考语法文法规则字典,以分析句子内分离后的语意单词是否具有任何文法关系以及语义关联,以及所述语法文法规则字典列有短语结构文法、格文法、敏感文法以及词汇文法中的至少一者。6.根据权利要求2所述的方法,其中所述分离针对每个词性来对所述关键字进行分离。7.根据权利要求6所述的方法,其中所述分离通过参考与每个单词的词性相关的信息来针对每个词性将所述关键字进行分离,所述与每个单词的词性相关的信息以数据库方式存储于语素字典内。8.根据权利要求1所述的方法,该方法进一步包括通过参考信息提供者的意图来确定用于执行搜索的目录,其中所述搜索对与所确定的目录相同或相似的目录中的内容进行搜索。9.根据权利要求1所述的方法,其中所述关键字为单词单元、短语单元以及句子单元中的任一者。10.根据权利要求1所述的方法,其中所述搜索对具有与通过所述编辑器的输入项输入的元数据中的至少一者相同的元数据、或具有与通过所述编辑器的输入项输入的元数据中的至少一者同义的元数据的内容进行搜索。11.根据权利要求1所述的方法,该方法进一步包括在搜索时将附加服务添加至搜索结果中。12.根据权利要求11所述的方法,其中所述附加服务为内容上下文认知服务,并且该内容上下文认知服务包括以下各项中的至少一者:导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务以及行政服务。13.根据权利要求1所述的方法,其中所述编辑器的输入项中的至少一者被自动输入作为通过使用所述关键字生成的实际数据。14.根据权利要求1所述的方法,该方法进一步包括通过将输入的元数据与构成所搜索的内容的元数据进行比较,来分别选择并输出具有高度一致性的内容。15.一种提供用于搜索的信息的方法,该方法包括:通过使用针对包含于信息内的文本的分析结果,来检测提供所述信息的信息提供者的意图;将符合所述信息提供者的意图的编辑器提供给用户;以及对整合了通过所述编辑器的输入项输入的元数据的内容进行存储,该方法进一步包括提取符合所述信息提供者的意图的内容的元数据,其中编辑器的提供提供作为符合所述信息提供者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。16.根据权利要求15所述的方法,该方法进一步包括:将包含于输入...

【专利技术属性】
技术研发人员:郑喜盛
申请(专利权)人:有限公司呢哦派豆
类型:发明
国别省市:KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1