当前位置: 首页 > 专利查询>郑茂专利>正文

网络智能搜索引擎系统技术方案

技术编号:4058746 阅读:317 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种网络智能搜索引擎系统,通过语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元,建立多角形复合数据统计语言模型。首先依据多个单元进行独立网络搜索,获得多个类别的索引模板;其次使用多角形复合数据统计语言模型对用户自然语言提出的搜索问题分析,获得多个类别的标本模板。通过相似单元的索引模板和标本模板比对,获得搜索逻辑模板,并形成一项或多项自然语言描述的搜索界定范围选项,在用户提出搜索问题的同一界面呈现。用户对界定范围的再次选择,实质修正和减小自然语言问题的误差,缩小逻辑搜索的范围。用户选择后形成搜索逻辑模块,而后通过搜索数据库的查询,得到用户答案模块。

【技术实现步骤摘要】
所属
本专利技术涉及一种网络智能搜索引擎系统,尤其是能对用户自然语言问题进行分析,对用户的搜索问题推荐提出一项或多项搜索范围的自然语言描述供用户选择,减小自然语言问题的误差,避免了搜索引擎信息量大、查询不准确、深度不够等问题,辅助用户精准地获得搜索答案。本专利技术直接应用于移动通讯搜索和互联网搜索等领域,对于终端显示信息容量相对有限制的网络终端设备非常适用。
技术介绍
搜索引擎的使命是整合网络的信息,如何让机器对信息、语言做最好的理解和处理,人类的思维、行为对机器的影响是至关重要的。目前,公知的网络搜索引擎仅提供用户一个搜索输入框及一些限定的搜索条件范围,搜索引擎完全依赖自身的搜索算法、检索公式、网络信息检索技术等等脱离用户感知、参与、互动的系统和技术这是有所缺陷的。网络信息搜索是“问与答”的模式,如果检索的用户没有准确的“问”问题,搜索引擎的“答案”肯定容易造成错误判断。所有的问题都有解决的方法,关键是有没有问对问题。因此本专利技术解决的就是高效率修正问题,获得答案。
技术实现思路
为了解决现有搜索引擎信息量大、查询不准确、深度精度不够等不足,本专利技术提供一种网络智能搜索引擎系统,本搜索引擎不仅能为用户提供网络搜索信息服务,而且能理解用户用自然语言和关键字词提出各种问题,并能在用户的简单协作下,给用户提供希望得到的问题答案。本专利技术解决其技术问题所采用的技术方案是:本专利技术根据用户查询请求的自然语言问题形式,建立了多角形复合数据统计语言模型,按照一定算法比对和分析用户的搜索问题,从而生成一项或多项以模拟自然语言形式来描述的搜索界定范围选项。通过用户的再次选择,搜索引擎从搜索数据库中查找出相对精准的信息返回给用户。网络智能搜索引擎系统主要由多角形复合数据统计语言模型和搜索数据库等部分组成。多角形复合数据统计语言模型是由语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元数据库、网络索引模板库、用户问题标本模板库、搜索逻辑模板库、搜索器、分析器、自然语言生成器等部分构成。多角形复合数据统计语言模型主要是推测用户的需求目标、问题诉求目标。多个独立单元中的语义指搜索引擎的工作不拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索。多个独立单元中的垂直专业标识指针对某一特定领域、某一特定需求做出的专、-->精、深的信息分类标识。多个独立单元中的关联信息标识指自然语言处理中的语言现象的相关性联系标识;也对多音多义字词进行关联性标识。首先依据语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元数据库定义网络索引模板库使用搜索器在网络上开始搜索网络信息,建立基于语义、关键词、关键字、垂直专业标识、关联信息标识的索引模板;而后依据语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元数据库定义用户问题标本模板库使用分析器对用户自然语言问题开始分析,建立基于语义、关键词、关键字、垂直专业标识、关联信息标识的标本模板;当网络信息索引模板和用户自然语言标本模板建立后,整个多角形复合数据统计语言模型就开始海量采集、积累、存储、维护、更新,以海量信息填充语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元数据库。当用户开始搜索查询时,搜索逻辑模板库将索引模板和标本模板比对,依据语义、关键词、关键字、垂直专业标识、关联信息标识等独立单元中任一或多个相似单元的要素,形成搜索逻辑范围。而后自然语言生成器模拟用户问题标本模板库中存储的自然语言形式,生成一项或多项自然语言描述形式的搜索界定范围选项,在用户提出搜索问题的同一界面呈现,并提供用户再次选择。提供用户对界定范围的选择,是修正和减小用户自然语言问题的误差,使用人工干预的形式缩小搜索逻辑模板的范围。搜索必定是用户发起的,用户对即将获得的答案是有唯一的、独立的思维界定,搜索引擎纯机器算法和智能模拟是基于搜索引擎覆盖的整个网络为基础出发点的,用户的搜索问题很大程度上是基于很小、很狭窄的信息空间提出的。因此,用户辅助选择后最终形成语言逻辑模块,而后通过对后台搜索数据库的查询,返回得到用户的答案模块。网络智能搜索引擎系统索引方法为了加快信息检索的速度,本专利技术对信息库建立单元并列索引。语义、关键词、关键字、垂直专业标识、关联信息标识等独立单元完全以同等并列级别存在,对每一网路信息建立多单元索引。过滤非单元以外的无用信息,对不能明确表达网络信息归属的信息不对它们进行索引。本专利技术的有益效果是:通过本专利技术索引的网络信息和用户问题的比对,在本专利技术形成的搜索界定范围的引导下,用户通过自然语言的形式修正和缩小搜索问题的范围,减小了网络资源的负载,精准地获得了希望的答案。本专利技术使用简单,符合用户使用习惯易于使用。附图说明下面结合附图和实施例对本专利技术进一步说明。图1是本专利技术实例显示图图中1.搜索引擎用户搜索框,2.搜索执行按键,3.本专利技术提供用户再次选择的搜索界定范围第一项,4.本专利技术提供用户再次选择的搜索界定范围第四项图2是本专利技术体系结构图图中1.独立单元(语义、关键词、关键字、垂直专业标识、关联信息标识等多个独-->立单元),2.索引模板,3.标本模板,4.搜索逻辑,5.搜索界定范围,6.用户具体实施方式图1是本专利技术一种网络智能搜索引擎系统的实例显示图。在同一界面呈现是用户提出搜索的问题和再次提供用户选择的搜索界定范围选项均在同一个显示界面中呈现,不分页呈现;搜索界定范围可以是一项或多项,其内容是以模拟自然语言形式来描述的文字或数据。图2是本专利技术一种网络智能搜索引擎系统的体系结构图。通过语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元(1),建立多角形复合数据统计语言模型。首先依据多个单元进行独立网络搜索,获得多个类别的索引模板(2);其次使用多角形复合数据统计语言模型对用户自然语言提出的搜索问题分析,获得多个类别的标本模板(3)。通过相似单元的索引模板和标本模板比对,获得搜索逻辑模板(4),并形成一项或多项自然语言描述的搜索界定范围选项(5),在用户提出搜索问题的同一界面呈现。用户对界定范围的再次选择,实质修正和减小自然语言问题的误差,缩小逻辑搜索的范围。用户选择后形成搜索逻辑模块,而后通过搜索数据库的查询,得到用户的答案模块(6)。-->本文档来自技高网...
网络智能搜索引擎系统

【技术保护点】
一种网络智能搜索引擎系统,其特征在于包括:通过语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元,建立多角形复合数据统计语言模型。依据多个单元进行独立网络搜索,获得多个类别的索引模板(1)。依据语义、关键词、关键字、垂直专业标识、关联信息标识等多个单元对用户自然语言提出的搜索问题分析,获得多个类别的标本模板(2)。通过相似单元的索引模板和标本模板比对,获得搜索逻辑模板,并形成一项或多项自然语言描述的搜索界定范围选项,在用户提出搜索问题的同一界面呈现(3)。用户对界定范围的再次选择,形成搜索逻辑模块,而后通过搜索数据库的查询,得到用户的希望的答案模块(4)。

【技术特征摘要】
1.一种网络智能搜索引擎系统,其特征在于包括:通过语义、关键词、关键字、垂直专业标识、关联信息标识等多个独立单元,建立多角形复合数据统计语言模型。依据多个单元进行独立网络搜索,获得多个类别的索引模板(1)。依据语义、关键词、关键字、垂直专业标识、关联信息标识等多个单元对用户自然语言提出的搜索问题分析,获得多个类别的标本模板(2)。通过相似单元的索引模板和标本模板比对,获得搜索逻辑模板,并形成一项或多项自然语言描述的搜索界定范围选项,在用户提出搜索问题的同一界面呈现(3)。用户对界定范围的再次选择,形成搜索逻辑模块,而后通过搜索数据库的查询,得到用户的希望的答案模块(4)。2.根据权利要求1所述的网络智能搜索引擎系统,其特征是:在步骤(1)中所述的网络搜索到的任一网络信息依据语义、关键词、...

【专利技术属性】
技术研发人员:郑琪心郑茂郑琪文
申请(专利权)人:郑茂
类型:发明
国别省市:90[中国|成都]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1