一种智能数据搜索系统及方法技术方案

技术编号:10484623 阅读:124 留言:0更新日期:2014-10-03 14:57
本发明专利技术涉及计算机信息系统中的数据处理领域,特别涉及一种智能数据搜索系统及方法。其中方法包括,获取搜索输入信息;根据所述搜索输入信息识别出搜索意图;根据所述搜索输入信息和搜索意图在数据库中进行搜索。通过上述实施例中的方法及系统,将使搜索引擎通过查询关键字等搜索输入的意图领域,针对性的搜索和展现;并通过用户的偏好识别,理解用户潜在的、个性化的搜索需求,通过排序的方式优先返回最符合用户需要的搜索结果。以此提高查询效率、准确度,提升用户在使用搜索引擎进行搜索时的用户体验。

【技术实现步骤摘要】
一种智能数据搜索系统及方法
本专利技术涉及计算机信息系统中的数据处理领域,特别涉及一种智能数据搜索系统及方法。
技术介绍
搜索引擎为用户提供了一个快速查找信息系统中海量资源的渠道。然而传统的通用搜索引擎中,由于其要适用广泛的要求,其智能性往往不高。因为提高其智能性必定大幅降低搜索的效率,让搜索引擎不堪重负。因此,通用的搜索引擎在信息查找时往往存在很多的缺陷,大多数用户并不能十分准确地用查询词表达自己的搜索意图,而使得搜索引擎无法提供精准、高效、个性化的搜索服务,甚至根本就搜索不到用户真正需要查找的信息。本专利技术的专利技术人发现现有技术中至少包括以下两方面的问题:无法理解用户输入的查询词所涉及的领域并进行针对性的搜索和展现。如搜索引擎应理解用户输入的是一个人名,还是产品名称,还是客户名称。虽然可用高级搜索方式代替,但通过填写一张表格的方式来完成搜索过于繁琐,不被大多数用户所接受。无法理解用户潜在的个性化需求。不同用户即使输入相同的查询词,需求往往也是不同的,过于通用的搜索结果将导致用户难以在大量的搜索结果中找到自己确切要找的信息。
技术实现思路
为了解决现有技术中搜索不够智能的问题,本专利技术的目的是采用更智能的搜索方法,识别用户的搜索意图,识别用户输入的查询词所属领域,进行针对性的搜索和展现;并且识别用户的个性化偏好,通过排序的方式优先返回最满足用户潜在意图的搜索结果。本专利技术实施例提供了一种智能数据搜索方法,包括,获取搜索输入信息;根据所述搜索输入信息识别出搜索意图;根据所述搜索输入信息和搜索意图在数据库中进行搜索。根据本专利技术实施例所述一种智能数据搜索方法的一个进一步的方面,所述根据所述搜索输入信息识别出搜索意图进一步包括,计算所述搜索输入信息针对于各个意图领域的概率,所述概率最高的一个或者几个意图领域为所述搜索意图。根据本专利技术实施例所述一种智能数据搜索方法的再一个进一步的方面,所述计算所述搜索输入信息针对于各个意图领域的概率进一步包括,通过以下公式识别搜索输入信息在某个意图领域的概率:P(S)=#(w1)/#*#(w1,w2)/#(w1)*#(w2,w3)/#(w2)*…*#(wi-1,wi)/#(wi-1)其中,P(S)为所述搜索输入信息在某个意图领域的概率,S为所述搜索输入信息,由w1,w2,w3…wn字符组成,#为某个意图领域语料总大小,#(wi-1)表示wi-1在某个意图领域中出现的次数,#(wi-1,wi)则表示wi-1,wi前后相邻的出现次数。根据本专利技术实施例所述一种智能数据搜索方法的另一个进一步的方面,在根据所述搜索输入信息识别出搜索意图之前还包括,在空闲时间段统计字符在所有意图领域的出现次数。根据本专利技术实施例所述一种智能数据搜索方法的另一个进一步的方面,在根据所述搜索输入信息和搜索意图在数据库中进行搜索之后还包括,获取用户对各个维度的偏好值和每个维度的权重值,根据所述偏好值和每个维度的权重值计算每条检索结果的综合偏好数值,并根据该综合偏好值对搜索结果进行排序;其中,z=a1x1+a2x2+a3x3…anxn其中,z为每条检索结果的综合偏好数值,x1,x2,…xn为用户对n个维度取值的偏好值;a1,a2,…,an为每个维度的权重值。根据本专利技术实施例所述一种智能数据搜索方法的另一个进一步的方面,获取用户对各个维度的偏好值和每个维度的权重值之前还包括,记录用户日常操作的偏好,统计记录结果得到该用户对各个维度的偏好值。本专利技术实施例还提供了一种智能数据搜索系统,包括输入单元,搜索意图识别单元,搜索单元;所述输入单元,用于获取搜索输入信息;所述搜索意图识别单元,用于根据所述搜索输入信息识别出搜索意图;所述搜索单元,用于根据所述搜索输入信息和搜索意图在数据存储单元中进行搜索。根据本专利技术实施例所述一种智能数据搜索系统的一个进一步的方面,所述搜索意图识别单元进一步用于,计算所述搜索输入信息针对于各个意图领域的概率,所述概率最高的一个或者几个意图领域为所述搜索意图。根据本专利技术实施例所述一种智能数据搜索系统的再一个进一步的方面,所述计算所述搜索输入信息针对于各个意图领域的概率进一步包括,通过以下公式识别搜索输入信息在某个意图领域的概率:P(S)=#(w1)/#*#(w1,w2)/#(w1)*#(w2,w3)/#(w2)*…*#(wi-1,wi)/#(wi-1)其中,P(S)为所述搜索输入信息在某个意图领域的概率,S为所述搜索输入信息,由w1,w2,w3…wn字符组成,#为某个意图领域语料总大小,#(wi-1)表示wi-1在某个意图领域中出现的次数,#(wi-1,wi)则表示wi-1,wi前后相邻的出现次数。根据本专利技术实施例所述一种智能数据搜索系统的另一个进一步的方面,还包括预分析单元,与所述数据存储单元相连接,用于在空闲时间段统计字符在所有意图领域的出现次数。根据本专利技术实施例所述一种智能数据搜索系统的另一个进一步的方面,还包括用户偏好计算单元,分别与搜索单元和数据存储单元相连接,获取用户对各个维度的偏好值和每个维度的权重值,根据所述偏好值和每个维度的权重值计算每条检索结果的综合偏好数值,并根据该综合偏好值对搜索结果进行排序。根据本专利技术实施例所述一种智能数据搜索系统的另一个进一步的方面,还包括用户日志采集单元和用户偏好分析单元,所述用户日志采集单元与所述数据存储单元相连接,记录用户日常操作的偏好并存储于所述数据存储单元中,所述用户偏好分析单元与所述数据存储单元相连接,统计所述数据存储单元中的记录结果得到该用户对各个维度的偏好值。通过上述实施例中的方法及系统,将使搜索引擎通过查询关键字等搜索输入的意图领域,针对性的搜索和展现;并通过用户的偏好识别,理解用户潜在的、个性化的搜索需求,通过排序的方式优先返回最符合用户需要的搜索结果。以此提高查询效率、准确度,提升用户在使用搜索引擎进行搜索时的用户体验。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1所示为本专利技术实施例一种智能数据搜索方法的流程图;图2所示为本专利技术实施例一种智能数据搜索系统的结构图;图3所示为本专利技术实施例一种智能数据搜索方法的具体流程图;图4所示为上述步骤302的具体流程图;图5所示为本专利技术实施例二元模型训练流程图;图6所示为本专利技术实施例关于偏好计算和处理的流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。如图1所示为本专利技术实施例一种智能数据搜索方法的流程图。包括步骤101,获取搜索输入信息。例如可以为包括至少一个字符的搜索关键字。步骤102,根据所述搜索输入信息识别出搜索意图。步骤103,根据所述搜索输入信息和搜索意图在数据库中进行搜索。作为本专利技术的一个实施例,所述根据所述搜索输入信息识别出搜索意图进一步包括,计算所述搜索输入信息针对于各个意图领域的概率,所述概率最高的一个或者几个意图领域为所述搜索意图。作本文档来自技高网...
一种智能数据搜索系统及方法

【技术保护点】
一种智能数据搜索方法,其特征在于包括,获取搜索输入信息;根据所述搜索输入信息识别出搜索意图;根据所述搜索输入信息和搜索意图在数据库中进行搜索。

【技术特征摘要】
1.一种智能数据搜索方法,其特征在于包括,获取搜索输入信息;根据所述搜索输入信息识别出搜索意图;根据所述搜索输入信息和搜索意图在数据库中进行搜索;所述根据所述搜索输入信息识别出搜索意图进一步包括,计算所述搜索输入信息针对于各个意图领域的概率,所述概率最高的一个或者几个意图领域为所述搜索意图;其中,通过以下公式识别搜索输入信息在某个意图领域的概率:P(S)=#(w1)/#*#(w1,w2)/#(w1)*#(w2,w3)/#(w2)*…*#(wi-1,wi)/#(wi-1)其中,P(S)为所述搜索输入信息在某个意图领域的概率,S为所述搜索输入信息,由w1,w2,w3…wn字符组成,#为某个意图领域语料总大小,#(wi-1)表示wi-1在某个意图领域中出现的次数,#(wi-1,wi)则表示wi-1,wi前后相邻的出现次数。2.根据权利要求1所述的一种智能数据搜索方法,其特征在于,在根据所述搜索输入信息识别出搜索意图之前还包括,在空闲时间段统计字符在所有意图领域的出现次数。3.根据权利要求1所述的一种智能数据搜索方法,其特征在于,在根据所述搜索输入信息和搜索意图在数据库中进行搜索之后还包括,获取用户对各个维度的偏好值和每个维度的权重值,根据所述偏好值和每个维度的权重值计算每条检索结果的综合偏好数值,并根据该综合偏好值对搜索结果进行排序;其中,z=a1x1+a2x2+a3x3…anxn其中,z为每条检索结果的综合偏好数值,x1,x2,…xn为用户对n个维度取值的偏好值;a1,a2,…,an为每个维度的权重值。4.根据权利要求1所述的一种智能数据搜索方法,其特征在于,获取用户对各个维度的偏好值和每个维度的权重值之前还包括,记录用户日常操作的偏好,统计记录结果得到该用户对各个维度的偏好值。5.一种智能数据搜...

【专利技术属性】
技术研发人员:张佶范融盛丽晔于志安
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1