资源搜索方法以及服务器技术

技术编号:13595916 阅读:40 留言:0更新日期:2016-08-26 13:16
本发明专利技术涉及通信技术领域,公开了一种资源搜索方法以及服务器,该方法包括:按照用户意图识别的结果排序搜索到的资源。本发明专利技术能够实现将与用户输入的词条相关的所有类型的资源(例如包括视频、应用程序、音频等资源)按照用户的意图排序,例如,如果用户期望的是视频资源,则可以在大量搜索到的资源中,将视频资源排列在最前端,这样用户可以方便、快速地找到自己需要的资源,在节约了时间的同时,也大大提高了用户体验。

【技术实现步骤摘要】

本专利技术涉及通信
,具体地,涉及一种资源搜索方法、以及一种服务器。
技术介绍
随着网络的发展,用户可以通过关键词搜索在各种搜索引擎上搜索用户感兴趣的资源,例如网页、视频/音频等媒体流、图像、应用程序等。但是,在现有技术中搜索一般为单向的垂直搜索,比如应用商店只有app相关搜索,视频播放器只有视频相关搜索。用户进行不同资源类型的搜索,需要打开不同的搜索引擎,这引起了不便,造成用户体验不佳。此外,现有技术中在搜索到资源后并不是按照用户意图进行显示的,因此用户很有可能需要花费一些时间才能在搜索到的大量资源中找到自己期望的资源,这也造成用户体验较差。
技术实现思路
针对现有技术中存在的现有资源搜索和显示方法不能满足用户需求的技术问题,本专利技术提供了一种资源搜索方法,该方法包括:根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及按照用户意图识别的结果排序搜索到的资源。相对应地,本专利技术还提供了一种服务器,该服务器包括:资源数据库;以及处理模块,用于根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及用于按照用户意图识别的结果排序搜索到的资源。采用本专利技术提供的资源搜索方法以及服务器,通过根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别,以及之后按照用户意图识别
的结果排序搜索到的资源,能够实现将与用户输入的词条相关的所有类型的资源(例如包括视频、应用程序、音频等资源)按照用户的意图排序,例如,如果用户期望的是视频资源,则可以在大量搜索到的资源中,将视频资源排列在最前端,这样用户可以方便、快速地找到自己需要的资源,在节约了时间的同时,也大大提高了用户体验。本专利技术的其它特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本专利技术,但并不构成对本专利技术的限制。在附图中:图1是根据本专利技术的一种实施方式的示例服务器的结构示意图;图2是根据本专利技术的一种实施方式的示例服务器的处理模块执行的示例流程图;以及图3是根据本专利技术的一种实施方式的资源搜索方法的示例流程图。附图标记说明10 资源数据库 20 处理模块 100服务器具体实施方式以下结合附图对本专利技术的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本专利技术,并不用于限制本专利技术。下面将举例说明本专利技术的思想,但应当理解的这些示例为非局限性示
例,本专利技术的保护范围不限于此:为了更加清楚地说明本专利技术的思想,以本专利技术所提供的示例服务器进行详细地说明。图1是根据本专利技术的一种实施方式的示例服务器的结构示意图,如图1所示,该服务器可以包括:资源数据库10;以及处理模块20,用于根据用户输入的词条在资源数据库10中进行资源搜索和用户意图识别;以及用于按照用户意图识别的结果排序搜索到的资源。为了实现本专利技术的目的,服务器100首先需要建立资源数据库10,所述资源数据库10可以包括以下词汇中的至少一者:(1)多个敏感词以及多个敏感词中的每一个敏感词所对应的资源类型,其中所述敏感词为能够标识资源类型的词语,例如“剧场版”可以为一个敏感词,并且该敏感词对应的资源类型为视频,即可以将“剧场版,视频”存储在数据库10中;(2)多个命名实体以及多个命名实体中的每一个命名实体所对应的多种资源类型的权重值,其中所述命名实体为以名称为标识的实体,例如“花千骨”可以为一个命名实体,并且该命名实体还对应多种资源类型的权重值,例如,视频资源对应权重值为5000,应用程序(app)资源对应权重值为2000,音频资源对应权重值为1500,即可以将“花千骨,视频:5000,app:2000,音频:1500”存储在数据库10中;再例如“武则天”可以为一个命名实体,并且该命名实体还对应多种资源类型的权重值,例如,视频资源对应权重值为6000,应用程序(app)资源对应权重值为1500,音频资源对应权重值为500,即可以将“武则天,视频:6000,app:1500,音频:500”存储在数据库10中;(3)多个词语以及多个词语中的每一个词语所对应的多种资源类型的权重值,例如“爸爸”和“麻将”可以分别为一个词语,并且所述词语还分
别对应多种资源类型的权重值,即可以将“爸爸,视频:6000,app:1200,音频:3000”、“麻将,视频:500,app:2500,音频:0”存储在数据库10中。其中,上述词汇的权重值越大表示与用户意图越相关,并且所述权重值根据TF-IDF(term frequency–inverse document frequency)算法获得,该算法的计算与现有技术相似,为了不混淆本专利技术的保护范围,在此不再赘述。应当理解的是,上述词汇以及权重值的示例仅用于说明本专利技术的思想而不用于限定本专利技术的保护范围,本领域技术人员可以根据实际情况对词汇和权重值进行适当地设定,本专利技术对此不进行限定。并且,本专利技术提供的资源数据库优选地包括上述三种词汇,但本领域技术人员也可以根据实际情况选择上述中的任一者及其组合。当用户通过客户端设备(例如移动电话、计算机、平板电脑等)输入一个词条时,服务器的处理模块20可以根据用户输入的词条在资源数据库10中进行资源搜索和用户意图识别;以及用于按照用户意图识别的结果排序搜索到的资源。图2是根据本专利技术的一种实施方式的示例服务器的处理模块执行的示例流程图,如图2所示,具体地:所述处理模块20首先执行步骤S1,即将用户输入的所述词条根据分词算法将所述词条分为多个词。优选地,所述分词算法可以为Friso算法等适当地分词算法,所述算法的计算与现有技术相似,为了不混淆本专利技术的保护范围,在此不再赘述;接着,由于上述三种词汇与用户意图之间的相关性是从高到低的,因此为了精确地识别用户意图,首先可以判断分词后的多个词中的至少一者与所述资源数据库中的多个敏感词中的至少一个敏感词是否匹配,即执行步骤S2;在所述多个词中的至少一者与所述资源数据库中的多个敏感词中的至少一个至少一者匹配的情况下(即此时用户输入的词条为包含敏感词),则
将用户意图识别为与所述至少一个敏感词所对应的资源类型,即执行步骤S3,并可以显示排序后的资源。其中,当多个词分别与多个敏感词对应时(即两个以上的词在资源数据库中找到与其匹配的敏感词),处理模块20可以将用户意图识别为在资源数据库中第一个搜索到的匹配的敏感词所对应的资源类型,并排序搜索到的与所述资源类型对应的资源;反之,在所述多个词与所述资源数据库中的所有敏感词均不匹配情况下(即此时用户输入的词条不包含敏感词),则需要执行步骤S4,即判断所述多个词中的至少一者与所述资源数据库中的多个命名实体中的至少一者是否匹配;在所述多个词中的至少一者与所述资源数据库中的多个命名实体中的至少一者匹配的情况下(即此时用户输入的词条为包含命名实体),则将用户意图识别为与所述至少一个命名实体所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述多种资源类型对应的多个资源,即执行步骤S5,并可以显示排序后的资源。其中,当多个词分别与多个命名实体对应时(即两个以上的词在资源数据库中找到与其匹配的命名实体),处理模本文档来自技高网
...

【技术保护点】
一种资源搜索方法,其特征在于,该方法包括:根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及按照用户意图识别的结果排序搜索到的资源。

【技术特征摘要】
1.一种资源搜索方法,其特征在于,该方法包括:根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及按照用户意图识别的结果排序搜索到的资源。2.根据权利要求1所述的方法,其特征在于,所述根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别包括:将用户输入的所述词条根据分词算法将所述词条分为多个词;以及根据所述多个词进行资源搜索和用户意图识别。3.根据权利要求2所述的方法,其特征在于,所述资源数据库包括多个敏感词以及多个敏感词中的每一个敏感词所对应的资源类型,其中所述敏感词为能够标识资源类型的词语。4.根据权利要求3所述的方法,其特征在于,按照用户意图识别的结果排序搜索到的资源包括:所述多个词中的至少一者与所述资源数据库中的多个敏感词中的至少一者匹配的情况下,将用户意图识别为与所述至少一个敏感词所对应的资源类型,并排序搜索到的与所述资源类型对应的资源。5.根据权利要求4所述的方法,其特征在于,所述资源数据库包括多个命名实体以及多个命名实体中的每一个命名实体所对应的多种资源类型的权重值,其中所述命名实体为以名称为标识的实体。6.根据权利要求5所述的方法,其特征在于,按照用户意图识别的结
\t果排序搜索到的资源包括:在所述多个词中的至少一者与所述资源数据库中的多个命名实体中的至少一者匹配的情况下,将用户意图识别为与所述至少一个命名实体所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述多种资源类型对应的多个资源。7.根据权利要求6所述的方法,其特征在于,所述资源数据库包括多个词语以及多个词语中的每一个词语所对应的多种资源类型的权重值。8.根据权利要求7所述的方法,其特征在于,按照用户意图识别的结果排序搜索到的资源包括:在所述多个词中的至少一者与所述资源数据库中的多个词语中的至少一者的情况下,将用户意图识别为与所述至少一个词语所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所...

【专利技术属性】
技术研发人员:王乙丁
申请(专利权)人:乐视网信息技术北京股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1