【技术实现步骤摘要】
一种基于人工智能技术的主题搜索方法及其系统
本专利技术涉及信息检索
,尤其涉及一种基于人工智能技术的主题搜索方法及其系统。
技术介绍
目前的搜索服务通常是以列表或图片链接的形式返回针对用户输入的关键字的搜索结果,用户通常只能逐条点击链接、即采用依次浏览搜索结果的标题和摘要,才能找到和确定其感兴趣的信息,或者所需要的搜索内容。这样的搜索过程效率低下,用户无法直观地获得想要的搜索结果。并且用户输入的关键字的语义可以有多种理解方式,由于语义的歧义性或用户无法准确表达自己的需求,使得现有的搜索服务不能够区分关键字的不同歧义,有可能造成搜索结果中包含用户实际并不感兴趣的信息,这样,就需要用户自己筛选定位,更进一步增加了用户筛选有效信息的工作量,从而增加了搜索时间,降低了搜索效率。以及目前的很多搜索服务中,通常采用聚类算法对指定数据进行迭代计算,检索出主题,但是通过聚类算法进行迭代计算的计算复杂程度高,而且计算量较大,从而导致检索出主题的速度往往需要等待几小时甚至几天。
技术实现思路
针对现有技 ...
【技术保护点】
1.一种基于人工智能技术的主题搜索方法,其特征在于,包括以下步骤:/n步骤S1,对用户输入的至少一个关键词进行搜索,并根据第一搜索结果对所述关键词进行预处理,以得到每个所述关键词对应的关联词组;/n步骤S2,根据权重计算公式于所述关联词组中获取每个关联词的权重,以根据权重顺序由上至下依次获取预设数量的所述关联词,并将根据权重获取的所述关联词记为预设核心词;/n步骤S3,根据所述预设核心词于所述第一搜索结果中获取得到与所述预设核心词相关联的次要核心词,根据所述权重计算公式计算所述次要核心词的权重,并根据权重顺序对所述次要核心词进行筛选,以根据筛选结果和所述预设核心词获取得到预 ...
【技术特征摘要】
1.一种基于人工智能技术的主题搜索方法,其特征在于,包括以下步骤:
步骤S1,对用户输入的至少一个关键词进行搜索,并根据第一搜索结果对所述关键词进行预处理,以得到每个所述关键词对应的关联词组;
步骤S2,根据权重计算公式于所述关联词组中获取每个关联词的权重,以根据权重顺序由上至下依次获取预设数量的所述关联词,并将根据权重获取的所述关联词记为预设核心词;
步骤S3,根据所述预设核心词于所述第一搜索结果中获取得到与所述预设核心词相关联的次要核心词,根据所述权重计算公式计算所述次要核心词的权重,并根据权重顺序对所述次要核心词进行筛选,以根据筛选结果和所述预设核心词获取得到预选主题词组;
步骤S4,对每个所述预选主题词组进行搜索,以获取每个所述预选主题词组对应的第二搜索结果中的每个主题搜索项的第一相关度;
步骤S5,根据相关度筛选阈值结合所述主题搜索项的所述第一相关度对所述主题搜索项进行筛选,并将对应于所有所述关键词的每个主题搜索信息根据所述第一相关度的大小进行依次展示;
其中,所述主题搜索信息包括所有所述关键词的一个所述预选主题词组和筛选后的对应于所述预选主题词组的一个所述主题搜索项;并且每两个主题搜索信息不同。
2.如权利要求1所述的基于人工智能技术的主题搜索方法,其特征在于,所述步骤S1具体包括以下步骤:
步骤S11,用户在搜索框中输入至少一个所述关键词,以得到对应于所有所述关键词的所述第一搜索结果;
步骤S12,与所述第一搜索结果中的每个关联词搜索项中获取得到与每个所述关键词相关联的所述关联词;
步骤S13,根据所有所述关联词搜索项中的所述关联词获取得到与每个所述关键词对应的所述关联词组。
3.如权利要求1所述的基于人工智能技术的主题搜索方法,其特征在于,所述关联词组包括与所述关键词相关联的所述关联词,和相互关联的所述关联词。
4.如权利要求3所述的基于人工智能技术的主题搜索方法,其特征在于,采用图表展示所述关联词、所述预设核心词和所述次要核心词之间的连接关系,以及采用所述图表展示所述关联词、所述预设核心词和所述次要核心词的权重大小。
5.如权利要求1所述的基于人工智能技术的主题搜索方法,其特征在于,所述权重计算公式如下述公式所示:
其中,Weight用于表示权重;
subsetFreq用于表示所述第一搜索结果的词频;
subsetSize用于表示所述第一搜索结果的大小;
superFreq用于表示整个搜索数据库的词频;
superSize用于表示整个搜索数据库的大小;
natureBoost用于表示词性权重;
fieldBoost用于表示字段权重。
6.如权利要求1所述的基于人工智能技术的主题搜索方法,其特征在于,所述步骤S3具体包括以下步骤:
步骤S31,于所述第一搜索结果中的每个关联词搜索项中获取与所述预设核心词相关联的次要核心词,以得到关联于所述预设核心词的次要核心词组;
步骤S32,根据所述权重计算公式计算得到所述次要核心词组中的每个所述次要核心词的权重,以根据权重顺序和预设筛选规则对所述次要核心词进行筛...
【专利技术属性】
技术研发人员:姚洲鹏,
申请(专利权)人:杭州凡闻科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。