System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种场景分类识别方法、系统及可读存储介质技术方案_技高网

一种场景分类识别方法、系统及可读存储介质技术方案

技术编号:40350829 阅读:7 留言:0更新日期:2024-02-09 14:35
一种场景分类识别方法、系统及可读存储介质,在该方法中,在历史搜索数据库中提取企业的历史搜索数据;在确定历史搜索数据中与目标技术词的所属领域相交叉的交叉技术词的数量不少于两个的情况下,根据第一技术词及目标技术词得到第一相似度;根据第二技术词及目标技术词得到第二相似度;在确定第一相似度大于第二相似度的情况下,分类识别第一技术词在历史搜索数据中的全部搜索结果场景,得到若干场景属性及与场景属性一一对应的数量;将数量最多的场景属性确定为目标场景;确定目标技术词的搜索结果场景为目标场景。基于用户历史搜索数据,对用户的搜索需求进行了场景的分类识别,提高了用户获取目标信息的准确率及效率。

【技术实现步骤摘要】

本申请属于场景分类识别领域,尤其涉及一种场景分类识别方法、系统及可读存储介质


技术介绍

1、产学研是指产业、学术界和科研机构之间的合作关系,旨在促进科技创新和技术转化,推动产业发展和学术进步。随着科技创新和产业发展的加速,越来越多的企业、学术界和科研机构意识到产学研合作的重要性,并积极开展相关合作。

2、在相关技术中,产业界的人员在相关网站或者软件上进行搜索,搜索的内容与其需要的技术相关。例如一家企业需要做智能驾驶类的产品,则其工作人员输入的词条可能需要包含“传感器技术”、“计算机视觉技术”及“人工智能和机器学习技术”等技术,相关网站或者软件可能会出现与其输入的词条相关的专家、专利或论文等等。

3、然而,相关技术中对于词条的反馈内容可能并不是工作人员的目标内容,还需要工作人员进行二次搜索,例如,该工作人员想要的是与“传感器技术”相关的专家,而相关技术给出的反馈内容是与“传感器技术”相关的设备,此时需要该工作人员进一步搜索,添加限制条件。这样产业界需要花费大量时间去获取自己想要的数据,致使获取数据的效率大大降低。


技术实现思路

1、本申请提供了一种场景分类识别方法、系统及可读存储介质,基于用户历史搜索数据,对用户的搜索需求进行场景的分类识别,提高用户获取目标信息的准确率及效率。

2、第一方面,本申请提供了一种场景分类识别方法,在确定接收到企业的终端发送的目标技术词的情况下,在历史搜索数据库中提取该企业的历史搜索数据;在确定该历史搜索数据中与该目标技术词的所属领域相交叉的交叉技术词的数量不少于两个的情况下,根据第一技术词及该目标技术词得到第一相似度;根据第二技术词及该目标技术词得到第二相似度,该交叉技术词包括该第一技术词及该第二技术词;在确定该第一相似度大于该第二相似度的情况下,分类识别该第一技术词在该历史搜索数据中的全部搜索结果场景,得到若干场景属性及与该场景属性一一对应的数量;将数量最多的场景属性确定为目标场景;确定该目标技术词的搜索结果场景为该目标场景。

3、通过采用上述技术方案,在确定接收到企业的终端发送的目标技术词的情况下,在历史搜索数据库中提取企业的历史搜索数据,确定第一技术词及第二技术词,分别计算第一技术词及第二技术词与目标技术词的相似度,在第一相似度大于第二相似度时,分类识别第一技术词对应的搜索结果场景,确定搜索结果场景中的目标场景,将目标技术词的搜索结果场景确定为目标场景,基于用户历史搜索数据,对用户的搜索需求进行场景的分类识别,提高了用户获取目标信息的准确率及效率。

4、结合第一方面的一些实施例,在一些实施例中,在该在历史搜索数据库中提取该企业的历史搜索数据之前,该方法还包括:在预设数据库中确定第一预设数量个包含该目标技术词的目标刊登读物;确定该目标刊登读物的引用文献的领域数量;在确定该领域数量大于预设交叉技术值时,提取该目标刊登读物的文本数据;根据该文本数据确定交叉技术词,该交叉技术词包括第一技术词和第二技术词,该第一技术词及该第二技术词不为该目标技术词,该第一技术词为该文本数据中词频最大的交叉技术词,该第二技术词为该文本数据中除该第一技术词外词频最大的交叉技术词。

5、通过采用上述技术方案,在预设数据库中确定第一预设数量个包含目标技术词的目标刊登读物,在确定目标刊登读物的引用文献的领域数量大于预设交叉技术值时,提取目标刊登读物的文本数据,根据文本数据确定第一技术词及第二技术词,通过对关于目标技术词的目标刊登读物的文本分析,得到与目标技术词该领域相交叉的第一技术词及第二技术词,为确定目标技术词的搜索结果场景提供了数据参考基础,提高了用户获取目标信息的准确率。

6、结合第一方面的一些实施例,在一些实施例中,根据该第一技术词及该目标技术词得到第一相似度,具体包括:在预设数据库中确定第一刊登读物,该第一刊登读物为该第一技术词的词频大于预设词频的刊登读物;确定该目标刊登读物中该目标技术词的词频大于该预设词频的第二刊登读物;利用快速自动关键词提取方法分别从该第一刊登读物及该第二刊登读物中提取若干第一关键词及若干目标关键词;根据若干该第一关键词及若干该目标关键词得到该第一技术与目标技术之间对应的第一关键词集合,该目标技术为该目标技术词对应的技术;根据该第一关键词集合确定该第一技术与该目标技术之间对应的第一文本向量;根据该第一文本向量确定该第一技术与该目标技术之间对应的第一词向量;根据该第一文本向量确定该目标技术与该第一技术之间对应的逆第一词向量;根据该第一词向量及该逆第一词向量得到该第一技术词与该目标技术词的第一相似度。

7、通过采用上述技术方案,用快速自动关键词提取方法分别从第一刊登读物及第二刊登读物中提取若干第一关键词及若干目标关键词,再根据若干第一关键词及若干目标关键词得到第一技术与目标技术之间对应的第一关键词集合,然后依次确定第一文本向量、第一词向量、逆第一词向量及第一相似度,通过提取关键词并使用关键词数据得到第一相似度,提高了用户获取目标信息的准确率及效率。

8、结合第一方面的一些实施例,在一些实施例中,根据若干该第一关键词及若干该目标关键词得到该第一技术与目标技术之间对应的第一关键词集合,具体包括:分别统计若干该第一关键词及若干该目标关键词对应的若干第一词频及若干目标词频;分别计算若干该第一关键词及若干该目标关键词对应的若干第一逆文件频率及若干目标逆文件频率;根据若干该第一词频、若干该目标词频、若干该第一逆文件频率、及若干该目标逆文件频率得到若干该第一关键词及若干该目标关键词对应的若干第一加权词频及若干目标加权词频;分别将若干该第一加权词频及若干该目标加权词频由大到小排序得到第一排序结果及目标排序结果;分别在该第一排序结果及该目标排序结果中取前第二预设数量个的该第一加权词频对应的第一关键词及该前第二预设数量个的该目标加权词频对应的目标关键词;根据该第一关键词及该目标关键词确定该第一技术与该目标技术之间对应的第一关键词集合。

9、通过采用上述技术方案,计算第一关键词及目标关键词对应的若干第一逆文件频率及若干目标逆文件频率,再得到若干第一加权词频及若干目标加权词频,分别将若干第一加权词频及若干目标加权词频排序,分别在排序结果中取前第二预设数量个的第一关键词及预设数量个的目标关键词,最后根据第一关键词及目标关键词确定第一技术与目标技术之间对应的第一关键词集合,提高了用户获取目标信息的准确率。

10、结合第一方面的一些实施例,在一些实施例中,分别计算若干该第一关键词及若干该目标关键词对应的若干第一逆文件频率及若干目标逆文件频率,具体包括:获取该预设数据库中的刊登读物总量;分别确定包含若干该第一关键词及包含若干该目标关键词对应的若干第一技术刊登读物数量及若干目标技术刊登读物数量;将该刊登读物总量、若干该第一技术刊登读物数量及若干该目标技术刊登读物数量输入逆文件频率函数,得到若干第一逆文件频率及若干目标逆文件频率;该逆文件频率函数为:

11、

12本文档来自技高网...

【技术保护点】

1.一种场景分类识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述在历史搜索数据库中提取所述企业的历史搜索数据之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据第一技术词及所述目标技术词得到第一相似度,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述根据若干所述第一关键词及若干所述目标关键词得到所述第一技术与目标技术之间对应的第一关键词集合,具体包括:

5.根据权利要求4所述的方法,其特征在于,所述分别计算若干所述第一关键词及若干所述目标关键词对应的若干第一逆文件频率及若干目标逆文件频率,具体包括:

6.根据权利要求3或4所述的方法,其特征在于,所述根据所述第一词向量及所述逆第一词向量得到所述第一技术词与所述目标技术词的第一相似度,具体包括:

7.根据权利要求6所述的方法,其特征在于,所述相似度函数函数为:

8.一种场景分类识别系统,其特征在于,包括:

9.一种场景分类识别系统,其特征在于,包括:一个或多个处理器和存储器;</p>

10.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在系统上运行时,使得所述系统执行如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种场景分类识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述在历史搜索数据库中提取所述企业的历史搜索数据之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据第一技术词及所述目标技术词得到第一相似度,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述根据若干所述第一关键词及若干所述目标关键词得到所述第一技术与目标技术之间对应的第一关键词集合,具体包括:

5.根据权利要求4所述的方法,其特征在于,所述分别计算若干所述第一关键词及若干所述目标关键词对应的若干...

【专利技术属性】
技术研发人员:周秋杏陈飞吴灏
申请(专利权)人:企知道产学研科技成果转化深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1