System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于人工智能的组合检索优化方法及系统技术方案_技高网

一种基于人工智能的组合检索优化方法及系统技术方案

技术编号:40651580 阅读:4 留言:0更新日期:2024-03-13 21:29
本申请公开了一种基于人工智能的组合检索优化方法及系统,其中,基于人工智能的组合检索优化方法,包括如下步骤:S1:按照预设的获取条件从多个受信数据源获取文本数据;S2:对文本数据进行分析,确定目标类别,并根据目标类别获取存储地址;S3:对文本数据进行处理,获得检索数据,并根据存储地址将检索数据存储于相应的检索数据库;S4:接收检索请求,对检索请求进行分析,确定检索类别,并根据检索类别从相应的检索数据库中获取检索结果。本申请能够提高检索效率和检索准确性。

【技术实现步骤摘要】

本申请涉及智能检索,尤其涉及一种基于人工智能的组合检索优化方法及系统


技术介绍

1、智能检索是一种通过使用人工智能技术来帮助用户快速、准确地找到所需信息的方法。在现有的智能检索系统中,通常是对大量的数据进行预处理,例如:去除重复项、将文本转换为结构化格式等,再使用自然语言处理(nlp)技术来理解用户的查询意图,生成一个表示查询意图的向量,并根据该向量在已有的数据集中查找与查询意图相关的文档作为检索结果。

2、但在实际应用过程中,通过现有的智能检索系统对海量文本数据进行检索具有以下问题:

3、(1)数据规模大、存储和索引效率低。

4、(2)未充分考虑文本数据的结构复杂性、内容复杂性和异构性,无法快速、准确、有效地进行检索,且检索结果的准确性低。


技术实现思路

1、本申请的目的在于提供一种基于人工智能的组合检索优化方法及系统,能够提高检索效率和检索准确性。

2、为达到上述目的,本申请提供一种基于人工智能的组合检索优化方法,包括如下步骤:s1:按照预设的获取条件从多个受信数据源获取文本数据;s2:对文本数据进行分析,确定目标类别,并根据目标类别获取存储地址;s3:对文本数据进行处理,获得检索数据,并根据存储地址将检索数据存储于相应的检索数据库;s4:接收检索请求,对检索请求进行分析,确定检索类别,并根据检索类别从相应的检索数据库中获取检索结果。

3、如上的,其中,确定受信数据源的步骤为:s11:选择数据源;s12:对数据源进行可靠性验证,获得验证结果,其中,验证结果为可靠或不可靠;若验证结果为可靠,则执行s13;若验证结果为不可靠,则结束;s13:向数据源发送合作请求,并接收根据合作请求发送的合作结果,其中,合作结果为同意或拒绝;若合作结果为同意,则执行s14;若合作结果为拒绝,则结束;s14:将数据源作为受信数据源,与受信数据源建立通信通道,并通过通信通道设置获取条件。

4、如上的,其中,对数据源进行可靠性验证,获得验证结果的子步骤如下:s121:通过第三方认证机构对数据源进行认证,若认证结果为可靠,则执行s122;若认证结果为不可靠,则结束;s122:从数据源的所有历史评价数据中随机获取多个历史评价数据作为验证样本数据,对验证样本数据进行分析,获得评级值;s123:根据预设的评级阈值对评级值进行判断,获得验证结果,若评级值大于或等于评级阈值,则生成的验证结果为可靠;若评级值小于评级阈值,则生成的验证结果为不可靠。

5、如上的,其中,评级值的表达式如下:;其中,评级值;为第个验证样本数据的实际评分值,,为验证样本数据的总个数;为第个实际评分值大于实际评分阈值的验证样本数据的实际评分值,,为实际评分值大于实际评分阈值的验证样本数据的总个数;。

6、如上的,其中,对文本数据进行分析,确定目标类别,并根据目标类别获取存储地址的子步骤如下: s21:对文本数据的文本结构进行特征提取,获得多个结构主特征;s22:遍历预先构建的多个文本类别,利用多个结构主特征分别与每个文本类别的结构特征集合进行相关性分析,获得多个结构相似度;s23:通过预设的结构相似阈值对每个结构相似度进行判断,获得结构相似结果,其中,结构相似结果为相似或不相似;若多个结构相似度中具有至少一个大于或等于结构相似阈值的结构相似度,则生成的结构相似结果为相似,执行s24;若所有结构相似度均小于结构相似阈值,则生成的结构相似结果为不相似,构建新的文本类别;s24:将结构相似结果为相似的结构相似度中的最大值所对应的文本类别作为目标类别,并获取目标类别对应的存储地址。

7、如上的,其中,接收检索请求,对检索请求进行分析,确定检索类别,并根据检索类别从相应的检索数据库中获取检索结果的子步骤如下:s41:接收检索请求,对检索内容进行特征提取,获得多个检索特征;其中,检索请求至少包括:用户信息、检索时间和检索内容;s42:遍历预先构建的多个查询类别,利用多个检索特征分别与每个查询类别的查询特征集合进行归属性分析,获得多个查询归属值;s43:将多个查询归属值中的最大值所对应的查询类别作为检索类别;s44:根据检索类别中的文本类别获取存储地址,并根据存储地址从相应的检索数据库中获取至少一个检索数据,将检索数据作为检索结果,并发送。

8、如上的,其中,每个预先构建的查询类别均对应一个查询名称、一个查询特征集合和至少一个文本类别,其中,每个文本类别均对应一个占比参数。

9、如上的,其中,占比参数根据从多个受信数据源获取的文本数据进行实时更新。

10、如上的,其中,查询特征集合根据从多个受信数据源获取的文本数据进行实时更新。

11、本申请还提供一种基于人工智能的组合检索优化系统,包括:多个受信数据源、多个用户端和组合检索优化中心;其中,受信数据源:允许组合检索优化中心按照预设的获取条件获取文本数据;用户端:向组合检索优化中心发送检索请求,并接收检索结果;组合检索优化中心:用于执行上述的基于人工智能的组合检索优化方法。

12、本申请实现的有益效果如下:

13、(1)本申请的基于人工智能的组合检索优化方法及系统,适用于海量文本数据检索。

14、(2)本申请的基于人工智能的组合检索优化方法及系统,充分考虑了文本数据的结构复杂性、内容复杂性和异构性,能够快速、准确、有效地进行存储和检索,且检索结果的准确性高。

15、(3)本申请的基于人工智能的组合检索优化方法及系统,通过实时更新优化查询特征集合、文本类别和占比参数,提高了组合检索的准确性。

本文档来自技高网...

【技术保护点】

1.一种基于人工智能的组合检索优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于人工智能的组合检索优化方法,其特征在于,确定受信数据源的步骤为:

3.根据权利要求2所述的基于人工智能的组合检索优化方法,其特征在于,对数据源进行可靠性验证,获得验证结果的子步骤如下:

4.根据权利要求3所述的基于人工智能的组合检索优化方法,其特征在于,评级值的表达式如下:

5.根据权利要求1所述的基于人工智能的组合检索优化方法,其特征在于,对文本数据进行分析,确定目标类别,并根据目标类别获取存储地址的子步骤如下:

6.根据权利要求5所述的基于人工智能的组合检索优化方法,其特征在于,接收检索请求,对检索请求进行分析,确定检索类别,并根据检索类别从相应的检索数据库中获取检索结果的子步骤如下:

7.根据权利要求6所述的基于人工智能的组合检索优化方法,其特征在于,每个预先构建的查询类别均对应一个查询名称、一个查询特征集合和至少一个文本类别,其中,每个文本类别均对应一个占比参数。

8.根据权利要求7所述的基于人工智能的组合检索优化方法,其特征在于,占比参数根据从多个受信数据源获取的文本数据进行实时更新。

9.根据权利要求7所述的基于人工智能的组合检索优化方法,其特征在于,查询特征集合根据从多个受信数据源获取的文本数据进行实时更新。

10.一种基于人工智能的组合检索优化系统,其特征在于,包括:多个受信数据源、多个用户端和组合检索优化中心;

...

【技术特征摘要】

1.一种基于人工智能的组合检索优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于人工智能的组合检索优化方法,其特征在于,确定受信数据源的步骤为:

3.根据权利要求2所述的基于人工智能的组合检索优化方法,其特征在于,对数据源进行可靠性验证,获得验证结果的子步骤如下:

4.根据权利要求3所述的基于人工智能的组合检索优化方法,其特征在于,评级值的表达式如下:

5.根据权利要求1所述的基于人工智能的组合检索优化方法,其特征在于,对文本数据进行分析,确定目标类别,并根据目标类别获取存储地址的子步骤如下:

6.根据权利要求5所述的基于人工智能的组合检索优化方法,其特征在于,接收检索请求,对检索请求进行分析...

【专利技术属性】
技术研发人员:司苗珍
申请(专利权)人:广州敏行数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1