System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,尤其是涉及一种用于海量数据的搜索方法、装置、系统及存储介质。
技术介绍
1、海量数据搜索因为数据量巨大,很难在有限的时间内完成,目前常用的处理方式如下:将数据分成较小的部分,分别处理,然后再合并结果;将数据分布到多个节点上,并行处理,以提高效率;使用索引可以快速定位到需要的数据,避免全量扫描;将之前搜索的结果缓存起来,避免重复计算;针对特定领域的数据进行搜索,只保留相关的结果。
2、例如使用各种搜索引擎进行搜索,得到的搜索结果会根据相关度进行排序,需要提问者进行自行筛选。但是随着人工智能的广泛使用,对于海量数据搜索提出了新的需求,需要根据提问者的要求给出准确答案。上述过程需要瞬时性的大量计算支撑,导致得到答案的成本较高。
技术实现思路
1、本申请提供一种用于海量数据的搜索方法、装置、系统及存储介质,通过在三维空间内进行关系匹配的方式来得到准确答案,该种方式可以迅速确定一个小的搜索范围,能够降低搜索过程的数据处理量。
2、本申请的上述目的是通过以下技术方案得以实现的:
3、第一方面,本申请提供了一种用于海量数据的搜索方法,包括:
4、响应于得到的语句数据,对语句数据进行解析,得到多个词语对象;
5、根据语句数据确定词语对象的归属关系,归属关系根据语句数据中的关联词语确定;
6、向关联词语赋予方向向量组,方向向量组对应关联词语和与关联词语相近的关联词语,方向向量组包括至少一个方向向量;
< ...【技术保护点】
1.一种用于海量数据的搜索方法,其特征在于,包括:
2.根据权利要求1所述的用于海量数据的搜索方法,其特征在于,对语句数据进行解析包括:
3.根据权利要求2所述的用于海量数据的搜索方法,其特征在于,将语句数据划分成多个词语单元的过程中,记录多种划分方式中位于相近位置处的词语单元的含义;
4.根据权利要求3所述的用于海量数据的搜索方法,其特征在于,一个位置处的划分方式确定后,不再参与后续的划分方式。
5.根据权利要求1至4中任意一项所述的用于海量数据的搜索方法,其特征在于,内容根据归属关系组成的折线与检索向量组在判定相似度时,折线的任意一段的长度均可以调整,调整包括伸长和缩短。
6.根据权利要求1至4中任意一项所述的用于海量数据的搜索方法,其特征在于,顺序序列上的两个方向向量组,第一个方向向量组中的方向向量均与第二个方向向量组中的至少一个方向向量连接。
7.根据权利要求6所述的用于海量数据的搜索方法,其特征在于,第一个方向向量组中的方向向量与第二个方向向量组中的方向向量连接时,具有多种连接关系;
8
9.一种用于海量数据的搜索系统,其特征在于,所述系统包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括:
...【技术特征摘要】
1.一种用于海量数据的搜索方法,其特征在于,包括:
2.根据权利要求1所述的用于海量数据的搜索方法,其特征在于,对语句数据进行解析包括:
3.根据权利要求2所述的用于海量数据的搜索方法,其特征在于,将语句数据划分成多个词语单元的过程中,记录多种划分方式中位于相近位置处的词语单元的含义;
4.根据权利要求3所述的用于海量数据的搜索方法,其特征在于,一个位置处的划分方式确定后,不再参与后续的划分方式。
5.根据权利要求1至4中任意一项所述的用于海量数据的搜索方法,其特征在于,内容根据归属关系组成的折线与检索向量组在判定相似度时,折线的任意一段的长度均...
【专利技术属性】
技术研发人员:王苹,曹婷,罗钦,洪静,黄宇,
申请(专利权)人:创意信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。