System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及分布式向量,尤其涉及一种基于分布式向量数据库的相似事件识别方法、服务端、客户端及基于分布式向量数据库的相似事件识别系统。
技术介绍
1、随着信息技术的发展,在城市治理、应急调度等领域下,积累了大量的业务事件,如何在海量的事件中快速的发现形同或相似的事件,从而减少事件的重复处理提高事件的响应速度,成为比较迫切的需求。
技术实现思路
1、本专利技术提供了一种基于分布式向量数据库的相似事件识别方法、服务端、客户端及基于分布式向量数据库的相似事件识别系统,解决相关技术中存在的海量事件响应速度低的问题。
2、作为本专利技术的第一个方面,提供一种基于分布式向量数据库的相似事件识别方法,其中,包括:
3、获取客户端的当前事件序列信息,其中所述客户端能够将接收到的当前上报事件进行序列化处理后获得当前事件序列信息,其中所述当前上报事件至少包括当前事件描述信息和当前事件标题信息;
4、将所述当前事件序列信息输入至语言识别模型,获得相似向量识别结果,其中所述语言识别模型能够对所述当前事件序列信息进行向量信息抽取以获得当前事件向量信息,以及能够将所述当前事件向量信息代入向量数据库获得相似向量识别结果,其中所述向量数据库包括根据语料库中的语料事件信息向量化处理后获得的语料事件向量信息;
5、将所述相似向量识别结果进行存储,并当接收到客户端的查询指令时向客户端返回相似向量识别结果。
6、进一步地,所述语言识别模型能够对所述当前事件序列信
7、将所述当前事件序列信息进行文本向量化处理,获得当前事件序列信息的向量化表示结果;
8、对当前事件序列信息的向量化表示结果进行向量信息抽取,获得当前事件向量信息。
9、进一步地,所述语言识别模型能够对所述当前事件序列信息进行向量信息抽取以获得当前事件向量信息,包括:
10、将所述当前事件序列信息进行文本向量化处理,获得当前事件序列信息的向量化表示结果;
11、对当前事件序列信息的向量化表示结果进行向量信息抽取,获得当前事件向量信息。
12、进一步地,将所述当前事件向量信息代入向量数据库获得相似向量识别结果,包括:
13、将所述当前事件向量信息与向量数据库内的语料事件向量信息进行向量相似度计算,获得向量相似度计算结果;
14、将所述向量相似度计算结果与预设相似度阈值进行比较,并将大于预设相似度阈值的向量相似度计算结果作为相似向量识别结果。
15、进一步地,所述基于分布式向量数据库的相似事件识别方法还包括:
16、根据语料库构建向量数据库;
17、创建向量数据库索引。
18、进一步地,所述创建向量数据库索引包括:
19、实时获取清洗过的语料库;
20、根据预设间隔定时读取语料库数据,以判断是否存在更新;
21、若存在更新,则根据语言识别模型在语料库这种抽取语义向量;
22、将抽取完成的寓意向量更新至向量数据库,并更新向量数据库中的id信息以及事件分类信息。
23、进一步地,所述基于分布式向量数据库的相似事件识别方法还包括:
24、接收客户端的查询指令;
25、根据所述查询指令提取待查询相似事件;
26、根据所述待查询相似事件在所述向量数据库中进行查询,以确定查询id信息;
27、根据所述查询id信息查询相似向量识别结果,以向客户端返回相似向量识别结果。
28、作为本专利技术的另一个方面,提供一种基于分布式向量数据库的相似事件识别方法,其中,包括:
29、接收当前上报事件以及语料库中的语料事件信息,其中所述当前上报事件至少包括当前事件描述信息和当前事件标题信息,所述语料事件信息至少包括语料事件描述信息和语料事件标题信息;
30、分别对所述当前上报事件以及语料事件信息进行序列化处理,获得当前事件序列信息以及语料事件序列信息;
31、将所述当前事件序列信息以及语料事件序列信息发送至服务端,所述服务端能够将当前事件序列信息输入至语言识别模型,以获得相似向量识别结果,其中所述语言识别模型能够对所述当前事件序列信息进行向量信息抽取以获得当前事件向量信息,以及能够将所述当前事件向量信息代入向量数据库获得相似向量识别结果,其中所述向量数据库包括根据语料库中的语料事件信息向量化处理后获得的语料事件向量信息;
32、接收服务端返回的相似向量识别结果。
33、作为本专利技术的另一个方面,提供一种服务端,用于实现前文所述的基于分布式向量数据库的相似事件识别方法,其中,包括:
34、获取模块,用于获取客户端的当前事件序列信息,其中所述客户端能够将接收到的当前上报事件进行序列化处理后获得当前事件序列信息,其中所述当前上报事件至少包括当前事件描述信息和当前事件标题信息;
35、识别模块,用于将所述当前事件序列信息输入至语言识别模型,获得相似向量识别结果,其中所述语言识别模型能够对所述当前事件序列信息进行向量信息抽取以获得当前事件向量信息,以及能够将所述当前事件向量信息代入向量数据库获得相似向量识别结果,其中所述向量数据库包括根据语料库中的语料事件信息向量化处理后获得的语料事件向量信息;
36、存储与返回模块,用于将所述相似向量识别结果进行存储,并当接收到客户端的查询指令时向客户端返回相似向量识别结果。
37、作为本专利技术的另一个方面,提供一种客户端,用于实现前文所述的基于分布式向量数据库的相似事件识别方法,其中,包括:
38、第一接收模块,用于接收当前上报事件以及语料库中的语料事件信息,其中所述当前上报事件至少包括当前事件描述信息和当前事件标题信息,所述语料事件信息至少包括语料事件描述信息和语料事件标题信息;
39、序列化处理模块,用于分别对所述当前上报事件以及语料事件信息进行序列化处理,获得当前事件序列信息以及语料事件序列信息;
40、发送模块,用于将所述当前事件序列信息以及语料事件序列信息发送至服务端,所述服务端能够将当前事件序列信息输入至语言识别模型,以获得相似向量识别结果,其中所述语言识别模型能够对所述当前事件序列信息进行向量信息抽取以获得当前事件向量信息,以及能够将所述当前事件向量信息代入向量数据库获得相似向量识别结果,其中所述向量数据库包括根据语料库中的语料事件信息向量化处理后获得的语料事件向量信息;
41、第二接收模块,用于接收服务端返回的相似向量识别结果。
42、作为本专利技术的另一个方面,提供一种基于分布式向量数据库的相似事件识别系统,其中,包括:前文所述的服务端和前文所述的客户端,所述服务端与所述客户端通信连接。
43、本专利技术提供的基于分布式向量数据库的相似事件识别方法,通过获取当前事本文档来自技高网...
【技术保护点】
1.一种基于分布式向量数据库的相似事件识别方法,其特征在于,包括:
2.根据权利要求1所述的基于分布式向量数据库的相似事件识别方法,其特征在于,所述语言识别模型能够对所述当前事件序列信息进行向量信息抽取以获得当前事件向量信息,包括:
3.根据权利要求1所述的基于分布式向量数据库的相似事件识别方法,其特征在于,将所述当前事件向量信息代入向量数据库获得相似向量识别结果,包括:
4.根据权利要求1所述的基于分布式向量数据库的相似事件识别方法,其特征在于,所述基于分布式向量数据库的相似事件识别方法还包括:
5.根据权利要求4所述的基于分布式向量数据库的相似事件识别方法,其特征在于,所述创建向量数据库索引包括:
6.根据权利要求1所述的基于分布式向量数据库的相似事件识别方法,其特征在于,所述基于分布式向量数据库的相似事件识别方法还包括:
7.一种基于分布式向量数据库的相似事件识别方法,其特征在于,包括:
8.一种服务端,用于实现权利要求1至6中任意一项所述的基于分布式向量数据库的相似事件识别方法,其特征在于
9.一种客户端,用于实现权利要求7所述的基于分布式向量数据库的相似事件识别方法,其特征在于,包括:
10.一种基于分布式向量数据库的相似事件识别系统,其特征在于,包括:权利要求8所述的服务端和权利要求9所述的客户端,所述服务端与所述客户端通信连接。
...【技术特征摘要】
1.一种基于分布式向量数据库的相似事件识别方法,其特征在于,包括:
2.根据权利要求1所述的基于分布式向量数据库的相似事件识别方法,其特征在于,所述语言识别模型能够对所述当前事件序列信息进行向量信息抽取以获得当前事件向量信息,包括:
3.根据权利要求1所述的基于分布式向量数据库的相似事件识别方法,其特征在于,将所述当前事件向量信息代入向量数据库获得相似向量识别结果,包括:
4.根据权利要求1所述的基于分布式向量数据库的相似事件识别方法,其特征在于,所述基于分布式向量数据库的相似事件识别方法还包括:
5.根据权利要求4所述的基于分布式向量数据库的相似事件识别方法,其特征在于,所述创建向...
【专利技术属性】
技术研发人员:王峰,顾毅,熊亮,梁新乐,
申请(专利权)人:无锡雪浪数制科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。