System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据检索,特别涉及一种领域模型检索方法、装置、设备及存储介质。
技术介绍
1、软件研发的一般流程需要经过:需求分析、架构设计、概要设计、详细设计、编码、测试、上线运维7个主要阶段。程序员会通过引用领域模型开发应用在平台进行测试,最后通过平台提供的运行管理能力完成上线运维的流程。
2、现有技术中,主要通过精确查询或模糊查询对领域模型检索,精确查询是指使用与数据库某字段的数据值完全一致的文字作为查询条件所进行的查询,模糊查询是指使用数据库某字段的数据值的片段文字作为查询条件所进行的查询。现有技术中,还通过标签辅助检索,即先为数据额外绑定标签,然后根据用户的描述进行数据检索时,采取对标签进行精确/模糊查询获得标签清单,再通过清单上的具体标签关联查询与之绑定的领域模型。但由于用户自然语言描述的多样性,用户描述语言很难与标签和数据库字段完全一致。以需求关键字“添加新菜品”为例,这个关键字的检索期望是“添加菜品”领域函数,但由于需求关键字中多了个“新”字,导致无法与模型的名称/标签对应,进而导致实际检索中无法找到该领域函数。降低了领域函数检索的能力。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种领域模型检索方法、装置、设备及存储介质,能够提高领域模型的检索能力和复用率。其具体方案如下:
2、第一方面,本申请公开了一种领域模型检索方法,包括:
3、获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所
4、若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;
5、利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。
6、可选的,所述基于所述需求文本确定检索文本,包括:
7、将所述需求文本作为所述检索文本;
8、或,将所述需求文本的关键词作为所述检索文本;
9、或,以句子为单位对所述需求文本进行切分得到语句清单,将所述语句清单作为所述检索文本。
10、可选的,所述利用向量模型对所述检索文本进行向量转换得到对应的目标向量,包括:
11、根据预设文本长度阈值确定所述检索文本的文本类型;所述文本类型包括单词、句子和段落;
12、利用所述文本类型对应的向量模型对所述检索文本进行向量转换,得到对应的目标向量。
13、可选的,所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述利用所述文本类型对应的向量模型对所述检索文本进行向量转换,包括:
14、若所述检索文本为单词,则利用所述词检索嵌入模型将所述检索文本转换为词向量;
15、若所述检索文本为句子,则利用所述句检索嵌入模型将所述检索文本转换为句向量
16、若所述检索文本为段落,则利用所述段检索嵌入模型将所述检索文本转换为段向量。
17、可选的,所述基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型之前,还包括:
18、获取多个领域模型,并将所述领域模型转换为领域文档;
19、利用预先特化训练得到的所述向量模型,对所述领域文档进行向量转换得到对应的领域向量;所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述领域向量包括所述词检索嵌入模型输出的词向量、所述句检索嵌入模型输出的句向量、所述段检索嵌入模型输出的段向量;
20、将所述领域向量和所述领域模型存储至所述向量数据库。
21、可选的,所述将所述领域模型转换为领域文档,包括:
22、利用领域函数文档转换模板将所述领域函数转换为第一文档;
23、利用领域数据库表文档转换模板将所述领域数据表转换为第二文档;
24、基于所述第一文档和所述第二文档得到所述领域文档。
25、可选的,所述基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型,包括:
26、确定所述目标向量的向量类型;所述向量类型包括词向量、句向量、段向量;
27、若所述目标向量为词向量,则依次比较所述目标向量与向量数据库中的所有词向量的相似度,根据相似度确定出所述需求文本对应的领域模型;
28、若所述目标向量为句向量,则依次比较所述目标向量与向量数据库中的所有句向量的相似度,根据相似度确定出所述需求文本对应的领域模型;
29、若所述目标向量为段向量,则依次比较所述目标向量与向量数据库中的所有段向量的相似度,根据相似度确定出所述需求文本对应的领域模型。
30、第二方面,本申请公开了一种领域模型检索装置,包括:
31、关键词匹配模块,用于获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表;
32、检索文本确定模块,用于若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;
33、向量检索模块,用于利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。
34、第三方面,本申请公开了一种电子设备,包括:
35、存储器,用于保存计算机程序;
36、处理器,用于执行所述计算机程序,以实现前述的领域模型检索方法。
37、第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中计算机程序被处理器执行时实现前述的领域模型检索方法。
38、本申请中,获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表;若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。可见,通过向量模型将领域模型进行向量表示建立向量索引,保存在向量数据库中,可以准确地通过自然语言进行语义检索,即用户直接使用需求文本对构建的领域模型进行检索,提高应用开发效率,提高领域模型的检索能力和复用率。
本文档来自技高网...【技术保护点】
1.一种领域模型检索方法,其特征在于,包括:
2.根据权利要求1所述的领域模型检索方法,其特征在于,所述基于所述需求文本确定检索文本,包括:
3.根据权利要求1所述的领域模型检索方法,其特征在于,所述利用向量模型对所述检索文本进行向量转换得到对应的目标向量,包括:
4.根据权利要求3所述的领域模型检索方法,其特征在于,所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述利用所述文本类型对应的向量模型对所述检索文本进行向量转换,包括:
5.根据权利要求1所述的领域模型检索方法,其特征在于,所述基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型之前,还包括:
6.根据权利要求5所述的领域模型检索方法,其特征在于,所述将所述领域模型转换为领域文档,包括:
7.根据权利要求1至6任一项所述的领域模型检索方法,其特征在于,所述基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型,包括:
8.一种领域模型检索装置,其特征在于,包括:
...【技术特征摘要】
1.一种领域模型检索方法,其特征在于,包括:
2.根据权利要求1所述的领域模型检索方法,其特征在于,所述基于所述需求文本确定检索文本,包括:
3.根据权利要求1所述的领域模型检索方法,其特征在于,所述利用向量模型对所述检索文本进行向量转换得到对应的目标向量,包括:
4.根据权利要求3所述的领域模型检索方法,其特征在于,所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述利用所述文本类型对应的向量模型对所述检索文本进行向量转换,包括:
5.根据权利要求1所述的领域模型检索方法,其特征在于,所述基于所述目标向量通过向量检索方式查询向...
【专利技术属性】
技术研发人员:杨清广,谢一铭,李伟,
申请(专利权)人:广东优特云科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。