System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 业务知识检索库构建方法、装置、电子设备及存储介质制造方法及图纸_技高网

业务知识检索库构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40547487 阅读:6 留言:0更新日期:2024-03-05 19:05
本申请提供了一种业务知识检索库构建方法、装置、电子设备及存储介质。所述方法包括:基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本;基于预先训练的语言表征模型对所述业务组合文本进行处理,得到所述业务组合文本的向量表征;所述语言表征模型是通过三元组函数对预训练语言表征模型进行微调之后得到的,所述三元组函数是由锚定业务知识语句、肯定业务知识语句和否定业务知识语句组成的函数;基于标准向量转换算法对所述向量表征进行向量转换处理,得到标准正交基向量;将所述标准正交基向量存储于预先建立的数据库中,生成业务知识检索库。本申请可以提高业务知识检索的效率和准确率。

【技术实现步骤摘要】

本申请涉及通信,特别是涉及一种业务知识检索库构建方法、装置、电子设备及存储介质


技术介绍

1、运营商开展满意服务升级行动,聚焦满意度调查短板、投申诉热难点问题,分专业推进服务问题攻坚,提升营业效能就是省企信非常重要的一项工作。

2、由于电信业务政策变更频繁,业务规则又比较复杂,且业务种类又多,同时一线人员流动性大,导致老员工培训不够而新员工的业务能力又无法及时跟上,严重影响业务办理的效率,降低了客户的满意度。

3、传统的知识共享模式依赖于专业技术人员的知识梳理及材料的及时更新,对知识检索是基于文本相似度来匹配,通过将两个或多个文本进行比较,计算不同文本之间的相似度,并根据相似度的大小来匹配文本,给出最相关的答案,但这种知识检索方式存在回答问题的效率不高和准确率低的问题,不能满足电信业务日益增长,运营商业务知识快速准确检索的需求。


技术实现思路

1、本申请实施例所要解决的技术问题是提供一种业务知识检索库构建方法、装置、电子设备及存储介质,以使用大模型有效处理大量的知识数据生成业务知识检索库,以提高业务知识检索的效率和准确率。

2、第一方面,本申请实施例提供了一种业务知识检索库构建方法,所述方法包括:

3、基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本;

4、基于预先训练的语言表征模型对所述业务组合文本进行处理,得到所述业务组合文本的向量表征;所述语言表征模型是通过三元组函数对预训练语言表征模型进行微调之后得到的,所述三元组函数是由锚定业务知识语句、肯定业务知识语句和否定业务知识语句组成的函数;

5、基于标准向量转换算法对所述向量表征进行向量转换处理,得到标准正交基向量;

6、将所述标准正交基向量存储于预先建立的数据库中,生成业务知识检索库。

7、可选地,所述基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本,包括:

8、获取所述运营商的业务知识文件;

9、提取所述业务知识文件中的初始业务知识文本;

10、对所述初始业务知识文本进行预处理,得到所述业务知识文本;

11、基于预设切割规则,对所述业务知识文本进行切割组合处理,生成所述业务组合文本。

12、可选地,所述对所述初始业务知识文本进行预处理,得到所述业务知识文本,包括:

13、根据预先设定的业务有效时长和所述初始业务知识文本对应的生成时间,过滤掉所述初始业务知识文本中过期的业务知识文本,得到第一业务知识文本;

14、将所述第一业务知识文本的类型调整为统一类型,得到所述业务知识文本。

15、可选地,所述基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本,包括:

16、基于设定切割长度和切割标识符,对所述业务知识文本进行切割处理,得到切割知识文本;

17、基于所述切割知识文本的语义相似度,对所述切割知识文本进行排序组合处理,得到所述业务组合文本。

18、可选地,在所述基于预先训练的语言表征模型对所述业务组合文本进行处理,得到所述业务组合文本的向量表征之前,还包括:

19、获取在先训练的预训练语言表征模型,及由锚定业务知识语句、肯定业务知识语句和否定业务知识语句构成的三元组函数;

20、基于所述三元组函数对所述预训练语言表征模型进行训练,得到所述语言表征模型。

21、可选地,所述将所述标准正交基向量存储于预先建立的数据库中,生成业务知识检索库,包括:

22、对所述标准正交基向量进行聚类,得到多个向量集群;

23、对每个所述向量集群创建一个倒排索引,生成相似向量倒排列表;

24、将所述相似向量倒排列表存储于所述数据库中,生成所述业务知识检索库。

25、可选地,在所述将所述标准正交基向量存储于预先建立的数据库中,生成业务知识检索库之后,还包括:

26、基于所述语言表征模型对用户输入的问题文本语句进行处理,得到所述问题文本语句的第一向量表征;

27、基于所述标准向量转换算法对所述第一向量表征进行向量转换,得到所述问题文本语句对应的第一标准正交基向量;

28、从所述业务知识检索库中获取与所述第一向量表征匹配的第二标准正交基向量;

29、计算所述第一标准正交基向量与所述第二标准正交基向量的余弦相似度;

30、根据所述余弦相似度,从所述第二标准正交基向量中筛选出目标标准正交基向量;

31、将所述目标标准正交基向量转换为目标业务知识文本;

32、基于prompt模板对所述目标业务知识文本进行处理,生成所述问题文本语句对应的业务知识信息,并将所述业务知识信息发送给所述用户。

33、第二方面,本申请实施例提供了一种业务知识检索库构建装置,所述装置包括:

34、业务组合文本生成模块,用于基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本;

35、向量表征获取模块,用于基于预先训练的语言表征模型对所述业务组合文本进行处理,得到所述业务组合文本的向量表征;所述语言表征模型是通过三元组函数对预训练语言表征模型进行微调之后得到的,所述三元组函数是由锚定业务知识语句、肯定业务知识语句和否定业务知识语句组成的函数;

36、标准向量获取模块,用于基于标准向量转换算法对所述向量表征进行向量转换处理,得到标准正交基向量;

37、检索库生成模块,用于将所述标准正交基向量存储于预先建立的数据库中,生成业务知识检索库。

38、可选地,所述业务组合文本生成模块包括:

39、业务知识文件获取单元,用于获取所述运营商的业务知识文件;

40、初始文本提取单元,用于提取所述业务知识文件中的初始业务知识文本;

41、业务知识文本获取单元,用于对所述初始业务知识文本进行预处理,得到所述业务知识文本;

42、业务组合文本生成单元,用于基于预设切割规则,对所述业务知识文本进行切割组合处理,生成所述业务组合文本。

43、可选地,所述业务知识文本获取单元包括:

44、第一知识文本获取子单元,用于根据预先设定的业务有效时长和所述初始业务知识文本对应的生成时间,过滤掉所述初始业务知识文本中过期的业务知识文本,得到第一业务知识文本;

45、业务知识文本获取子单元,用于将所述第一业务知识文本的类型调整为统一类型,得到所述业务知识文本。

46、可选地,所述业务组合文本生成模块包括:

47、切割文本获取单元,用于基于设定切割长度和切割标识符,对所述业务知识文本进行切割处理,得到切割知识文本;

48、组合文本获取单元,用于基于所述切割知识文本的语义相似度,对所述切割本文档来自技高网...

【技术保护点】

1.一种业务知识检索库构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述初始业务知识文本进行预处理,得到所述业务知识文本,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本,包括:

5.根据权利要求1所述的方法,其特征在于,在所述基于预先训练的语言表征模型对所述业务组合文本进行处理,得到所述业务组合文本的向量表征之前,还包括:

6.根据权利要求1所述的方法,其特征在于,所述将所述标准正交基向量存储于预先建立的数据库中,生成业务知识检索库,包括:

7.根据权利要求1所述的方法,其特征在于,在所述将所述标准正交基向量存储于预先建立的数据库中,生成业务知识检索库之后,还包括:

8.一种业务知识检索库构建装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至7中任一项所述的业务知识检索库构建方法。

...

【技术特征摘要】

1.一种业务知识检索库构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述初始业务知识文本进行预处理,得到所述业务知识文本,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于预设切割规则,对运营商的业务知识文本进行切割组合处理,生成业务组合文本,包括:

5.根据权利要求1所述的方法,其特征在于,在所述基于预先训练的语言表征模型对所述业务组合文本进行处理,得到所述业务组合文...

【专利技术属性】
技术研发人员:张玉
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1