【技术实现步骤摘要】
基于参数的知识注入方法、装置、设备及介质
[0001]本专利技术涉及人工智能
,特别涉及一种基于参数的知识注入方法、装置、设备及介质。
技术介绍
[0002]在金融保险行业中,通常有大量的合同条款和产品相关的数据与知识,这些数据或是结构化知识,或是非结构化知识。在寿险坐席话术违规检测项目中,我们往往需要准确地提取这些知识,从而判断坐席的推销是否违规。
[0003]一些传统的方法通常使用表单和图谱等数据结构方式对结构化知识进行存储。以表单方式通常为用表格对一些批量数据进行存储;以图谱方式是指将一些知识存储为对应三元组格式,通常为(实体1,关系,实体2),其中关系是连接两个实体的边。这些开源知识库通常使用人工整理方法收集知识,来对数据库的节点(实体1、实体2)与边(关系)增删查改。在查询时,一般使用符号化查询与推理(SQL\SPARQL)等方式去明确返回符合查找条件的结果。
[0004]这些知识库存储方式通常有以下缺点:
[0005]1、无法存储非结构化知识。大量的合同条款数据并没有经过人工整理,他 ...
【技术保护点】
【技术特征摘要】
1.一种基于参数的知识注入方法,其特征在于,包括:获取目标领域的三元组;根据预定义模板将所述三元组转换为纯文本格式语句;随机遮蔽所述纯文本格式语句中所述纯文本格式语句所对应三元组的三个元素中的一个来构造辅助语句,并将所述辅助语句和遮蔽位置处的答案作为注入数据;将所述辅助语句输入到知识注入模型,并利用知识注入模型来预测遮蔽位置的答案,以利用所述知识注入模型的参数记忆知识。2.根据权利要求1所述的基于参数的知识注入方法,其特征在于,所述获取目标领域的三元组包括,获取目标领域的非结构化数据,并抽取出所述非结构化数据中的三元组。3.根据权利要求1所述的基于参数的知识注入方法,其特征在于,所述获取目标领域的三元组包括:获取目标领域的非结构化数据;根据预定义的关系集合,在所述非结构化数据中利用关系抽取算法去抽取所述关系集合中的关系;利用序列标注的方法在所述非结构化数据中获取抽取到的每个关系关联的两个实体来构造三元组。4.根据权利要求3所述的基于参数的知识注入方法,其特征在于,根据预定义的关系集合,在所述非结构化数据中利用关系抽取算法来抽取所述关系集合中的关系,包括:根据预定义的关系集合,在所述非结构化数据中利用Bert算法来抽取所述关系集合中的关系。5.根据权利要求1所述的基于参数的知识注入方法,其特征在于,将所述辅助语句输入到知识注入模型,并利用知识注入模型来预测遮蔽位置的答案,以利用所述知识注入模型的参数记下知识中,所述知识注入模型为Transformer模型。6.根据权利...
【专利技术属性】
技术研发人员:陈家豪,徐亮,
申请(专利权)人:深圳壹账通科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。