【技术实现步骤摘要】
大语言模型用于建立逻辑表达式的方法、装置及查询系统
[0001]本公开一般涉及自然语言处理
,具体涉及一种大语言模型用于建立逻辑表达式的方法
、
装置及查询系统
。
技术介绍
[0002]随着电子信息化的不断发展,在银行和保险等领域中产生了海量录音数据,这些录音数据包含属性
、
业务维度与数据时间等结构化信息以及通话录音与语音识别文本等非结构化信息
。
[0003]企业对非结构化语音与文本内容进行分析的业务场景众多,例如包括投诉原因分析
、
成交单分析
、
来电原因分析和坐席违规分析等
。
目前,相关技术通过人工建立语义标签的逻辑表达式,例如问候语可以用逻辑表达式“你好
or
您好”表示,再将其转换为全文检索引擎输入,通过全文检索引擎检出匹配的索引,并输出结构化的语义标签
。
[0004]然而,不同逻辑表达式语法复杂且形式多样,这给业务人员带来了较大的学习成本,同时人工建立逻辑表达式需 ...
【技术保护点】
【技术特征摘要】
1.
一种大语言模型用于建立逻辑表达式的方法,其特征在于,所述方法包括:检测大语言模型的训练类型;若所述训练类型为已完成继续训练,则向所述大语言模型输入描述逻辑表达式的自然语言文本,并获得所述大语言模型输出的所述自然语言文本对应的逻辑表达式;所述继续训练包括对根据所述大语言模型得到的微调模型以及奖励模型进行强化学习,其中所述微调模型用于生成预测表达式,所述奖励模型用于对所述预测表达式进行评分,以更新所述微调模型的参数
。2.
根据权利要求1所述的方法,其特征在于,所述微调模型根据人工标注数据,对所述大语言模型进行微调训练获得,所述人工标注数据包括自然语言与逻辑表达式的映射关系
。3.
根据权利要求1所述的方法,其特征在于,所述奖励模型通过对所述预测表达式的人工评分排序结果进行训练获得
。4.
根据权利要求1至3中任意一项所述的方法,其特征在于,所述方法还包括:若所述训练类型为未完成继续训练,则向所述大语言模型提供自然语言转化为逻辑表达式的示例,之后输入所述自然语言文本,以获得所述自然语言文本对应的逻辑表达式
。5.
根据权利要求4所述的方法,其特征在于,所述大语言模型的输出格式包括
json
格式
、xml
格式
、yaml
格式或者字段名称...
【专利技术属性】
技术研发人员:杨喆,李全忠,
申请(专利权)人:普强时代珠海横琴信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。