数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40176139 阅读：21 留言：0更新日期：2024-01-26 23:44

本申请提供了一种数据处理方法、装置、电子设备及存储介质。包括：获取问话数据及所述问话数据对应的场景领域；基于所述场景领域确定所述问话数据对应的数据补充策略，以及，基于所述场景领域确定所述问话数据对应的领域知识图谱；基于所述数据补充策略对所述问话数据进行补充处理，得到对应的补充结果；基于所述领域知识图谱对所述问话数据进行推理，得到对应的推理结果；将所述补充结果和所述推理结果输入至大语言模型，以由所述大语言模型输出所述问话数据对应的回答数据。从而提高大语言模型在该场景领域上进行数据处理的时效性和准确性，改善模型处理效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，尤其涉及一种数据处理方法、装置、电子设备及存储介质。

技术介绍

1、大语言模型（large language model，llm），是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务，如文本分类、问答、对话等，是通向人工智能的一条重要途径。千亿参数的大语言模型具有较好的自然语言理解能力和基于海量数据的常识知识，基于大语言模型在对话系统领域已经取得了最新的里程碑式的应用。

2、然而，目前的大语言模型在处理垂直领域的自然语言任务时，由于无法感知领域性知识的内容，使得数据处理的时效性和准确性难以得到保障，模型处理效果不够理想。

技术实现思路

1、本申请实施例的目的在于提供一种数据处理方法、装置、电子设备及存储介质，以解决目前的大语言模型在处理垂直领域的自然语言任务时，数据处理的时效性和准确性难以得到保障的问题。具体技术方案如下：

2、第一方面，本申请提供了一种数据处理方法，包括：

3、获取问话数本文档来自技高网...

【技术保护点】

1.一种数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述数据补充策略包括参数提取策略和参数配置策略，所述基于所述数据补充策略对所述问话数据进行补充处理，得到对应的补充结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一补充数据包括：所述问话数据的咨询时间、所述问话数据的咨询地点、所述问话数据对应的回答范围及所述问话数据对应的行为分类中的一项或多项。

4.根据权利要求2所述的方法，其特征在于，所述第二补充数据包括：所述大语言模型对应的回答场景、所述大语言模型模拟的人物身份、所述大语言模型对应的输出策略及...

【技术特征摘要】

1.一种数据处理方法，其特征在于，所述方法包括：

4.根据权利要求2所述的方法，其特征在于，所述第二补充数据包括：所述大语言模型对应的回答场景、所述大语言模型模拟的人物身份、所述大语言模型对应的输出策略及所述大语言模型返回结果的数量中的一项或多项。

5.根据权利要求2所述的方法，其特征...

【专利技术属性】
技术研发人员：李靖阳，白莉婷，张楠坤，
申请(专利权)人：北京海纳数聚科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人