【技术实现步骤摘要】
本申请涉及信息处理领域,更具体的说,是涉及一种数据可视化处理方法和装置。
技术介绍
1、大语言模型(llm,large language model)通常包括较深的网络结构和较多的神经元,因此,其具有较高的数据处理能力。
2、当大语言模型的训练样本不够精细时,会导致大语言模型的训练不能够得到精确的结果。
3、而大语言模型的训练样本不够精细,一般是因为无法对于训练样本数据进行可视化展示,导致训练人员无法准确选择训练样本。
技术实现思路
1、有鉴于此,本申请提供了一种数据可视化处理方法和装置,如下:
2、一种数据可视化处理方法,包括:
3、获得目标数据集;
4、提取所述目标数据集中每个数据的文本特征和所述数据所属任务类型的文本特征;
5、处理所述目标数据集中每个数据的文本特征和所述数据所属任务类型的文本特征,得到每个数据的两维度特征,所述两维度特征包括第一维度特征和第二维度特征;
6、依据所述目标数据集中每个数
...【技术保护点】
1.一种数据可视化处理方法,包括:
2.根据权利要求1所述的数据可视化处理方法,所述处理所述目标数据集中每个数据的文本特征和所述数据所属任务类型的文本特征,得到每个数据的两维度特征,包括:
3.根据权利要求1所述的数据可视化处理方法,所述至少依据所述目标数据集中每个数据的第一维度特征和第二维度特征得到所述目标数据集的第一视图之后,还包括以下任一项:
4.根据权利要求3所述的数据可视化处理方法,所述依据所述第一视图中各数据散点对应的质量评分值,突出展示在所述目标数据集中确定的至少一个目标数据,包括:
5.根据权利要求4所述
...【技术特征摘要】
1.一种数据可视化处理方法,包括:
2.根据权利要求1所述的数据可视化处理方法,所述处理所述目标数据集中每个数据的文本特征和所述数据所属任务类型的文本特征,得到每个数据的两维度特征,包括:
3.根据权利要求1所述的数据可视化处理方法,所述至少依据所述目标数据集中每个数据的第一维度特征和第二维度特征得到所述目标数据集的第一视图之后,还包括以下任一项:
4.根据权利要求3所述的数据可视化处理方法,所述依据所述第一视图中各数据散点对应的质量评分值,突出展示在所述目标数据集中确定的至少一个目标数据,包括:
5.根据权利要求4所述的数据可视化处理方法,所述第二视图能够突出展示在所述目标数据集中...
【专利技术属性】
技术研发人员:张俊丽,王奇刚,孟蕊,王鹏,
申请(专利权)人:北京联想软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。