一种基于大模型的数据处理方法及其接待装置制造方法及图纸

技术编号:39748205 阅读:10 留言:0更新日期:2023-12-17 23:46
本发明专利技术公开了一种基于大模型的数据处理方法及其接待装置,大模型的数据处理方法5个步骤,

【技术实现步骤摘要】
一种基于大模型的数据处理方法及其接待装置


[0001]本专利技术涉及人工智能技术领
,特别是涉及一种基于大模型的数据处理方法及其接待装置


技术介绍

[0002]自然语言是人类逻辑和思维的重要载体,在人机交互,甚至通用人工智能领域具有非常重大的意义

近几年,随着计算机硬件性能的不断提升和深度学习算法的不断优化,大模型的发展也越来越快速

随着计算机硬件性能的不断提升和深度学习算法的不断优化,大模型的发展也越来越快速

大模型又可以称为
Foundation Model
(基石)模型,模型通过亿级的语料或者图像进行知识抽取,学习进而生产了亿级参数的大模型

其实感觉就是自监督学习,利用大量无标签很便宜的数据去做预训练

一系列的大模型相继问世,如
OpenAI

GPT、Facebook

RoBERTa、Google

BERT
等,国内如清华大学的
ChatGLM

6B
,百度文心一言
,
华为的盘古大模型

[0003]接待装置,常用于火车站,汽车站,航站楼,政府大厅,银行,等公众场合,目前的常规接待装置,主要还是人工回复,不但效率低下,而且由于单个工作人员的知识量有限, 很难满足广大使用者的需求


技术实现思路

[0004]为了克服上述现有技术的不足,本专利技术提供了一种基于大模型的数据处理方法及其接待装置,用以解决目前的常规接待装置,不但效率低下, 很难满足广大使用者的使用需求

[0005]本专利技术所采用的技术方案是:把大模型技术和显示装置技术相结合,实现人机智慧交互,满足航站后,高铁站等公众接待咨询

[0006]本申请提供一种基于大模型的数据处理方法及其接待装置,大模型的数据处理方法是系统获取人机交互的输入信息,输入信息输入到经过训练得到的预设大模型中,经预设大模型中各神经网络层对待输入数据进行分析,得到输入信息对应的结果
,
形成输出信息,输出信息可以通过音响或显示装置发送给使用者

[0007]进一步的输入信息,可以由使用者通过语音或在显示装置上手动输入

[0008]预设大模型采用了强化学习方法进行训练,其基本原理是通过大规模的无监督学习来生成对话

训练过程中,模型通过最大化预测下一个词的概率来进行优化,从而使得生成的对话更加流畅和有意义

[0009]训练数据来大部分自于互联网上的海量文本,这些文本包含了各种各样的语言表达和对话场景,另外一部分来自不同使用场景的定制对话场景,如:高铁站,定制化的列车信息,周围公交车信息,出租车场地等定制对话场景

通过学习这些数据,预设大模型可以理解并生成各种语言表达,包括回答问题

提供建议等

[0010]预设大模型通过将上一个生成的词作为输入来预测下一个词,从而逐步生成整个
对话

这种方法可以保持对话的连贯性,并且可以在生成过程中引入一定的随机性,使得对话更加富有变化

[0011]进一步的,预设大模型分析对话,形成近似人工的理解和推理

它可以根据对话的上下文来生成回答,并且可以根据问题的不同提供多种可能的回答

[0012]显示装置包括显示装置,语音采集和播放模块,进一步的显示装置包括触摸膜,用户触碰触摸膜触发相应选择项启动,配合语音交互,实现高效率沟通

[0013]中央控制模块控制预设大模型和显示装置运行

[0014]与现有技术相比,本专利技术的有益效果是把大模型技术和显示装置技术相结合,语音和透明显示屏同时显示咨询结果,还可以系统根据用户的反馈情况不断的优化大模型

附图说明
[0015]图1为:本专利技术第一实施例的显示装置示意图;图2为:本专利技术第一实施例的系统示意图;图3为:本专利技术第一实施例的大模型的数据处理示意图

[0016]其中,
1、
透明显示屏;
101、
触摸膜;
2、
反射玻璃;
3、
光线;
4、
光源;
5、
中央控制模块;
6、
语音采集和播放模块;
7、
摄像头;
8、
大模型

具体实施方式
[0017]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0018]实施例1:请参阅附图1‑3,本专利技术实施例提供一种基于大模型的数据处理方法及其接待装置,接待装置包括中央控制模块5,大模型8,显示装置,语音采集和播放模块
6。
语音采集和播放模块6固定在显示装置

[0019]中央控制模块5与大模型8相连,中央控制模块5用于控制整个系统,中央控制模块5连接显示装置,显示装置包括透明显示屏1,透明显示屏1设置在中央控制模块5的上表面一端位置,中央控制模块5的表面设有光源4,光源4可调整为紫外光源和彩色光源,透明显示屏1与中央控制模块5之间连接有反射玻璃2,反射玻璃2的两端分别与透明显示屏
1、
中央控制模块5二者不相接触的一端连接,透明显示屏
1、
中央控制模块5和紫外反射玻璃2侧面形成一个三角形,光源4的光线3反射在反射玻璃2上,经过再反射投影于透明显示屏1上形成图像
,
中央控制模块5根据设定好的图案信息通过光源4进行投影
,
透明显示屏1与中央控制模块5之间的角度为
90
°

[0020]本实施例中的大模型8采用
GLM2

6B
模型
(
以下简称 GLM
大模型
)。GLM
大模型包括训练算法和训练数据,训练算法主要有反馈自助(
Feedback Bootstrap


人类反馈强化学习(
Reinforcement Learning from Human Feedback
),自回归语言算法

[0021]训练数据部分来自于互联网上的海量文本,这些文本包含了各种各样的语言表达
和对话场景

通过学习这些数据,...

【技术保护点】

【技术特征摘要】
1.
一种基于大模型的数据处理方法,其特征在于,包括如下步骤:
S1
:建立大模型和获取训练数据;
S2
:大模型算法训练;
S3
:根据用户的咨询,大模型生成咨询结果;
S4
:语音播放咨询结果,同时透明显示屏显示咨询结果;
S5
:接收用户反馈信息,优化大模型
。2.
根据权利要求1所述的一种基于大模型的数据处理方法,其特征在于:所述
S1
步骤中所述大模型采用
GLM2

6B
模型或
ChatGPT4
,训练数据部分来自于互联网上的海量文本,另外一部分来自不同使用场景的定制对话场景
。3.
根据权利要求1所述的一种基于大模型的数据处理方法,其特征在于:所述
S2
步骤中训练算法有反馈自算法

人类反馈强化学习算法,自回归语言算法
。4.
根据权利要求1所述的一种基于大模型的数据处理方法,其特征在于:所述
S3
步骤中,可以接受不同语言的咨询
。5.
根据权利要求1所述的一种基于大模型的数据处理方法,其特征在于:所述
S4
步骤中,根据
S3
步骤中的语言,输出...

【专利技术属性】
技术研发人员:李荣民蔡焱
申请(专利权)人:丽屏威视科技丽水有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1