【技术实现步骤摘要】
本专利技术涉及机器学习和扩散模型,特别是一种用于校正量化扩散模型的系统及其校正方法。
技术介绍
1、扩散模型作为一种强大的生成方法在各种应用中崭露头角,包括图像去噪、图像合成、文本生成和音频生成。这些模型通过一个迭代去噪过程逐步精炼噪声输入,利用学习到的噪声预测网络。在采样过程中,产生的图像或潜在表示的信号与噪声比(signal-to-noise ratio,简称snr)显示出一致的、逐步增强的特性。与容易出现模式崩溃和后验崩溃问题的生成对抗网络(generative adversarial networks,简称gans)和变分自编码器(variational autoencoders,简称vaes)相比,扩散模型能够一致地产生多样化、高质量的样本,使其成为生成建模中的主导技术。
2、然而,由于其庞大的计算需求,将扩散模型部署到计算能力受限的设备上(如智能手机)是具有挑战性的。这些需求源于复杂的网络结构和采样过程中所需的大量迭代去噪步骤。为了应对这些挑战并提高计算效率,已经探索了模型量化作为一种可行的解决方案。
【技术保护点】
1.一种由计算机系统执行的量化扩散模型的校正方法,该方法包括:
2.如权利要求1所述的方法,其中测量该量化误差包括:
3.如权利要求2所述的方法,其中计算该校正的时间步序列和该误差均值序列包括:
4.如权利要求3所述的方法,进一步包括:
5.如权利要求3所述的方法,进一步包括按步长缩放对应于该当前时间步的该预测的浮点噪声电平和该预测的量化噪声电平;其中,该步长是基于与该当前时间步对应的该校正时间步的信号保持超参数确定的。
6.如权利要求1所述的方法,其中使用该量化扩散模型根据该校正的时间步序列和该误差均值序列
...【技术特征摘要】
1.一种由计算机系统执行的量化扩散模型的校正方法,该方法包括:
2.如权利要求1所述的方法,其中测量该量化误差包括:
3.如权利要求2所述的方法,其中计算该校正的时间步序列和该误差均值序列包括:
4.如权利要求3所述的方法,进一步包括:
5.如权利要求3所述的方法,进一步包括按步长缩放对应于该当前时间步的该预测的浮点噪声电平和该预测的量化噪声电平;其中,该步长是基于与该当前时间步对应的该校正时间步的信号保持超参数确定的。
6.如权利要求1所述的方法,其中使用该量化扩散模型根据该校正的时间步序列和该误差均值序列处理该输入数据以生成该输出结果包括:
7.如权利要求1所述的方法,其中使用该量化扩散模型处理该输入数据,基于该校正的时间步序列和该误差均值序列生成该输出结果包括:
8.如权利要求1所述的方法,其中使用该量化扩散模型处理该输入数据,基于该校正的时间步序列和该误差均值序列生成该输出结果包括:
9.如权利要求1所述的方法,其中使用该量化扩散模型处理该输入数据,基于该校正的时间步序列和该误差均值序列生成该输出结果包括:
10.如权利要求1所述的方法,其中使用该量化扩散模型处理该输入数据,基于该校正的时间步序列和该误差均值序列生成该输出结果包括:
11.一个用于校正量化扩散模型的系统,包括:...
【专利技术属性】
技术研发人员:陈奕中,黄子楷,陈敬仁,
申请(专利权)人:联发科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。