【技术实现步骤摘要】
电子装置和执行该电子装置的操作的方法相关申请的交叉引用本申请是基于2019年6月5日在韩国知识产权局提交的韩国专利申请第10-2019-0066396号并要求享有其优先权,该韩国专利申请的公开内容通过引用全文合并于此。
本公开涉及电子装置和执行该电子装置的操作的方法,更具体地,涉及执行人工神经网络模型的操作的方法。
技术介绍
近来,通过使用硬件来实现人工智能模型(例如深度学习模型)的研究正在持续。在通过使用硬件来实现人工智能模型的情况下,可以极大地提高人工智能模型的操作速度,并且先前由于存储器大小或对响应时间的限制而难以使用的各种深度学习模型的使用成为可能。提出了用于从硬件的实现的观点来看持续改善人工智能模型的性能的算法,作为例如减少操作数据的量用以减少操作延迟和功耗的数据量子化技术。数据量子化是例如减少表示矩阵参数的信息的量的方法,并且可以将实数数据分解为二进制数据和缩放因子,并将数据表示为近似值。由于量子化的数据不能达到原始数据的精度,因此使用量子化的数据的人工智能模型的推理的精度可能低于 ...
【技术保护点】
1.一种用于电子装置执行人工智能模型的操作的方法,该方法包括:/n在用于神经网络模型的操作的多个数据存储在存储器中时,获得用于电子装置的硬件的资源信息,所述多个数据分别具有彼此不同的重要程度;/n基于所获取的资源信息,根据所述多个数据中的每个的重要程度,获得所述多个数据之中的用于神经网络模型的操作的数据;以及/n通过使用所获得的数据执行神经网络模型的操作。/n
【技术特征摘要】
20190605 KR 10-2019-00663961.一种用于电子装置执行人工智能模型的操作的方法,该方法包括:
在用于神经网络模型的操作的多个数据存储在存储器中时,获得用于电子装置的硬件的资源信息,所述多个数据分别具有彼此不同的重要程度;
基于所获取的资源信息,根据所述多个数据中的每个的重要程度,获得所述多个数据之中的用于神经网络模型的操作的数据;以及
通过使用所获得的数据执行神经网络模型的操作。
2.根据权利要求1所述的方法,其中,所述多个数据包括用于神经网络模型的操作的量子化的矩阵的参数值。
3.根据权利要求2所述的方法,其中,所述量子化的矩阵的参数值包括分别具有彼此不同的重要程度的二进制数据。
4.根据权利要求3所述的方法,其中,在二进制数据中,二进制数据的重要程度分别随着二进制数据的比特顺序增加而降低。
5.根据权利要求3所述的方法,其中,所述执行神经网络模型的操作还包括:
对输入值和二进制数据的每个比特执行矩阵运算;
对每个比特的运算结果求和;以及
获取输出值。
6.根据权利要求3所述的方法,其中,所述执行神经网络模型的操作还包括分别基于二进制数据的每个比特的顺序使用多个神经网络处理单元来执行矩阵并行运算。
7.根据权利要求2所述的方法,其中,所述量子化的矩阵的参数值包括通过使用贪婪算法量子化的矩阵的参数值。
8.根据权利要求1所述的方法,...
【专利技术属性】
技术研发人员:权世重,李桐洙,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:韩国;KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。