【技术实现步骤摘要】
【国外来华专利技术】用于压缩语言模型的电子设备、用于提供推荐词的电子设备及其操作方法
本公开涉及用于在使用诸如深度学习等机器学习算法模拟人脑的诸如认知、判断等功能的人工智能(AI)系统中在应用该系统时压缩语言模型的电子设备、用于提供推荐词的电子设备及其操作方法,例如,涉及用于基于针对其执行递归神经网络(RNN)训练的语言模型来压缩语言模型的电子设备、用于提供推荐词的电子设备及其操作方法。
技术介绍
人工智能(AI)系统是体现与人类智能等同的智能的计算机系统,并且不同于基于规则的智能系统,AI系统通过本身训练和判定而变得智能。AI系统使用越多,系统的识别率改进就越多,并且系统变得能够更准确地理解用户偏好。因此,基于规则的智能系统已经被基于深度学习的AI系统代替。AI技术可以配置成具有机器学习(深度学习)和利用机器学习的元素技术。机器学习是指自身分类和学习输入数据的特性的算法技术,并且元素技术是使用诸如深度学习等机器学习算法来复制人脑的诸如人脑的认知、判断等功能的复制技术,并且元素技术包括语言理解、视觉理解、推断/预测、知识表达、操作控制等
AI技术使用并应用于各种领域。语言理解技术可以涉及识别人类语言/文本并应用/处理语言/文本,并且该技术可以包括自然词处理、机器翻译、对话系统、回答问题、语音识别/合成等。视觉理解技术可以涉及将对象识别为人类视觉,并且该技术可以包括识别对象、跟踪对象、搜索图像、识别人、理解场景、理解空间、升级图像等。推断和预测技术可以涉及判定、逻辑推断和预测信息,并且该技术可以包括基于知识/概率的推断、优化预测、基于偏好的计划、推荐等。知识表达技术可以 ...
【技术保护点】
1.一种电子设备,配置成压缩语言模型,所述电子设备包括:存储装置,配置成存储语言模型,所述语言模型包括通过基于包括多个语句的基本数据进行递归神经网络RNN训练而生成的嵌入矩阵和softmax矩阵;以及处理器,配置成:将所述嵌入矩阵转换成第一投影矩阵与共享矩阵的乘积,所述第一投影矩阵与所述共享矩阵的乘积具有与所述嵌入矩阵的大小相同的大小,并且将所述softmax矩阵的转置矩阵转换成第二投影矩阵与所述共享矩阵的乘积,所述第二投影矩阵与所述共享矩阵的乘积具有与所述softmax矩阵的所述转置矩阵的大小相同的大小,以及通过基于所述基本数据而相对于所述第一投影矩阵、所述第二投影矩阵和所述共享矩阵执行所述RNN训练来更新所述第一投影矩阵、所述第二投影矩阵和所述共享矩阵的元素。
【技术特征摘要】
【国外来华专利技术】2017.11.08 KR 10-2017-0147922;2017.03.09 US 62/4691.一种电子设备,配置成压缩语言模型,所述电子设备包括:存储装置,配置成存储语言模型,所述语言模型包括通过基于包括多个语句的基本数据进行递归神经网络RNN训练而生成的嵌入矩阵和softmax矩阵;以及处理器,配置成:将所述嵌入矩阵转换成第一投影矩阵与共享矩阵的乘积,所述第一投影矩阵与所述共享矩阵的乘积具有与所述嵌入矩阵的大小相同的大小,并且将所述softmax矩阵的转置矩阵转换成第二投影矩阵与所述共享矩阵的乘积,所述第二投影矩阵与所述共享矩阵的乘积具有与所述softmax矩阵的所述转置矩阵的大小相同的大小,以及通过基于所述基本数据而相对于所述第一投影矩阵、所述第二投影矩阵和所述共享矩阵执行所述RNN训练来更新所述第一投影矩阵、所述第二投影矩阵和所述共享矩阵的元素。2.如权利要求1所述的电子设备,其中所述处理器还配置成:基于测试模块而相对于所述第一投影矩阵、所述第二投影矩阵和所述共享矩阵来确定词复杂度,响应于所述词复杂度等于或大于预定值,获得大小大于所述共享矩阵的大小的新共享矩阵,并且响应于所述词复杂度小于所述预定值,获得大小小于所述共享矩阵的大小的新共享矩阵,以及使用所述新共享矩阵来重新确定所述第一投影矩阵、所述第二投影矩阵和所述共享矩阵。3.如权利要求2所述的电子设备,其中所述处理器还配置成:基于文本模块而相对于所述嵌入矩阵和所述softmax矩阵来确定参考词复杂度,以及基于所述参考词复杂度来确定所述预定值。4.如权利要求3所述的电子设备,其中所述处理器还配置成:使用词复杂度低于所述预定值的多个共享矩阵之中的最小大小的共享矩阵来重新确定所述第一投影矩阵、所述第二投影矩阵和所述共享矩阵,以及基于重新确定的第一投影矩阵、第二投影矩阵和共享矩阵来生成经压缩语言模型。5.如权利要求1所述的电子设备,其中所述处理器还被配置成:使用奇异值分解SVD来将所述共享矩阵转换成第一矩阵、第二矩阵和第三矩阵,通过基于所述基本数据相对于所述第一投影矩阵、所述第二投影矩阵、所述第一矩阵、所述第二矩阵和所述第三矩阵执行所述RNN训练来更新所述第一投影矩阵、所述第二投影矩阵、所述第一矩阵、所述第二矩阵和所述第三矩阵的元素,以及基于具有更新的元素的所述第一投影矩阵、所述第二投影矩阵、所述第一矩阵、所述第二矩阵和所述第三矩阵来生成经压缩语言模型。6.如权利要求1所述的电子设备,其中所述处理器还配置成:获得第一数据,其中与所述多个语句中的一者中所包括的第一个词对应的第一矢量基于第一随机矩阵而映射到矢量空间,并且响应于接收到所述语句中所包括的且在所述第一个词之后的第二个词的输入,获得第二数据,其中与所述第二个词对应的第二矢量基于所述第一随机矩阵而映射到所述矢量空间,基于所述第一数据和所述第二数据而生成第三数据,以及基于第二随机矩阵而从所述第三数据获得恢复矢量,并且基于所述恢复矢量与对应于所述第二个词之后的第三个词的第三矢量之间的差异而更新所述第一随机矩阵和所述第二随机矩阵的元素,并且执行训练。7.如权利要求6所述的电子设备,其中所述处理器还配置成:基于所述多个语句中的剩余语句而更新所述第一随机矩阵和所述第二随机矩阵中的元素,以及将具有基于所述剩余语句更新的元素的所述第一随机矩阵和所述第二随机矩阵存储在所述存储装置中分别作为所述...
【专利技术属性】
技术研发人员:俞承学,奈尔什·库尔卡尼,宋熙俊,李海俊,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:韩国,KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。