信息转换方法、装置、存储介质和电子装置制造方法及图纸

技术编号：18657998 阅读：37 留言：0更新日期：2018-08-11 14:26

本发明专利技术公开了一种信息转换方法、装置、存储介质和电子装置。其中，该方法包括：对源信息进行编码得到第一编码；获取预先设置的转换条件，其中，所述转换条件为所述源信息与转换结果的映射关系；根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码，得到目标信息，其中，所述目标信息与所述源信息为不同语种的信息，所述译出信息是从所述源信息转换得到的词语，所述译出信息的语种与所述目标信息相同。本发明专利技术解决了基于神经网络的信息转换的灵活性比较差的技术问题。

Information conversion method, device, storage medium and electronic device

The invention discloses an information conversion method, a device, a storage medium and an electronic device. The method includes: encoding the source information to obtain a first encoding; acquiring a pre-set conversion condition in which the conversion condition is a mapping relationship between the source information and the conversion result; decoding the first encoding according to the source information, the conversion condition and the translated information to obtain the target information. Wherein, the target information and the source information are information in different languages, the translated information is words converted from the source information, and the language of the translated information is the same as the target information. The invention solves the technical problem of poor flexibility in information conversion based on neural network.

全部详细技术资料下载

【技术实现步骤摘要】
信息转换方法、装置、存储介质和电子装置
本专利技术涉及数据处理领域，具体而言，涉及一种信息转换方法、装置、存储介质和电子装置。
技术介绍
信息转换是指在保证原有意思不被改变的基础上，将一种信息转换为另一种信息的过程，也就是说，通过信息转换技术将源信息转换为目标信息。其中，目前常用的信息转换技术包括：机器转换，例如，传统的统计机器转换(StatisticalMachineTranslation，简称SMT)和神经网络机器转换(NeuralMachineTranslation，简称NMT)。其中，在通过神经网络机器转换NMT进行信息转换的过程中，通常是将输入的源信息编码为向量或者向量序列，然后基于编码得到的向量或者向量序列逐词生成目标信息。然而，在采用上述方式进行信息转换的过程中，所使用的往往是已完成训练的神经网络模型，如果希望调整转换结果，则需重新获取训练对象，对神经网络模型重新进行训练。也就是说，相关技术所提供的信息转换方式存在对外部资源利用困难，无法在信息转换过程中及时添加信息转换所需的新的映射关系，从而导致信息转换灵活性较差的问题。针对上述的问题，目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种信息转换方法、装置、存储介质和电子装置，以至少解决基于神经网络的信息转换的灵活性比较差的技术问题。根据本专利技术实施例的一个方面，提供了一种信息转换方法，包括：对源信息进行编码得到第一编码；获取预先设置的转换条件，其中，所述转换条件为所述源信息与转换结果的映射关系；根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码，得到目标信息，其中...

【技术保护点】
1.一种信息转换方法，其特征在于，包括：对源信息进行编码得到第一编码；获取预先设置的转换条件，其中，所述转换条件为所述源信息与转换结果的映射关系；根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码，得到目标信息，其中，所述目标信息与所述源信息为不同语种的信息，所述译出信息是从所述源信息转换得到的信息，所述译出信息的语种与所述目标信息相同。

【技术特征摘要】
1.一种信息转换方法，其特征在于，包括：对源信息进行编码得到第一编码；获取预先设置的转换条件，其中，所述转换条件为所述源信息与转换结果的映射关系；根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码，得到目标信息，其中，所述目标信息与所述源信息为不同语种的信息，所述译出信息是从所述源信息转换得到的信息，所述译出信息的语种与所述目标信息相同。2.根据权利要求1所述的方法，其特征在于，根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码，得到目标信息包括：根据所述源信息和所述译出信息确定预先设置的多个条件与所述源信息在句式上的相似度；将多个所述条件中所述相似度最高的条件作为所述转换条件；根据所述源信息、所述转换条件和所述译出信息对所述第一编码进行解码，得到目标信息。3.根据权利要求2所述的方法，其特征在于，根据所述源信息和所述译出信息确定预先设置的多个条件与所述源信息在句式上的相似度包括：根据用于表示所述源信息的第一向量、用于表示所述译出信息的第二向量和用于表示第一条件的第三向量确定多个所述条件中第一条件的权重值，所述第一条件为多个所述条件中任意一个；将多个所述条件中所述权重值最大的条件作为所述相似度最高的条件。4.根据权利要求3所述的方法，其特征在于，根据用于表示所述源信息的第一向量、用于表示所述译出信息的第二向量和用于表示第一条件的第三向量确定多个所述条件中第一条件的权重值包括：采用以下公式获取每个条件的权重值atat＝S(Uht+Wsi)其中，ht用于表示第t个条件的向量，si用于表示所述第一向量和所述第二向量，S表示S型生长曲线，U和W分别为矩阵。5.根据权利要求1至4中任一项所述的方法，其特征在于，获取预先设置的转换条件包括：获取预先设置的多个非连续信息，其中，所述非连续信息用于表示一个短语中包括具有关联的至少两个不连续的部分。6.根据权利要求1至4中任一项所述的方法，其特征在于，对源信息进行编码得到第一编码包括：利用神经网络的编码器对所述源信息进行编码得到第一编码，其中，所述第一编码为第一向量；根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码，得到目标信息包括：利用神经网络的解码器根据所述源信息、所述转换条件和译出信息对所述第一向量进行解码，得到所述目标信息，其中，所述转换条件预先被所述神经网络的解码器获取。7.一种信息转换装置，其特征在于，包括：编码单元，用...

【专利技术属性】
技术研发人员：王明轩，谢军，姚健，黄江泉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人