信息转换方法、装置、存储介质和电子装置制造方法及图纸

技术编号:18657998 阅读:37 留言:0更新日期:2018-08-11 14:26
本发明专利技术公开了一种信息转换方法、装置、存储介质和电子装置。其中,该方法包括:对源信息进行编码得到第一编码;获取预先设置的转换条件,其中,所述转换条件为所述源信息与转换结果的映射关系;根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码,得到目标信息,其中,所述目标信息与所述源信息为不同语种的信息,所述译出信息是从所述源信息转换得到的词语,所述译出信息的语种与所述目标信息相同。本发明专利技术解决了基于神经网络的信息转换的灵活性比较差的技术问题。

Information conversion method, device, storage medium and electronic device

The invention discloses an information conversion method, a device, a storage medium and an electronic device. The method includes: encoding the source information to obtain a first encoding; acquiring a pre-set conversion condition in which the conversion condition is a mapping relationship between the source information and the conversion result; decoding the first encoding according to the source information, the conversion condition and the translated information to obtain the target information. Wherein, the target information and the source information are information in different languages, the translated information is words converted from the source information, and the language of the translated information is the same as the target information. The invention solves the technical problem of poor flexibility in information conversion based on neural network.

【技术实现步骤摘要】
信息转换方法、装置、存储介质和电子装置
本专利技术涉及数据处理领域,具体而言,涉及一种信息转换方法、装置、存储介质和电子装置。
技术介绍
信息转换是指在保证原有意思不被改变的基础上,将一种信息转换为另一种信息的过程,也就是说,通过信息转换技术将源信息转换为目标信息。其中,目前常用的信息转换技术包括:机器转换,例如,传统的统计机器转换(StatisticalMachineTranslation,简称SMT)和神经网络机器转换(NeuralMachineTranslation,简称NMT)。其中,在通过神经网络机器转换NMT进行信息转换的过程中,通常是将输入的源信息编码为向量或者向量序列,然后基于编码得到的向量或者向量序列逐词生成目标信息。然而,在采用上述方式进行信息转换的过程中,所使用的往往是已完成训练的神经网络模型,如果希望调整转换结果,则需重新获取训练对象,对神经网络模型重新进行训练。也就是说,相关技术所提供的信息转换方式存在对外部资源利用困难,无法在信息转换过程中及时添加信息转换所需的新的映射关系,从而导致信息转换灵活性较差的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种信息转换方法、装置、存储介质和电子装置,以至少解决基于神经网络的信息转换的灵活性比较差的技术问题。根据本专利技术实施例的一个方面,提供了一种信息转换方法,包括:对源信息进行编码得到第一编码;获取预先设置的转换条件,其中,所述转换条件为所述源信息与转换结果的映射关系;根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码,得到目标信息,其中,所述目标信息与所述源信息为不同语种的信息,所述译出信息是从所述源信息转换得到的词语,所述译出信息的语种与所述目标信息相同。根据本专利技术实施例的另一方面,还提供了一种信息转换装置,包括:编码单元,用于对源信息进行编码得到第一编码;获取单元,用于获取预先设置的转换条件,其中,所述转换条件为所述源信息与转换结果的映射关系;解码单元,用于根据源信息、转换条件和译出信息对第一编码进行解码,得到目标信息,其中,目标信息与源信息为不同语种的信息,译出信息是从源信息转换得到的词语,译出信息的语种与目标信息相同。根据本专利技术实施例的一个方面,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述的方法。根据本专利技术实施例的一个方面,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述的方法。在本专利技术实施例中,通过加入转换条件对源信息进行转换,转换条件对机器转换的干预使得机器转换更加灵活,且结合转换条件使得转换结果更加准确,进而解决了基于神经网络的信息转换的灵活性比较差的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的硬件环境的示意图;图2是根据本专利技术实施例的信息转换方法的流程图;图3是根据本专利技术实施例的神经网络的解码器和编码器的示意图;图4是根据本专利技术优选实施例的神经网络模型的示意图;图5是根据本专利技术实施例的信息转换装置的示意图;图6是根据本专利技术实施例的电子装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。根据本专利技术实施例的一个方面,提供了一种信息转换方法。在本实施例中,上述信息转换方法可以应用于如图1所示的终端101和服务器102所构成的硬件环境中。如图1所示,终端101通过网络与服务器102进行连接,上述网络包括但不限于:广域网、城域网或局域网,终端101可以是手机终端,也可以是PC终端、笔记本终端或平板电脑终端。该信息转换方法可以应用在服务器102上,或者终端101上。通常情况下,可以在终端101上显示转换界面,终端101将通过转换界面接收到的待转换源信息发送给服务器102,由服务器102对待转换源信息进行转换,并将转换结果返给终端101,在终端101的转换界面上显示转换结果。该转换界面可以接收文字信息或者语音信息等,接收到的语音信息可以自动转换成文字,并作为源信息转换为目标信息。图2是根据本专利技术实施例的信息转换方法的流程图。如图2所示,该信息转换方法包括如下步骤:步骤S202,对源信息进行编码得到第一编码。利用神经网络的编码器对源信息进行编码得到第一编码,其中,第一编码为第一向量。即利用神经网络的编码器将源信息编码为一组向量来表示。步骤S204,获取预先设置的转换条件,其中,所述转换条件为所述源信息与转换结果的映射关系。预先设置的转换条件可以是多个非连续信息,其中,非连续信息用于表示一个短语中包括具有关联的至少两个不连续的部分。例如,和…有关系作为一个转换条件,是一个非连续信息,包括“和”以及“有关系”这两个具有关联却不连续的部分。例如,让…去…拿…,也是一个非连续信息,可以作为一个转换条件,包括“让”、“去”和“拿”这3个具有关联却不连续的部分。神经网络的编码器对源信息转换的时候,如果没有该转换条件也可以转换,但是,不使用该转换条件转换得到的目标信息与适用转换条件转换得到的目标信息可能不同。例如,预先设置的转换条件为:“X和Y有关系-->XhaverelationshipwithY”,其中X和Y是一种变量,可以是任意片段,比如“北京和上海有关系”利用这个规则就可以转换为“BeijinghaverelationshipwithShanghai”。但是,在没有利用该规则的情况下,“北京和上海有关系”可以转换为“thereisarelationshipbetweenBeijingandShanghai”。也就是说,基于神经网络的机器转换在没有上述转换条件的情况下,也可以根据自己的逻辑将源信息转换为目标信息,但是,为了使得转换更加准确,或者使得转换得到的信息更符合源信息的语境和语义,可以通过添加转换条件的方式,使得转换的结果更加准确。例如,词汇communication通常的意思为沟通,在通信领域,该词转换为通信、通讯。在源信息数据通信领域时,基于神经网络的机器转换在转换过程中可以根据预先设置的转换条件将该词相关的短语转换为通信领域的短本文档来自技高网
...

【技术保护点】
1.一种信息转换方法,其特征在于,包括:对源信息进行编码得到第一编码;获取预先设置的转换条件,其中,所述转换条件为所述源信息与转换结果的映射关系;根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码,得到目标信息,其中,所述目标信息与所述源信息为不同语种的信息,所述译出信息是从所述源信息转换得到的信息,所述译出信息的语种与所述目标信息相同。

【技术特征摘要】
1.一种信息转换方法,其特征在于,包括:对源信息进行编码得到第一编码;获取预先设置的转换条件,其中,所述转换条件为所述源信息与转换结果的映射关系;根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码,得到目标信息,其中,所述目标信息与所述源信息为不同语种的信息,所述译出信息是从所述源信息转换得到的信息,所述译出信息的语种与所述目标信息相同。2.根据权利要求1所述的方法,其特征在于,根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码,得到目标信息包括:根据所述源信息和所述译出信息确定预先设置的多个条件与所述源信息在句式上的相似度;将多个所述条件中所述相似度最高的条件作为所述转换条件;根据所述源信息、所述转换条件和所述译出信息对所述第一编码进行解码,得到目标信息。3.根据权利要求2所述的方法,其特征在于,根据所述源信息和所述译出信息确定预先设置的多个条件与所述源信息在句式上的相似度包括:根据用于表示所述源信息的第一向量、用于表示所述译出信息的第二向量和用于表示第一条件的第三向量确定多个所述条件中第一条件的权重值,所述第一条件为多个所述条件中任意一个;将多个所述条件中所述权重值最大的条件作为所述相似度最高的条件。4.根据权利要求3所述的方法,其特征在于,根据用于表示所述源信息的第一向量、用于表示所述译出信息的第二向量和用于表示第一条件的第三向量确定多个所述条件中第一条件的权重值包括:采用以下公式获取每个条件的权重值atat=S(Uht+Wsi)其中,ht用于表示第t个条件的向量,si用于表示所述第一向量和所述第二向量,S表示S型生长曲线,U和W分别为矩阵。5.根据权利要求1至4中任一项所述的方法,其特征在于,获取预先设置的转换条件包括:获取预先设置的多个非连续信息,其中,所述非连续信息用于表示一个短语中包括具有关联的至少两个不连续的部分。6.根据权利要求1至4中任一项所述的方法,其特征在于,对源信息进行编码得到第一编码包括:利用神经网络的编码器对所述源信息进行编码得到第一编码,其中,所述第一编码为第一向量;根据所述源信息、所述转换条件和译出信息对所述第一编码进行解码,得到目标信息包括:利用神经网络的解码器根据所述源信息、所述转换条件和译出信息对所述第一向量进行解码,得到所述目标信息,其中,所述转换条件预先被所述神经网络的解码器获取。7.一种信息转换装置,其特征在于,包括:编码单元,用...

【专利技术属性】
技术研发人员:王明轩谢军姚健黄江泉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1