文本风格转换方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24889378 阅读:23 留言:0更新日期:2020-07-14 18:16
本申请实施例提供一种文本风格转换方法、装置、电子设备及存储介质,该方法中,根据类型转换标签将服务提供方在提供服务过程中与服务请求方之间的交互信息转换为第二文本风格的文本信息,即将第一文本风格的文本信息转换为第二文本风格的文本信息,相比于现有技术中通过人工编写规则进行词语替换导致耗时较长且准确率低的问题,本方案中可以自动学习第一文本风格的文本信息转换为第二文本风格的文本信息的转换规则,从而可以有效提高数据转换的效率和准确性。

【技术实现步骤摘要】
文本风格转换方法、装置、电子设备及存储介质
本申请涉及数据处理领域,具体而言,涉及一种文本风格转换方法、装置、电子设备及存储介质。
技术介绍
以网约车场景为例,为了进一步保证乘客的乘车安全,一般可以获取乘客在乘车过程中与司机之间的对话来判断司机和乘客之间是否产生矛盾,所以,有效识别司机和乘客之间的对话数据尤其重要。由于,司机和乘客之间的对话数据可能比较口语化,或者由于地域差异,其对话还可能为方言,所以,为了后续对司机和乘客之间的对话数据进行有效识别,在对司机和乘客之间的对话进行语义理解或者用于训练语言模型之前,还需对这些对话数据进行转换,转换为比较标准书面语,从而便于后续进行语义理解或者便于训练语言模型。现有技术中进行转换的方式是通过人工编写规则进行转换,例如,将对话数据中的某些词替换为比较标准的书面语,如“要去->导航去”,但是若对话数据量大的情况下,则需预先人工编写大量的转换规则,耗时较长导致效率太低,且若编写的转换规则数量不足,可能无法对有的数据进行正确转换,准确率不高。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种文本风格转换方法、装置、电子设备及存储介质,以提高数据转换的效率和准确性。第一方面,本申请实施例提供了一种文本风格转换方法,所述方法包括:获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。在上述实现过程中,可以根据类型转换标签将服务提供方在提供服务过程中与服务请求方之间的交互信息转换为第二文本风格的文本信息,即将第一文本风格的文本信息转换为第二文本风格的文本信息,相比于现有技术中通过人工编写规则进行词语替换导致耗时较长且准确率低的问题,本方案中可以自动学习第一文本风格的文本信息转换为第二文本风格的文本信息的转换规则,从而可以有效提高数据转换的效率和准确性。可选地,根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息,包括:采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。在上述实现过程中,由于GAN模型可以比其他模型产生更好的样本,即其可以生成任意想生成的数据,如第二文本风格的文本信息,所以,通过GAN模型可以将第一文本风格的文本信息更加便捷地转换为第二文本风格的文本信息。可选地,获取待转换的第一文本风格的文本信息之前,还包括:获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息;将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签;将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。在上述实现过程中,预先对GAN模型进行训练,使得GAN模型在实际使用过程中可以更加准确地将第一文本风格的文本信息转换为第二文本风格的文本信息。可选地,将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型,包括:采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;若所述判别式模型无法判断,则表明完成所述GAN模型的训练。在上述实现过程中,GAN模型中的生成式模型可以基于类型转换标签将第一文本风格的文本信息转换为第二文本风格的文本信息,判别式模型可以判断第二文本风格的文本信息是否为类型转换标签中的需转换的文本风格对应的文本信息,若所述判别式模型无法判断,则表明完成GAN模型的训练,所以,通过训练阶段可以使得该GAN模型可以自动学习文本风格转换的规则,无需在学习过程中进行推断,从而可以提高数据转换的效率和准确性。可选地,获取待转换的第一文本风格的文本信息,包括:获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息;对所述交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。在上述实现过程中,将服务提供方与服务请求方之间的交互语音信息进行语音识别,转换为第一文本风格的文本信息,从而可利于后续进行文本风格的转换。第二方面,本申请实施例提供了一种文本风格转换装置,所述装置包括:信息获取模块,用于获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;标签获取模块,用于获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;信息转换模块,用于根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。可选地,所述信息转换模块,具体用于采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。可选地,所述装置还包括:模型训练模块,用于获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息;将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签;将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。可选地,所述模型训练模块,还用于采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;若所述判别式模型无法判断,则表明完成所述GAN模型的训练。可选地,所述信息获取模块,用于获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息;对所述交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。第四方面,本申请实施例提供一种可读存储介质本文档来自技高网...

【技术保护点】
1.一种文本风格转换方法,其特征在于,所述方法包括:/n获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;/n获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;/n根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。/n

【技术特征摘要】
1.一种文本风格转换方法,其特征在于,所述方法包括:
获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;
获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;
根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。


2.根据权利要求1所述的方法,其特征在于,根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息,包括:
采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。


3.根据权利要求1所述的方法,其特征在于,获取待转换的第一文本风格的文本信息之前,还包括:
获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息;
将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签;
将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。


4.根据权利要求3所述的方法,其特征在于,将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型,包括:
采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;
通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;
若所述判别式模型无法判断,则表明完成所述GAN模型的训练。


5.根据权利要求1-4任一所述的方法,其特征在于,获取待转换的第一文本风格的文本信息,包括:
获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息;
对所述交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。


6.一种文本风格转换装置,...

【专利技术属性】
技术研发人员:龚彩霞
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1