文本风格转换方法、装置、电子设备及存储介质制造方法及图纸

技术编号：24889378 阅读：23 留言：0更新日期：2020-07-14 18:16

本申请实施例提供一种文本风格转换方法、装置、电子设备及存储介质，该方法中，根据类型转换标签将服务提供方在提供服务过程中与服务请求方之间的交互信息转换为第二文本风格的文本信息，即将第一文本风格的文本信息转换为第二文本风格的文本信息，相比于现有技术中通过人工编写规则进行词语替换导致耗时较长且准确率低的问题，本方案中可以自动学习第一文本风格的文本信息转换为第二文本风格的文本信息的转换规则，从而可以有效提高数据转换的效率和准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文本风格转换方法、装置、电子设备及存储介质
本申请涉及数据处理领域，具体而言，涉及一种文本风格转换方法、装置、电子设备及存储介质。
技术介绍
以网约车场景为例，为了进一步保证乘客的乘车安全，一般可以获取乘客在乘车过程中与司机之间的对话来判断司机和乘客之间是否产生矛盾，所以，有效识别司机和乘客之间的对话数据尤其重要。由于，司机和乘客之间的对话数据可能比较口语化，或者由于地域差异，其对话还可能为方言，所以，为了后续对司机和乘客之间的对话数据进行有效识别，在对司机和乘客之间的对话进行语义理解或者用于训练语言模型之前，还需对这些对话数据进行转换，转换为比较标准书面语，从而便于后续进行语义理解或者便于训练语言模型。现有技术中进行转换的方式是通过人工编写规则进行转换，例如，将对话数据中的某些词替换为比较标准的书面语，如“要去->导航去”，但是若对话数据量大的情况下，则需预先人工编写大量的转换规则，耗时较长导致效率太低，且若编写的转换规则数量不足，可能无法对有的数据进行正确转换，准确率不高。
技术实现思路
有鉴于此，本申请实施例的目的在于提供一种文本风格转换方法、装置、电子设备及存储介质，以提高数据转换的效率和准确性。第一方面，本申请实施例提供了一种文本风格转换方法，所述方法包括：获取待转换的第一文本风格的文本信息，所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息；获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文...

【技术保护点】
1.一种文本风格转换方法，其特征在于，所述方法包括：/n获取待转换的第一文本风格的文本信息，所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息；/n获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签；/n根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。/n

【技术特征摘要】
1.一种文本风格转换方法，其特征在于，所述方法包括：
获取待转换的第一文本风格的文本信息，所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息；
获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签；
根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。

2.根据权利要求1所述的方法，其特征在于，根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息，包括：
采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。

3.根据权利要求1所述的方法，其特征在于，获取待转换的第一文本风格的文本信息之前，还包括：
获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息；
将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签；
将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练，获得训练后的GAN模型。

4.根据权利要求3所述的方法，其特征在于，将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练，获得训练后的GAN模型，包括：
采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息；
通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息；
若所述判别式模型无法判断，则表明完成所述GAN模型的训练。

5.根据权利要求1-4任一所述的方法，其特征在于，获取待转换的第一文本风格的文本信息，包括：
获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息；
对所述交互语音信息进行语音识别，获得待转换的第一文本风格的文本信息。

6.一种文本风格转换装置，...

【专利技术属性】
技术研发人员：龚彩霞，
申请(专利权)人：北京嘀嘀无限科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人