一种信息处理方法和装置制造方法及图纸

技术编号：38857636 阅读：17 留言：0更新日期：2023-09-17 10:02

本发明专利技术公开了一种信息处理方法和装置，涉及智能化信息处理技术领域。该方法实施方式可包括：获取终端设备接收到的待处理信息，并将待处理信息转换为标准文本；利用包含编码器和解码器的预训练语言模型，分析标准文本，其中，包含编码器和解码器的预训练语言模型通过训练编码器和解码器得到，在训练解码器过程为训练解码器用的编码信息添加噪声；根据分析结果，生成对应于待处理信息的反馈信息，并提供反馈信息给终端设备。该实施方式能够减少噪声干扰，以准确地分析出用户需求，从而提高智能化业务服务的用户体验。化业务服务的用户体验。化业务服务的用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种信息处理方法和装置

[0001]本专利技术涉及智能化信息处理
，尤其涉及一种信息处理方法和装置。

技术介绍

[0002]为了能够使各种智能化业务服务比如智能客服服务、机器人服务等，能够准确地分析出用户的需求，以使用户获得满意的服务，需要训练出比较准确的自然语言模型，并将训练出的自然语言模型应用到智能化业务服务中。
[0003]目前，智能化业务服务常用的包含有编码器
‑
解码器的预训练语言模型作为自然语言模型，但是，现有的训练方式，会使包含有编码器
‑
解码器的预训练语言模型的去噪能力较差，很多情况下，由于受到噪声干扰，不能准确地分析出用户需求，导致用户对于智能化业务服务的体验较差。

技术实现思路

[0004]有鉴于此，本专利技术实施例提供一种信息处理方法和装置，能够减少噪声干扰，以准确地分析出用户需求，从而提高智能化业务服务的用户体验。
[0005]为实现上述目的，第一方面，本专利技术实施例提供了一种信息处理方法，包括：
[0006]获取终端设备接收到的待处理信息，并将所述待处理信息转换为标准文本；
[0007]利用包含编码器和解码器的预训练语言模型，分析所述标准文本，其中，所述包含编码器和解码器的预训练语言模型通过训练所述编码器和所述解码器得到，在训练所述解码器过程为训练所述解码器用的编码信息添加噪声；
[0008]根据分析结果，生成对应于所述待处理信息的反馈信息，并提供反馈信息给所述终端设备。
[0009]可...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法，其特征在于，包括：获取终端设备接收到的待处理信息，并将所述待处理信息转换为标准文本；利用包含编码器和解码器的预训练语言模型，分析所述标准文本，其中，所述包含编码器和解码器的预训练语言模型通过训练所述编码器和所述解码器得到，在训练所述解码器过程为训练所述解码器用的编码信息添加噪声；根据分析结果，生成对应于所述待处理信息的反馈信息，并提供反馈信息给所述终端设备。2.根据权利要求1所述的信息处理方法，其特征在于，所述将所述待处理信息转换为标准文本，包括：识别所述待处理信息的信息类型；在识别出所述待处理信息的信息类型为图片类型的情况下，从所述待处理信息中识别出第一文本信息，并从所述第一文本信息中提取出实体信息；在识别出所述待处理信息的信息类型为语音类型的情况下，将所述待处理信息转化为第二文本信息，并从所述第二文本信息中提取出实体信息；在识别出所述待处理信息的信息类型为文本类型的情况下，直接从所述待处理信息中提取出实体信息。3.根据权利要求1所述的信息处理方法，其特征在于，所述训练所述编码器和所述解码器，包括：利用训练用数据训练所述编码器，并获取所述编码器输出的编码信息；为所述编码信息添加噪音，并将添加噪音后的编码信息输入解码器，使所述解码器去噪音，以训练所述解码器。4.根据权利要求3所述的信息处理方法，其特征在于，所述利用训练用数据训练所述编码器，包括：确定训练用数据，并对所述训练用数据包括的部分文本进行掩码处理；利用所述编码器对掩码处理后的训练用数据进行编码。5.根据权利要求3或4所述的信息处理方法，其特征在于，所述编码器输出的编码信息包括所述训练用数据所包含字符的编码向量以及位置向量；所述为所述编码信息添加噪音，包括：随机调整任意一个或者多个所述字符对应的位置向量。6.根据权利要求5所述的信息处理方法，其特征在于，所述训练所述编码器和所述解码器，进一步包括：基于每一个修改位置向量的字...

【专利技术属性】
技术研发人员：李浩然，吴友政，
申请(专利权)人：北京京东尚科信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人