数据处理方法、装置及系统制造方法及图纸

技术编号：18240836 阅读：127 留言：0更新日期：2018-06-17 05:47

本申请提供了一种数据处理方法、装置系统，包括：获取用户语音数据以及用户文字数据；其中，所述用户语音数据与所述用户文字数据对应；确定与用户文字数据对应的唇形图像集；调整所述唇形图像集获得与人脸图像对应的唇形图像集，并合成人脸图像对应的唇形视频数据；合成用户语音数据和唇形视频数据，获得用户视频数据。本申请可以基于用户语音数据，并结合人脸图像，在人脸图像上显示用于语音数据，以展示出以人脸图像展示用户语音数据的效果。这样可以丰富即时通讯软件的交流方式。 1

Data processing methods, devices and systems

The present application provides a data processing method, device system, including: obtaining user voice data and user text data, in which the user voice data is corresponding to the user text data, determines a lip image set corresponding to the user text data, and adjusts the lip image set to correspond with the face image. The lip image set is used to synthesize lip image data corresponding to face images, and user voice data and lip video data are synthesized to obtain user video data. The application can be based on the user's voice data, combined with the face image, and display the speech data on the face image to show the effect of displaying the user's voice data with the face image. This can enrich the communication mode of instant messaging software. One

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置及系统
本申请涉及通信
，尤其涉及一种数据处理方法、装置及系统。
技术介绍
在日益发达的互联网中，一些社交应用可以采用语音方式发送消息。语音消息其展现形式较为单一，互动效果差。
技术实现思路
鉴于此，本申请提供一种数据处理方法、装置及系统，可以丰富即时通讯软件的交流方式。为了实现上述目的，本申请提供了下述技术特征：一种数据处理方法，包括：获取用户语音数据以及用户文字数据；其中，所述用户语音数据与所述用户文字数据对应；确定与用户文字数据对应的唇形图像集；调整所述唇形图像集获得与人脸图像对应的唇形图像集，并合成人脸图像对应的唇形视频数据；合成用户语音数据和唇形视频数据，获得用户视频数据。可选的，所述获取用户语音数据以及用户文字数据，包括：响应于用户输入的文字数据获得用户文字数据，基于文字数据转换为语音数据获得用户语音数据；或者，响应于用户输入的语音数据获得用户语音数据，基于语音数据转换为文字数据获得用户文字数据。可选的，所述确定与用户文字数据对应的唇形图像集，包括：对用户文字数据进行语义分析并进行分词，获得多个分词以及对应的多个分词属性信息；分别确定与多个分词对应的多个唇形图像；基于分词属性信息对对应的唇形图像进行调整；多个调整后的唇形图像组成唇形图像集。可选的，所述分别确定与多个分词对应的多个唇形图像，包括：在按韵母划分的多个唇形图像中，确定与分词韵母对应的唇形图像；在按声母和韵母划分的多个唇形图像中，确定与分词的声母和韵母对应的唇形图像；将声母和韵母输入至唇形图像模型，获得唇形图像模型输出的唇形图像。可选的，所述调整所述唇形图像集获得与...
数据处理方法、装置及系统

【技术保护点】
1.一种数据处理方法，其特征在于，包括：

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：获取用户语音数据以及用户文字数据；其中，所述用户语音数据与所述用户文字数据对应；确定与用户文字数据对应的唇形图像集；调整所述唇形图像集获得与人脸图像对应的唇形图像集，并合成人脸图像对应的唇形视频数据；合成用户语音数据和唇形视频数据，获得用户视频数据。2.如权利要求1所述的方法，其特征在于，所述获取用户语音数据以及用户文字数据，包括：响应于用户输入的文字数据获得用户文字数据，基于文字数据转换为语音数据获得用户语音数据；或者，响应于用户输入的语音数据获得用户语音数据，基于语音数据转换为文字数据获得用户文字数据。3.如权利要求1所述的方法，其特征在于，所述确定与用户文字数据对应的唇形图像集，包括：对用户文字数据进行语义分析并进行分词，获得多个分词以及对应的多个分词属性信息；分别确定与多个分词对应的多个唇形图像；基于分词属性信息对对应的唇形图像进行调整；多个调整后的唇形图像组成唇形图像集。4.如权利要求1所述的方法，其特征在于，所述分别确定与多个分词对应的多个唇形图像，包括：在按韵母划分的多个唇形图像中，确定与分词韵母对应的唇形图像；在按声母和韵母划分的多个唇形图像中，确定与分词的声母和韵母对应的唇形图像；将声母和韵母输入至唇形图像模型，获得唇形图像模型输出的唇形图像。5.如权利要求1所述的方法，其特征在于，所述调整所述唇形图像集获得与人脸图像对应的唇形图像集，包括：调整人脸图像中的唇形特征，以使唇形特征与唇形图像中的唇形特征匹配；将多幅调整后的人脸图像，确定为与人脸图像对应的唇形图像集。6.如权利要求1所述的方法，其特征在于，所述合成用户语音数据和唇形视频数据，获得用户视频数据，包括：确定用户语音数据的编码参数，获得编码后的语音文件；确定唇...

【专利技术属性】
技术研发人员：张引，吴烁，
申请(专利权)人：北京搜狐新媒体信息技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人