数据处理方法、文本显示方法、数据处理系统及设备技术方案

技术编号：36954050 阅读：13 留言：0更新日期：2023-03-22 19:14

本申请实施例提供一种数据处理方法、文本显示方法、数据处理系统及设备。其中数据处理方法包括：从多个数据源，获取目标商品关联的多媒体数据；对多媒体数据进行处理得到多个文本信息；基于商品文案对应的多个类目，分别为多个文本信息确定相应的类目；对多个文本信息按类目进行文本编辑，得到目标商品的结构化描述文本。本申请各实施例提供的方案，因文本信息源自多个数据源，使得商品描述文本的内容丰富度高；另外，描述文本可被搜索引擎爬取和收录，这有助于提高商品的搜索召回率；另外，结构化的描述文本方便易读，且可利用应用或浏览器自带的翻译功能进行语言翻译，用户体验好。用户体验好。用户体验好。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、文本显示方法、数据处理系统及设备

[0001]本申请涉及计算机
，尤其涉及一种数据处理方法、文本显示方法、数据处理系统及设备。

技术介绍

[0002]电商平台的商品页面上显示的商品详情内容主要以图片为主，文本信息较少，这影响了搜索引擎的爬取和收录，进而影响商品信息的召回率。另一方面，图片中的文字不能利用应用或浏览器自带的翻译功能进行翻译。比如，一些跨境电商平台上的商品详情图片中的文字多为英文，因为不能翻译，对于非英语国家的用户体验不好，不能直接的、准确的了解到商品的信息。

技术实现思路

[0003]本申请各实施例提供能改善上述问题的一种数据处理方法、文本显示方法、数据处理系统及设备。
[0004]在本申请的一个实施例中，提供了一种数据处理方法，适于服务端。所述数据处理方法包括：
[0005]从多个数据源，获取目标商品关联的多媒体数据；
[0006]对所述多媒体数据进行处理，得到多个文本信息；
[0007]基于商品文案对应的多个类目，分别为所述多个文本信息确定相应的类目；
[0008]对所述多个文本信息按类目进行文本编辑，得到所述目标商品的结构化描述文本。
[0009]在本申请的另一个实施例中，提供了一种文本显示方法，适于第一客户端。该文本显示方法包括：
[0010]响应于第一用户针对目标商品的操作，向服务端发送文案申请请求；
[0011]接收所述服务端反馈的所述目标商品的结构化第一描述文本；
[0012]显示所...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，适于服务端，所述方法包括：从多个数据源，获取目标商品关联的多媒体数据；对所述多媒体数据进行处理，得到多个文本信息；基于商品文案对应的多个类目，分别为所述多个文本信息确定相应的类目；对所述多个文本信息按类目进行文本编辑，得到所述目标商品的结构化描述文本。2.根据权利要求1所述的方法，其特征在于，对所述多媒体数据进行处理，得到多个文本信息，包括：对所述多媒体数据进行文本化处理，得到至少一个文本信息；基于所述多媒体数据，在商品卖点文案库中查询与所述目标商品适配的至少一个文本信息。3.根据权利要求2所述的方法，其特征在于，所述多媒体数据包括所述目标商品的属性信息，所述属性信息包括商品标题、商品类别及商品属性数据；以及基于所述多媒体数据，在商品卖点文案库中查询与所述目标商品适配的至少一个文本信息，包括如下中的至少一项：利用深度语义匹配模型，从所述商品卖点库中召回与所述属性信息匹配的至少一个第一卖点文案；从所述商品卖点库中，召回与所述目标商品的商品类别相对应的至少一个第二卖点文案；根据所述至少一个第一卖点文案和所述至少一个第二卖点文案，确定与所述目标商品卖点相关的至少一个文本信息。4.根据权利要求2所述的方法，其特征在于，所述多媒体数据包括如下中的至少一项：所述目标商品的主图片、所述目标商品的第一商品详情信息、所述目标商品相关的第一音频信息、所述目标商品相关的第一视频信息、与所述目标商品同款商品的第二商品详情信息、与所述目标商品同款商品的第二音频信息、与所述目标商品同款商品的第二视频信息；其中，商品详情信息包括详情图片和/或详情文本；以及对所述多媒体数据进行文本化处理，得到至少一个文本信息，包括如下中的至少一项：利用图片描述技术，对所述主图片进行识别，生成描述所述主图片的文本信息；对所述第一音频信息和/或所述第二音频信息进行语音识别，基于语音识别结果生成与所述目标商品相关的文本信息；对所述第一商品详情信息和/或所述第二商品详情信息中的详情图片进行文字识别，根据文字识别结果生成文本信息；基于所述第一商品详情信息和/或所述第二商品详情信息中的详情文本，获得至少一个文本信息；对所述第一视频信息和/或第二视频信息中抽取关键帧，对所述关键帧进行图像识别，根据图像识别结果生成与所述目标商品相关的文本信息。5.根据权利要求1至4中任一项所述的方法，其特征在于，从多个数据源，获取目标商品关联的多媒体数据，包括：
从商品信息库中，获取所述目标商品的主图片、商品详情信息和/或属性信息；从音视频信息库中，获取所述目标商品相关的第一视频信息和/或第一音频信息；从互联网侧，获取所述目标商品的多媒体数据以及与所述目标商品同款商品的多媒体数据。6.根据权利要求1至4中任一项所述的方法，其特征在于，还包括：基于所述目标商品的属性信息，确定所述多个类目；或者根据商品文案预配置信息，获取所述多个类目。7.根据权利要求6所述的方法，其特征在于，基于商品文案对应的多个类目，分别为所述多个文本信息确定相应的类目，包括：获取分类模型；将所述多个类目及所述多个文本信息输入所述分类模型，执行所述分类模型，得到所述多个文本信息对应的类目。8.一种文本显示方法，其特征在于，...

【专利技术属性】
技术研发人员：鲁志红，赵帅帅，刘敏，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人