数据处理方法、文本显示方法、数据处理系统及设备技术方案

技术编号:36954050 阅读:13 留言:0更新日期:2023-03-22 19:14
本申请实施例提供一种数据处理方法、文本显示方法、数据处理系统及设备。其中数据处理方法包括:从多个数据源,获取目标商品关联的多媒体数据;对多媒体数据进行处理得到多个文本信息;基于商品文案对应的多个类目,分别为多个文本信息确定相应的类目;对多个文本信息按类目进行文本编辑,得到目标商品的结构化描述文本。本申请各实施例提供的方案,因文本信息源自多个数据源,使得商品描述文本的内容丰富度高;另外,描述文本可被搜索引擎爬取和收录,这有助于提高商品的搜索召回率;另外,结构化的描述文本方便易读,且可利用应用或浏览器自带的翻译功能进行语言翻译,用户体验好。用户体验好。用户体验好。

【技术实现步骤摘要】
数据处理方法、文本显示方法、数据处理系统及设备


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、文本显示方法、数据处理系统及设备。

技术介绍

[0002]电商平台的商品页面上显示的商品详情内容主要以图片为主,文本信息较少,这影响了搜索引擎的爬取和收录,进而影响商品信息的召回率。另一方面,图片中的文字不能利用应用或浏览器自带的翻译功能进行翻译。比如,一些跨境电商平台上的商品详情图片中的文字多为英文,因为不能翻译,对于非英语国家的用户体验不好,不能直接的、准确的了解到商品的信息。

技术实现思路

[0003]本申请各实施例提供能改善上述问题的一种数据处理方法、文本显示方法、数据处理系统及设备。
[0004]在本申请的一个实施例中,提供了一种数据处理方法,适于服务端。所述数据处理方法包括:
[0005]从多个数据源,获取目标商品关联的多媒体数据;
[0006]对所述多媒体数据进行处理,得到多个文本信息;
[0007]基于商品文案对应的多个类目,分别为所述多个文本信息确定相应的类目;
[0008]对所述多个文本信息按类目进行文本编辑,得到所述目标商品的结构化描述文本。
[0009]在本申请的另一个实施例中,提供了一种文本显示方法,适于第一客户端。该文本显示方法包括:
[0010]响应于第一用户针对目标商品的操作,向服务端发送文案申请请求;
[0011]接收所述服务端反馈的所述目标商品的结构化第一描述文本;
[0012]显示所述第一描述文本;
[0013]其中,所述第一描述文本是将多个文本信息分类目进行文本编辑得到,所述多个文本信息中的文本信息预先基于商品文案对应的多个类目进行了类目分类;所述多个文本信息是由多个数据源处的所述目标商品关联的多媒体数据确定的。
[0014]在本申请的又一个实施例中,还提供了一种文本显示方法,适于第一客户端。该文本显示方法包括:
[0015]响应于用户针对目标商品的指令,从多个数据源,获取所述目标商品关联的多媒体数据;
[0016]对所述多媒体数据进行处理,得到多个文本信息;
[0017]基于商品文案对应的多个类目,分别为所述多个文本信息确定相应的类目;
[0018]对所述多个文本信息按类目进行文本编辑,得到所述目标商品的结构化描述文
本;
[0019]在所述目标商品的商品页面上,显示所述描述文本。
[0020]在本申请的又一个实施例中,提供了一种数据处理系统。该系统包括:
[0021]服务端,用于从多个数据源,获取目标商品关联的多媒体数据;对所述多媒体数据进行处理,得到多个文本信息;基于商品文案对应的多个类目,分别为所述多个文本信息确定相应的类目;对所述多个文本信息按类目进行文本编辑,得到所述目标商品的结构化描述文本;将所述结构化描述文本添加到所述目标商品的商品页面信息中;
[0022]第二客户端,用于响应第二用户针对所述目标商品的操作,从所述服务端获取所述商品页面信息;基于所述商品页面信息,显示所述目标商品的商品页面。
[0023]在本申请的又一个实施例中,提供了一种数据处理系统。该系统包括:
[0024]第一客户端,用于响应于第一用户针对目标商品的操作,向服务端发送文案申请请求;
[0025]服务端,用于响应于所述文案申请请求,从多个数据源,获取目标商品关联的多媒体数据;对所述多媒体数据进行处理,得到多个文本信息;基于商品文案对应的多个类目,分别为所述多个文本信息确定相应的类目;对所述多个文本信息按类目进行文本编辑,生成所述目标商品的结构化第一描述文本;
[0026]所述第一客户端,还用于接收所述服务端反馈的所述目标商品的第一描述文本;显示所述第一描述文本。
[0027]本申请的还提供了一种计算设备实施例,该计算设备包括存储器和处理器,所述存储器,存储一条或多条计算机指令;所述处理器,与所述存储器耦合,用于执行所述一条或多条计算机指令,以用于实现上述数据处理方法中的步骤,或上述文本显示方法中的步骤。
[0028]本申请实施例还提供一种存储有计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,使得所述一个或多个处理器执行上述数据处理方法中的步骤,或上述文本显示方法中的步骤。
[0029]本申请还有一实施例提供一种计算机程序产品,该计算机程序产品包括计算机程序或指令,当所述计算机程序或指令被处理器执行时,使得所述处理器执行上述数据处理方法中的步骤,或上述文本显示方法中的步骤。
[0030]本申请各实施例提供的技术方案,从多个数据源获取目标商品关联的多媒体数据;然后对多媒体数据进行处理以得到多个文本信息;并基于商品文案对应的多个类目,分别对多个文案进行类目分类,以便于将多个文本信息按类目进行文本编辑,得到目标商品的结构化描述文本。可见,本申请各实施例提供的方案,因文本信息源自多个数据源,使得商品描述文本的内容丰富度高;另外,描述文本可被搜索引擎爬取和收录,这有助于提高商品的搜索召回率;另外,结构化的描述文本方便易读,且可利用应用或浏览器自带的翻译功能进行语言翻译,用户体验好,能帮助多国用户更直接、准确的获知商品信息。
附图说明
[0031]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要利用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申
请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1示出了本申请一实施例提供的数据处理系统的一种原理性示意图;
[0033]图2示出了本申请一实施例提供的数据处理系统的另一种原理性示意图;
[0034]图3示出了本申请提供的一种数据处理方法的流程示意图;
[0035]图4示出了本申请一实施例提供的技术方案中商品页面的一种展现方式示意图;
[0036]图5示出了本申请一实施例提供的技术方案中包含有各类目对应的文本内容的描述文本的展示示意图;
[0037]图6示出了本申请一实施例提供文本显示方法的流程示意图;
[0038]图7示出了本申请另一实施例提供文本显示方法的流程示意图;
[0039]图8示出了本申请另一实施例提供的数据处理方法的原理性示意图;
[0040]图9示出了本申请一实施例提供的数据处理装置的结构框图;
[0041]图10示出了本申请一实施例提供的文本显示装置的结构框图;
[0042]图11示出了本申请另一实施例提供的文本显示装置的结构框图;
[0043]图12示出了本申请一实施例提供的计算机设备的结构示意图。
具体实施方式
[0044]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,适于服务端,所述方法包括:从多个数据源,获取目标商品关联的多媒体数据;对所述多媒体数据进行处理,得到多个文本信息;基于商品文案对应的多个类目,分别为所述多个文本信息确定相应的类目;对所述多个文本信息按类目进行文本编辑,得到所述目标商品的结构化描述文本。2.根据权利要求1所述的方法,其特征在于,对所述多媒体数据进行处理,得到多个文本信息,包括:对所述多媒体数据进行文本化处理,得到至少一个文本信息;基于所述多媒体数据,在商品卖点文案库中查询与所述目标商品适配的至少一个文本信息。3.根据权利要求2所述的方法,其特征在于,所述多媒体数据包括所述目标商品的属性信息,所述属性信息包括商品标题、商品类别及商品属性数据;以及基于所述多媒体数据,在商品卖点文案库中查询与所述目标商品适配的至少一个文本信息,包括如下中的至少一项:利用深度语义匹配模型,从所述商品卖点库中召回与所述属性信息匹配的至少一个第一卖点文案;从所述商品卖点库中,召回与所述目标商品的商品类别相对应的至少一个第二卖点文案;根据所述至少一个第一卖点文案和所述至少一个第二卖点文案,确定与所述目标商品卖点相关的至少一个文本信息。4.根据权利要求2所述的方法,其特征在于,所述多媒体数据包括如下中的至少一项:所述目标商品的主图片、所述目标商品的第一商品详情信息、所述目标商品相关的第一音频信息、所述目标商品相关的第一视频信息、与所述目标商品同款商品的第二商品详情信息、与所述目标商品同款商品的第二音频信息、与所述目标商品同款商品的第二视频信息;其中,商品详情信息包括详情图片和/或详情文本;以及对所述多媒体数据进行文本化处理,得到至少一个文本信息,包括如下中的至少一项:利用图片描述技术,对所述主图片进行识别,生成描述所述主图片的文本信息;对所述第一音频信息和/或所述第二音频信息进行语音识别,基于语音识别结果生成与所述目标商品相关的文本信息;对所述第一商品详情信息和/或所述第二商品详情信息中的详情图片进行文字识别,根据文字识别结果生成文本信息;基于所述第一商品详情信息和/或所述第二商品详情信息中的详情文本,获得至少一个文本信息;对所述第一视频信息和/或第二视频信息中抽取关键帧,对所述关键帧进行图像识别,根据图像识别结果生成与所述目标商品相关的文本信息。5.根据权利要求1至4中任一项所述的方法,其特征在于,从多个数据源,获取目标商品关联的多媒体数据,包括:
从商品信息库中,获取所述目标商品的主图片、商品详情信息和/或属性信息;从音视频信息库中,获取所述目标商品相关的第一视频信息和/或第一音频信息;从互联网侧,获取所述目标商品的多媒体数据以及与所述目标商品同款商品的多媒体数据。6.根据权利要求1至4中任一项所述的方法,其特征在于,还包括:基于所述目标商品的属性信息,确定所述多个类目;或者根据商品文案预配置信息,获取所述多个类目。7.根据权利要求6所述的方法,其特征在于,基于商品文案对应的多个类目,分别为所述多个文本信息确定相应的类目,包括:获取分类模型;将所述多个类目及所述多个文本信息输入所述分类模型,执行所述分类模型,得到所述多个文本信息对应的类目。8.一种文本显示方法,其特征在于,...

【专利技术属性】
技术研发人员:鲁志红赵帅帅刘敏
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1