本发明专利技术公开了一种文本信息生成方法、装置以及计算设备。方法包括:获取商品的标题信息;将所述标题信息输入到文本生成模型,以生成针对所述商品的多个描述文本;获取所述多个描述文本的点击信息;至少根据所获取的点击信息对所述文本生成模型进行训练,以调整所述文本生成模型的网络参数。
A text information generation method, device and computing equipment
【技术实现步骤摘要】
一种文本信息生成方法、装置以及计算设备
本专利技术涉及自然语言处理领域,具体涉及一种文本信息生成方法、装置以及计算设备。
技术介绍
目前电商在内容化的过程中,商品的描述信息需要人工/达人去手动书写,文本生成效率极低。因此希望对商品描述进行自动生成,来解放人工的双手,提高文本的生成效率。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的文本生成方法、装置以及计算设备。根据本专利技术的一个方面,提供了一种文本信息生成方法,包括:获取商品的标题信息;将所述标题信息输入到文本生成模型,以生成针对所述商品的多个描述文本;获取所述多个描述文本的点击信息;至少根据所获取的点击信息对所述文本生成模型进行训练,以调整所述文本生成模型的网络参数。可选地,在根据本专利技术的文本信息生成方法中,所述文本生成模型包括标题编码器和标题解码器,所述标题编码器适于将标题信息编码为针对标题信息的语义向量,所述标题解码器适于至少根据所述语义向量,生成描述文本的每个位置的词分布向量,并根据所述词分布向量生成针对所述商品的多个描述文本。可选地,根据本专利技术的文本信息生成方法,还包括:获取与商品关联的属性信息;根据所述属性信息生成注意力向量;将所述注意力向量输入到所述标题解码器,以使所述标题解码器根据所述语义向量和所述注意力向量生成所述词分布向量。可选地,在根据本专利技术的文本信息生成方法中,所述与商品关联的属性信息包括商品的品牌、颜色、尺寸、价格中的至少一个。可选地,在根据本专利技术的文本信息生成方法中,所述至少根据所获取的点击信息对所述文本生成模型进行训练,以调整所述文本生成模型的网络参数,包括:获取所述标题信息的目标描述文本;计算所述词分布向量与所述目标描述文本的第一交叉熵损失;计算所述多个描述文本中预定数目个点击率最高的描述文本、与所述标题信息的第二交叉熵损失;以所述第一交叉熵损失与第二交叉熵损失之和作为损失函数值,调整文本生成模型的网络参数。可选地,在根据本专利技术的文本信息生成方法中,所述根据所述词分布向量生成针对所述商品的多个描述文本,包括:采用集束搜索算法对每个位置的词分布向量进行搜索,从而生成所述商品的多个描述文本。可选地,在根据本专利技术的文本信息生成方法中,所述标题编码器和标题解码器采用循环神经网络RNN、门控循环单元GRU或者长短时记忆网络LSTM中的至少一个。可选地,根据本专利技术的文本信息生成方法,还包括:将所述描述文本发送至客户端显示。根据本专利技术的另一方面,还提供一种文本信息生成装置,包括:第一获取模块,适于获取商品的标题信息;文本生成模块,适于将所述标题信息输入到文本生成模型,以生成针对所述商品的多个描述文本;第二获取模块,适于获取所述多个描述文本的点击信息;参数调整模块,适于根据所获取的点击信息对所述文本生成模型进行训练,以调整所述文本生成模型的网络参数。根据本专利技术的又一方面,还提供一种计算设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据上述的方法中的任一方法的指令。本专利技术首先在文本生成模型生成多个版本的描述文本的基础上,将各个版本的描述文本投放到线上,然后获取到线上版本的用户行为(用户对描述文本的点击情况),将用户行为加入到文本生成模型的损失函数中继续进行训练,从而能够提升文本生成模型的性能指标。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的文本信息生成系统100的示意图;图2示出了根据本专利技术一个实施例的计算设备200的示意图;图3示出了根据本专利技术一个实施例的文本信息生成方法300的流程图;图4示出了根据本专利技术一个实施例的文本信息生成装置400的示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了根据本专利技术一个实施例的文本信息生成系统100的示意图。如图1所示,文本信息生成系统100包括用户终端110和计算设备200。用户终端110即用户所使用的终端设备,其具体可以是桌面电脑、笔记本电脑等个人计算机,也可以是手机、平板电脑、多媒体设备、智能可穿戴设备等,但不限于此。计算设备200用于向用户终端110提供服务,其可以实现为服务器,例如应用服务器、Web服务器等;也可以实现为桌面电脑、笔记本电脑、处理器芯片、平板电脑等,但不限于此。根据一种实施例,计算设备200可以执行商品信息查询,终端设备110可以经由互联网与计算设备200建立连接,从而使得用户可以经由终端设备110进行商品信息查询。例如,用户在终端设备110上打开浏览器或者购物类应用(APP),在搜索框中输入查询短语(query),即向计算设备200发起查询请求。计算设备200接收到查询请求后,根据用户输入的查询短语来查询商品信息,并将查询结果返回至终端设备110,查询结果可以包括商品的标题信息以及针对该商品的描述文本。终端设备110在界面中展示商品的标题信息和商品描述文本,用户可以对感兴趣的商品描述文本进行点击,从而进入商品详情页。同时,计算设备200会记录用户针对商品描述文本的点击行为。其中,商品描述文本由计算设备200基于商品的标题信息,利用文本生成工具(文本生成模型)自动生成。在一个实施例中,文本信息生成系统100还包括数据存储装置120。数据存储装置120可以是关系型数据库例如MySQL、ACCESS等,也可以是非关系型数据库例如NoSQL等;可以是驻留于计算设备200中的本地数据库,也可以作为分布式数据库例如HBase等设置于多个地理位置处,总之,数据存储装置120用于存储数据,本专利技术对数据存储装置120的具体部署、配置情况不做限制。计算设备200可以与数据存储装置120连接,并获取数据存储装置120中所存储的数据。例如,计算设备200可以直接读取数据存储装置120中的数据(在数据存储装置120为计算设备200的本地数据库时),也可以通过有线或无线的方式接入互联网,并通过数据接口来获取数据存储装置120中的数据。在本专利技术本文档来自技高网...
【技术保护点】
1.一种文本信息生成方法,包括:/n获取商品的标题信息;/n将所述标题信息输入到文本生成模型,以生成针对所述商品的多个描述文本;/n获取所述多个描述文本的点击信息;/n至少根据所获取的点击信息对所述文本生成模型进行训练,以调整所述文本生成模型的网络参数。/n
【技术特征摘要】
1.一种文本信息生成方法,包括:
获取商品的标题信息;
将所述标题信息输入到文本生成模型,以生成针对所述商品的多个描述文本;
获取所述多个描述文本的点击信息;
至少根据所获取的点击信息对所述文本生成模型进行训练,以调整所述文本生成模型的网络参数。
2.如权利要求1所述的方法,其中,所述文本生成模型包括标题编码器和标题解码器,所述标题编码器适于将标题信息编码为针对标题信息的语义向量,所述标题解码器适于至少根据所述语义向量,生成描述文本的每个位置的词分布向量,并根据所述词分布向量生成针对所述商品的多个描述文本。
3.如权利要求2所述的方法,还包括:
获取与商品关联的属性信息;
根据所述属性信息生成注意力向量;
将所述注意力向量输入到所述标题解码器,以使所述标题解码器根据所述语义向量和所述注意力向量生成所述词分布向量。
4.如权利要求3所述的方法,其中,所述与商品关联的属性信息包括商品的品牌、颜色、尺寸、价格中的至少一个。
5.如权利要求2或3所述的方法,其中,所述至少根据所获取的点击信息对所述文本生成模型进行训练,以调整所述文本生成模型的网络参数,包括:
获取所述标题信息的目标描述文本;
计算所述词分布向量与所述目标描述文本的第一交叉熵损失;
计算所述多个描述文本中预定数目个点击率最高的...
【专利技术属性】
技术研发人员:严玉良,王勇臻,黄恒,刘晓钟,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。