【技术实现步骤摘要】
标题重构方法、装置及计算机存储介质
[0001]本申请实施例涉及计算机
,尤其涉及一种标题重构方法、装置及计算机存储介质。
技术介绍
[0002]互联网为电商运营提供了广阔的内容平台,受到了电商运营的广泛使用。在海量内容数据中,能够吸引用户点击和浏览的一个内容数据的重要特征就是商品标题。
[0003]目前,电商运营在做新商品市场推广或个人用户在进行商品发布时都需要用到商品标题。例如,电商运营会在商品标题中写明与该商品对应的信息。但是,另一方面,为了提高搜索召回促进成交,电商运营往往会在商品标题中堆砌大量冗余词,这些词可能包含商品的品牌、品类、型号、颜色、风格、材质等信息,也可能包含很多重复冗余信息。由此,造成商品的原始标题长度都较长且可能包含非必要的商品信息。
[0004]但是,用户在浏览商品的时候,由于屏幕尺寸限制,过长的商品标题会显示不全。现有技术中,通过对商品标题进行分词后,直接对商品标题进行改写,以适合商品标题的屏幕显示。然而,对于某些不规范的标题如使用了口语化用词的口语化标题,按照上述方式对其 ...
【技术保护点】
【技术特征摘要】
1.一种标题重构方法,包括:对原始标题进行分词并获得每个分词对应的标签;识别所述原始标题的一个或多个中心词;利用所述一个或多个中心词对所述每个分词对应的标签进行纠错;根据纠错后的标签进行每个分词的成分筛选和排序;根据所述成分筛选和排序结果,生成重构后的标题。2.根据权利要求1所述的方法,其中,所述利用所述一个或多个中心词对所述每个分词对应的标签进行纠错之后,所述方法还包括:根据纠错后的标签对所述原始标题的属性进行判断,所述属性包括规范化属性和非规范化属性;如果所述原始标题的属性为非规范化属性,则对所述原始标题进行截断;如果所述原始标题的属性为规范化属性,则执行根据所述纠错后的标签进行每个分词的成分筛选和排序的步骤。3.根据权利要求2所述的方法,其中,所述根据纠错后的标签对所述原始标题的属性进行判断,包括:判断所述纠错后的标签中重要标签的占比;如果所述占比高于预设阈值,则所述原始标题的属性为规范化属性;如果所述占比低于或等于所述预设阈值,则所述原始标题的属性为非规范化属性。4.根据权利要求1所述的方法,其中,所述根据纠错后的标签进行每个分词的成分筛选和排序,包括:根据已获取的用户行为计算每个分词对应的标签的重要性;根据每个分词对应的标签的重要性选择相应的分词;将被选择的分词进行排序得到排序结果。5.根据权利要求4所述的方法,其中,所述根据已获取的用户行为计算每个分词对应的标签的重要性,包括:获得用户行为中的检索词;根据检索词对用户行为进行建模;根据所述建模的结果计...
【专利技术属性】
技术研发人员:桂敏,田俊峰,
申请(专利权)人:阿里巴巴新加坡控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。