线上服务实体的文案信息生成方法及装置制造方法及图纸

技术编号:24576450 阅读:45 留言:0更新日期:2020-06-21 00:26
本发明专利技术公开了一种线上服务实体的文案信息生成方法及装置,该方法包括:采集待展示线上服务实体的多个预设维度的描述信息;从各个维度的描述信息中提取关键分词,在建立的词典中查询所述关键分词,根据查询结果构建所述待展示线上服务实体的描述向量;将所述描述向量输入至训练好的文案预测模型中,根据所述文案预测模型输出的文案向量生成所述待展示线上服务实体的文案信息。本发明专利技术方案,依据待展示线上服务对象的描述信息构建描述向量,并生成该待展示服务对象的文案信息,进而可以快速、准确的生成文案信息并进行展示。

A method and device for generating copywriting information of online service entities

【技术实现步骤摘要】
线上服务实体的文案信息生成方法及装置
本专利技术涉及互联网
,具体涉及一种线上服务实体的文案信息生成方法及装置。
技术介绍
近年来,随着互联网技术的发展,依赖线上平台满足日常的需求已越来越普遍,例如,利用购物平台进行购物,利用本地生活应用完成点餐、预约服务等等。与此同时,这些平台通过为平台上的实体赋予相应的标签,来区分不同实体的实体特征。在现有技术中,通常是选取某一维度的特征来作为实体的标签,例如,选取用户评价特征作为店铺的标签,这种方式能够从一定程度上区别不同实体的实体特征,但是该标签过于单一,尤其是针对一些特征维度较多的实体,根本无法全面的体现该实体的特征。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的线上服务实体的文案信息生成方法及装置。根据本专利技术实施例的一个方面,提供了一种线上服务实体的文案信息生成方法,包括:采集待展示线上服务实体的多个预设维度的描述信息;从各个维度的描述信息中提取关键分词,在建立的词典中查询所述关键分词,根据查询结果构建所述待展示线上服务实体的描述向量;将所述描述向量输入至训练好的文案预测模型中,根据所述文案预测模型输出的文案向量生成所述待展示线上服务实体的文案信息。可选的,所述词典通过如下步骤建立:采集多个线上服务实体的多个预设维度的描述信息;统计所述多个线上服务实体的多个预设维度的描述信息中包含的多个词语及其词频;按照多个词语的词频由高至低的顺序对多个词语进行排序,根据排序结果建立包含多个词语及其排序编号的词典。可选的,所述在建立的词典中查询所述关键分词,根据查询结果构建所述线上服务实体的描述向量进一步包括:在所述词典中查询所述关键分词,根据词典中所述关键分词的排序编号构建所述线上服务实体的描述向量。可选的,所述多个预设维度包括评价信息维度,所述方法还包括:采集多个线上服务实体的评价信息维度的描述信息,对所述多个线上服务实体的评价信息维度的描述信息进行分词处理;对得到的多个分词中的停顿词进行过滤处理,根据过滤结果确定多个评价分词;统计多个评价分词在所述多个线上服务实体的评价信息维度的描述信息中的出现频率;根据出现频率由高至低的顺序从所述多个评价分词中选出预设数量的候选分词并构成评价热词候选集;所述从各个维度的描述信息中提取关键分词进一步包括:从待展示线上服务实体的评价信息维度的描述信息中拆分出多个待选评价分词,将所述多个待选评价分词与评价热词候选集中的候选分词进行匹配,根据匹配结果从多个待选评价分词中筛选出关键分词。可选的,所述多个预设维度包括入驻店铺信息维度;所述采集待展示线上服务实体的多个预设维度的描述信息进一步包括:将所述待展示线上服务实体的入驻店铺与品牌店铺库进行匹配,若所述入驻店铺包含在品牌店铺库中,则采集所述入驻店铺的品牌信息;若所述入驻店铺不包含在品牌店铺库中,则采集所述入驻店铺的标识信息和地理位置信息。可选的,所述多个预设维度包括实体属性信息维度;所述采集待展示线上服务实体的多个预设维度的描述信息进一步包括:采集待展示线上服务实体的从业时间信息、培训进修信息、角色信息和/或证书信息。可选的,所述多个预设维度还包括活动信息维度。可选的,所述文案预测模型通过以下步骤训练得到:确定多个线上服务实体样本;获取每个线上服务实体样本的多个预设维度的描述信息样本,从各个维度的描述信息样本中提取关键分词样本,在建立的词典中查询所述关键分词样本,根据查询结果构建所述线上服务实体样本的描述向量样本,将所述描述向量样本作为训练输入数据;对每个线上服务实体样本的已配置文案信息进行分词处理,得到多个文案分词样本,在建立的词典中查询所述多个文案分词样本,根据查询结果构建所述线上服务实体样本的文案向量样本,将所述文案向量样本作为训练输出数据;利用所述训练输入数据和训练输出数据对神经网络模型进行训练,根据训练结果得到文案预测模型。根据本专利技术实施例的另一方面,提供了一种线上服务实体的文案信息生成装置,包括:采集模块,适于采集待展示线上服务实体的多个预设维度的描述信息;构建模块,适于从各个维度的描述信息中提取关键分词,在建立的词典中查询所述关键分词,根据查询结果构建所述待展示线上服务实体的描述向量;生成模块,适于将所述描述向量输入至训练好的文案预测模型中,根据所述文案预测模型输出的文案向量生成所述待展示线上服务实体的文案信息。可选的,所述装置还包括:词典建立模块,适于:采集多个线上服务实体的多个预设维度的描述信息;统计所述多个线上服务实体的多个预设维度的描述信息中包含的多个词语及其词频;按照多个词语的词频由高至低的顺序对多个词语进行排序,根据排序结果建立包含多个词语及其排序编号的词典。可选的,所述构建模块进一步适于:在所述词典中查询所述关键分词,根据词典中所述关键分词的排序编号构建所述线上服务实体的描述向量。可选的,所述多个预设维度包括评价信息维度,所述装置还包括:评价热词筛选模块,适于采集多个线上服务实体的评价信息维度的描述信息,对所述多个线上服务实体的评价信息维度的描述信息进行分词处理;对得到的多个分词中的停顿词进行过滤处理,根据过滤结果确定多个评价分词;统计多个评价分词在所述多个线上服务实体的评价信息维度的描述信息中的出现频率;根据出现频率由高至低的顺序从所述多个评价分词中选出预设数量的候选分词并构成评价热词候选集;所述构建模块进一步适于:从待展示线上服务实体的评价信息维度的描述信息中拆分出多个待选评价分词,将所述多个待选评价分词与评价热词候选集中的候选分词进行匹配,根据匹配结果从多个待选评价分词中筛选出关键分词。可选的,所述多个预设维度包括入驻店铺信息维度;所述采集模块进一步适于:将所述待展示线上服务实体的入驻店铺与品牌店铺库进行匹配,若所述入驻店铺包含在品牌店铺库中,则采集所述入驻店铺的品牌信息;若所述入驻店铺不包含在品牌店铺库中,则采集所述入驻店铺的标识信息和地理位置信息。可选的,所述多个预设维度包括实体属性信息维度;所述采集模块进一步适于:采集待展示线上服务实体的从业时间信息、培训进修信息、角色信息和/或证书信息。可选的,所述多个预设维度还包括活动信息维度。可选的,所述装置还包括:训练模块,适于确定多个线上服务实体样本;获取每个线上服务实体样本的多个预设维度的描述信息样本,从各个维度的描述信息样本中提取关键分词样本,在建立的词典中查询所述关键分词样本,根据查询结果构建所述线上服务实体样本的描述向量样本,将所述描述向量样本作为训练输入数据;对每个线上服务实体样本的已配置文案信息进行分词处理,得到多个文案分词样本,在建立的词典中查询所述多个文案分词样本,根据查询结果构建所述线本文档来自技高网...

【技术保护点】
1.一种线上服务实体的文案信息生成方法,包括:/n采集待展示线上服务实体的多个预设维度的描述信息;/n从各个维度的描述信息中提取关键分词,在建立的词典中查询所述关键分词,根据查询结果构建所述待展示线上服务实体的描述向量;/n将所述描述向量输入至训练好的文案预测模型中,根据所述文案预测模型输出的文案向量生成所述待展示线上服务实体的文案信息。/n

【技术特征摘要】
1.一种线上服务实体的文案信息生成方法,包括:
采集待展示线上服务实体的多个预设维度的描述信息;
从各个维度的描述信息中提取关键分词,在建立的词典中查询所述关键分词,根据查询结果构建所述待展示线上服务实体的描述向量;
将所述描述向量输入至训练好的文案预测模型中,根据所述文案预测模型输出的文案向量生成所述待展示线上服务实体的文案信息。


2.根据权利要求1所述的方法,其中,所述词典通过如下步骤建立:
采集多个线上服务实体的多个预设维度的描述信息;
统计所述多个线上服务实体的多个预设维度的描述信息中包含的多个词语及其词频;
按照多个词语的词频由高至低的顺序对多个词语进行排序,根据排序结果建立包含多个词语及其排序编号的词典。


3.根据权利要求2所述的方法,其中,所述在建立的词典中查询所述关键分词,根据查询结果构建所述线上服务实体的描述向量进一步包括:
在所述词典中查询所述关键分词,根据词典中所述关键分词的排序编号构建所述线上服务实体的描述向量。


4.根据权利要求1-3任一项所述的方法,其中,所述多个预设维度包括评价信息维度,所述方法还包括:
采集多个线上服务实体的评价信息维度的描述信息,对所述多个线上服务实体的评价信息维度的描述信息进行分词处理;对得到的多个分词中的停顿词进行过滤处理,根据过滤结果确定多个评价分词;
统计多个评价分词在所述多个线上服务实体的评价信息维度的描述信息中的出现频率;
根据出现频率由高至低的顺序从所述多个评价分词中选出预设数量的候选分词并构成评价热词候选集;
所述从各个维度的描述信息中提取关键分词进一步包括:
从待展示线上服务实体的评价信息维度的描述信息中拆分出多个待选评价分词,将所述多个待选评价分词与评价热词候选集中的候选分词进行匹配,根据匹配结果从多个待选评价分词中筛选出关键分...

【专利技术属性】
技术研发人员:殷晓明
申请(专利权)人:口碑上海信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1