一种在社交媒体上发布的具有高关注度内容的机器撰写系统和方法技术方案

技术编号:21571542 阅读:27 留言:0更新日期:2019-07-10 15:24
本发明专利技术涉及一种在社交媒体上发布的具有高关注度内容的机器撰写系统及方法,其通过对用户所提供的关键词进行扩展,获取产品关键词,然后根据产品关键词在不同的社交媒体上获取包含产品关键词的社交媒体内容,通过对该包含产品关键词的社交媒体内容进行热度分析,获取热度排行榜,对热度排行榜中排行较高的社交媒体内容进行相似度分析,获取数量最多的相似内容,最后对该数量最多的相似内容进行排列组合,获取语义通顺的语句,得到最后的机器撰写结果,将该机器撰写结果提供给用户选择,从而替代用户撰写社交媒体上具有高关注度的发布内容。

A Machine Writing System and Method with High Concern Content Published on Social Media

【技术实现步骤摘要】
一种在社交媒体上发布的具有高关注度内容的机器撰写系统和方法
本专利技术涉及数据处理领域,具体涉及一种在社交媒体上发布的具有高关注度内容的机器撰写系统和方法。
技术介绍
由于社交媒体被广大网民所喜爱,成为了新的广告渠道,用户在社交媒体上发布产品广告软文时,其撰写内容常常侧重于产品介绍,大多无法获得高转发、评论或者点赞,存在缺少关注度的问题。对于这类基于社交媒体的广告软文,其传播推广的效率就相对比较低。
技术实现思路
本专利技术的目的在于提供一种在社交媒体上发布的具有高关注度内容的机器撰写系统和方法,通过该方法能够替代人撰写获得在社交媒体上具有高关注度的发布内容,从而提升发布内容的传播推广效率。为实现上述目的,本专利技术采用的技术方案是:一种在社交媒体上发布的具有高关注度内容的机器撰写系统,包括关键词扩展单元、社交媒体内容抓取单元、社交媒体内容过滤单元、社交媒体内容热度分析单元、内容撰写单元:关键词扩展单元:用户提供需要撰写的社交媒体发布内容的关键词,将该关键词进行扩展,得到产品关键词;社交媒体内容抓取单元:根据产品关键词在不同的社交媒体上搜索或抓取获得包含产品关键词的社交媒体内容;社交媒体内容过滤单元:通过已有的语义识别分析工具分析包含产品关键词的社交媒体内容,对该包含产品关键词的社交媒体内容进行过滤,剔除负面或无效内容;社交媒体内容热度分析单元:将过滤后的社交媒体内容在社交媒体上的互动行为数转化成为热度,并根据该热度从高到低对社交媒体内容进行排序,形成热度排行榜;其中,热度用于评价社交媒体内容在社交媒体上的价值;内容撰写单元:对热度排行榜前阈值比例的社交媒体内容使用相似度分析,计算相似度值,根据相似度值将多条社交媒体内容划分为多组,并获取包含社交媒体内条数最多的一组作为撰写资料,将撰写资料中的多条社交媒体内容进行排列组合,得到多个语义通顺的语句,作为最后的机器撰写结果供用户选择。一种在社交媒体上发布的具有高关注度内容的方法,包括以下步骤:步骤1、用户提供需要创建的社交内容的关键词;步骤2、将用户提供的关键词进行扩展,得到产品关键词;步骤3、根据产品关键词在不同的社交媒体上搜索或抓取获得包含产品关键词的社交媒体内容;步骤4、通过已有的语义识别分析工具分析包含产品关键词的社交媒体内容,对该包含产品关键词的社交媒体内容进行过滤;步骤5、将过滤后的社交媒体内容在社交媒体上的互动行为数转化成为热度,并根据该热度从高到低对社交媒体内容进行排序,形成热度排行榜;步骤6、在热度排行榜前阈值比例的社交媒体内容中使用相似度分析,计算相似度值,根据相似度值将多条社交媒体内容划分为多组,并获取包含社交媒体内条数最多的一组作为撰写资料;步骤7、将步骤6中获取的撰写资料中的多条社交媒体内容进行排列组合,得到多个语义通顺的语句,作为最后的机器撰写结果供用户选择。采用上述方案后,本专利技术通过对用户所提供的关键词进行扩展,获取产品关键词,然后根据产品关键词在不同的社交媒体上获取包含产品关键词的社交媒体内容,通过对该包含产品关键词的社交媒体内容进行热度分析,获取热度排行榜,对热度排行榜中排行较高的社交媒体内容进行相似度分析,获取数量最多的相似内容,最后对该数量最多的相似内容进行排列组合,获取语义通顺的语句,得到最后的机器撰写结果,将该机器撰写结果提供给用户选择,从而提高用户所要发表的社交信息在社交媒体上的关注度。附图说明图1为本专利技术流程图。具体实施方式如图1所示,本专利技术揭示了一种在社交媒体上发布的具有高关注度内容的机器撰写系统,包括关键词扩展单元、社交媒体内容抓取单元、社交媒体内容过滤单元、社交媒体内容热度分析单元、内容撰写单元:关键词扩展单元:用户提供需要撰写的社交媒体发布内容的关键词,将该关键词进行扩展,得到产品关键词;在进行关键词扩展时,可以采用同义关键词扩展、关联关键词扩展或语义关键词扩展。其中,同义关键词扩展是指依据词典中的近义词、同义词对关键词进行扩展,如“bike”扩展为“bike-bicycle”;关联关键词扩展,是指在同一范畴内扩展为更详细的关键词,如“运动鞋”扩展为“跑鞋-篮球鞋-滑板鞋”;语义关键词扩展,是指根据关键词语义进行扩展,如“sneaker”口语中用于指“运动鞋”,“AirForce”是一款运动鞋的商品名。社交媒体内容抓取单元:根据产品关键词在不同的社交媒体上搜索或抓取获得包含产品关键词的社交媒体内容,该社交媒体内容可以采用API接口获取、直接读取搜索结果、爬虫爬取等方式获取。社交媒体内容过滤单元:通过已有的语义识别分析工具分析包含产品关键词的社交媒体内容,对该包含产品关键词的社交媒体内容进行过滤,剔除负面或无效内容。如剔除具有歧视、色情、恐怖倾向、暴力倾向、政治敏感等负面内容,剔除广告、吐槽、投诉、无意义字符串等无效内容。社交媒体内容热度分析单元:将过滤后的社交媒体内容在社交媒体上的互动行为数转化成为热度,并根据该热度从高到低对社交媒体内容进行排序,形成热度排行榜;其中,热度用于评价社交媒体内容在社交媒体上的价值。因为不同行为付出的成本不同,基于最小行动原则,成本一般满足“点赞<评论<转发”,因此按照成本从低到高赋予的权重从低到高,用以形成评价指标热度。内容撰写单元:对热度排行榜前T%(例如前10%)的社交媒体内容使用相似度分析,计算相似度值,根据相似度值将多条社交媒体内容划分为多组,并获取包含社交媒体内条数最多的一组作为撰写资料,将撰写资料中的多条社交媒体内容进行排列组合,得到多个语义通顺的语句,作为最后的机器撰写结果供用户选择。一种在社交媒体上发布的具有高关注度内容的机器撰写方法,其包括以下步骤:步骤1、用户提供需要创建的社交内容的关键词;步骤2、将用户提供的关键词进行扩展,得到产品关键词;在进行关键词扩展时,可以采用同义关键词扩展、关联关键词扩展或语义关键词扩展。步骤3、根据产品关键词在不同的社交媒体上搜索或抓取获得包含产品关键词的社交媒体内容,该社交媒体内容可以采用API接口获取、直接读取搜索结果、爬虫爬取等方式获取。步骤4、通过已有的语义识别分析工具分析包含产品关键词的社交媒体内容,对该包含产品关键词的社交媒体内容进行过滤。如剔除具有歧视、色情、恐怖倾向、暴力倾向、政治敏感等负面内容,剔除广告、吐槽、投诉、无意义字符串等无效内容。步骤5、将过滤后的社交媒体内容在社交媒体上的互动行为数转化成为热度,并根据该热度从高到低对社交媒体内容进行排序,形成热度排行榜;其中,热度用于评价社交媒体内容在社交媒体上的价值。因为不同行为付出的成本不同,基于最小行动原则,成本一般满足“点赞<评论<转发”,因此按照成本从低到高赋予的权重从低到高,用以形成评价指标热度。本专利技术也可以参考社交媒体的热搜排行榜。步骤6、在热度排行榜前T%(例如前10%)的社交媒体内容中使用相似度分析,计算相似度值,根据相似度值将多条社交媒体内容划分为多组,并获取包含社交媒体内条数最多的一组作为撰写资料。步骤7、将步骤6中获取的撰写资料中的多条社交媒体内容进行排列组合,得到多个语义通顺的语句,作为最后的机器撰写结果供用户选择。本专利技术的关键在于,本专利技术通过对用户所提供的关键词进行扩展,获取产品关键词,然后根据产品关键词在不同本文档来自技高网...

【技术保护点】
1.一种在社交媒体上发布的具有高关注度内容的机器撰写系统,其特征在于包括关键词扩展单元、社交媒体内容抓取单元、社交媒体内容过滤单元、社交媒体内容热度分析单元、内容撰写单元:关键词扩展单元:用户提供需要撰写的社交媒体发布内容的关键词,将该关键词进行扩展,得到产品关键词;社交媒体内容抓取单元:根据产品关键词在不同的社交媒体上搜索或抓取获得包含产品关键词的社交媒体内容;社交媒体内容过滤单元:通过已有的语义识别分析工具分析包含产品关键词的社交媒体内容,对该包含产品关键词的社交媒体内容进行过滤,剔除负面或无效内容;社交媒体内容热度分析单元:将过滤后的社交媒体内容在社交媒体上的互动行为数转化成为热度,并根据该热度从高到低对社交媒体内容进行排序,形成热度排行榜;其中,热度用于评价社交媒体内容在社交媒体上的价值;内容撰写单元:对热度排行榜前阈值比例的社交媒体内容使用相似度分析,计算相似度值,根据相似度值将多条社交媒体内容划分为多组,并获取包含社交媒体内条数最多的一组作为撰写资料,将撰写资料中的多条社交媒体内容进行排列组合,得到多个语义通顺的语句,作为最后的机器撰写结果供用户选择。

【技术特征摘要】
2018.11.15 CN 201811359900X1.一种在社交媒体上发布的具有高关注度内容的机器撰写系统,其特征在于包括关键词扩展单元、社交媒体内容抓取单元、社交媒体内容过滤单元、社交媒体内容热度分析单元、内容撰写单元:关键词扩展单元:用户提供需要撰写的社交媒体发布内容的关键词,将该关键词进行扩展,得到产品关键词;社交媒体内容抓取单元:根据产品关键词在不同的社交媒体上搜索或抓取获得包含产品关键词的社交媒体内容;社交媒体内容过滤单元:通过已有的语义识别分析工具分析包含产品关键词的社交媒体内容,对该包含产品关键词的社交媒体内容进行过滤,剔除负面或无效内容;社交媒体内容热度分析单元:将过滤后的社交媒体内容在社交媒体上的互动行为数转化成为热度,并根据该热度从高到低对社交媒体内容进行排序,形成热度排行榜;其中,热度用于评价社交媒体内容在社交媒体上的价值;内容撰写单元:对热度排行榜前阈值比例的社交媒体内容使用相似度分析,计算相似度值,根据相似度值将多条社交媒体内容划分为多组...

【专利技术属性】
技术研发人员:高阳孙锦彬王凯锋
申请(专利权)人:厦门笨鸟电子商务有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1