【技术实现步骤摘要】
一种信息处理方法和系统
本说明书实施例涉及大数据领域,特别涉及一种信息处理方法和系统。
技术介绍
大数据时代为人们的生活和工作带来了诸多便利。例如,传统的营销文案需要由专人设计,而现有的一些场景下,用户只需输入关键词,即可获得机器由该关键词自动生成的营销文案。然而,由于用户输入的只有关键词,缺乏其他相关信息,机器很难识别出用户的真实兴趣(或意图),生成迎合用户兴趣的文案。因此,希望提供一种技术方案,能够从用户输入的关键词中精准识别出用户兴趣以自动生成迎合用户兴趣的文案。
技术实现思路
本说明书中的一些实施例提供一种信息处理方法,包括:获取原始关键词;根据所述原始关键词得到关键词集合,所述关键词集合包括所述原始关键词在内的至少一个关键词;基于所述关键词集合中的关键词从预设文本库中检索出一个或多个关键词对应文本;用机器学习模型处理一个或多个关键词对应文本,得到一个或多个关键词的兴趣成分;统计在所述一个或多个关键词的兴趣成分中各兴趣成分出现的频次,根据统计结果确定所述原始关键词的兴趣成分。本说明 ...
【技术保护点】
1.一种信息处理方法,包括:/n获取原始关键词;/n根据所述原始关键词得到关键词集合,所述关键词集合包括所述原始关键词在内的至少一个关键词;/n基于所述关键词集合中的关键词从预设文本库中检索出一个或多个关键词对应文本;/n用机器学习模型处理一个或多个关键词对应文本,得到一个或多个关键词的兴趣成分;/n统计在所述一个或多个关键词的兴趣成分中各兴趣成分出现的频次,根据统计结果确定所述原始关键词的兴趣成分。/n
【技术特征摘要】
1.一种信息处理方法,包括:
获取原始关键词;
根据所述原始关键词得到关键词集合,所述关键词集合包括所述原始关键词在内的至少一个关键词;
基于所述关键词集合中的关键词从预设文本库中检索出一个或多个关键词对应文本;
用机器学习模型处理一个或多个关键词对应文本,得到一个或多个关键词的兴趣成分;
统计在所述一个或多个关键词的兴趣成分中各兴趣成分出现的频次,根据统计结果确定所述原始关键词的兴趣成分。
2.根据权利要求1所述的信息处理方法,所述根据所述原始关键词得到关键词集合包括:
确定所述原始关键词的至少一个同义词;
根据所述原始关键词和所述至少一个同义词构建所述关键词集合。
3.根据权利要求1或2所述的信息处理方法,所述根据所述原始关键词得到关键词集合包括:
获取多个候选词;
确定所述原始关键词和每个候选词的词向量;
根据所述原始关键词和每个候选词的词向量确定每个候选词与所述原始关键词的相似度;
从所述多个候选词中选出与所述原始关键词的相似度满足设定条件的至少一个候选词;
根据所述原始关键词和所选出的至少一个候选词构建所述关键词集合。
4.根据权利要求1所述的信息处理方法,所述机器学习模型为以下中的一种:
长短期记忆和条件随机场模型;
条件随机场模型;或
隐马尔可夫模型。
5.根据权利要求1所述的信息处理方法,所述兴趣成分包括利益成分,所述利益成分用于指示其对应的关键词携带利益信息。
6.根据权利要求1所述的信息处理方法,所述根据统计结果确定所述原始关键词的兴趣成分包括:
将在所述一个或多个关键词的兴趣成分中出现的频次最大的兴趣成分确定为所述原始关键词的兴趣成分。
7.一种信息处理系统,包括:
原始关键词获取模块,用于获取原始关键词;
关键词集合获取模块,用于根据所述原始关键词得到关键词集合,所述关键词集合包括所述原始关键词在内的至少一个关键词;
文本检索模块,用于基于所述关...
【专利技术属性】
技术研发人员:康潮明,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。