一种基于输入法应用的新用户的冷启动方法及设备技术

技术编号:23148566 阅读:31 留言:0更新日期:2020-01-18 13:16
本申请的目的是提供一种基于输入法应用的新用户的冷启动方法及设备,本申请通过获取输入法应用中的新用户对应的终端所安装的应用程序列表,应用程序列表包括至少一个应用程序;根据应用程序列表与新用户的应用程序列表相同的所有其他用户对词汇的使用频次,确定新用户的初始推荐词库;将新用户的应用程序列表和初始推荐词库输入至已训练好的词汇召回模型,预测初始推荐词库中的每个初始推荐词汇的使用概率;根据使用概率从初始推荐词库中确定出新用户在所述输入法应用中的冷启动词库,以便新用户在输入法应用中进行词汇首次输入时,可以更精准地向新用户推荐与输入的词汇更相关的词汇,从而提高新用户的输入法使用体验。

A new user's cold start method and equipment based on input method application

【技术实现步骤摘要】
一种基于输入法应用的新用户的冷启动方法及设备
本申请涉及计算机领域,尤其涉及一种基于输入法应用的新用户的冷启动方法及设备。
技术介绍
现有输入法中,用户在首次使用一种输入法时,一般根据用户自身的输入需求,使用拼音、手写等方式拼写出词语,再在弹出的所有词语中选择自己需要的词汇,比如单字、成语、词语或句子等,在此,现有输入法向用户首次输入的词汇进行弹出的方式可以是根据用户预先下载的常用领域相关词包中选择弹出,也可以是根据马尔可夫链技术将历史中输入了某一词汇的所有人中最多人选择的词汇作为向用户首次输入该某一词汇时所推荐的词汇。当然,用户在输入法中首次输入词汇时,只有在用户多次输入同一个词汇后,输入法才能记住用户的个人习惯,但面对另一个陌生的词,又会出现同样的问题,导致无法向该输入法的新用户进行首次输入词汇的精准推荐。
技术实现思路
本申请的一个目的是提供一种基于输入法应用的新用户的冷启动方法及设备,以解决现有技术中无法向输入法应用中的新用户首次输入词汇时进行相关词汇的精准推荐的问题。根据本申请的一个方面,提供了一种基于输入本文档来自技高网...

【技术保护点】
1.一种基于输入法应用的新用户的冷启动方法,其特征在于,所述方法包括:/n获取输入法应用中的新用户对应的终端所安装的应用程序列表,所述应用程序列表包括至少一个应用程序;/n根据应用程序列表与所述新用户的应用程序列表相同的所有其他用户对词汇的使用频次,确定所述新用户的初始推荐词库;/n将所述新用户的应用程序列表和所述初始推荐词库输入至词汇召回模型,预测所述初始推荐词库中的每个初始推荐词汇的使用概率;/n根据所述使用概率从所述初始推荐词库中确定出所述新用户在所述输入法应用中的冷启动词库。/n

【技术特征摘要】
1.一种基于输入法应用的新用户的冷启动方法,其特征在于,所述方法包括:
获取输入法应用中的新用户对应的终端所安装的应用程序列表,所述应用程序列表包括至少一个应用程序;
根据应用程序列表与所述新用户的应用程序列表相同的所有其他用户对词汇的使用频次,确定所述新用户的初始推荐词库;
将所述新用户的应用程序列表和所述初始推荐词库输入至词汇召回模型,预测所述初始推荐词库中的每个初始推荐词汇的使用概率;
根据所述使用概率从所述初始推荐词库中确定出所述新用户在所述输入法应用中的冷启动词库。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
训练并确定所述词汇召回模型,其中,所述词汇召回模型用于预测所述输入法应用中的用户对词汇的使用概率。


3.根据权利要求2所述的方法,其特征在于,所述训练并确定所述词汇召回模型,其中,所述词汇召回模型用于预测所述输入法应用中的用户对词汇的使用概率,包括:
获取所述输入法应用中的、最热门的第一预设数量的词汇作为用于训练所述词汇召回模型的候选词汇;
获取所述输入法应用中的、所有使用用户对应的终端所安装的应用程序列表和使用词汇的历史数据;
根据所述第一预设数量的候选词汇、所有所述使用用户的应用程序列表和使用词汇的所述历史数据,确定用于训练所述词汇召回模型的正样本和负样本;
对所述正样本和所述负样本进行训练,确定用于预测所述输入法应用中的用户对词汇的使用概率的所述词汇召回模型。


4.根据权利要求3所述的方法,其特征在于,所述根据所述第一预设数量的候选词汇、所有所述使用用户的应用程序列表和使用词汇的所述历史数据,确定用于训练所述词汇召回模型的正样本和负样本,包括:
将所述第一预设数量的候选词汇、所有所述使用用户的应用程序列表和使用词汇的所述历史数据处理为用户、应用程序列表、候选词汇及是否使用所述候选词汇的四维数组;
将使用过所述候选词汇的使用用户对应的应用程序列表和候选词汇作为所述正样本,同时将未使用所述候选词汇的使用用户对应的应用程序列表和候选词汇作为所述负样本。


5.根据权利要求4所述的方法,其特征在于,所述将所述第一预设数量的候选词汇、所有所述使用用户的应用程序列表和使用词汇的所述历史数据处理为用户、应用程序列表、候选词汇及是否使用所述候选词汇的四维数组,包括:
从所述第一预设数量的候选词汇中任选一词汇作为目标候选词汇,重复如下操作直至遍历完所述第一预设数量的候选词汇,以得到用户、应用程序列表、候选词汇及是否使用...

【专利技术属性】
技术研发人员:陈文涛郑小宾
申请(专利权)人:连尚新昌网络科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1