一种词条召回方法、装置和用于召回词条的装置制造方法及图纸

技术编号:33016682 阅读:18 留言:0更新日期:2022-04-15 08:48
本申请实施例公开了一种词条召回方法、装置和用于召回词条的装置。该方法的实施例包括:获取目标用户的输入词序列;基于输入词序列和预先训练的深度树匹配模型,从候选词词表中召回目标词条;将目标词条发送至目标用户的客户端。该实施方式可召回符合用户输入习惯的个性化词条,提高了用户的输入效率。提高了用户的输入效率。提高了用户的输入效率。

【技术实现步骤摘要】
一种词条召回方法、装置和用于召回词条的装置


[0001]本申请实施例涉及计算机
,具体涉及一种词条召回方法、装置和用于召回词条的装置。

技术介绍

[0002]输入法客户端通常配置有系统词库,该词库中通常包含全量的高频词以及一些权威词、热点词等。在用户输入过程中,可从系统词库中选取若干词条作为候选项推荐给用户。
[0003]然而,随着越来越多的新词条、新表达方式不断涌现,不同用户的输入需求存在较大的差异化,且不同用户的偏好以及关注的领域不同,由此导致用户的一些个性化的高频词条往往无法入选系统词库,用户需要分段多次输入才能完成想要表达的词条,给用户带来不必要的输入代价,影响用户的输入效率。

技术实现思路

[0004]本申请实施例提出了一种词条召回方法,以解决现有技术中因用户的个性化的高频词条无法入选系统词库导致用户的输入效率较低的技术问题。
[0005]第一方面,本申请实施例提供了一种词条召回方法,该方法包括:获取目标用户的输入词序列;基于所述输入词序列和预先训练的深度树匹配模型,从所述候选词词表中召回目标词条;将所述目标词条发送至所述目标用户的客户端。
[0006]第二方面,本申请实施例提供了一种词条召回装置,该装置包括:获取单元,被配置成获取目标用户的输入词序列;召回单元,被配置成基于所述输入词序列和预先训练的深度树匹配模型,从所述候选词词表中召回目标词条;发送单元,被配置成将所述目标词条发送至所述目标用户的客户端。
[0007]第三方面,本申请实施例提供了一种用于召回词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行以下操作的指令:获取目标用户的输入词序列;基于所述输入词序列和预先训练的深度树匹配模型,从所述候选词词表中召回目标词条;将所述目标词条发送至所述目标用户的客户端。
[0008]第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所描述的方法。
[0009]本申请实施例提供的词条召回方法、装置和用于召回词条的装置,通过获取目标用户的输入词序列,而后基于输入词序列和预先训练的深度树匹配模型,从所述候选词词表中召回目标词条,最终将目标词条发送至目标用户的客户端,由此可为目标用户提供系统词库以外的目标词条。由于输入词序列能够体现目标用户个性化的输入特征以及用户的偏好,因而基于输入词序列从候选词词表中召回目标词条,能够使召回的目标词条能够满足用户的输入习惯和偏好。由此,基于所召回的目标词条进行候选项推荐,更易将用户需要
的词条推荐给用户,可降低用户的输入代价,提高用户的输入效率。
附图说明
[0010]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0011]图1是根据本申请的词条召回方法的一个实施例的流程图;
[0012]图2是根据本申请的词条召回方法的树模型的结构示意图
[0013]图3是根据本申请的词条召回装置的一个实施例的结构示意图;
[0014]图4是根据本申请的一种用于召回词条的装置的结构示意图;
[0015]图5是根据本申请的一些实施例中服务器的结构示意图。
具体实施方式
[0016]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。
[0017]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0018]请参考图1,其示出了根据本申请的词条召回方法的一个实施例的流程100。上述词条召回方法可运行于各种电子设备,上述电子设备包括但不限于:服务器、智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
[0019]本申请实施例中所提到的输入法应用能够支持多种输入法。其中,输入法可以是一种为了将各种符号输入到如计算机、手机等电子设备而采用的编码方法,用户可以使用输入法应用便利地将需要的字符或者字符串输入电子设备。需要注意的是,在本申请实施例中输入法除了支持常见的中文输入法(比如拼音输入法、五笔输入法、注音输入法、语音输入法、手写输入法等)以外,还可以支持其他语种的输入法(比如英文输入法、日文平假名输入法、韩文输入法等),在此不对输入法以及输入法的语言种类做任何限定。
[0020]本实施例中的词条召回方法,可以包括以下步骤:
[0021]步骤101,获取目标用户的输入词序列。
[0022]在本实施例中,词条召回方法的执行主体(如上述电子设备)可以获取目标用户的输入词序列。其中,目标用户可以是待对其进行词条推送的用户。输入词序列可以是从目标用户的输入信息中提取的词序列。目标用户的输入信息可以是目标用户在预设时长内通过输入法客户端所输入的信息。
[0023]此处,执行主体可以通过与候选词词表进行字符串匹配的方式,从目标用户的输入信息中抽取词序列。其中,候选词词表中的词条可以从大量用户(如全量用户)的用户语料中抽取得到。例如,候选词词表中可包括用户A的输入词“永恒战士、不诉离殇、雷霆半月斩、五辅助、公主切、海蓝时见鲸、约定的梦幻岛”、用户B的输入词“永恒战士、不诉离殇、雷
霆半月斩、五辅助、智慧晶、国服貂蝉、甜蜜双排、地狱咆哮、圣光雪狐”等。其中,用户语料可通过输入法客户端(包括但不限于智能手机、平板电脑、台式计算机、膝上型便携计算机等设备上安装的输入法客户端)收集。
[0024]步骤102,基于输入词序列和预先训练的深度树匹配模型,从候选词词表中召回目标词条。
[0025]在本实施例中,上述执行主体中可以部署有预先训练的深度树匹配模型。其中,深度树匹配(Tree-based Deep Match,TDM)模型是一种基于树结构的深度推荐模型。该模型可以基于用户行为序列,从大量的内容中检索出需要推荐给用户的目标内容。由此,可以以用户的输入词序列表征用户行为序列,使用该模型从候选词词表中召回目标词条,从而推荐给目标用户。
[0026]实践中,深度树匹配模型可使用现有的训练工具训练得到。例如,训练工具可以是XDL(X-Deep Learning)中的TDM模块(如Tree-based Deep Model for Recommender System本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种词条召回方法,其特征在于,所述方法包括:获取候选词词表和目标用户的输入词序列;基于所述输入词序列和预先训练的深度树匹配模型,从所述候选词词表中召回目标词条;将所述目标词条发送至所述目标用户的客户端。2.根据权利要求1所述的方法,其特征在于,所述深度树匹配模型包括树模型和深度神经网络,所述树模型的叶子节点与所述候选词词表中的词条一一对应。3.根据权利要求2所述的方法,其特征在于,所述基于所述输入词序列和预先训练的深度树匹配模型,从预先获取的候选词词表中召回目标词条,包括:基于所述输入词序列和所述深度神经网络,从所述树模型中选取预设数量的叶子节点;将所选取的叶子节点对应的词条作为目标词条,召回所述目标词条。4.根据权利要求3所述的方法,其特征在于,所述从所述树模型中选取预设数量的叶子节点,包括:将所述树模型的根节点作为第一层目标节点,按照从根节点到叶子节点的顺序,依次从每层目标节点的子节点中选取预设数量的节点作为下一层的目标节点,以得到所述预设数量的叶子节点。5.根据权利要求4所述的方法,其特征在于,所述依次从每层目标节点的子节点中选取预设数量的节点作为下一层的目标节点,包括:对于所述树模型的每一层目标节点,执行如下步骤:将该层目标节点的子节点进行聚类,得到多个簇;从所述多个簇中分别选择代表节点,并确定各代表节点的得分;将每个代表节点的得分作为该代表节点所属簇中的其他节点的得分,按照得分从该层目标节点的子节点中选取预设数量的节...

【专利技术属性】
技术研发人员:王丹崔欣
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1