搜索方法、装置及电子设备制造方法及图纸

技术编号:31507331 阅读:25 留言:0更新日期:2021-12-22 23:40
本公开提供了一种搜索方法、装置及电子设备,属于信息处理技术领域。该方法包括:获取正在直播的主播信息和用户输入的第一搜索词;根据搜索词和主播信息的搜索模型,确定第一搜索词和正在直播的主播信息的高阶交叉特征;基于该高阶交叉特征与每个直播对应的点击权重,对该正在直播的主播信息进行排序并显示;其中,高阶交叉特征,与高阶交叉特征和每个直播对应的点击权重,为基于点击样本数据和无点击样本数据学习得到的。基于本公开实施例提供的技术方案,能够解决搜索结果与用户意图的匹配度低的问题。的问题。的问题。

【技术实现步骤摘要】
搜索方法、装置及电子设备


[0001]本公开属于信息处理
,具体涉及一种搜索方法、装置及电子设备。

技术介绍

[0002]随着信息技术的发展,搜索服务可以应用于越来越多的场景中。用户可以根据显示的搜索结果确定是否继续操作。
[0003]目前,直播客户端通过ES(elastic search)搜索引擎提供搜索功能,该ES搜索引擎是基于文本匹配实现搜索功能。用户可以输入搜索词搜索正在进行的直播/主播,在用户使用ES搜索引擎搜索直播时,若用户搜索意图明确,例如,明确输入了gametype中文或者主播昵称等直接文本信息时,ES搜索引擎可以将最相关的直播/主播排在首位。
[0004]然而,在基于ES搜索引擎搜索的情况下,除了显示文本信息完全匹配的主播以外,其他靠前显示的主播是按照字或者词的粒度匹配的,即根据两个文本信息的字面重合程度进行匹配,会出现很多单字或者单词匹配的结果。若用户搜索的主播不在线,则会将部分匹配的结果置顶,用户搜索意图之外的搜索结果展示在搜索结果靠前的位置,导致显示的搜索结果与用户实际意图的匹配度低。

技术实现思路

[0005]本公开实施例的目的是提供一种搜索方法、装置及电子设备,能够解决搜索结果与用户意图的匹配度低的问题。
[0006]为了解决上述技术问题,本公开是这样实现的:
[0007]第一方面,本公开实施例提供了一种搜索方法,该方法包括:获取正在直播的主播信息和用户输入的第一搜索词;根据搜索词和主播信息的搜索模型,确定第一搜索词和每个直播的主播信息的高阶交叉特征,并基于该高阶交叉特征,与该高阶交叉特征和对应的点击权重,排序并显示所述正在直播的主播信息;其中,每个高阶交叉特征与对应的点击权重,为基于点击样本数据和无点击样本数据学习得到的。
[0008]第二方面,本公开实施例提供了一种搜索装置,搜索装置包括:获取模块、计算模块和显示模块;获取模块,用于获取正在直播的主播信息和用户输入的第一搜索词;计算模块,用于根据搜索词和主播信息的搜索模型,确定第一搜索词和每个直播的主播信息的高阶交叉特征,并基于该高阶交叉特征,与该高阶交叉特征与每个直播的重要性权重,排序所述正在直播的主播信息;显示模块,用于显示排序后的正在直播的主播信息;其中,每个高阶交叉特征对应的点击权重,为基于点击样本数据和无点击样本数据学习得到的。
[0009]第三方面,本公开实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的搜索方法的步骤。
[0010]第四方面,本公开实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的搜索方法的步骤。
[0011]第五方面,本公开实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的搜索方法。
[0012]在本公开实施例中,电子设备在获取到正在直播的主播信息和用户输入的搜索词之后,由于在搜索是采用搜索词和主播信息的搜索模型对搜索结果排序,即可以根据搜索词和每个主播信息的高阶交叉特征,与根据机器学习的高阶交叉特征对应的点击权重,将接近用户意图的搜索结果排列在靠前位置,避免仅根据搜索词和主播相关文本信息的字面重合度排序,导致主播不在线时将不接近用户搜索意图的直播显示在靠前位置,例如搜索词和主播信息的搜索模型根据机器学习到,大部分用户在搜索第一搜索词的时候是期望搜索到第一分类中的第一用户的直播,在第一用户未在线直播的情况下是期望搜索第一分类中的其他类似的用户的直播,则在用户输入第一搜索词的情况下,将直播的第一用户显示在首位,将其他与第一分类的直播排列在搜索结果靠前的显示位置;若搜索词对应的第一未上播,则可以将其他与第一分类的正在进行直播的主播或者直播间信息显示在搜索结果靠前的显示位置。
附图说明
[0013]图1为本公开实施例提供的一种搜索方法的流程示意图;
[0014]图2为本公开实施例提供的一种搜索模型的示意图;
[0015]图3为本公开实施例提供的一种Cross模块的示意图;
[0016]图4为本公开实施例提供的一种BiGraph

Bert模型的示意图;
[0017]图5为本公开实施例提供的一种点击二部图示意图;
[0018]图6为本公开实施例提供的一种辅助损失处理的逻辑示意图;
[0019]图7为本公开实施例提供的一种搜索性能比对示意图;
[0020]图8为本公开实施例提供的一种搜索装置可能的结构示意图;
[0021]图9为本公开实施例提供的一种电子设备可能的结构示意图;
[0022]图10为本公开实施例提供的一种电子设备的硬件示意图。
具体实施方式
[0023]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0024]本公开的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0025]下面结合附图,通过具体的实施例及其应用场景对本公开实施例提供的搜索方法
进行详细地说明。
[0026]图1为本公开实施例提供的一种搜索方法的流程示意图,如图1中所示,该搜索方法包括下述的S101至S103:
[0027]S101、电子设备获取正在直播的主播信息和用户输入的第一搜索词。
[0028]示例性地,电子设备可以接收用户在直播客户端中的搜索输入,该搜索的输入可以为用户输入的、也可以为用户选择的。
[0029]例如,用户可以在直播客户端中输入“晨时微凉”,以搜索与“晨时微凉”相关的直播。
[0030]S102、电子设备根据搜索词和主播信息的搜索模型,确定第一搜索词和正在直播的主播信息的高阶交叉特征。
[0031]S103、电子设备基于第一搜索词和每个直播的主播信息的高阶交叉特征,与该高阶交叉特征对应的点击权重,排序并显示正在直播的主播信息。
[0032]其中,每个高阶交叉特征对应的点击权重,为基于点击样本和无点击样本数据学习得到的。
[0033]示例性地,图2为本公开实施例提供的一种搜索模型的结构示意图。如图2中所示,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索方法,其特征在于,所述方法包括:获取正在直播的主播信息和用户输入的第一搜索词;根据搜索词和主播信息的搜索模型,确定所述第一搜索词和每个直播的主播信息的高阶交叉特征;基于所述高阶交叉特征,与所述高阶交叉特征对应的点击权重,排序并显示所述正在直播的主播信息;其中,每个高阶交叉特征对应的点击权重,为基于点击样本数据和无点击样本数据学习得到的。2.根据权利要求1所述的方法,其特征在于,所述搜索模型为基于BiGraph

Bert模型学习得到的,所述BiGraph

Bert模型的嵌入向量编码模块和Transformer模块之间连接Cross模块;所述根据搜索词和主播信息的搜索模型,确定所述第一搜索词和正在直播的主播信息的高阶交叉特征,包括:基于所述搜索词和主播信息的搜索模型的Cross模块,确定所述第一搜索词和每个正在直播的主播信息的高阶交叉特征。3.根据权利要求2所述的方法,其特征在于,所述BiGraph

Bert模型的样本数据包括:基于直播客户端的曝光日志和点击日志拼接的第一样本数据,所述第一样本包括点击样本和无点击样本;构造的搜索词和主播信息的第二样本数据;基于直播客户端的曝光日志和点击日志召回的第三样本数据。4.根据权利要求3所述的方法,其特征在于,所述获取正在直播的主播信息和用户输入的第一搜索词之前,所述方法还包括:基于BiGraph

Bert模型的样本数据,和所述BiGraph

Bert模型,学习得到搜索词和主播信息的搜索模型;其中,所述搜索词和主播信息的搜索模型包括:搜索词和主播信息的高阶交叉特征对应的点击权重。5.根据权利要求4所述的方法,其特征在于,所述基于BiGraph

Bert模型的样本数据,和BiGraph

Bert模型,学习得到搜索词和主播信息的搜索模型之前,所述方法还包括:获取直播客户端的曝光日志和点击日志;根据所述曝光日志和所述点击日志,拼接得到所述第一样本数据。6.根据权利要求4所述的方法,其特征在于,所述拼接得到第一样本数据之后,所述方法还...

【专利技术属性】
技术研发人员:赖弘基练质彬
申请(专利权)人:广州博冠信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1