【技术实现步骤摘要】
文章推荐方法、装置、设备及存储介质
本申请涉及计算机
,特别涉及一种文章推荐方法、装置、设备及存储介质。
技术介绍
在互联网上阅读文章(例如新闻文章、博客文章、自媒体文章等)是人们获取信息的一种重要手段。随着互联网技术的发展,网络上的媒体平台可在用户帐号订阅该媒体平台的服务后向用户帐号推荐文章。相关技术中,用户通过在终端上登录用户帐号并订阅媒体平台的服务后,媒体平台定期或不定期地向用户帐号推送通过人工筛选的文章。例如,用户通过社交应用程序登录用户帐号后,通过社交应用程序关注社交平台上的科技新闻公众号,该科技新闻公众号会定期或不定期地向用户帐号推荐并发送人工筛选后的科技新闻。由于媒体平台向用户帐号推荐的文章是文章的正文,用户需要阅读文章的正文才能获取到文章中的有效信息,而文章的正文通常篇幅较长,因此用户难以快速获取得到有效信息,导致获取有效信息的效率较低。
技术实现思路
本申请实施例提供了一种文章推荐方法、装置、设备及存储介质,用以解决相关技术中的文章推荐方法导致获取有效信息的 ...
【技术保护点】
1.一种文章推荐方法,其特征在于,所述方法应用于服务器中,所述方法包括:/n接收语音终端发送的请求文本,所述请求文本是用于表示文章检索需求的文本信息,所述请求文本是所述语音终端在获取到用户语音信息后,识别所述用户语音信息得到的;/n根据所述请求文本在文章数据库中查询得到与所述请求文本相匹配的目标文章;/n获取所述目标文章对应的摘要信息,所述摘要信息是所述服务器调用摘要生成模型对所述目标文章进行处理后得到的,所述摘要生成模型是用于基于文章的正文内容生成所述文章的摘要信息的机器学习模型;/n向所述语音终端发送所述目标文章对应的摘要信息,所述摘要信息用于被所述语音终端以语音形式进行播放。/n
【技术特征摘要】
1.一种文章推荐方法,其特征在于,所述方法应用于服务器中,所述方法包括:
接收语音终端发送的请求文本,所述请求文本是用于表示文章检索需求的文本信息,所述请求文本是所述语音终端在获取到用户语音信息后,识别所述用户语音信息得到的;
根据所述请求文本在文章数据库中查询得到与所述请求文本相匹配的目标文章;
获取所述目标文章对应的摘要信息,所述摘要信息是所述服务器调用摘要生成模型对所述目标文章进行处理后得到的,所述摘要生成模型是用于基于文章的正文内容生成所述文章的摘要信息的机器学习模型;
向所述语音终端发送所述目标文章对应的摘要信息,所述摘要信息用于被所述语音终端以语音形式进行播放。
2.根据权利要求1所述的方法,其特征在于,所述摘要生成模型包括句子特征提取模型、句子打分模型以及摘要抽取模型;
所述接收语音终端发送的请求文本之前,还包括:
通过所述句子特征提取模型对所述目标文章进行分割,得到所述目标文章的至少一个句子;
通过所述句子特征提取模型提取所述句子的特征向量;
通过所述句子打分模型,根据所述句子的特征向量对所述句子进行打分,得到每个所述句子对应的分数;
通过所述摘要抽取模型,按照生成策略将所述分数排名靠前的x个句子,生成所述目标文章的摘要信息,x为正整数,x≥1。
3.根据权利要求2所述的方法,其特征在于,所述目标文章对应有m篇所述摘要信息,m为正整数,m≥2;
所述通过所述摘要抽取模型,按照生成策略将所述分数排名靠前的x个句子,生成所述目标文章的摘要信息,包括:
通过所述摘要抽取模型按照所述生成策略将所述分数排名靠前的xk个句子生成所述目标文章的第k篇摘要信息,1≤k≤m。
4.根据权利要求1至3任一所述的方法,其特征在于,所述根据所述请求文本查询得到与所述请求文本匹配的目标文章之前,还包括:
调用意图识别模型对所述请求文本进行处理,得到所述请求文本对应的用户意图,所述意图识别模型是识别所述请求文本的用户意图的机器学习模型;
当所述用户意图为推荐文章时,执行根据所述请求文本查询得到与所述请求文本匹配的目标文章的步骤。
5.根据权利要求4所述的方法,其特征在于,所述根据所述请求文本在文章数据库中查询得到与所述请求文本匹配的目标文章,包括:
当所述用户意图为推荐文章时,对所述请求文本进行语义识别,得到所述请求文本的特征词以及所述特征词对应的属性;
根据所述特征词以及所述特征词对应的属性,在所述文章数据库中查询得到与所述特征词和所述属性相匹配的候选文章;
调用排序模型对所述候选文章进行处理,得到所述候选文章的序号,所述排序模型是按照文章与所述请求文本的匹配度对所述文章排序的机器学习模型;
将所述序号在前预设位的候选文章作为所述目标文章。
6.根据权利要求5所述的方法,其特征在于,所述排序模型包括文章特征提取模型、文章打分模型以及文章排序模型;
所述调用排序模型对所述候选文章进行处理,得到所述候选文章的序号,包括:
通过所述文章特征提取模型提取所述候选文章的特征向量;
通过所述文章打分模型,根据所述候选文章的特征向量对所述候选文章进行打分,得到每个所述候选文章的分数,所述分数用于表示所述候选文章与所述请求文本的匹配度;
通过所述文章排序模型,根据每个所述候选文章的分数,按照分数从大到小的顺序对所述候选文章进行排序,得到所述候选文章的序号。
7.根据权利要求6所述的方法,其特征在于,所述请求文本中还携带有所述语音终端对应的用户帐号;
所述将序号在前预设位的候选文章作为所述目标文章,包括:
确定所述序号在前预设位的候选文章中是否包括已读文章,所述已读文章是所述用户帐号浏览过的文章;
当所述序号在前预设位的候选文章中包括所述已读文章时,将所述已读文章从所述序号在前预设位的候选文章中去除,将所述序号在前预设位的候选文章中除去所述已读文章的其它候选文章作为所述目标文章;或,当所述序号在前预设位的候选文章中不包括所述已读文章时,将所述序号在前预设位的候选...
【专利技术属性】
技术研发人员:赵丽娜,何鑫,郑渊,赵占平,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。