基于长文本的信息推荐方法及装置制造方法及图纸

技术编号:22101934 阅读:29 留言:0更新日期:2019-09-14 03:20
本发明专利技术实施例公开了一种基于长文本的信息推荐方法,包括:对长文本进行意图识别,得到多个短文本,所述短文本为基于所述长文本中的分词扩展出的文本;对每一短文本进行意图识别,得到所述每一短文本的推荐信息;从所述每一短文本的推荐信息中获取与所述长文本中的分词关联的推荐信息;向用户推荐与所述长文本中的分词关联的推荐信息。由于向用户推荐的推荐信息是根据长文本中的分词从每一短文本的推荐信息中获取的,因此,能够减少推荐信息的数量,以便用户查找,并且,由于每一短文本是通过对长文本进行意图识别得到的,因此,还能够使推荐的信息更加精准。

Information Recommendation Method and Device Based on Long Text

【技术实现步骤摘要】
基于长文本的信息推荐方法及装置
本专利技术实施例涉及信息处理
,特别是涉及一种基于长文本的信息推荐方法及装置。
技术介绍
长文本,是指其中存在有多个分词(即具有实际意义的词语)的文本。在现有技术中,如果需要根据长文本向用户推荐信息,一般的,是对长文本进行分词,按照分词获取对应的热点内容或者是与分析相关的用户喜好的推荐内容,长文本分词较多,推荐内容也较多,用户想要获取感兴趣的内容需要在大量信息中搜索,非常不便。
技术实现思路
有鉴于此,本专利技术实施例提供了一种基于长文本的信息推荐方法及装置,能够减少向用户推荐的信息的数量,并且使得推荐的信息更加精准。为了解决上述问题,本专利技术实施例主要提供如下技术方案:第一方面,本专利技术实施例提供了一种基于长文本的信息推荐方法,该方法包括:对长文本进行意图识别,得到多个短文本,所述短文本为基于所述长文本中的分词扩展出的文本;对每一短文本进行意图识别,得到所述每一短文本的推荐信息;从所述每一短文本的推荐信息中获取与所述长文本中的分词关联的推荐信息;向用户推荐与所述长文本中的分词关联的推荐信息。第二方面,本专利技术实施例还提供一种基于长文本的信息推荐装置,该装置包括:获取模块,用于对长文本进行意图识别,得到多个短文本,所述短文本为基于所述长文本中的分词扩展出的文本;识别模块,用于对每一短文本进行意图识别,得到所述每一短文本的推荐信息;确定模块,用于从所述每一短文本的推荐信息中获取与所述长文本中的分词关联的推荐信息;推荐模块,用于向用户推荐与所述长文本中的分词关联的推荐信息。第三方面,本专利技术实施例提供一种电子设备,包括:至少一个处理器;以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述一个或多个技术方案中的方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述一个或多个技术方案中的方法。本专利技术实施例提供的基于长文本的信息推荐方法及装置,首先,对长文本进行意图识别,得到多个短文本,短文本为基于长文本中的分词扩展出的文本;然后,对每一短文本进行意图识别,得到每一短文本的推荐信息;接着,从每一短文本的推荐信息中获取与长文本中的分词关联的推荐信息;最后,向用户推荐与长文本中的分词关联的推荐信息。由于向用户推荐的推荐信息是根据长文本中的分词从每一短文本的推荐信息中获取的,因此,能够减少推荐信息的数量,以便用户查找,并且,由于每一短文本是通过对长文本进行意图识别得到的,因此,还能够使推荐的信息更加精准。上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术实施例的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本专利技术实施例中的基于长文本的信息推荐方法的流程示意图一;图2为本专利技术实施例中的基于长文本的信息推荐方法的流程示意图二;图3为本专利技术实施例中的基于长文本的信息推荐装置的结构示意图;图4为本专利技术实施例中的电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例提供了一种基于长文本的信息推荐方法,在实际应用中,当用户在电子设备上使用短信、微信等即时通讯类软件进行聊天时,或者在网页或应用程序内浏览新闻时,有时需要基于聊天界面或网页中的某一文本获得推荐信息,通过本专利技术实施例提供的基于长文本的信息推荐方法,能够基于用户选择的文本向用户推荐该文本的相关信息。尤其是当用户选择的文本为长文本时,能够避免向用户推荐大量的信息,实现信息的精准推荐。下面对本专利技术实施例提供的基于长文本的信息推荐方法进行详细说明。图1为本专利技术实施例中的基于长文本的信息推荐方法的流程示意图一,参见图1所示,该方法可以包括:S101:对长文本进行意图识别,得到多个短文本。其中,短文本为基于长文本中的分词扩展出的文本。所谓对长文本进行意图识别,就是识别出长文本中的意思。即用户看到例如新闻标题的文本后想要获知的更多信息,对于长文本来说,其中可以是存在有多个意思的,而这每一个意思所表现出来的就是一个短文本。举例来说,对于“短道世锦赛1500米范可新无缘决赛韩国包揽两金”这一长文本,对该长文本进行意图识别,就能够得到多个短文本。例如:“短道世锦赛金牌榜”、“短道世锦赛韩国名将”、“范可新有几块金牌”等文本。当然,得到的上述三个短文本仅为举例,通过对上述长文本进行意图识别,还可以得到其它的短文本,在此不做限定。S102:对每一短文本进行意图识别,得到每一短文本的推荐信息。在得到多个短文本后,还需要分别对每一个短文本进行意图识别。即识别每一个短文本的意图。例如:得到的短文本为“国贸大厦”,对该短文本进行意图识别,能够得到该短文本是一个基于地址的意图。再例如:得到的短文本为“明天上午九点”,对该短文本进行意图识别,能够得到该短文本是一个基于时间的意图。再例如:得到的短文本为“金牌榜”,对该短文本进行意图识别,能够得到该短文本是一个基于金牌数量推荐的意图。在识别出每一个短文本的意图后,根据意图的不同,要么是直接基于短文本的意图向用户进行推荐,要么是基于短文本的意图进行搜索,将搜索结果推荐给用户。例如:对于“明天上午九点”这一短文本,识别出该短文本是一个基于时间的意图,该用户可能需要进行记事,因此,就将记事本作为推荐信息。再例如:对于“金牌榜”这一短文本,识别出该短文本是一个基于金牌数量推荐的意图,因此,将“金牌榜”输入搜索引擎中进行搜索,就能够得到各种赛事的金牌获得情况,进而将各种赛事的金牌获得情况作为推荐信息。在这里,搜索引擎可以是百度、谷歌、必应等搜索引擎,当然,还可以是其它搜索引擎,在此不做具体限定。S103:从每一短文本的推荐信息中获取与长文本中的分词关联的推荐信息。由于每一个短文本的推荐信息都可能会存在数量较大的问题,这样不利于用户查找,因此,需要再次结合长文本,从每一短文本的推荐信息中筛选出与长文本中的分词存在关联的推荐信息。示例性的,对于“金牌榜”这一短文本,得到的推荐信息的数量就较多,例如:奥运会金牌榜、亚运会金牌榜、世锦赛金牌榜、亚锦赛金牌榜等等,而结合“短道世锦赛1500米范可新无缘决赛韩国包揽两金”这一长文本,就可以从众多的金牌榜中筛选出短道世锦赛金牌榜,进而较少推荐信息的数量,以便用户查找。S104:向用户推荐与长文本中的分词关联的推荐信息。在实际应用中,可以在用户当前使用的界面的下半部分界面中插入推荐信息,这样,既不会影响用户对于当前界面的使用,还能够基于用户本文档来自技高网...

【技术保护点】
1.一种基于长文本的信息推荐方法,其特征在于,包括:对长文本进行意图识别,得到多个短文本,所述短文本为基于所述长文本中的分词扩展出的文本;对每一短文本进行意图识别,得到所述每一短文本的推荐信息;从所述每一短文本的推荐信息中获取与所述长文本中的分词关联的推荐信息;向用户推荐与所述长文本中的分词关联的推荐信息。

【技术特征摘要】
1.一种基于长文本的信息推荐方法,其特征在于,包括:对长文本进行意图识别,得到多个短文本,所述短文本为基于所述长文本中的分词扩展出的文本;对每一短文本进行意图识别,得到所述每一短文本的推荐信息;从所述每一短文本的推荐信息中获取与所述长文本中的分词关联的推荐信息;向用户推荐与所述长文本中的分词关联的推荐信息。2.根据权利要求1所述的方法,其特征在于,所述对长文本进行意图识别,得到多个短文本,包括:获所述长文本中的多个分词;对所述长文本中的每一分词进行意图识别,得到所述每一分词对应的短文本,并将所述每一分词对应的短文本作为所述多个短文本。3.根据权利要求1所述的方法,其特征在于,所述对长文本进行意图识别,得到多个短文本,包括:获取所述长文本中的多个分词;将所述长文本中的至少两个分词进行合并,得到多个合并后的分词;计算所述多个合并后的分词的权重值,并将权重值大于或等于预设阈值的合并后的分词或者根据合并后的分词扩展出的短文本作为所述多个短文本。4.根据权利要求1所述的方法,其特征在于,所述对每一短文本进行意图识别,得到所述每一短文本的推荐信息,包括:通过分词处理、命名实体识别、语义分析中的一种或多种对每一短文本进行意图识别,得到所述每一短文本的推荐信息。5.根据权利要求1所述的方法,其特征在于,所述从所述每一短文本的推荐信息中获取与所述长文本中的分词关联的推荐信息,包括:确定所述每一短文本的推荐信息的数量;若所述每一短文本的推荐信息的数量大于或等于第一预设数量,则基于所述长文本中的分词,对所述每一短文本的推荐信息进行筛选,获得与所述长文本中的分词...

【专利技术属性】
技术研发人员:王卓然亓超马宇驰陈华荣温泉范彦革梁伟岳媛媛刁德纯曹圣明李宇舰王东亮赵巍林梓悦
申请(专利权)人:三角兽北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1