信息处理方法及装置、终端设备以及计算机可读存储介质制造方法及图纸

技术编号:17655297 阅读:40 留言:0更新日期:2018-04-08 08:32
本发明专利技术提供一种信息处理方法、信息处理装置、终端设备以及计算机存储介质。该信息处理方法包括:从预定文本中获取多个候选词条;据各个所述候选词条的词条属性,从所述多个候选词条中确定所述预定文本的关键词条;以及基于用户属性信息对所述关键词条进行选择,以将存储在预定数据库中的、与所选择的关键词条对应的详细信息呈现给用户。根据本发明专利技术的信息处理方法、信息处理装置、终端设备以及计算机存储介质至少能够使阅读文章的用户更有效地获得其所需要的关键词条的详细信息。

【技术实现步骤摘要】
信息处理方法及装置、终端设备以及计算机可读存储介质
本专利技术涉及文本信息处理领域,尤其涉及一种在用户阅读文章时为用户提供关键词的详细信息的信息处理方法、信息处理装置、终端设备以及计算机可读存储介质。
技术介绍
随着互联网的普及,人们越来越多地通过阅读互联网上刊载的文章来获取信息。网络文章(如Feed流文章)通常内容生动,事件性、故事性更强。为了保证文章的连贯性,在网络文章中通常不会对文章主体或较为生僻实体(例如,专有名词、名人、历史事件、植物、动物、武器等)做详细描述。而为了让用户在阅读文章之余,能够便捷地获取对于文章主体的详细信息和/或专业知识,从而更加深入和全面地了解文章内容,需要一种能够使得用户在阅读网络文章时获得关于文章中关键词条的详细信息的信息处理方法和装置。
技术实现思路
本专利技术实施例提供一种信息处理方法、信息处理装置、终端设备以及计算机可读存储介质,以至少解决现有技术中的以上技术问题。第一方面,本专利技术实施例提供了一种信息处理方法,包括:从预定文本中获取多个候选词条;根据各个所述候选词条的词条属性,从所述多个候选词条中确定所述预定文本的关键词条;以及基于用户属性信息对所述关键词条进行选择,以将存储在预定数据库中的、与所选择的关键词条对应的详细信息呈现给用户。第二方面,本专利技术实施例提供了一种信息处理装置,包括:获取单元,用于从预定文本中获取多个候选词条;确定单元,用于根据各个所述候选词条的词条属性,从所述多个候选词条中确定所述预定文本的关键词条;以及选择单元,用于基于用户属性信息对所述关键词条进行选择,以将存储在预定数据库中的、与所选择的关键词条对应的详细信息呈现给用户。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。第三方面,本专利技术实施例提供了一种终端设备,所述终端设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的信息处理方法。所述终端设备还可以包括通信接口,用于终端设备与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,其中,该程序被处理器执行时实现如上所述的信息处理方法。上述技术方案中的一个技术方案至少具有如下优点或有益效果:能够使阅读文章的用户更有效地获得其所需要的关键词条的详细信息。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为根据本专利技术一个实施例的信息处理方法的示例性流程图。图2示出了根据本专利技术实施例的从预定文本获取候选词条的一种示例性处理。图3示例性示出了示出了根据本专利技术实施例的基于候选词条的词条属性、从所述多个候选词条中确定所述预定文本的关键词条的一种示例性处理。图4示出了根据本专利技术实施例的基于候选词条的词条属性、从所述多个候选词条中确定所述预定文本的关键词条的另一种示例性处理。图5示出了根据本专利技术实施例的一种信息处理装置的示例性结构。图6示出了根据本专利技术实施例的一种终端设备的示例性结构。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。本专利技术实施例提供一种信息处理方法,以便用户在阅读文章时能够个性化地获取关于文章中的关键词条的详细信息。图1是根据本专利技术一个实施例的信息处理方法的示例性流程图。如图1所示,根据本专利技术一个实施例的信息处理方法包括以下步骤:在步骤S101,从预定文本中获取多个候选词条;在步骤S102,根据各个所述候选词条的词条属性,从所述多个候选词条中确定所述预定文本的关键词条;以及在步骤S103,基于用户属性信息对所述关键词条进行选择,以将存储在预定数据库中的、与所选择的关键词条对应的详细信息呈现给用户。根据本专利技术的实施例,预定文本例如可以是用户想要浏览的文章、如Feed流文章。在步骤S101,例如可以通过对预定文本进行文本分析,来获取候选词条。根据本专利技术的实施例,与关键词条对应的详细信息可以包括对于该关键词条的解释信息、说明信息和/或专业信息等,用户通过详细信息可以了解对于该关键词条的更详尽的说明,从而有助于用户理解包括该关键词条的文章。。图2示出了根据本专利技术实施例的从预定文本获取候选词条的一种示例性处理。如图2所示,从预定文本获取多个候选词条包括:在步骤S1011,对所述预定文本进行文本分析,从而获取预定文本中的实体词条;以及在步骤S1012,将所述实体词条与所述预定数据库中存储的词条进行匹配,以获取相匹配的实体词条作为所述候选词条。根据本专利技术的实施例,在步骤S1011,可以使用现有技术中已知的任何方法对预定文本进行文本分析,例如可以使用现有技术中已知的命名实体识别技术(如,百度命名实体识别、StanfordNLP、哈工大的LTP等)对文章进行句法分析、即切词,从而得到文章中实体词条、例如人名、地名、机构名、专有名词等。上述文本分析方法是本领域公知的,在此省略了对其具体处理的详细描述。在获得了实体词条之后,在步骤S1012,例如可以通过将每个实体词条与预定数据库中存储的词条进行匹配,从而将与数据库中存储的词条相对应的实体词条作为候选词条。根据本专利技术的实施例,预定数据库可以是关联地存储有实体词条及其详细信息的专业数据库。例如,预定数据库可以是百度百科数据库、维基百科数据库等等。根据本专利技术的实施例,在步骤S1012,可以将在步骤S1011获得的实体词条中的、与预定数据库中存储的词条相匹配的每个实体词条作为候选词条,从而形成候选词条集合。也就是说,根据本公开的实施例,候选词条集合可以包括在预定数据库中存储有其详细信息的多个实体词条。虽然以上描述了通过上述步骤S1011、S1012获取候选词条,但是本专利技术不限于此,例如也可以直接获取通过对文章进行文本分析而获得的所有实体词条作为候选词条。在通过步骤S101获取的多个候选词条中,很多并非预定文本中的主要描述对象,其对于理解预定文本的内容可能不具有实际意义。为了更准确地辅助用户理解其所阅读的预定文本的内容,根据本专利技术的实施例,在获取了候选词条之后,可以在步骤S102,基于候选词条的词条属性,从多个候选词条中确定预定文本的关键词条。图3示出了根据本专利技术实施例的基于候选词条的词条属性、从所述多个候选词条中确定所述预定文本的关键词条的一种示例性处理。如图3所示,从所述多个候选词条中确定所述预定文本的关键词条可以包括:在步骤S1021,根据所述候选词条的词条属性计算所述候选词条的词条重要度;以及在步骤S1022,将所述词条重要度大于第一阈值的候选词条确定为所述预定文本的关键词条。根据本专利技术的实施例,本文档来自技高网...
信息处理方法及装置、终端设备以及计算机可读存储介质

【技术保护点】
一种信息处理方法,包括:从预定文本中获取多个候选词条;根据各个所述候选词条的词条属性,从所述多个候选词条中确定所述预定文本的关键词条;以及基于用户属性信息对所述关键词条进行选择,以将存储在预定数据库中的、与所选择的关键词条对应的详细信息呈现给用户。

【技术特征摘要】
1.一种信息处理方法,包括:从预定文本中获取多个候选词条;根据各个所述候选词条的词条属性,从所述多个候选词条中确定所述预定文本的关键词条;以及基于用户属性信息对所述关键词条进行选择,以将存储在预定数据库中的、与所选择的关键词条对应的详细信息呈现给用户。2.根据权利要求1所述的信息处理方法,其中,从预定文本获取多个候选词条包括:对所述预定文本进行文本分析,从而获取预定文本中的实体词条;以及将所述实体词条与所述预定数据库中存储的词条进行匹配,以获取相匹配的实体词条作为所述候选词条。3.根据权利要求1或2所述的信息处理方法,其中,所述候选词条的词条属性包括:候选词条在所述预定文本中的词频、档频、候选词条在所述预定文本中的位置至少其中之一。4.根据权利要求1-3中任一项所述的信息处理方法,其中,从所述多个候选词条中确定所述预定文本的关键词条包括:根据所述候选词条的词条属性计算所述候选词条的词条重要度;以及将所述词条重要度大于第一阈值的候选词条确定为所述预定文本的关键词条。5.根据权利要求1-3中任一项所述的信息处理方法,其中,从所述多个候选词条中确定所述预定文本的关键词条包括:根据所述候选词条的词条属性计算所述候选词条的词条重要度;以及由所述预定文本的作者从词条重要度大于第二阈值的候选词条中选择所述预定文本的关键词条。6.根据权利要求1-5中任一项所述的信息处理方法,其中,所述用户属性信息基于用户在阅读文章时的历史点击行为、历史搜索行为至少其中之一而确定,其中,基于用户属性信息对所述关键词条进行选择包括将所述用户属性信息与所述关键词条进行匹配,以基于所述匹配对所述关键词条进行选择。7.根据权利要求1-6中任一项所述的信息处理方法,其中,基于用户属性信息对所述关键词条进行选择包括:根据所述关键词条在所述预定数据库中的详细信息与所述预定文本的相关度,对所述预定数据库中存储的、与所述关键词条对应的多条详细信息进行消歧,以便基于所述用户属性信息、对消歧后的关键词条进行选择。8.一种信息处理装置,包括:获取单元,用于从预定文本中获取多个候选词条;确定单元,用于根据各个所述候选词条的词条属性,从所述多个候选词条中确定所述预定...

【专利技术属性】
技术研发人员:李跃洲孙志杰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1