信息获取方法及装置制造方法及图纸

技术编号:19692217 阅读:25 留言:0更新日期:2018-12-08 11:16
本发明专利技术实施例提供一种信息获取方法及装置,属于计算机技术领域。该方法包括:分别获取每一结构化文本与问询文本之间的匹配概率,结构化文本是对说明文档进行拆解后得到的,结构化文本用于描述问询文本所问询的信息;将每一匹配概率按照从大到小进行排序,选取前预设数量个匹配概率对应的结构化文本作为与问询文本匹配的结构化文本。由于可对说明文档进行拆解得到结构化文本,并可依据问询文本与每一结构化文本之间的匹配概率,选取与问询文本匹配的结构化文本,并作为查询结果,而不用手动查询,从而提高了获取信息的效率。另外,由于查询依据是与产品功能相关联的说明文档,从而能够提高获取消息的准确性及可靠性。

【技术实现步骤摘要】
信息获取方法及装置
本专利技术实施例涉计算机
,更具体地,涉及一种信息获取方法及装置。
技术介绍
在日常生活中,在使用一项产品时,可能会不能立即熟练使用该产品。通常用户需要查阅该产品的说明书,获取产品功能的相关信息,才能了解该产品某项功能如何使用。相关技术中通常提供了如下信息获取方式:由用户自行搜索电子说明书,即通过在电子说明书逐一查阅每项产品功能,直至找到自身需要的产品功能信息。由于产品功能的项数通常比较多,从而导致逐一查阅效率比较低。
技术实现思路
为了解决上述问题,本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的信息获取方法及装置。根据本专利技术实施例的第一方面,提供了一种信息获取方法,该方法包括:分别获取每一结构化文本与问询文本之间的匹配概率,结构化文本是对说明文档进行拆解后得到的,结构化文本用于描述问询文本所问询的信息;将每一匹配概率按照从大到小进行排序,选取前预设数量个匹配概率对应的结构化文本作为与问询文本匹配的结构化文本。本专利技术实施例提供的方法,通过分别获取每一结构化文本与问询文本之间的匹配概率。将每一匹配概率按照从大到小进行排序,选取前预设数量个匹配概率对应的结构化文本作为与问询文本匹配的结构化文本。由于可对说明文档进行拆解得到结构化文本,并可依据问询文本与每一结构化文本之间的匹配概率,选取与问询文本匹配的结构化文本,并作为查询结果,而不用手动查询,从而提高了获取信息的效率。同时,由于匹配概率是基于语义建模计算,因而可以支持问询信息语义上的灵活变化,提高了信息获取的灵活性。另外,由于查询依据是与产品功能相关联的说明文档,从而能够提高获取消息的准确性及可靠性。根据本专利技术实施例的第二方面,提供了一种信息获取装置,该装置包括:第一获取模块,用于分别获取每一结构化文本与问询文本之间的匹配概率,结构化文本是对说明文档进行拆解后得到的,结构化文本用于描述问询文本所问询的信息;选取模块,用于将每一匹配概率按照从大到小进行排序,选取前预设数量个匹配概率对应的结构化文本作为与问询文本匹配的结构化文本。根据本专利技术实施例的第三方面,提供了一种信息获取设备,包括:至少一个处理器;以及与处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的信息获取方法。根据本专利技术的第四方面,提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的信息获取方法。应当理解的是,以上的一般描述和后文的细节描述是示例性和解释性的,并不能限制本专利技术实施例。附图说明图1为本专利技术实施例的一种信息获取方法的流程示意图;图2为本专利技术实施例的一种结构化文本的内容示意图;图3为本专利技术实施例的一种关键词预测模型的结构示意图;图4为本专利技术实施例的一种问题识别模型的结构示意图;图5为本专利技术实施例的一种信息获取方法的流程示意图;图6为本专利技术实施例的一种概率计算模型的结构示意图;图7为本专利技术实施例的一种信息获取装置的框图;图8为本专利技术实施例的一种信息获取设备的框图。具体实施方式下面结合附图和实施例,对本专利技术实施例的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术实施例,但不用来限制本专利技术实施例的范围。目前在汽车领域或电子产品领域,用户在使用某项功能时,通常会查阅说明书该功能如何使用,以获取产品功能信息。针对上述情形,本专利技术实施例提供了一种信息获取方法。该方法可适用于各种产品,产品形式可以为电子产品,生活用品、交通工具等,本专利技术实施例对此不作具体限定。为了便于理解,本专利技术实施例以产品为汽车为例,对本专利技术实施例提供的方法进行阐述。相应地,该方法的执行主体可以为车载系统或车载设备上的处理器等,本专利技术实施例对此不作具体限定。参见图1,该方法包括:101、分别获取每一结构化文本与问询文本之间的匹配概率,结构化文本是对说明文档进行拆解后得到的,结构化文本用于描述问询文本所问询的信息;102、将每一匹配概率按照从大到小进行排序,选取前预设数量个匹配概率对应的结构化文本作为与问询文本匹配的结构化文本。在上述步骤101中,问询文本是对用户提问时采集到的语音信号进行语音识别后得到的;说明文档用于对产品功能进行说明,说明文档可以为电子文档,可以是对纸质说明书进行电子化得到的,本专利技术实施例对此不作具体限定。例如,对于汽车的说明书文档,通常汽车上配备的功能通常比较多,如驾驶相关功能、空调调节功能等,说明文档也会记载每项功能的具体说明。另外,在执行步骤101之前,可按照说明文档中记载的每项功能,将说明文档拆解成多个结构化文本。每个结构化文本可对应产品的一项功能,并用于记载该项功能对应的具体使用说明。需要说明的是,为了后续能让用户精准地定位到需要查询的产品功能的产品功能信息,在对说明文档进行拆解时,可以按照功能粒度的划分拆解至说明文档中功能粒度最小的功能。例如,对于汽车上的空调调节功能,可进一步拆解为空调制冷调节功能及空调制热调节功能这两项功能粒度最小的功能。相应地,每个结构化文本均对应一项功能粒度最小的功能。与此同时,若每个结构化文本均对应一个功能标题,则每个结构化文本中的标题均为最低一级的标题。需要说明的是,若本专利技术实施例提供的方法若是由产品功能指导系统实现的,则拆解产品说明文档的功能可由产品功能指导系统下的说明文档结构化拆解模块实现。另外,每项功能对应的结构化文本可包含多个字段。例如,对于汽车上的空调制冷调节功能,该功能对应的结构化文本中可包含多个字段,分别为文档标题、主要内容(操作或功能描述)、提示或警告、注意事项、对应图片列表等。如图2所示,图2为空调制冷调节功能对应的结构化文本,该结构化文本中包含四个字段,分别为“空调制冷操作”(即对应文档标题)、“将点火钥匙……保证空气质量”(即对应文档标题下的主要内容)、“重要提示:在……空调”(即对应空调制冷调节功能在使用时的提示或警告)、“注意:1、在温热……自然通风”(即对应空调制冷调节功能在使用时的注意事项)。需要说明的是,除了结构化文本中除了包含上述划分的五种类型字段之外,还可以包含其它类型的字段,本专利技术实施例对此不作具体限定。另外,若说明文档中存在结构化文本只包含上述五种类型字段中的几种字段,则可通过填充默认值“NULL”的方式,使得该结构化文本同样包含五种类型的字段,进而保证所有结构化文本的格式统一,以便于后续对结构化文本作统一处理。其中,填充字段中的内容为空。由上述内容可知,说明文档中可拆解为多个结构化文本。为了找到与用户提问的问询文本相关的结构化文本,可分别获取每一结构化文本与问询文本之间的匹配概率。其中,与用户提问的问询文本相关的结构化文本,指的是包含用户提问想要问询的信息的结构化文本。对于任一结构文本,本专利技术实施例不对获取该结构化文本与问询文本之间的匹配概率的方式作具体限定,包括但不限于:将该结构化文本及问询文本输入到概率计算模型中,从而输出该结构化文本与问询文本之间的匹配概率。其中,概率计算模型可通过预先训练得到。具体地,可将样本结构化文本与样本问询文本作为初始模型的输入,将样本结构化文本文档来自技高网...

【技术保护点】
1.一种信息获取方法,其特征在于,包括:分别获取每一结构化文本与问询文本之间的匹配概率,所述结构化文本是对说明文档进行拆解后得到的,所述结构化文本用于描述所述问询文本所问询的信息;将每一匹配概率按照从大到小进行排序,选取前预设数量个匹配概率对应的结构化文本作为与所述问询文本匹配的结构化文本。

【技术特征摘要】
1.一种信息获取方法,其特征在于,包括:分别获取每一结构化文本与问询文本之间的匹配概率,所述结构化文本是对说明文档进行拆解后得到的,所述结构化文本用于描述所述问询文本所问询的信息;将每一匹配概率按照从大到小进行排序,选取前预设数量个匹配概率对应的结构化文本作为与所述问询文本匹配的结构化文本。2.根据权利要求1所述的方法,其特征在于,所述分别获取每一结构化文本与问询文本之间的匹配概率之前,还包括:将文本序列输入至第一问题识别模型,输出所述文本序列与所述说明文档之间的相关程度值,若所述相关程度值大于预设阈值,则确定所述问询文本与所述说明文档之间内容相关,所述文本序列是对所述问询文本进行分词后得到的,所述第一问题识别模型是由样本文本序列以及所述样本文本序列与所述说明文档之间的相关程度值进行训练后得到的;或者,将文本序列输入至第二问题识别模型,输出所述问询文本与所述说明文档之间的相关结果,所述第二问题识别模型是由样本文本序列以及所述样本文本序列与所述说明文档之间的相关结果进行训练后得到的,所述文本序列是对所述问询文本进行分词后得到的。3.根据权利要求1所述的方法,其特征在于,所述分别获取每一结构化文本与所述问询文本之间的匹配概率之前,还包括:若文本序列中存在分词需要被替换,则获取需要被替换的分词所对应的目标词,并基于所述目标词更新所述问询文本;其中,需要被替换的分词与所述目标词的内容不同且含义等同,所述文本序列是对所述问询文本进行分词后得到的。4.根据权利要求1所述的方法,其特征在于,所述结构化文本至少包含标题及正文内容;相应地,所述分别获取每一结构化文本与所述问询文本之间的匹配概率,包括:对于任一结构化文本,获取所述问询文本与所述任一结构化文本中的标题之间的第一相似度,以及所述问询文本与所述任一结构化文本中的正文内容之间的第二相似度;将所述问询文本与所述任一结构化文本之间的基础特征、所述第一相似度及所述第二相似度进行融合,得到所述任一结构化文本与所述问询文本之间的匹配概率。5.根据权利要求4所述的方法,其特征在于,所述基础特征包含以下三种信息中的至少一种信息,所述以下三种信息分别为所述问询文本与所述任一结构化文本之间的匹配分值、所述问询文本与所述任一结构化文本之间的加权匹配值、以及所述问询文本与所述任一结构化文本之间的向量相似度。6.根据权利要求5所述的方法,其特征在于,所述将所述问询...

【专利技术属性】
技术研发人员:马文涛崔一鸣齐乐何苏陈致鹏王士进胡国平张宇刘挺
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1