基于人工智能的搜索结果播报方法和装置制造方法及图纸

技术编号:14959168 阅读:52 留言:0更新日期:2017-04-02 12:13
本发明专利技术公开了一种基于人工智能的搜索结果播报方法和装置,其中,方法包括:接收用户输入的查询语句,并根据查询语句获取多个候选搜索结果;对候选搜索结果进行分析,以确定候选搜索结果的类别;获取查询语句的意图信息,根据意图信息和类别筛选候选搜索结果,以获取筛选后的搜索结果;以及生成筛选后的搜索结果对应的文本信息,并播报文本信息。本发明专利技术实施例的基于人工智能的搜索结果播报方法和装置,通过对用户输入的查询语句进行分析,获取对应的意图信息,并筛选出符合播报条件的搜索结果,最后通过生成的连续自然语音播报出符合用户意图的搜索结果,直观地反馈用户所需的核心信息,降低用户操作成本,节省用户时间,更加智能化。

【技术实现步骤摘要】

本专利技术涉及人工智能
,尤其涉及一种基于人工智能的搜索结果播报方法和装置
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。随着科技的不断进步,搜索引擎已成为人们生活中必不可少的部分,并日趋智能化。目前,传统的搜索引擎的交互方式是用户输入搜索关键字,搜索引擎返回与用户需求相关的搜索结果,并按照相关性由高到低的顺序排序。用户可浏览和点击搜索结果,并从中选择感兴趣或有需求的信息和内容。而传统的交互方式存在以下问题:搜索引擎无法理解用户的意图,提供的搜索结果难以抓住核心信息,需要用户自己从搜索结果中选取符合需求的内容,耗费时间,操作成本高。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于人工智能的搜索结果播报方法,能够直观地反馈用户所需的核心信息,降低用户操作成本,节省用户时间,更加智能化。本专利技术的第二个目的在于提出一种基于人工智能的搜索结果播报装置。为了实现上述目的,本专利技术第一方面实施例提出了一种基于人工智能的搜索结果播报方法,包括:接收用户输入的查询语句,并根据所述查询语句获取多个候选搜索结果;对所述候选搜索结果进行分析,以确定所述候选搜索结果的类别,其中,所述类别包括结构化结果和富文本结果;获取所述查询语句的意图信息,根据所述意图信息和所述类别筛选所述候选搜索结果,以获取筛选后的搜索结果;以及生成所述筛选后的搜索结果对应的文本信息,并播报所述文本信息。本专利技术实施例的基于人工智能的搜索结果播报方法,通过对用户输入的查询语句进行分析,获取对应的意图信息,并筛选出符合播报条件的搜索结果,最后通过生成的连续自然语音播报出符合用户意图的搜索结果,直观地反馈用户所需的核心信息,降低用户操作成本,节省用户时间,更加智能化。本专利技术第二方面实施例提出了一种基于人工智能的搜索结果播报装置,包括:查询模块,用于接收用户输入的查询语句,并根据所述查询语句获取多个候选搜索结果;确定模块,用于对所述候选搜索结果进行分析,以确定所述候选搜索结果的类别,其中,所述类别包括结构化结果和富文本结果;筛选模块,用于获取所述查询语句的意图信息,根据所述意图信息和所述类别筛选所述候选搜索结果,以获取筛选后的搜索结果;以及播报模块,用于生成所述筛选后的搜索结果对应的文本信息,并播报所述文本信息。本专利技术实施例的基于人工智能的搜索结果播报装置,通过对用户输入的查询语句进行分析,获取对应的意图信息,并筛选出符合播报条件的搜索结果,最后通过生成的连续自然语音播报出符合用户意图的搜索结果,直观地反馈用户所需的核心信息,降低用户操作成本,节省用户时间,更加智能化。附图说明图1是本专利技术一个实施例的基于人工智能的搜索结果播报方法的流程图;图2是展示结构化结果效果示意图;图3是本专利技术一个实施例的生成对应的文本信息的流程图一;图4是本专利技术一个实施例的生成对应的文本信息的流程图二;图5是本专利技术一个实施例的基于人工智能的搜索结果播报装置的结构示意图一;图6是本专利技术一个实施例的基于人工智能的搜索结果播报装置的结构示意图二。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的基于人工智能的搜索结果播报方法和装置。图1是根据本专利技术一个实施例的基于人工智能的搜索结果播报方法的流程图。如图1所示,基于人工智能的搜索结果播报方法可包括:S1、接收用户输入的查询语句,并根据查询语句获取多个候选搜索结果。举例来说,用户在搜索引擎中输入“苹果”,搜索引擎可搜索“苹果”相关的信息,并在搜索结果页中展示如“苹果官网”、“苹果的最新相关信息”、“苹果手机的报价”等多个候选搜索结果。S2、对候选搜索结果进行分析,以确定候选搜索结果的类别。具体地,可获取候选搜索结果对应的页面内容信息,对页面内容信息进行解析,并提取页面内容信息对应的数据特征,然后可根据数据特征确定候选搜索结果的类别。其中,候选搜索结果的类别可包括结构化结果和富文本结果。例如:结构化结果可包括阿拉丁结果,阿拉丁结果为通过接口直接展示实体结果的搜索结果。如图2所示,通过预设接口直接展示当天天气及未来一周的天气气象情况。再例如用户查询某一地点,直接通过地图展示该地点的信息。而富文本结果可包括新闻、论坛、文库等文字信息类结果。举例来说,某一候选搜索结果对应的页面内容可通过超文本标记语言HTML表示,可对该HTML进行解析,解析出该页面内容的数据特征,如标题、用户名、内容、在页面中的位置等。假设数据特征包括主题名称、发帖用户名称及其发布的内容、回帖用户名称及其对应的回复内容、回贴的数量、回覆内容对应的楼层数等等,基于这些数据特征可确定该候选搜索结果的类别为论坛类,即属于富文本结果。S3、获取查询语句的意图信息,根据意图信息和类别筛选候选搜索结果,以获取筛选后的搜索结果。在本专利技术的一个实施例中,可将查询语句切分为多个单词或短语,分析单词的字面特征、语义特征、对于查询语句的重要度等特征,根据上述特征分析出该查询语句的意图信息,然后再结合上一步骤中候选搜索结果的类别,筛选出符合播报条件的搜索结果。例如:某一查询语句的意图信息可确定为无语音播报的意图,则其对应的搜索结果无需语音播报,即可过滤掉该查询语句对应的搜索结果。再例如:虽然某一查询语句确定为有语音播报的意图,则可过滤掉其对应的搜索结果中不是结构化结果和富文本结果的搜索结果。S4、生成筛选后的搜索结果对应的文本信息,并播报文本信息。在本专利技术的一个实施例中,结构化结果和富文本结果生成对应的文本信息的方式是不同的。具体地,当候选搜索结果的类别为结构化结果时,如图3所示,生成对应的文本信息可包括以下步骤:S41、提取结构化结果中包含的多个字段。S42、计算每个字段对于结构化结果的重要度,并根据重要度获取符合预设条件的候选字段。<本文档来自技高网...

【技术保护点】
一种基于人工智能的搜索结果播报方法,其特征在于,包括以下步骤:接收用户输入的查询语句,并根据所述查询语句获取多个候选搜索结果;对所述候选搜索结果进行分析,以确定所述候选搜索结果的类别,其中,所述类别包括结构化结果和富文本结果;获取所述查询语句的意图信息,根据所述意图信息和所述类别筛选所述候选搜索结果,以获取筛选后的搜索结果;以及生成所述筛选后的搜索结果对应的文本信息,并播报所述文本信息。

【技术特征摘要】
1.一种基于人工智能的搜索结果播报方法,其特征在于,包括以下步骤:
接收用户输入的查询语句,并根据所述查询语句获取多个候选搜索结果;
对所述候选搜索结果进行分析,以确定所述候选搜索结果的类别,其中,所述类别包
括结构化结果和富文本结果;
获取所述查询语句的意图信息,根据所述意图信息和所述类别筛选所述候选搜索结果,
以获取筛选后的搜索结果;以及
生成所述筛选后的搜索结果对应的文本信息,并播报所述文本信息。
2.如权利要求1所述的方法,其特征在于,对所述候选搜索结果进行分析,以确定所
述候选搜索结果的类别,包括:
获取所述候选搜索结果对应的页面内容信息;
对所述页面内容信息进行解析,并提取所述页面内容信息对应的数据特征;
根据所述数据特征确定所述候选搜索结果的类别。
3.如权利要求1所述的方法,其特征在于,当所述候选搜索结果的类别为结构化结果
时,生成筛选后的搜索结果对应的文本信息,包括:
提取所述结构化结果中包含的多个字段;
计算每个字段对于所述结构化结果的重要度,并根据所述重要度获取符合预设条件的
候选字段;
根据所述候选字段生成多个候选文本信息;
计算所述查询语句与所述候选文本信息的相似度,并根据所述相似度对所述候选文本
信息进行排序,以及根据排序结果生成筛选后的搜索结果对应的文本信息。
4.如权利要求3所述的方法,其特征在于,在根据所述候选字段生成多个候选文本信
息后,还包括:
对所述候选文本信息进行口语播报化改写。
5.如权利要求3所述的方法,其特征在于,计算所述查询语句与所述候选文本信息的
相似度,包括:
基于广义语言模型计算所述查询语句与所述候选文本信息的相似度,其中,所述相似
度包括字面相似度、语义相似度、播报风格相似度中的一种或多种。
6.如权利要求3所述的方法,其特征在于,根据所述相似度对所述候选文本信息进行
排序,包括:
基于预设排序模型对所述候选文本信息进行排序,所述预设排序模型包括线性回归

\tLinear-Regression排序模型、组合分析Pair-Wise排序模型。
7.如权利要求1所述的方法,其特征在于,当所述候选搜索结果的类别为富文本结果
时,生成筛选后的搜索结果对应的文本信息,包括:
对所述富文本结果进行预处理,所述预处理包括文本抽取、文本去重、关键词分析、
文本结构分析中的一种或多种;
基于广义语言模型提取所述富文本结果中多个候选语句的特征,所述特征包括所述候
选语句与所述查询语句的语义相似度和/或意图相似度、所述候选语句在对应的富文本结果
中的位置信息、所述候选语句包含的关键词信息中的一种或多种;
根据所述特征计算所述候选语句的得分;
根据所述得分对所述候选语句进行排序,以及根据排序结果生成筛选后的搜索结果对
应的文本信息。
8.如权利要求1所述的方法,其特征在于,播报所述文本信息,包括:
基于TTS语音合成技术将所述文本信息合成为语音信息,并播报所述语音信...

【专利技术属性】
技术研发人员:刘凯冯洋杨钦吕雅娟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1