基于人工智能的搜索结果播报方法和装置制造方法及图纸

技术编号：14959168 阅读：52 留言：0更新日期：2017-04-02 12:13

本发明专利技术公开了一种基于人工智能的搜索结果播报方法和装置，其中，方法包括：接收用户输入的查询语句，并根据查询语句获取多个候选搜索结果；对候选搜索结果进行分析，以确定候选搜索结果的类别；获取查询语句的意图信息，根据意图信息和类别筛选候选搜索结果，以获取筛选后的搜索结果；以及生成筛选后的搜索结果对应的文本信息，并播报文本信息。本发明专利技术实施例的基于人工智能的搜索结果播报方法和装置，通过对用户输入的查询语句进行分析，获取对应的意图信息，并筛选出符合播报条件的搜索结果，最后通过生成的连续自然语音播报出符合用户意图的搜索结果，直观地反馈用户所需的核心信息，降低用户操作成本，节省用户时间，更加智能化。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能
，尤其涉及一种基于人工智能的搜索结果播报方法和装置。
技术介绍
人工智能(ArtificialIntelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。随着科技的不断进步，搜索引擎已成为人们生活中必不可少的部分，并日趋智能化。目前，传统的搜索引擎的交互方式是用户输入搜索关键字，搜索引擎返回与用户需求相关的搜索结果，并按照相关性由高到低的顺序排序。用户可浏览和点击搜索结果，并从中选择感兴趣或有需求的信息和内容。而传统的交互方式存在以下问题：搜索引擎无法理解用户的意图，提供的搜索结果难以抓住核心信息，需要用户自己从搜索结果中选取符合需求的内容，耗费时间，操作成本高。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的一个目的在于提出一种基于人工智能的搜索结果播报方法，能够直观地反馈用户所需的核心信息，降低用户操作成本，节省用户时间，更加智能化。本专利技术的第二个目的在于提出一种基于人工智能的搜索结果播报装置。为了实现上述目的，本专利技术第一方面实施例提出了一种基于人工智能的...

【技术保护点】
一种基于人工智能的搜索结果播报方法，其特征在于，包括以下步骤：接收用户输入的查询语句，并根据所述查询语句获取多个候选搜索结果；对所述候选搜索结果进行分析，以确定所述候选搜索结果的类别，其中，所述类别包括结构化结果和富文本结果；获取所述查询语句的意图信息，根据所述意图信息和所述类别筛选所述候选搜索结果，以获取筛选后的搜索结果；以及生成所述筛选后的搜索结果对应的文本信息，并播报所述文本信息。

【技术特征摘要】
1.一种基于人工智能的搜索结果播报方法，其特征在于，包括以下步骤：
接收用户输入的查询语句，并根据所述查询语句获取多个候选搜索结果；
对所述候选搜索结果进行分析，以确定所述候选搜索结果的类别，其中，所述类别包
括结构化结果和富文本结果；
获取所述查询语句的意图信息，根据所述意图信息和所述类别筛选所述候选搜索结果，
以获取筛选后的搜索结果；以及
生成所述筛选后的搜索结果对应的文本信息，并播报所述文本信息。
2.如权利要求1所述的方法，其特征在于，对所述候选搜索结果进行分析，以确定所
述候选搜索结果的类别，包括：
获取所述候选搜索结果对应的页面内容信息；
对所述页面内容信息进行解析，并提取所述页面内容信息对应的数据特征；
根据所述数据特征确定所述候选搜索结果的类别。
3.如权利要求1所述的方法，其特征在于，当所述候选搜索结果的类别为结构化结果
时，生成筛选后的搜索结果对应的文本信息，包括：
提取所述结构化结果中包含的多个字段；
计算每个字段对于所述结构化结果的重要度，并根据所述重要度获取符合预设条件的
候选字段；
根据所述候选字段生成多个候选文本信息；
计算所述查询语句与所述候选文本信息的相似度，并根据所述相似度对所述候选文本
信息进行排序，以及根据排序结果生成筛选后的搜索结果对应的文本信息。
4.如权利要求3所述的方法，其特征在于，在根据所述候选字段生成多个候选文本信
息后，还包括：
对所述候选文本信息进行口语播报化改写。
5.如权利要求3所述的方法，其特征在于，计算所述查询语句与所述候选文本信息的
相似度，包括：
基于广义语言模型计算所述查询语句与所述候选文本信息的相似度，其中，所述相似
度包括字面相似度、语义相似度、播报风格相似度中的一种或多种。
6.如权利要求3所述的方法，其特征在于，根据所述相似度对所述候选文本信息进行
排序，包括：
基于预设排序模型对所述候选文本信息进行排序，所述预设排序模型包括线性回归

\tLinear-Regression排序模型、组合分析Pair-Wise排序模型。
7.如权利要求1所述的方法，其特征在于，当所述候选搜索结果的类别为富文本结果
时，生成筛选后的搜索结果对应的文本信息，包括：
对所述富文本结果进行预处理，所述预处理包括文本抽取、文本去重、关键词分析、
文本结构分析中的一种或多种；
基于广义语言模型提取所述富文本结果中多个候选语句的特征，所述特征包括所述候
选语句与所述查询语句的语义相似度和/或意图相似度、所述候选语句在对应的富文本结果
中的位置信息、所述候选语句包含的关键词信息中的一种或多种；
根据所述特征计算所述候选语句的得分；
根据所述得分对所述候选语句进行排序，以及根据排序结果生成筛选后的搜索结果对
应的文本信息。
8.如权利要求1所述的方法，其特征在于，播报所述文本信息，包括：
基于TTS语音合成技术将所述文本信息合成为语音信息，并播报所述语音信...

【专利技术属性】
技术研发人员：刘凯，冯洋，杨钦，吕雅娟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人