用于提供语音服务的方法和装置制造方法及图纸

技术编号:17409616 阅读:29 留言:0更新日期:2018-03-07 06:35
本申请公开了用于提供语音服务的方法和装置。该用于提供语音服务的方法的一具体实施方式包括:获取语音输入信号;对语音输入信号的时域波形进行分析以确定语音输入信号的当前语速信息;比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,其中,标准语速信息集合包括至少一个标准语速信息,预设的需求信息集合包括与标准语速信息集合中的各标准语速信息对应的需求信息;根据第一需求信息以及解析语音输入信号获取的第二需求信息生成语音响应信号。该实施方式能够提升语音服务与用户潜在需求的匹配度,实现了更灵活、更精准的语音服务。

Methods and devices for providing voice services

The present application discloses methods and devices for providing voice services. For the specific implementation method provides voice service includes: acquiring the input speech signal; time domain waveform of the input speech signal is analyzed to determine the speed information of the input speech signal; comparison of current speed information and standard speed has acquired a voice input signal of the user's information collection, and according to the comparison results from the preset demand information sets determined the first demand information, the standard speed information set includes at least one standard speed preset information, demand information collection includes the corresponding information in the standard speed and speed standard set of information demand information; according to the second demand information to generate demand information and analysis of speech in the first speech input signal acquisition the response signal. The implementation method can improve the matching degree of the voice service and the potential demand of the user, and realize a more flexible and accurate voice service.

【技术实现步骤摘要】
用于提供语音服务的方法和装置
本申请涉及计算机
,具体涉及语音
,尤其涉及用于提供语音服务的方法和装置。
技术介绍
人工智能(ArtificialIntelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。人工智能领域中的语音识别技术是计算机科学领域与人工智能领域中的一个重要方向,主要用在智能语音服务技术中,对用户的发出的语音信号进行识别,而后基于识别结果生成响应信息,并通过语音合成技术将响应信息转化为语音信号输出。现有的语音服务技术在对用户发出的语音服务请求进行响应时,大都采用将语音信号转换为对应的文字,而后对文字进行分析、检索进而确定响应策略的方式。然而,这个过程中忽略了说话人的不同语速所包含的不同的潜在需求信息,从而存在着提供的语音服务与用户需求匹配度差的问题。
技术实现思路
为了解决上述
技术介绍
部分提到的一个或多个技术问题,本申请实施例提供了用于提供语音服务的方法和装置。第一方面,本申请实施例提供了一种用于提供语音服务的方法,包括:获取语音输入信号;对语音输入信号的时域波形进行分析以确定语音输入信号的当前语速信息;比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,其中,标准语速信息集合包括至少一个标准语速信息,预设的需求信息集合包括与标准语速信息集合中的各标准语速信息对应的需求信息;根据第一需求信息以及解析语音输入信号获取的第二需求信息生成语音响应信号。在一些实施例中,上述比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,包括:比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,以从标准语速信息集合中确定出与当前语速信息匹配的目标标准语速信息;在预设的需求信息集合中查找出与目标标准语速信息对应的需求信息,作为第一需求信息。在一些实施例中,在比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息之前,上述方法还包括:基于语音输入信号对发出语音输入信号的用户进行识别;获取识别出的用户的标准语速信息集合。在一些实施例中,上述根据第一需求信息以及解析语音输入信号获取的第二需求信息生成语音响应信号,包括:基于第二需求信息生成至少一个用于响应语音输入信号的候选语音信号;计算各候选语音信号与第一需求信息的关联度,根据关联度从候选语音信号中确定出语音响应信号。在一些实施例中,上述方法还包括构建用户的标准语速信息集合的步骤,包括:获取与用户关联的历史语音服务记录,历史语音服务记录包括:用户发出的历史语音输入信号的语速信息、历史语音响应信号、用户对历史语音服务的反馈信息;筛选出反馈信息为正面反馈信息的历史语音服务对应的历史语音响应信号作为样本语音响应信号,筛选出反馈信息为正面反馈信息的历史语音服务对应的历史语音输入信号的语速信息作为样本语速信息;对样本语音响应信号进行解析以确定对应的与语速相关的第三需求信息,基于第三需求信息对语音响应信号进行聚类,根据各聚类中语音响应信号对应的样本语速信息生成各标准语速信息。第二方面,本申请实施例提供了一种用于提供语音服务的装置,包括:获取单元,用于获取语音输入信号;分析单元,用于对语音输入信号的时域波形进行分析以确定语音输入信号的当前语速信息;确定单元,用于比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,其中,标准语速信息集合包括至少一个标准语速信息,预设的需求信息集合包括与标准语速信息集合中的各标准语速信息对应的需求信息;生成单元,用于根据第一需求信息以及解析语音输入信号获取的第二需求信息生成语音响应信号。在一些实施例中,上述确定单元进一步用于按照如下方式确定出第一需求信息:比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,以从标准语速信息集合中确定出与当前语速信息匹配的目标标准语速信息;在预设的需求信息集合中查找出与目标标准语速信息对应的需求信息,作为第一需求信息。在一些实施例中,上述装置还包括:识别单元,用于在比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息之前,基于语音输入信号对发出语音输入信号的用户进行识别;并且获取识别出的用户的标准语速信息集合。在一些实施例中,上述生成单元进一步用于按照如下方式生成语音响应信号:基于第二需求信息生成至少一个用于响应语音输入信号的候选语音信号;计算各候选语音信号与第一需求信息的关联度,根据关联度从候选语音信号中确定出语音响应信号。在一些实施例中,上述装置还包括用于构建用户的标准语速信息集合的构建单元;构建单元用于:获取与用户关联的历史语音服务记录,历史语音服务记录包括:用户发出的历史语音输入信号的语速信息、历史语音响应信号、用户对历史语音服务的反馈信息;筛选出反馈信息为正面反馈信息的历史语音服务对应的历史语音响应信号作为样本语音响应信号,筛选出反馈信息为正面反馈信息的历史语音服务对应的历史语音输入信号的语速信息作为样本语速信息;对样本语音响应信号进行解析以确定对应的与语速相关的第三需求信息,基于第三需求信息对语音响应信号进行聚类,根据各聚类中语音响应信号对应的样本语速信息生成各标准语速信息。本申请实施例提供的用于提供语音服务的方法和装置,通过获取语音输入信号,然后对语音输入信号进行频谱分析以确定语音输入信号的当前语速信息,而后比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,其中,标准语速信息集合包括至少一个标准语速信息,预设的需求信息集合包括与标准语速信息集合中的各标准语速信息对应的需求信息,最后根据第一需求信息以及解析语音输入信号获取的第二需求信息生成语音响应信号,能够提升语音服务与用户潜在需求的匹配度,实现了更灵活、更精准的语音服务。附图说明通过阅读参照以下附图所作的对非限制性实施例详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的用于提供语音服务的方法的一个实施例的流程示意图;图3是一段语音输入信号的示意性时域波形图;图4是根据本申请的用于提供语音服务的方法的另一个实施例的流程示意图;图5是本申请的用于提供语音服务的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的本文档来自技高网...
用于提供语音服务的方法和装置

【技术保护点】
一种用于提供语音服务的方法,其特征在于,所述方法包括:获取语音输入信号;对所述语音输入信号的时域波形进行分析以确定所述语音输入信号的当前语速信息;比对所述当前语速信息和已获取的发出所述语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,其中,所述标准语速信息集合包括至少一个标准语速信息,所述预设的需求信息集合包括与所述标准语速信息集合中的各标准语速信息对应的需求信息;根据所述第一需求信息以及解析所述语音输入信号获取的第二需求信息生成语音响应信号。

【技术特征摘要】
1.一种用于提供语音服务的方法,其特征在于,所述方法包括:获取语音输入信号;对所述语音输入信号的时域波形进行分析以确定所述语音输入信号的当前语速信息;比对所述当前语速信息和已获取的发出所述语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,其中,所述标准语速信息集合包括至少一个标准语速信息,所述预设的需求信息集合包括与所述标准语速信息集合中的各标准语速信息对应的需求信息;根据所述第一需求信息以及解析所述语音输入信号获取的第二需求信息生成语音响应信号。2.根据权利要求1所述的方法,其特征在于,所述比对所述当前语速信息和已获取的发出所述语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,包括:比对所述当前语速信息和已获取的发出所述语音输入信号的用户的标准语速信息集合,以从所述标准语速信息集合中确定出与所述当前语速信息匹配的目标标准语速信息;在所述预设的需求信息集合中查找出与所述目标标准语速信息对应的需求信息,作为所述第一需求信息。3.根据权利要求1所述的方法,其特征在于,在比对所述当前语速信息和已获取的发出所述语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息之前,所述方法还包括:基于所述语音输入信号对发出所述语音输入信号的用户进行识别;获取识别出的用户的标准语速信息集合。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一需求信息以及解析所述语音输入信号获取的第二需求信息生成语音响应信号,包括:基于所述第二需求信息生成至少一个用于响应所述语音输入信号的候选语音信号;计算各所述候选语音信号与所述第一需求信息的关联度,根据所述关联度从所述候选语音信号中确定出所述语音响应信号。5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括构建所述用户的标准语速信息集合的步骤,包括:获取与所述用户关联的历史语音服务记录,所述历史语音服务记录包括:用户发出的历史语音输入信号的语速信息、历史语音响应信号、用户对历史语音服务的反馈信息;筛选出所述反馈信息为正面反馈信息的历史语音服务对应的历史语音响应信号作为样本语音响应信号,筛选出所述反馈信息为正面反馈信息的历史语音服务对应的历史语音输入信号的语速信息作为样本语速信息;对所述样本语音响应信号进行解析以确定对应的与语速相关的第三需求信息,基于第三需求信息对所述语音响应信号进行聚类,根据各聚类中语音响应信号对应的样本语速信息生成各标准语速信息。6.一种用于提供语音服务的装置,其特征在于,所述装置包括:获取单元,用于获取语音输入信号;分析单元,用于对所述语音输入信号的时域波形进行分析以确定...

【专利技术属性】
技术研发人员:谢波
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1