当前位置: 首页 > 专利查询>清华大学专利>正文

信息处理的方法技术

技术编号:39495450 阅读:5 留言:0更新日期:2023-11-24 11:22
本公开的实施例涉及信息处理的方法

【技术实现步骤摘要】
信息处理的方法、装置、设备和存储介质


[0001]本公开的示例实施例总体涉及计算机领域,特别地涉及信息处理的方法

装置

设备和存储介质


技术介绍

[0002]随着计算机技术的发展,机器学习等技术已经被广泛地应用到人们生活中的各个方面

人们可以利用基于机器学习实现的各种类型的模型来完成多种类型的任务

在一个典型的应用场景中,人们例如可以通过向语言模型来提供提示项
(
也称为提示词或引导词
)
,来指引语言模型生成期望的内容

然而,这样的语言模型的处理能力较为单一,其仅能够分析或处理用户输入的文本内容,这很难全面满足用户的交互需求


技术实现思路

[0003]在本公开的第一方面,提供了一种信息处理方法

该方法包括:获取第一音频内容和针对第一音频内容的第一提示项,第一提示项用于指示目标模型响应第一音频内容中包括的目标请求;以及提供针对目标请求的响应内容,其中响应内容是由目标模型根据目标请求并基于第一音频内容所生成

[0004]在本公开的第二方面,提供了一种信息处理方法

该方法包括:获取第二音频内容和针对第二音频内容的第二提示项,第二提示项用于指示目标模型基于第二音频内容来响应第二提示项;以及提供目标内容,其中目标内容是由目标模型至少基于第二音频内容的非话语部分所生成

[0005]在本公开的第三方面,提供了一种信息处理方法

该方法包括:获取音频内容和提示项;基于音频内容的音频特征表示和提示项的文本特征表示,确定第一中间特征表示;利用一组预设的查询特征表示,将第一中间特征表示转换为第二中间特征表示;以及至少基于第二中间特征表示,生成用于响应提示项的内容

[0006]在本公开的第四方面,提供了一种信息处理装置

该装置包括:获取模块,被配置为获取第一音频内容和针对第一音频内容的第一提示项,第一提示项用于指示目标模型响应第一音频内容中包括的目标请求;以及提供模块,被配置为提供针对目标请求的响应内容,其中响应内容是由目标模型根据目标请求并基于第一音频内容所生成

[0007]在本公开的第五方面,提供了一种信息处理装置

该装置包括:获取模块,被配置为获取第二音频内容和针对第二音频内容的第二提示项,第二提示项用于指示目标模型基于第二音频内容来响应第二提示项;以及提供模块,被配置为提供目标内容,其中目标内容是由目标模型至少基于第二音频内容的非话语部分所生成

[0008]在本公开的第六方面,提供了一种信息处理装置

该装置包括:获取模块,被配置为获取音频内容和提示项;确定模块,被配置为基于音频内容的音频特征表示和提示项的文本特征表示,确定第一中间特征表示;转换模块,被配置为利用一组预设的查询特征表示,将第一中间特征表示转换为第二中间特征表示;以及生成模块,被配置为至少基于第二
中间特征表示,生成用于响应提示项的内容

[0009]在本公开的第七方面,提供了一种电子设备

该电子设备包括:至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到所述至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令在由至少一个处理单元执行时使电子设备执行第一方面

第二方面和
/
或第三方面的方法

[0010]在本公开的第八方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现第一方面

第二方面和
/
或第三方面的方法

[0011]应当理解,本内容部分中所描述的内容并非旨在限定本公开的实施例的关键特征或重要特征,也不用于限制本公开的范围

本公开的其它特征将通过以下的描述而变得容易理解

附图说明
[0012]结合附图并参考以下详细说明,本公开各实施例的上述和其它特征

优点及方面将变得更加明显

在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
[0013]图1示出了本公开的实施例能够在其中实现的示例环境的示意图;
[0014]图2示出了根据本公开的一些实施例的示例交互界面;
[0015]图
3A
至图
3C
示出了根据本公开的一些实施例的示例场景;
[0016]图4示出了根据本公开的一些实施例的目标模型的示例结构的示意图;
[0017]图
5A
至图
5C
示出了根据本公开的一些实施例的信息处理的过程的流程图;
[0018]图
6A
至图
6C
示出了根据本公开的一些实施例的信息处理的装置的框图;以及
[0019]图7示出了能够实施本公开的多个实施例的设备的框图

具体实施方式
[0020]下面将参照附图更详细地描述本公开的实施例

虽然附图中示出了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反,提供这些实施例是为了更加透彻和完整地理解本公开

应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围

[0021]在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。
术语“基于”应当理解为“至少部分地基于”。
术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。
术语“一些实施例”应当理解为“至少一些实施例”。
下文还可能包括其它明确的和隐含的定义

[0022]在本文中,除非明确说明,“响应于
A”执行一个步骤并不意味着在“A”之后立即执行该步骤,而是可以包括一个或多个中间步骤

[0023]可以理解的是,本技术方案所涉及的数据
(
包括但不限于数据本身

数据的获得

使用

存储或删除
)
应当遵循相应法律法规及相关规定的要求

[0024]可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当根据相关法律法规通过适当的方式对本公开所涉及信息的类型

使用范围

使用场景等告知相关用户并获得相关用户的授权,其中,相关用户可以包括任何类型的权利主体,例如个人

企业

团体

[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种信息处理方法,包括:获取第一音频内容和针对所述第一音频内容的第一提示项,所述第一提示项用于指示目标模型响应所述第一音频内容中包括的目标请求;以及提供针对所述目标请求的响应内容,其中所述响应内容是由所述目标模型根据所述目标请求并基于所述第一音频内容所生成
。2.
根据权利要求1所述的方法,其中所述目标请求包括问询请求和
/
或推理请求
。3.
根据权利要求1所述的方法,其中所述第一音频内容包括请求部分和背景部分,所述请求部分用于指示所述目标请求,并且所述响应内容至少基于与所述背景部分相关联的音频特征而被生成
。4.
根据权利要求3所述的方法,其中所述音频特征包括非话语特征
。5.
一种信息处理方法,包括:获取第二音频内容和针对所述第二音频内容的第二提示项,所述第二提示项用于指示目标模型基于所述第二音频内容来响应所述第二提示项;以及提供目标内容,其中所述目标内容是由所述目标模型至少基于所述第二音频内容的非话语特征所生成
。6.
一种信息处理方法,包括:获取音频内容和提示项;基于所述音频内容的音频特征表示和所述提示项的文本特征表示,确定第一中间特征表示;利用一组预设的查询特征表示,将所述第一中间特征表示转换为第二中间特征表示;以及至少基于所述第二中间特征表示,生成用于响应所述提示项的内容
。7.
根据权利要求6所述的方法,其中至少基于所述第二中间特征表示生成用于响应所述提示项的内容包括:基于所述第二中间特征表示和所述提示项,生成用于输入到语言处理模块的第一输入;以及由所述语言处理模块至少基于所述第一输入生成用于响应所述提示项的内容
。8.
根据权利要求7所述的方法,其中由所述语言处理模块至少基于所述第一输入生成用于响应所述提示项的内容包括:获取用于输入到语言处理模块的第二输入,所述第二输入包括与所述语言处理模块相关联的一组微调参数;以及由所述语言处理模块基于所述第一输入和所述第二输入生成用于响应所述提示项的内容
。9.
根据权利要求6所述的方法,其中基于所述音频内容的音频特征表示和所述提示项的文本特征表示确定第一中间特征表示包括:将所述文本特征表示投影至与所述音频特征表示对应的特征维度;以及基于所述音频特征表示和经投影的所述文本特征表示,确定所述第一中间特征表示
。10.
根据权利要求6所述的方法,其中利用一组预设的查询特征表示将所述第一中间特征表示转换为第二中间特征表示包括:
确定所述第一中间特征表示与所述一组预设的查询特征表示之间的一组注意力;以及基于所述一组注意力,将所述第一中间特征表示转换为所述第二中间特征表示
。11.
根据权利要求6所述的方法,其中所述信息处理方法是由目标模型所执行,所述目标模型包括转换器模块,所述转换器模块用于将所述第一中间特征表示转换为第二中间特征表示,并且所述目标模型至少基于以下过程而被训练:确定一组初始的查询特征表示;以及在固定所述目标模型除所述转换器模块和查询特征表示以外的其它参数的情况下,利用第一组训练数据来...

【专利技术属性】
技术研发人员:陈献钊唐昌礼于文一孙广智谭天李伟卢璐马泽君
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1