音频播放方法、装置、设备及可读存储介质制造方法及图纸

技术编号：40836298 阅读：3 留言：0更新日期：2024-04-01 15:01

本申请实施例提供一种音频播放方法、装置、设备及可读存储介质。该方法包括：获取第一文本，第一文本是多媒体文件的相关文本；通过第一大型语言模型，对第一文本进行摘要提取，得到第二文本；通过第二大型语言模型，对第二文本进行口语化生成，得到第三文本；将第三文本转换为音频文件，得到多媒体文件的介绍音频；播放多媒体文件以及多媒体文件的介绍音频。为多媒体文件生成对应的介绍内容，辅助用户对多媒体文件作进一步了解，提高用户收听多媒体文件的趣味性；以及将多媒体文件和对应的介绍音频进行关联，进一步提高对多媒体文件信息的获取效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及多媒体，特别涉及一种音频播放方法、装置、设备及可读存储介质。

技术介绍

1、用户通常通过多媒体应用程序来播放多媒体文件，例如：利用音乐类播放类应用程序收听音乐作品、利用视频播放类应用程序浏览影视作品等等。

2、相关技术中，用户在单一的应用程序中只能实现一个目的，例如：对音乐作品进行播放时，用户只能对当前音乐作品进行收听。如果需要搜索与当前音乐作品相关的介绍信息，只能通过其他应用程序进行查看。

3、然而，当用户处于听歌场景时，听歌环境单一，音乐作品与其相关的介绍信息无任何关联性，降低用户获取信息的效率以及降低用户的听歌体验。

技术实现思路

1、本申请实施例提供了一种音频播放方法、装置、设备及可读存储介质，利用生成的介绍音频对多媒体文件进行辅助介绍，提高用户收听多媒体文件的趣味性以及提高对多媒体文件信息的获取效率。所述技术方案如下：

2、一个方面，提供了一种音频播放方法，所述方法包括：

3、获取第一文本，所述第一文本是多媒体文件的相关文本；

4、通过第一大型语言模型，对所述第一文本进行摘要提取，得到第二文本；

5、通过第二大型语言模型，对所述第二文本进行口语化处理，得到第三文本；

6、将所述第三文本转换为音频文件，得到所述多媒体文件的介绍音频；

7、播放所述多媒体文件以及所述多媒体文件的介绍音频。

8、另一方面，提供了一种音频播放装置，所述装置包括：

9、获

10、提取模块，用于通过第一大型语言模型，对所述第一文本进行摘要提取，得到第二文本；

11、生成模块，用于通过第二大型语言模型，对所述第二文本进行口语化处理，得到第三文本；

12、转换模块，用于将所述第三文本转换为音频文件，得到所述多媒体文件的介绍音频；

13、播放模块，用于播放所述多媒体文件以及所述多媒体文件的介绍音频。

14、另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一段程序，所述至少一段程序由素数处理器加载并执行如上述的音频播放方法。

15、另一方面，提供了一种计算机可读存储介质，所述可读存储介质中存储有至少一段程度，所述至少一段程度由处理器加载并执行以实现如上述的音频播放方法。

16、另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行以实现如上述的音频播放方法。

17、本申请实施例提供的技术方案带来的有益效果至少包括：

18、利用第一大型语言模型对与多媒体文件相关的第一文本进行摘要提取，得到第二文本；再基于第二大型语言模型对第二文本进行口语化处理得到的第三文本进行音频转换，得到与多媒体文件具有关联性的介绍音频，进而播放多媒体文件以及介绍音频。利用大型语言模型对多媒体文件的相关信息进行逐层级处理，使生成的第三文本较为简短并具备口语化特征。用户收听介绍音频时，有效提升用户与多媒体文件的距离感；收听多媒体文件时还可以收听到与多媒体文件相关的介绍信息，进一步提高用户获取信息的效率。

本文档来自技高网...

【技术保护点】

1.一种音频播放方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述通过第一大型语言模型，对所述第一文本进行摘要提取，得到第二文本，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过所述第一大型语言模型，对所述多媒体文件的歌手信息进行摘要提取，得到所述第二文本，包括：

4.根据权利要求2所述的方法，其特征在于，所述通过所述第一大型语言模型，对所述多媒体文件的专辑信息进行摘要提取，得到所述第二文本，包括：

5.根据权利要求2所述的方法，其特征在于，所述通过所述第一大型语言模型，对所述多媒体文件的歌词信息进行摘要提取，得到所述第二文本，包括：

6.根据权利要求1至5任一所述的方法，其特征在于，所述通过第二大型语言模型，对所述第二文本进行口语化处理，得到第三文本，包括：

7.根据权利要求6所述的方法，其特征在于，所述提示所述第二大型语言模型，采用目标口吻模式对所述第二文本进行口语化处理，生成所述第三文本，包括：

8.根据权利要求7所述的方法，其特征在于，所述提示所述第

9.根据权利要求8所述的方法，其特征在于，所述基于预设评分规则，对所述至少两个候选第三文本进行评分，得到至少两个分数，包括：

10.根据权利要求8所述的方法，其特征在于，所述基于预设评分规则，对所述至少两个候选第三文本进行评分，得到至少两个分数，包括：

11.根据权利要求8所述的方法，其特征在于，所述基于预设评分规则，对所述至少两个候选第三文本进行评分，得到至少两个分数，包括：

12.根据权利要求1所述的方法，其特征在于，所述方法还包括：

13.一种音频播放装置，其特征在于，所述装置还包括：

14.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一段程序，所述至少一段程序由所述处理器加载并执行以实现如权利要求1至12任一所述的音频播放方法。

15.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一段程序，所述至少一段程序由处理器加载并执行以实现如权利要求1至12任一所述的音频播放方法。

...

【技术特征摘要】

1.一种音频播放方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述通过第一大型语言模型，对所述第一文本进行摘要提取，得到第二文本，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过所述第一大型语言模型，对所述多媒体文件的歌手信息进行摘要提取，得到所述第二文本，包括：

4.根据权利要求2所述的方法，其特征在于，所述通过所述第一大型语言模型，对所述多媒体文件的专辑信息进行摘要提取，得到所述第二文本，包括：

5.根据权利要求2所述的方法，其特征在于，所述通过所述第一大型语言模型，对所述多媒体文件的歌词信息进行摘要提取，得到所述第二文本，包括：

6.根据权利要求1至5任一所述的方法，其特征在于，所述通过第二大型语言模型，对所述第二文本进行口语化处理，得到第三文本，包括：

8.根据权利要求7所述的方法，其特征在于，所述提示所述第二大型语言模型...

【专利技术属性】
技术研发人员：付敏，朱艺，蔡海军，曾冠东，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人