一种中医视频中英双语字幕自动生成系统技术方案

技术编号:37149087 阅读:27 留言:0更新日期:2023-04-06 22:03
本发明专利技术公开了一种中医视频中英双语字幕自动生成系统,包括基于系统架构的前端信息获取模块、解析处理模块和后端编写模块,前端信息获取模块获取视频数据,并根据获取的视频数据类型调用中医药术语库的数据。本发明专利技术与现有技术相比的优点在于:系统架构设计和流程步骤合理,通过自建语料库去导入到语音识别引擎进行模型训练,并通过知识图谱技术进行动态更新,以此不断构建和完善的模型去提升对中医领域的语音识别准确率,有效提高中医视频的双语翻译效率和准确度,减轻了翻译人员的工作负荷,适用性好,便于推广。便于推广。便于推广。

【技术实现步骤摘要】
一种中医视频中英双语字幕自动生成系统


[0001]本专利技术涉及中医领域,具体是指一种中医视频中英双语字幕自动生成系统。

技术介绍

[0002]中医理论来源于对医疗经验的总结,其内容包括精气学说、气血津液、藏象、经络、体质、病因、发病、病机、治则、养生等。早在两千多年前,中医专著《黄帝内经》问世,奠定了中医学的基础。时至今日,中国传统医学相关的理论、诊断法、治疗方法等,均可在此书中找到根源。

技术实现思路

[0003]本专利技术要解决的技术问题是目前中医视频均以汉语为解说音源,在翻译过程中多依靠人工翻译,导致翻译效率低且存在翻译准确性不高的问题,也提高了翻译人员的工作负荷。
[0004]为解决上述技术问题,本专利技术提供的技术方案为:一种中医视频中英双语字幕自动生成系统,包括基于系统架构的前端信息获取模块、解析处理模块和后端编写模块,前端信息获取模块获取视频数据,并根据获取的视频数据类型调用中医药术语库的数据;解析处理模块通过科大讯飞接口对语音内容进行识别,在解析结果后得到文本并生成相应的字幕,解析处理模块内置有判断程序,判断程序检测生成的字幕结果是否需要翻译,具体包括:1)需要翻译,系统调用百度机器翻译机口和中英双语中医药术语翻译库对字幕结果进行翻译并生成双语字幕;2)不需要翻译,直接将字幕结果进行导出;判断程序对字幕进行关键词提取,提取的带有关键词的数据通过信道传输至后端编写模块,后端编写模块通过网页页面制作而成,通过信道获取前端信息获取模块、解析处理模块发送来的指令数据进行系统制作。r/>[0005]本专利技术与现有技术相比的优点在于:系统架构设计和流程步骤合理,通过自建语料库去导入到语音识别引擎进行模型训练,并通过知识图谱技术进行动态更新,以此不断构建和完善的模型去提升对中医领域的语音识别准确率,有效提高中医视频的双语翻译效率和准确度,减轻了翻译人员的工作负荷,适用性好,便于推广。
[0006]进一步的,前端信息获取模块的音频获取方法包括语音信号提取、声音特征参数提取。
[0007]进一步的,解析处理模块对识别的语音数据解析功能基于阿里的开源库FastJson。
[0008]进一步的,解析处理模块基于TextView生成字幕结果。
[0009]进一步的,后端编写模块功能包括:1)利用知识图谱技术进行检索;2)修改字幕;3)人声提取;4) 音频转写;5)语音播报。
附图说明
[0010]图1是一种中医视频中英双语字幕自动生成系统的工作流程示意图。
[0011]图2是实施例一的示意图。
[0012]图3是实施例二的示意图。
[0013]图4是实施例三的示意图。
具体实施方式
[0014]下面结合附图对本专利技术做进一步的详细说明。
[0015]本专利技术在具体实施时,如图1所示的实施例中,前端信息获取模块获取视频数据,并根据获取的视频数据类型调用中医药术语库的数据;解析处理模块通过科大讯飞接口对语音内容进行识别,在解析结果后得到文本并生成相应的字幕,解析处理模块内置有判断程序,判断程序检测生成的字幕结果是否需要翻译,具体包括:1)需要翻译,系统调用百度机器翻译机口和中英双语中医药术语翻译库对字幕结果进行翻译并生成双语字幕;2)不需要翻译,直接将字幕结果进行导出;判断程序对字幕进行关键词提取,提取的带有关键词的数据通过信道传输至后端编写模块,后端编写模块通过网页页面制作而成,通过信道获取前端信息获取模块、解析处理模块发送来的指令数据进行系统制作。每个导入的视频都可以生成视频对应的小型知识图谱。
[0016]进一步的,前端信息获取模块的音频获取方法包括语音信号提取、声音特征参数提取。解析处理模块对识别的语音数据解析功能基于阿里的开源库FastJson。解析处理模块基于TextView生成字幕结果。后端编写模块功能包括:1)利用知识图谱技术进行检索;2)修改字幕;3)人声提取;4)音频转写;5)语音播报。
[0017]在本专利技术的一个实施例中,如图2所示,本实施例给出的是系统所搭载的各项技术,具体包括:1) 语音识别技术,语音识别技术包含声学特征参数提取(梅尔频率倒谱系数、声学模型训练、语音模型训练、线性预测分析)、实时语音转写技术(握手阶段、实时通信阶段)、语音信号的获取(A/D转换、采样、量化、编码);
[0018]2)系统开发技术(网页制作、后台开发);
[0019]3)字幕生成(TextView、Observab监听语音识别结果);
[0020]4)中医药术语数据库(对照国家中医术语标准、中国药典中医中药网);
[0021]5)知识图谱(解析中医关键词、构建知识梳理图);
[0022]6)双语种翻译技术(阿里开源库FastJSon、百度机翻译引擎、

多语种翻译术语库(中医术语翻译对照标准、中医术语翻译对照辞典)、ViewModel)。
[0023]7)采用neo4j技术,对数据库中的专业术语关键词和之间的关系检索。
[0024]在本专利技术的一个实施例中,如图3所示,本实施例给出的是系统的工作原理,中医药术语库通过语音识别获得并解析文本得到关键词,利用知识图谱技术进行检索,检索后的结果完善知识图谱并动态扩充中医药术语库,而中医药术语库通过术语识别准确率来检验知识图谱合理性。
[0025]在本专利技术的一个实施例中,如图4所示,本实施例给出的是系统的循环式流程,系统提取音频并调用中医药术语库,通过科大讯飞接口和阿里开源库FastJSon进行语音识别,识别后的结果通过“是否转成英语”的逻辑算法进行处理,是则调用中英双语中医药术
语库和翻译接口并最后生成字幕,否则直接生成字幕(中文),系统对字幕进行解析并提取出关键词,利用提取的关键词进行知识图谱检索,在完善知识图谱过程中会产生许多中医术语,将其用来完善中医术语语料库。在细节设计上,通过自训练平台结合中医药术语库训练模型对其进行语音识别。
[0026]以上显示和描述了本专利技术的基本原理和主要特征以及专利技术的优点,本行业的技术人员应该了解,本专利技术不受上述实施例的限制,上述实施例和说明书中描述的只是说明本专利技术的原理,在不脱离本专利技术精神和范围的前提下,本专利技术还会有各种变化和改进,这些变化和改进都落入要求保护的本专利技术范围内。本专利技术要求保护范围由所附的权利要求书及其等效物界定。
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种中医视频中英双语字幕自动生成系统,包括基于系统架构的前端信息获取模块、解析处理模块和后端编写模块,其特征在于:所述前端信息获取模块获取视频数据,并根据获取的视频数据类型调用中医药术语库的数据;所述解析处理模块通过科大讯飞接口对语音内容进行识别,在解析结果后得到文本并生成相应的字幕,解析处理模块内置有判断程序,判断程序检测生成的字幕结果是否需要翻译,具体包括:1)需要翻译,系统调用百度机器翻译机口和中英双语中医药术语翻译库对字幕结果进行翻译并生成双语字幕;2)不需要翻译,直接将字幕结果进行导出;所述判断程序对字幕进行关键词提取,提取的带有关键词的数据通过信道传输至后端编写模块,所述后端编写模块通过网页页面制作而成,通过信道获取前端信息获取模块...

【专利技术属性】
技术研发人员:刘秀峰吴雨璐王坤杨兴钊陈平平李荣耀
申请(专利权)人:广州中医药大学广州中医药研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1