【技术实现步骤摘要】
一种构建数据库、语音编程的方法及相关装置
本申请涉及语音数据处理
,尤其涉及一种构建数据库、语音编程的方法及相关装置。
技术介绍
随着科技的快速发展,语音识别技术应用于越来越多的领域。编程是编定程序的中文简称,实际上是指开发人员进行代码编写得到程序。一般地,开发人员使用键盘+鼠标设备编程,但采用此方式需要开发人员的双手足够协调以及开发人员对键盘和鼠标设备极其熟悉,因而,语音识别技术逐渐应用于编程领域实现语音编程。目前,语音编程的具体实现方式是指首先获取开发人员输入的编程语音,然后,识别开发人员输入的编程语音,在编程数据库内搜索对应的编程标识符并调取;最后,基于开发人员输入的编程语音的顺序组合调取的编程标识符形成程序。对于不同开发人员输入的编程语音而言,均采用上述编程数据库。但是,由于不同开发人员进行语音编程时,不同开发人员对相同含义的关键字、变量名称或函数名称等编程标识符的命名习惯或发音习惯等不同,则针对不同开发人员输入的编程语音,通过上述编程数据库无法高效准确地搜索到对应的编程标识符,即,上述语音编程 ...
【技术保护点】
1.一种构建数据库的方法,其特征在于,包括:/n确定目标编程语言的编程标识符;/n获得目标用户对所述编程标识符的发音特征作为所述编程标识符的语音特征;/n基于所述编程标识符对应存储所述编程标识符的语音特征,构建对应所述目标用户和所述目标编程语言的目标编程数据库。/n
【技术特征摘要】
1.一种构建数据库的方法,其特征在于,包括:
确定目标编程语言的编程标识符;
获得目标用户对所述编程标识符的发音特征作为所述编程标识符的语音特征;
基于所述编程标识符对应存储所述编程标识符的语音特征,构建对应所述目标用户和所述目标编程语言的目标编程数据库。
2.根据权利要求1所述的方法,其特征在于,所述目标编程语言包括C语言、C++语言、C#语言、Java语言、go语言、python语言或scala语言;所述编程标识符的类型包括关键字、函数名称、自定义变量名称、常量名称和类名称中的一种或多种;所述函数名称包括常用函数名称和/或自定义函数名称。
3.根据权利要求1所述的方法,其特征在于,所述获得目标用户对所述编程标识符的发音特征作为所述编程标识符的语音特征,包括:
获取所述目标用户对所述编程标识符的发音数据;
基于语音特征提取模型获得所述发音数据的发音特征作为所述编程标识符的语音特征。
4.根据权利要求2所述的方法,其特征在于,若所述编程标识符的类型为自定义函数名称或自定义变量名称时,在所述确定目标编程语言的编程标识符之前,还包括:
预先自定义并存储所述编程标识符。
5.根据权利要求1所述的方法,其特征在于,所述基于所述编程标识符对应存储所述编程标识符的语音特征,具体为:
基于所述编程标识符对应存储所述编程标识符的类型、拼写数据、发音数据和语音特征。
6.根据权利要求1所述的方法,其特征在于,还包括:
确定所述目标编程语言的常用代码编辑模板和对应的模板名称;
将所述常用代码编辑模板和所述模板名称对应存储在所述目标编程数据库中。
7.根据权利要求1所述的方法,其特征在于,还包括:
确定所述目标编程语言的开发环境执行操作和对应的执行指令;
将所述开发环境执行操作和所述执行指令对应存储在所述目标编程数据库中。
8.一种语音编程的方法,其特征在于,利用如权利要求1-7任一项所述的目标编程数据库,包括:
获取目标用户的待识别编程语音数据,所述待识别编程语音数据包括待识别编程标识符语音数据;
获得所述待识别编程标识符语音数据的语音特征;基于目标用户的标识和编程语言的标识确定所述目标编程数据库;
在所述目标编程数据库中确定所述待识别编程标识符语音数据的语音特征对应的编程标识符。
9.根据权利要求8所述的方法,其特征在于,所述待识别编程语音还包括待识别模板名称语音数据,所述目标编程数据库为如权利要求6或7所述的目标编程数据库,还包括:
识别所述待识别模板名称语音数据中的模板名称;
在所述目标编程数据库中确定所述模板名称对应的常用代码...
【专利技术属性】
技术研发人员:刘伟,谢远江,许静芳,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。