【技术实现步骤摘要】
一种基于语音的数据处理方法、装置和电子设备
本专利技术涉及
,特别是涉及一种基于语音的数据处理方法、装置和电子设备。
技术介绍
语音识别通常是将语音转换成文字,传统的语音识别记录工具只能将语音数据转换为相应的文字,而无法区分说话人。因此在多人语音的情况下,通过语音识别无法有效的进行记录。例如在医院实际诊疗过程中,至少会有两人进行交流,即至少会有医生和患者进行交流,有时还可能包括患者家属等,而通过现有语音识别工具无法实现对获取的语音问诊记录分别对应的语音产生者进行区分,无法全面的记录整个问诊过程。
技术实现思路
本专利技术实施例提供一种基于语音的数据处理方法,以完整的记录问诊过程。相应的,本专利技术实施例还提供了一种基于语音的数据处理装置、一种电子设备、一种可读存储介质,用以保证上述方法的实现及应用。为了解决上述问题,本专利技术实施例公开了一种基于语音的数据处理方法,包括:获取问诊过程数据,所述问诊过程数据依据问诊过程中采集的语音数据确定;依据所述问诊过程数据进行识别,获取对应的第一文本数据和第二文本数据,其中,所述第一文本数据属于一个目标用户,所述第二文本数据属 ...
【技术保护点】
1.一种基于语音的数据处理方法,其特征在于,包括:获取问诊过程数据,所述问诊过程数据依据问诊过程中采集的语音数据确定;依据所述问诊过程数据进行识别,获取对应的第一文本数据和第二文本数据,其中,所述第一文本数据属于一个目标用户,所述第二文本数据属于除所述目标用户之外的其他用户;依据所述第一文本数据和第二文本数据,得到问诊信息。
【技术特征摘要】
1.一种基于语音的数据处理方法,其特征在于,包括:获取问诊过程数据,所述问诊过程数据依据问诊过程中采集的语音数据确定;依据所述问诊过程数据进行识别,获取对应的第一文本数据和第二文本数据,其中,所述第一文本数据属于一个目标用户,所述第二文本数据属于除所述目标用户之外的其他用户;依据所述第一文本数据和第二文本数据,得到问诊信息。2.根据权利要求1所述的方法,其特征在于,所述问诊过程数据为语音数据;所述依据所述问诊过程数据进行识别,获取对应的第一文本数据和第二文本数据,包括:依据声纹特征,从所述语音数据中分离出第一语音数据和第二语音数据;对所述第一语音数据和第二语音数据分别进行语音识别,获取对应的第一文本数据和第二文本数据。3.根据权利要求2所述的方法,其特征在于,所述依据声纹特征,从所述语音数据中分离出第一语音数据和第二语音数据,包括:将所述语音数据划分为多个语音片段;依据声纹特征,采用所述语音片段确定第一语音数据和第二语音数据。4.根据权利要求3所述的方法,其特征在于,所述依据声纹特征,采用所述语音片段确定第一语音数据和第二语音数据,包括:采用基准声纹特征对各语音片段分别进行匹配,其中,所述基准声纹特征为目标用户的声纹特征;获取与所述基准声纹特征相符的语音片段,得到对应的第一语音数据;获取与所述基准声纹特征不相符的语音片段,得到对应的第二语音数据。5.根据权利要求3所述的方法,其特征在于,所述依据声纹特征,采用所述语音片段确定第一语音数据和第二语音数据,包括:对各语音片段的声纹特征进行识别;统计各声纹特征分别对应语音片段的数量;确定具有语音片段的数量最大的声纹特征,采用所述声纹特征对应的语音片段生成第一语音数据;采用不属于所述第一语音数据的语音片段生成第二语音数据。6.根据权利要求2所述的方法,其特征在于,所述对所述第一语音数据和第二语音数据分别进行语音识别,获取对应的第一文本数据和第二文本数据,包括:对所述第一语音数据中各语音片段分别进行语音识别,采用识别得到的文本片段生成第一文本数据;对所述第二语音数据中各语音片段分别进行语音识别,采用识别得到的文本片段生成第二文本数据;则,所述依据所述第一文本数据和第二...
【专利技术属性】
技术研发人员:李明修,银磊,卜海亮,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。