数据获取装置和获取方法制造方法及图纸

技术编号:15765127 阅读:87 留言:0更新日期:2017-07-06 07:12
本发明专利技术公开了一种数据获取装置,该数据获取装置包括:语音采集模块、传感器模块和控制模块,其中,语音采集模块用于采集语音信息;传感器模块用于采集语音信息所对应的语音发出者的行为状态信息;控制模块根据时间顺序以标记语言格式分别对语音信息和行为状态信息进行标记处理,并将标记处理之后的信息根据对应的语音发出者进行保存。该数据获取装置,为提升传统的管理方法提供技术可行性,为将传统的粗放式管理转换为更加客观的数据化精细话管理提供数据基础。本发明专利技术还公开了一种数据获取方法。

Data acquisition device and acquisition method

The invention discloses a data acquisition device, the data acquisition device comprises a voice acquisition module, sensor module and control module, the voice acquisition module is used for collecting voice information; sensor module for voice acquisition corresponding to the voice information issued by the bank for the state information; control module based on time sequence in a markup language format respectively. The voice information and behavior information tag processing, and label processing after the information according to the corresponding voice issued to save. The data acquisition device provides technical feasibility for improving traditional management methods, and provides data base for converting traditional extensive management to more objective data and fine word management. The invention also discloses a data acquisition method.

【技术实现步骤摘要】
数据获取装置和获取方法
本专利技术属于信息处理
,尤其涉及一种数据获取装置,以及一种数据获取方法。
技术介绍
随着基于云的大数据技术和可穿戴智能电子产品技术的发展,为提升传统的管理方法提供了许多的可能性。比如,针对营销业务人员的管理,可以通过配备可穿戴式智能大数据采集终端设备,通过数据采集,大数据分析,获得许多传统方法无法获取的有价值信息。例如,业务人员和客户沟通的技巧评估、业务人员为客户传达信息的要素点分析、客户潜在需求分析、业务人员业绩评估要素分析等。将传统的粗放式管理转化为更客观的数据化精细化管理,是建立高效精益化管理的必要技术保证。在相关技术中,公开了一种客服语音智能搜索和分析系统及方法,其主要专注于对录音文件、音频文件分析处理的方法,例如,如何从录音文件、音频文件数字化,基于VAD段和特征提取技术区分语音对话角色实现场景分割,将结果已文本文件输出,完成语音转写过程,然后进行索引,检索等分析。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术需要提出一种数据获取装置,该装置,为提升传统的管理方法提供技术可行性,为将传统的粗放式管理转换为更加客观的数据化精细话管理提供数据基础。本专利技术还提出一种数据获取方法。为了解决上述问题,本专利技术一方面提出一种数据获取装置,该装置包括:语音采集模块,用于采集语音信息;传感器模块,用于采集所述语音信息所对应的语音发出者的行为状态信息;控制模块,所述控制模块根据时间顺序以标记语言格式分别对所述语音信息和所述行为状态信息进行标记处理,并将标记处理之后的信息根据对应的所述语音发出者进行保存。本专利技术实施例的数据获取装置,通过传感器模块采集语音发出者的行为状态信息,进而控制模块根据时间顺序以标记语言格式分别对语音信息和该行为状态信息进行标记处理,从而使得语音信息与行为状态信息关联,并对应目标人员保存数据,通过关联更多的数据可以获得更加客观的结果,为更加客观化精细化的管理提供数据基础和技术可行性。为了解决上述问题,本专利技术另一方面提出一种数据获取方法,该方法包括以下步骤:采集语音信息;采集所述语音信息对应的语音发出者的行为状态信息;根据时间顺序以标记语言格式分别对所述语音信息和所述行为状态信息进行标记处理,并将标记处理之后的信息根据对应的所述语音发出者进行保存。本专利技术实施例的数据获取方法,通过采集语音发出者的行为状态信息,进而根据时间顺序以标记语言格式分别对语音信息和行为状态信息进行标记处理,使得语音信息和行为状态信息相关联,可以获得更加客观的结果,为更加客观化精细化的管理提供数据基础和技术可行性。附图说明图1是根据本专利技术的一个实施例的数据获取装置的功能框图;图2是根据本专利技术的另一个实施例的数据获取装置的功能框图;以及图3是根据本专利技术的一个实施例的数据获取方法的流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。针对通过数据采集和大数据分析实现更加客观的数据化精细化管理的实现,虽然在相关技术中提出从录音文件、音频文件数字化,基于VAD(VoiceActivityDetection,语音活动检测)段和特征提取技术区分语音对话角色实现场景分割,将结果以文本文件输出,完成语音转写过程,然后进行索引,检索等分析。但是,并没有提到如何获得此类音频文件,只是针对音频信息提取获得数据进一步的挖掘,并没有更进一步地关联语音角色的地理特征信息例如行为轨迹等,或者人体行为信息例如静止、走动等。换句话说,相关技术对语音信息的发出者本身的一些关联信息关注的比较少,因而在某些领域,采用采集到的数据对相关人员进行更加客观化精细化管理有待进一步完善。在本专利技术实施例中,正是考虑到语音信息的发出者本身的关联信息,而提出一种数据获取装置和采集方法。下面对本专利技术实施例的数据获取装置进行说明。图1是根据本专利技术的一个实施例的数据获取装置的框图。如图1所示,该装置100包括语音采集模块20、传感器模块30和控制模块40。其中,语音采集模块20用于采集语音信息,例如采集目标人员的语音数据、开始时间、时长、声音强度等;传感器模块30用于采集语音信息所对应的语音发出者的行为状态信息,例如,采集语音发出者的行为活动轨迹、形态例如走路、坐着或者站着,也就是说,在采集语音信息的同时,获得语音发出者的其他相关信息,采集更多的信息进行分析,可以获得更加客观的结果。控制模块40根据时间顺序以标记语言格式分别对语音信息和行为状态信息进行标记处理,并将标记处理之后的信息根据对应的语音发出者进行保存。其中,标记语言,是一种将文本以及文本相关的其他信息结合起来,展现出关于文档结构和数据处理细节的电脑文字编码,与文本相关的其他信息(例如包括文本的结构和表示信息等)与原来的文本结合在一起,但是使用标记进行标识。具体地,控制模块40获取某人员在某段时间的语音信息和对应该段时间的行为状态信息,并对语音信息和行为状态信息进行标记处理。例如,标记语音信息,以及增加该被标记语音信息的额外信息例如开始时间、时长、声音强度;以及,标记该语音信息发出者的各种行为状态,并增加各个行为状态信息对应的额外信息例如对于活动轨迹进行标记,并增加活动轨迹的额外信息例如坐标数据和时间等。通过以标记语言格式分别对语音信息和行为状态信息进行标记处理,将语音信息和行为状态信息进行关联,从而通过标记以结构化的格式存储数据,可以更好地表现目标人员的很多数据关系,更加准确高效地搜索相关数据内容。也就是说,本专利技术实施例的装置100,关联语音发出者的更多的特征信息,通过采集此类语音数据和语音发出者的行为状态信息,控制模块40进行标记处理,进而通过算法可以测算出目标人员的行为习惯、工作状态、工作绩效等。本专利技术实施例的数据获取装置100,通过传感器模块30采集语音发出者的行为状态信息,进而控制模块40根据时间顺序以标记语言格式分别对语音信息和该行为状态信息进行信息标记处理,通过关联更多的信息,可以获得更加客观的结果,为将传统的粗放式管理转换为更加客观化精细化的管理提供数据基础和技术可行性。具体地,在本专利技术的实施例中,控制模块40以可扩展标记语言(XML,ExtensibleMarkupLanguage)格式分别对语音信息和行为状态信息进行标记处理。通过相关技术可知,可扩展标记语言,是标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言,它的标签没有被预定义,需要自行定义标签,其被设计为具有自我描述性。因此,采用XML可以自定义标签,并为被标记内容附加一些额外的信息。具体地,采用XML格式进行标记处理时,控制模块40分别对语音信息和行为状态信息标记对应的标签,以及分别标记语音信息和行为状态信息对应的标签的嵌套子元素,其中,嵌套子元素包括时间信息。例如,语音信息标记为音频信息标签,该音频信息标签对应的嵌套子元素包括录音开始、识别结束,时长,声强。其中,传感器模块30可以包括但不限于重力传感器、加速度传感器、磁力传感器和GPS(Gl本文档来自技高网...
数据获取装置和获取方法

【技术保护点】
一种数据获取装置,其特征在于,包括:语音采集模块,用于采集语音信息;传感器模块,用于采集所述语音信息所对应的语音发出者的行为状态信息;和控制模块,所述控制模块根据时间顺序以标记语言格式分别对所述语音信息和所述行为状态信息进行标记处理,并将标记处理之后的信息根据对应的所述语音发出者进行保存。

【技术特征摘要】
1.一种数据获取装置,其特征在于,包括:语音采集模块,用于采集语音信息;传感器模块,用于采集所述语音信息所对应的语音发出者的行为状态信息;和控制模块,所述控制模块根据时间顺序以标记语言格式分别对所述语音信息和所述行为状态信息进行标记处理,并将标记处理之后的信息根据对应的所述语音发出者进行保存。2.如权利要求1所述的数据获取装置,其特征在于,所述控制模块以可扩展标记语言格式分别对所述语音信息和所述行为状态信息进行标记处理。3.如权利要求2所述的数据获取装置,其特征在于,所述控制模块分别对所述语音信息和所述行为状态信息标记对应的标签,以及分别标记所述语音信息和所述行为状态信息对应的所述标签的嵌套子元素,所述嵌套子元素包括时间信息。4.如权利要求3所述的数据获取装置,其特征在于,所述传感器模块包括重力传感器、加速度传感器、磁力传感器和GPS接收模块中的一种或者多种。5.如权利要求4所述的数据获取装置,其特征在于,其中,所述语音信息标记为音频信息标签,所述音频信息标签对应的嵌套子元素包括录音开始、识别结束,时长,声强;所述行为状态信息对应的标签和对应的标签的嵌套子元素包括以下任意一种或多种:所述重力传感器采集的信息标记为重力信息标签,所述重力信息标签对应的嵌套子元素包括重力和时间;所述加速度传感采集的信息标记为加速度信息标签,所述加速度信息标签对应的嵌套子元素包括加速度和时间;所述磁力传感器采集的信息标记为磁力信息标签,所述磁力信息标签对应的嵌套子元素包括磁力数据和时间;所述GPS接收模块采集的信息标记为GPS信息标签,所述GPS信息标签对应的嵌套子元素包括坐标数据和时间。6.如权利要求1所述的数据获取装置,其特征在于,还包括:电源单元和电源管理单元,所述电源管理单元对所述数据获取装置的供电进行管理。7.如权利要求6所述的数据获取装置,其特征在于,还包括:唤醒模块,用于接收数据采集事件的唤醒指令,在所述唤醒模块未接收到所述唤醒指令时,所述电源管理单元关闭对除了所述唤醒模块以外的模块的供电。8.如权利要求7所述的数据获取装置,其特征在于,所述唤醒指令包括语音唤醒模式或/和运动唤醒模式。9.如权利要求1所述的数据获取装置,...

【专利技术属性】
技术研发人员:范卫军
申请(专利权)人:比亚迪股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1