一种数据提取方法、装置及数据采集终端制造方法及图纸

技术编号:31024044 阅读:13 留言:0更新日期:2021-11-30 03:21
本申请提供一种数据提取方法、装置及数据采集终端,该方法包括:数据采集终端获取电子设备上安装的能即时通讯应用程序中的目标对话数据;从所述目标对话数据中确定纠纷数据;提取所述纠纷数据。这样,通过获取电子设备上的特定对话数据,并对该对话数据进行纠纷数据识别和提取,从而可保证只提取电子设备上实际需要的数据,避免获取过多数据而威胁用户隐私,相比现有方式可极大提高安全性,且无需再对提取数据作进一步筛选,处理效率更高。处理效率更高。处理效率更高。

【技术实现步骤摘要】
一种数据提取方法、装置及数据采集终端


[0001]本申请涉及数据处理
,尤其涉及一种数据提取方法、装置及数据采集终端。

技术介绍

[0002]随着电子技术的发展和手机等电子设备的普及,人们对电子设备的使用日益频繁,在一些场景下,需要获取电子设备上的数据,例如,两个用户之间产生了民事纠纷或刑事纠纷,需要获取这两个用户之间的聊天数据,纠纷例如为诈骗、打架、威胁或恐吓等等,又例如,需要获取遭遇诈骗的用户所使用的电子设备中与诈骗分子的聊天数据。
[0003]而相关技术中,通常是抓取用户电子设备上的所有聊天记录,这样,导致不仅抓取到产生纠纷的双方的所有聊天数据,还可能会抓取到该电子设备对应的用户与其他人的聊天数据,一方面,对用户的隐私数据造成一定泄露风险,安全性较差,另一方面,还需要进一步对抓取的所有的聊天记录进一步提取,导致处理的效率很低。

技术实现思路

[0004]本申请实施例提供一种数据提取方法、装置及数据采集终端,以解决现有获取电子设备数据的方式易对用户的隐私数据造成泄露风险,安全性较差,且处理效率很低的问题。
[0005]为解决上述技术问题,本申请是这样实现的:
[0006]第一方面,本申请实施例提供了一种数据提取方法,应用于数据采集终端,所述数据采集终端用于与电子设备通信连接,所述电子设备中安装有能即时通讯的应用程序,所述方法包括:
[0007]获取所述应用程序中的目标对话数据;
[0008]从所述目标对话数据中确定纠纷数据;
[0009]提取所述纠纷数据。
[0010]可选的,所述从所述目标对话数据中确定纠纷数据,包括:
[0011]将所述目标对话数据对应的每条文本数据与预设的纠纷类型对应的关键字段比对;
[0012]确定比对成功的文本数据为所述纠纷数据。
[0013]可选的,所述数据采集终端上设置有辅助采集程序,所述获取所述应用程序中的目标对话数据,包括:
[0014]运行所述辅助采集程序;
[0015]通过所述辅助采集程序启动所述应用程序,并进入目标对话界面;
[0016]获取所述目标对话界面上的目标对话数据。
[0017]可选的,所述获取所述目标对话界面上的目标对话数据,包括:
[0018]所述辅助采集程序基于进入的所述目标对话界面,播放所述目标对话界面上的至
少一个目标对象发送的语音数据;
[0019]录制播放的所述语音数据,获得录制的目标对话数据;
[0020]对所述录制的目标对话数据进行语音识别,得到所述录制的目标对话数据对应的文本数据。
[0021]可选的,所述提取所述纠纷数据,包括:
[0022]从所述录制的目标对话数据中提取所述纠纷数据对应的音频数据。
[0023]可选的,所述纠纷类型包括诈骗;所述关键字段包括财产类型字段、工作内容类型字段和支付类型字段中的至少一种。
[0024]可选的,所述获取所述应用程序中的目标对话数据,包括:
[0025]根据预先设置的抓取时间段,获取所述应用程序中对话时间在所述抓取时间段内的目标对话数据。
[0026]可选的,所述数据采集终端与所述电子设备建立蓝牙连接,或者所述数据采集终端与所述电子设备通过耳机转接线建立连接。
[0027]第二方面,本申请实施例提供一种数据提取装置,设置在数据采集终端上,所述数据采集终端用于与电子设备通信连接,所述电子设备中安装有能即时通讯的应用程序,所述数据提取装置包括:
[0028]获取模块,用于获取所述应用程序中的目标对话数据;
[0029]确定模块,用于从所述目标对话数据中确定纠纷数据;
[0030]提取模块,用于提取所述纠纷数据。
[0031]可选的,所述确定模块包括:
[0032]比对子模块,用于将所述目标对话数据对应的每条文本数据与预设的纠纷类型对应的关键字段比对;
[0033]确定子模块,用于确定比对成功的文本数据为所述纠纷数据。
[0034]可选的,所述数据采集终端上设置有辅助采集程序,所述获取模块包括:
[0035]运行子模块,用于运行所述辅助采集程序;
[0036]处理子模块,用于通过所述辅助采集程序启动所述应用程序,并进入目标对话界面;
[0037]获取子模块,用于获取所述目标对话界面上的目标对话数据。
[0038]可选的,所述获取子模块包括:
[0039]播放单元,用于由所述辅助采集程序基于进入的所述目标对话界面,播放所述目标对话界面上的至少一个目标对象发送的语音数据;
[0040]录制单元,用于录制播放的所述语音数据,获得录制的目标对话数据;
[0041]识别单元,用于对所述录制的目标对话数据进行语音识别,得到所述录制的目标对话数据对应的文本数据。
[0042]可选的,所述提取模块用于从所述录制的目标对话数据中提取所述纠纷数据对应的音频数据。
[0043]可选的,所述纠纷类型包括诈骗;所述关键字段包括财产类型字段、工作内容类型字段和支付类型字段中的至少一种。
[0044]可选的,所述获取模块用于根据预先设置的抓取时间段,获取所述应用程序中对
Device)等用户设备。
[0058]例如,用户遭遇网络诈骗,公安部门、检察院或公证处等相关部门对诈骗事件取证时,可以采用数据采集终端提取电子设备内的诈骗数据,即数据采集终端可以是公安系统、检察院或公证处等部门用来获取报案用户手机上与诈骗分子的相关聊天数据的设备。本申请实施例可应用于获取用户设备上的诈骗、恐吓、骚扰、广告、贷款等相关的纠纷数据,这些数据可用于公安部门取证、分析犯罪分子手段、宣传防骗知识等。
[0059]本申请实施例中,当需要获取电子设备上的相关数据时,可以将所述数据采集终端与所述电子设备建立连接,以保证所述电子设备上的数据能够通过某种方式传输至所述数据采集终端上。
[0060]可选的,所述数据采集终端与所述电子设备建立蓝牙连接,或者所述数据采集终端与所述电子设备通过耳机转接线建立连接。
[0061]即一种实施方式中,所述数据采集终端与所述电子设备可通过蓝牙建立连接,从而可通过蓝牙传输的方式获取所述电子设备上的相关数据。
[0062]另一种实施方式中,也可以使用耳机转接线连接所述数据采集终端与所述电子设备,例如,将耳机转接线的输出端接入所述电子设备,将耳机转接线的输入端接入所述数据采集终端,这样可将所述电子设备上的音频数据经所述耳机转接线传输至所述数据采集终端,所述数据采集终端就可以获取所述电子设备上相关的音频。
[0063]当然,所述数据采集终端与所述电子设备也可采用除蓝牙、耳机转接线之外的方式建立连接,只要能实现在二者之间传输需要获取的目标数据即可。
[0064]这样,通过该实施方式,可实现所述数据采集终端与所述电子设备之间建立连接,并能传输音频、图片、文件等数据。...

【技术保护点】

【技术特征摘要】
1.一种数据提取方法,其特征在于,应用于数据采集终端,所述数据采集终端用于与电子设备通信连接,所述电子设备中安装有能即时通讯的应用程序,所述方法包括:获取所述应用程序中的目标对话数据;从所述目标对话数据中确定纠纷数据;提取所述纠纷数据。2.根据权利要求1所述的方法,其特征在于,所述从所述目标对话数据中确定纠纷数据,包括:将所述目标对话数据对应的每条文本数据与预设的纠纷类型对应的关键字段比对;确定比对成功的文本数据为所述纠纷数据。3.根据权利要求1或2所述的方法,其特征在于,所述数据采集终端上设置有辅助采集程序,所述获取所述应用程序中的目标对话数据,包括:运行所述辅助采集程序;通过所述辅助采集程序启动所述应用程序,并进入目标对话界面;获取所述目标对话界面上的目标对话数据。4.根据权利要求3所述的方法,其特征在于,所述获取所述目标对话界面上的目标对话数据,包括:所述辅助采集程序基于进入的所述目标对话界面,播放所述目标对话界面上的至少一个目标对象发送的语音数据;录制播放的所述语音数据,获得录制的目标对话数据;对所述录制的目标对话数据进行语音识别,得到所述录制的目标对话数据对应的文本数据。5.根据权利要求4所述的方法,其特征在于,所述提取所述纠纷数...

【专利技术属性】
技术研发人员:孙连鹏冯大航陈孝良
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1