进行对话数据采集的方法及装置制造方法及图纸

技术编号:35414715 阅读:15 留言:0更新日期:2022-11-03 11:12
本公开提供了进行对话数据采集的方法及装置,该方法提出了两个用户进行对话采集的方法及协助用户进行对话数据采集的方法,其中,通过获取第一对话的对话主题的特征,并根据第一对话的对话主题的特征、或者根据第一对话的对话主题的特征和两个用户输入的对话数据,获取第一知识信息,第一知识信息用于向两个用户提供与第一对话相关的背景知识,从而协助对话数据采集的用户流利且高效率的完成对话数据的采集。的采集。的采集。

【技术实现步骤摘要】
进行对话数据采集的方法及装置


[0001]本公开涉及数据采集领域,尤其涉及一种进行对话数据采集的方法及装置。

技术介绍

[0002]人工智能(Artificial Intelligence,AI)是当今的热门研究方向。从人工智能出现至20世纪80年代,大多数的AI系统都是人工编程实现的,其通常使用声明性的、功能性的或其他高级语言,这也构成了大多数知识表示的基础。目前的主要AI领域包括问题解决、机器学习、自然语言、语音识别、视觉和机器人等。随着技术的进步,人们研究了很多机器学习方法,包括神经网络、生物学、进化技术和数学建模等,在其中,深度学习被证明是构建和训练神经网络以解决复杂问题的有效方法。
[0003]而无论是使用何种方法,目前的AI技术都需要海量的数据作为基础,包括但不限于文本数据、音频数据、视频数据和图像数据。在获取数据途径中,互联网自然是优秀的数据来源,但是互联网中的数据种类繁多且数据的获取需要合法合规,因此对于一些特定场景的数据,例如对话数据,其获取往往不是十分容易且成本较高。

技术实现思路

[0004]为了解决现有技术中的对话数据的采集不易且成本高的技术问题,本公开提供了进行对话数据采集的方法及装置。
[0005]第一方面,本公开提供了一种协助用户进行对话数据采集的方法,包括:获取第一对话的对话主题的特征,对话主题为参与第一对话的两个用户从预设对话主题中选择的、或者对话主题是两个用户自定义的;根据第一对话的对话主题的特征、或者根据第一对话的对话主题的特征和两个用户输入的对话数据,获取第一知识信息,第一知识信息用于向两个用户提供与第一对话相关的背景知识。
[0006]在一种可选的实施方式中,根据第一对话的对话主题的特征、或者根据第一对话的对话主题的特征和两个用户输入的对话数据,获取第一知识信息,包括:响应于获取到第一对话的对话主题的特征,获取第一知识信息;或者,响应于获取到第一对话的对话主题的特征且接收到对话数据,获取第一知识信息;或者,响应于接收到用于获取第一知识信息的请求信息,获取第一知识信息。
[0007]在一种可选的实施方式中,响应于获取到第一对话的对话主题的特征且接收到对话数据,获取第一知识信息,包括:响应于获取到第一对话的对话主题的特征,并且在接收到对话数据之后,立即获取第一知识信息;或者,响应于获取到第一对话的对话主题的特征,并且在开始接收对话数据之后,未接收到对话数据的时长等于或超过预设时长的情况下,获取第一知识信息。
[0008]在一种可选的实施方式中,方法还包括:根据两个用户输入的对话数据,更新第一知识信息。
[0009]在一种可选的实施方式中,获取第一知识信息,包括:从预先建立的知识信息库中
获取第一知识信息。
[0010]第二方面,本公开提供了一种采集对话数据的方法,包括:向多个用户发起第一对话数据采集任务;响应于两个用户接受第一对话数据采集任务,向两个用户提供预设对话主题,以供两个用户选择;响应于两个用户开始进行对话数据采集,执行如上述第一方面中任一项的方法;接收并保存两个用户输入的对话数据。
[0011]在一种可选的实施方式中,方法还包括:判断对话数据的对话回合数是否达到预设阈值;在为是时,停止进行对话数据采集并确定第一对话数据采集任务完成;在为否时,继续进行对话数据采集。
[0012]在一种可选的实施方式中,方法还包括:根据统计方法,评估对话数据的完成度;在对话数据的完成度低于预设完成度时,丢弃对话数据或者对对话数据进行标记。
[0013]第三方面,本公开提供了一种对话数据的采集装置,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用程序指令以执行上述第一方面中任一项的方法。
[0014]第四方面,本公开提供了一种对话数据的采集装置,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用程序指令以执行上述第二方面中任一项的方法。
[0015]第五方面,本公开提供了一种计算机可读存储介质,其中,计算机可读存储介质存储用于由设备执行的程序代码,程序代码包括用于执行上述第一方面中任一项的方法。
[0016]第六方面,本公开提供了一种计算机可读存储介质,其中,计算机可读存储介质存储用于由设备执行的程序代码,程序代码包括用于执行上述第二方面中任一项的方法。
[0017]第七方面,本公开提供了一种协助用户进行对话数据采集的装置,包括:特征获取模块,用于获取第一对话的对话主题的特征,对话主题为参与第一对话的两个用户从预设对话主题中选择的、或者对话主题是两个用户自定义的;知识信息获取模块,用于根据第一对话的对话主题的特征、或者根据第一对话的对话主题的特征和两个用户输入的对话数据,获取第一知识信息,第一知识信息用于向两个用户提供与第一对话相关的背景知识。
[0018]第八方面,本公开提供了一种采集对话数据的装置,包括:任务发起模块,用于向多个用户发起第一对话数据采集任务;主题模块,用于响应于两个用户接受第一对话数据采集任务,向两个用户提供预设对话主题,以供两个用户选择;对话采集模块,用于响应于两个用户开始进行对话数据采集,执行如上述第一方面中任一项的方法;数据模块,用于接收并保存两个用户输入的对话数据。
[0019]在本公开中,提供了进行对话数据采集的方法及装置,该方法提出了两个用户进行对话采集的方法及协助用户进行对话数据采集的方法,其中,通过获取第一对话的对话主题的特征,并根据第一对话的对话主题的特征、或者根据第一对话的对话主题的特征和两个用户输入的对话数据,获取第一知识信息,第一知识信息用于向两个用户提供与第一对话相关的背景知识,从而协助对话数据采集的用户流利且高效率的完成对话数据的采集。
附图说明
[0020]为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
[0021]图1示出根据本公开至少一个实施例提供的一种采集对话数据的方法的流程示意
图:
[0022]图2示出了根据本公开至少一个实施例提供的一种协助用户进行对话数据采集的方法的流程图;
[0023]图3示出了根据本公开至少一个实施例提供的又一种采集对话数据的方法的流程图;
[0024]图4示出了根据本公开至少一个实施例提供的一种对话数据的采集装置的示意图;
[0025]图5示出了根据本公开至少一个实施例提供的一种协助用户进行对话数据采集的装置的示意图;
[0026]图6示出了根据本公开至少一个实施例提供的一种采集对话数据的装置的示意图。
具体实施方式
[0027]为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种协助用户进行对话数据采集的方法,包括:获取第一对话的对话主题的特征,所述对话主题为参与所述第一对话的两个用户从预设对话主题中选择的、或者所述对话主题是所述两个用户自定义的;根据所述第一对话的对话主题的特征、或者根据所述第一对话的对话主题的特征和所述两个用户输入的对话数据,获取第一知识信息,所述第一知识信息用于向所述两个用户提供与所述第一对话相关的背景知识。2.根据权利要求1所述的方法,其中,所述根据所述第一对话的对话主题的特征、或者根据所述第一对话的对话主题的特征和所述多个用户输入的对话数据,获取第一知识信息,包括:响应于获取到所述第一对话的对话主题的特征,获取所述第一知识信息;或者,响应于获取到所述第一对话的对话主题的特征且接收到所述对话数据,获取所述第一知识信息;或者,响应于接收到用于获取所述第一知识信息的请求信息,获取所述第一知识信息。3.根据权利要求2所述的方法,其中,所述响应于获取到所述第一对话的对话主题的特征且接收到所述对话数据,获取所述第一知识信息,包括:响应于获取到所述第一对话的对话主题的特征,并且在接收到所述对话数据之后,立即获取所述第一知识信息;或者,响应于获取到所述第一对话的对话主题的特征,并且在开始接收所述对话数据之后,未接收到所述对话数据的时长等于或超过预设时长的情况下,获取所述第一知识信息。4.根据权利要求1所述的方法,其中,所述方法还包括:根据所述两个用户输入的对话数据,更新所述第一知识信息。5.根据权利要...

【专利技术属性】
技术研发人员:陶铭亮张墨之史新红
申请(专利权)人:名日之梦北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1