基于人机交互的标注方法及相关装置、设备和介质制造方法及图纸

技术编号:35660683 阅读:19 留言:0更新日期:2022-11-19 16:58
本申请公开了一种基于人机交互的标注方法及相关装置、设备和介质,其中,基于人机交互的标注方法包括:获取人机交互系统响应于用户输入的请求信息而反馈的候选信息;其中,请求信息含有命名实体,候选信息含有与目标对象相关的命名实体,目标对象为请求信息中命名实体所属对象,且候选信息中命名实体采用标准名称;提取请求信息中命名实体作为第一实体,并提取用户选择的候选信息中命名实体作为第二实体;其中,人机交互系统基于用户选择的候选信息与用户进行交互;基于第一实体与第二实体之间的文本相似度,确定是否将第一实体标注为第二实体的非标名称。上述方案,能够在降低标注成本的同时,提升标注质量。提升标注质量。提升标注质量。

【技术实现步骤摘要】
基于人机交互的标注方法及相关装置、设备和介质


[0001]本申请涉及数据标注
,特别是涉及一种基于人机交互的标注方法及相关装置、设备和介质。

技术介绍

[0002]当前,诸如语音交互等人机交互技术已经在智能家居、移动终端、车载等领域广泛应用。为了提升交互效果,行业内普遍亟需标注出用户对各种对象的不同名称,特别是标准名称之外的非标名称。例如,对于标准名称“XX市第一中学”,其非标名称包括但不限于:“XX市一中”、“XX一中”等。
[0003]目前,通常采用人工识别并标注出非标名称,或基于规则自动生成非标名称。但是,前者需要耗费大量成本,后者所生成的非标名称不一定与真实情况相吻合。有鉴于此,如何在降低标注成本的同时,提升标注质量,成为亟待解决的问题。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种基于人机交互的标注方法及相关装置、设备和介质,能够在降低标注成本的同时,提升标注质量。
[0005]为了解决上述技术问题,本申请第一方面提供了一种基于人机交互的标注方法,包括:获取人机交互系统响应于用户输入的请求信息而反馈的候选信息;其中,请求信息含有命名实体,候选信息含有与目标对象相关的命名实体,目标对象为请求信息中命名实体所属对象,且候选信息中命名实体采用标准名称;提取请求信息中命名实体作为第一实体,并提取用户选择的候选信息中命名实体作为第二实体;其中,人机交互系统基于用户选择的候选信息与用户进行交互;基于第一实体与第二实体之间的文本相似度,确定是否将第一实体标注为第二实体的非标名称。
[0006]为了解决上述技术问题,本申请第二方面提供了一种基于人机交互的标注装置,包括:信息获取模块、实体提取模块和非标确定模块,信息获取模块,用于获取人机交互系统响应于用户输入的请求信息而反馈的候选信息;其中,请求信息含有命名实体,候选信息含有与目标对象相关的命名实体,目标对象为请求信息中命名实体所属对象,且候选信息中命名实体采用标准名称;实体提取模块,用于提取请求信息中命名实体作为第一实体,并提取用户选择的候选信息中命名实体作为第二实体;其中,人机交互系统基于用户选择的候选信息与用户进行交互;非标确定模块,用于基于第一实体与第二实体之间的文本相似度,确定是否将第一实体标注为第二实体的非标名称。
[0007]为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面的基于人机交互的标注方法。
[0008]为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的基于人机交互的标注
方法。
[0009]上述方案,获取人机交互系统响应于用户输入的请求信息而反馈的候选信息,且请求信息含有命名实体,候选信息含有与目标对象相关的命名实体,目标对象为请求信息中命名实体所属对象,候选信息中命名实体采用标准名称,在此基础上,提取请求信息中命名实体作为第一实体,并提取用户选择的候选信息中命名实体作为第二实体,且人机交互系统基于用户选择的候选信息与用户进行交互,再基于第一实体与第二实体之间的文本相似度,确定是否将第一实体标注为第二实体的非标名称,一方面通过巧妙地复用在正常人机交互过程中用户输入的请求信息和用户选择的候选信息自动完成标注,而无需人工手动标注,也不会对正常人机交互产生干扰,有助于降低标注成本,另一方面由于通过第一实体和第二实体之间的文本相似度来确定是否将第一实体标注为非标名称,且第一实体也是真实的用户说法,而非规则生成,有助于提升标注质量。故此,能够在降低标注成本的同时,提升标注质量。
附图说明
[0010]图1是本申请基于人机交互的标注方法一实施例的流程示意图;图2是本申请基于人机交互的标注方法另一实施例的流程示意图;图3是本申请基于人机交互的标注装置一实施例的框架示意图;图4是本申请电子设备一实施例的框架示意图;图5是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
[0011]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0012]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0013]本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中片段“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0014]本申请公开实施例,获取人机交互系统响应于用户输入的请求信息而反馈的候选信息,且请求信息含有命名实体,候选信息含有与目标对象相关的命名实体,目标对象为请求信息中命名实体所属对象,候选信息中命名实体采用标准名称,在此基础上,提取请求信息中命名实体作为第一实体,并提取用户选择的候选信息中命名实体作为第二实体,且人机交互系统基于用户选择的候选信息与用户进行交互,再基于第一实体与第二实体之间的文本相似度,确定是否将第一实体标注为第二实体的非标名称,一方面通过巧妙地复用在正常人机交互过程中用户输入的请求信息和用户选择的候选信息自动完成标注,而无需人工手动标注,也不会对正常人机交互产生干扰,有助于降低标注成本,另一方面由于通过第一实体和第二实体之间的文本相似度来确定是否将第一实体标注为非标名称,且第一实体也是真实的用户说法,而非规则生成,有助于提升标注质量。故此,能够在降低标注成本的同时,提升标注质量。
[0015]请参阅图1,图1是本申请基于人机交互的标注方法一实施例的流程示意图。具体而言,可以包括如下步骤:步骤S11:获取人机交互系统响应于用户输入的请求信息而反馈的候选信息。
[0016]本公开实施例中,请求信息含有命名实体,候选信息含有与目标对象相关的命名实体,目标对象为请求信息中命名实体所属对象,且候选信息中命名实体采用标准名称。需要说明的是,命名实体(named entity)人名、机构名、地名以及其他所有以名称为标识的实体,具体可以参阅命名实体的相关定义,在此不再赘述。此外,标准名称指为使命名尽可能不造成歧义,通常在正式场合、正式文件中所采用的名称,如可以包括但不限于:官方名称、正式名称等,在此不做限定。示例性地,命名实体“XX市第一高级中学”采用标准名称,而命名实体“XX一中”、“XX市一中”则并非标准名称;或者,命名实体“XX市妇幼保健医院”采用标准名称,而命名实体“XX妇幼”并非标准名称;或者,命名实体“张XX”采用标准名称,而命名实体“老张”、“小张”并非标准名称。此外,本申请公开实施例中,命名实体可以为人名实体、地名实体、机构实体等中任一者,在此不做限定。在命名实体为人名实体的情况下,可以为人名实体的标准名称标注其非标名称;在命名实体为地名实体的情况下,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人机交互的标注方法,其特征在于,包括:获取人机交互系统响应于用户输入的请求信息而反馈的候选信息;其中,所述请求信息含有命名实体,所述候选信息含有与目标对象相关的命名实体,所述目标对象为所述请求信息中所述命名实体所属对象,且所述候选信息中所述命名实体采用标准名称;提取所述请求信息中所述命名实体作为第一实体,并提取用户选择的候选信息中所述命名实体作为第二实体;其中,所述人机交互系统基于用户选择的候选信息与用户进行交互;基于所述第一实体与所述第二实体之间的文本相似度,确定是否将所述第一实体标注为所述第二实体的非标名称。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一实体与所述第二实体之间的文本相似度,确定是否将所述第一实体标注为所述第二实体的非标名称,包括:响应于所述文本相似度处于第一阈值与第二阈值之间,确定将所述第一实体标注为所述第二实体的非标名称;响应于所述文本相似度未处于第一阈值与第二阈值之间,确定所述第一实体并非所述第二实体的非标名称。3.根据权利要求2所述的方法,其特征在于,所述第一阈值和所述第二阈值的获取步骤包括:收集若干次历史交互过程中分别产生的样本交互数据,并剔除满足第一条件的样本交互数据;其中,所述样本交互数据包括用户输入的样本请求信息和用户选择的样本候选信息,所述第一条件包括:所述样本请求信息中的命名实体为样本参考实体的非标名称,且所述样本参考实体为所述用户选择的样本候选信息中的命名实体;对于剩余的各个样本交互数据,度量所述样本请求信息中的命名实体与所述样本参考实体之间的文本相似度,并基于剩余的各个样本交互数据分别对应的文本相似度,将剩余的各个样本交互数据划分至第一数据集合和第二数据集合;基于所述第一数据集合中所述样本交互数据对应的文本相似度,确定所述第一阈值,并基于所述第二数据集合中所述样本交互数据对应的文本相似度,确定所述第二阈值。4.根据权利要求3所述的方法,其特征在于,所述第一阈值小于所述第二阈值,所述基于所述第一数据集合中所述样本交互数据对应的文本相似度,确定所述第一阈值,包括:将所述第一数据集合中各所述样本交互数据分别对应的文本相似度中的最大值,确定为所述第一阈值;所述基于所述第二数据集合中所述样本交互数据对应的文本相似度,确定所述第二阈值,包括:将所述第二数据集合中各所述样本交互数据分别对应的文本相似度中的最小值,确定为所述第二阈值。5.根据权利要求1所述的方法,其特征在于,若确定将所述第一实体标注为所述第二实体的非标名称,则所述第一实体和所述第二实体绑定为实体对并归拢于名称集合,在所述名称集合的数据规模满足第二条件的情况下,所述方法还包括:响应于新的请求信息,在所述名称集合中搜索与所述新的请求信息中的命名实体绑定的目标实体,并生成包含所述目标实体的反馈信息;其中,所述目标实体采用标准名称;
将所述反馈信息作为新的候选信息,优先反馈用户。6.根据权利要求5所述的方法,其特征在于,所述人机交互系统应...

【专利技术属性】
技术研发人员:肖建辉
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1