【技术实现步骤摘要】
一种残缺语料的补全方法及装置
本专利技术涉及一种自然语言处理领域,尤其涉及一种残缺语料的补全方法及装置。
技术介绍
随着网络技术的迅速发展,智能终端逐渐设计人们生活的方方面面,随着人工智能相关技术的日益成熟,各类终端的智能化程度也越来越高。语音交互作为智能终端应用中主流的交互方式之一,极大地方便了各个用户的使用。比如各类家教机、学习的使用,孩子们可以通过语音向家教机、学习机问各种不懂的问题,然后学习机再给予孩子相应的回应。对于用户的疑问,智能设备往往需要先采集该疑问信息,然后对该疑问语料信息进行补全,以便及时反馈给用户,解答用户的疑惑,而常规补全方式主要为分词后判定句子中词性的完整度,准确率不高,容易造成答非所问的结果。
技术实现思路
为解决上述技术问题,本专利技术提供一种残缺语料的补全方法及装置,具体的,本专利技术的技术方案如下:一方面,本专利技术公开了一种残缺语料的补全方法,包括:采集用户语料;对所述语料进行解析,获得对应的实体关系表达句;判断所述实体关系表达句 ...
【技术保护点】
1.一种残缺语料的补全方法,其特征在于,包括:/n采集用户语料;/n对所述语料进行解析,获得对应的实体关系表达句;/n判断所述实体关系表达句是否存在人物实体残缺;/n当判定所述实体关系表达句存在人物实体残缺时,将所述实体关系表达句在预存的种子关系库中进行匹配,补全所述实体关系表达句。/n
【技术特征摘要】
1.一种残缺语料的补全方法,其特征在于,包括:
采集用户语料;
对所述语料进行解析,获得对应的实体关系表达句;
判断所述实体关系表达句是否存在人物实体残缺;
当判定所述实体关系表达句存在人物实体残缺时,将所述实体关系表达句在预存的种子关系库中进行匹配,补全所述实体关系表达句。
2.根据权利要求1所述的一种残缺语料的补全方法,其特征在于,将所述实体关系表达句在预存的种子关系库中进行匹配,补全所述实体关系表达句包括:
根据所述实体关系表达句中已有的人物实体,在种子关系库中查找到目标种子,所述目标种子中包含有人物实体对,且所述人物实体对中的一个人物实体为所述实体关系表达句中已有的人物实体;
根据所述目标种子获取对应的目标种子关系集;所述目标种子关系集中包含若干关系表达式;
将所述实体关系表达句包含的关系表达式在所述目标种子关系集中进行匹配;
当所述实体关系表达句包含的关系表达式在所述目标种子关系集中匹配到相同的关系表达式时,根据所述目标种子关系集对应的种子包含的人物实体对,对所述实体关系表达句进行补全。
3.根据权利要求1所述的一种残缺语料的补全方法,其特征在于,在采集用户语料之前还包括:
构建并存储种子关系库,所述种子关系库中包含N个种子及对应的种子关系集;具体包括:
定义包含人物实体对的种子;
从收集的文档中抽取包含种子中的人物实体对的内容;
根据抽取到的包含种子实体对的内容,获得种子关系表达式;
根据获取到的种子关系表达式,建立所述种子对应的种子关系集;
将所有定义的种子及各自对应的种子关系集存储在种子关系库中。
4.根据权利要求1所述的一种残缺语料的补全方法,其特征在于,还包括:
当判定所述实体关系表达句不存在人物实体残缺时,从所述实体关系句中提取包含的人物实体对及关系表达式;
在所述种子关系库中查找是否存在包含有所述提取的人物实体对的目标种子;
当判定所述种子关系库中不存在包含有所述提取的人物实体对的目标种子时,在所述种子关系库中,将所述提取的人物实体对作为新的种子,建立所述新的种子的种子关系集,所述新的种子的种子关系集中包含所述实体关系表达句包含的关系表达式。
5.根据权利要求4所述的一种残缺语料的补全方法,其特征在于,还包括:
当判定所述种子关系库中存在包含有所述提取的人物实体对的目标种子时,获取所述目标种子对应的目标种子关系集;
将所述实体关系表达句包含的关系表达式在所述目标种子关系集中进行匹配;
当从所述实体关系表达句中提取的关系表达式在所述目标种子关系集中未匹配到相同的关系表达式时,将所述实体关系表达句包含的关系表达式扩充于所述目标种子关系集中。
6.一种残缺语料的补全装置,其特征在于,包括:
语料采集模块,用于采集用户语料;
语料解析模块,用于对所述语料进行解析,获...
【专利技术属性】
技术研发人员:饶盛添,魏誉荧,
申请(专利权)人:广东小天才科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。