【技术实现步骤摘要】
一种词槽抽取方法、词槽抽取装置及电子设备
本申请属于人工智能
,尤其涉及一种词槽抽取方法、词槽抽取装置、电子设备及计算机可读存储介质。
技术介绍
词槽抽取是指在一定的领域中,对一句话进行词法分析和语法分析,并结合上下文判断指定的语句字符串某个片段是否是具有一定意义的符合上下文的词槽。词槽需要结合一定领域中大量的词典来进行搜索过滤,如果是小语料的词典,自然语言处理系统在载入词典时不需要太耗性能;但如果是大语料的词典,自然语言处理系统在载入词典时需要耗费大量的时间,考虑到自然语言处理系统通常在接收用户输入的交互请求后才载入词典,这会严重影响到自然语言处理系统的工作性能。
技术实现思路
有鉴于此,本申请提供了一种词槽抽取方法、词槽抽取装置、电子设备及计算机可读存储介质,可一定程度上保障了自然语言处理系统的工作性能,同时提升了词槽抽取的速度。本申请的第一方面提供了一种词槽抽取方法,上述词槽抽取方法应用于自然语言处理系统,上述词槽抽取方法包括:当接收到输入语句时,确定上述输入语句所属的目标领域 ...
【技术保护点】
1.一种词槽抽取方法,其特征在于,所述词槽抽取方法应用于自然语言处理系统,所述词槽抽取方法包括:/n当接收到输入语句时,确定所述输入语句所属的目标领域;/n基于所述目标领域所包含的一个以上实体词典,构建领域词典树;/n通过所述领域词典树对所述输入语句进行词槽抽取,得到第一词槽集合;/n通过所述自然语言处理系统中预加载的通用词典树对所述输入语句进行词槽抽取,得到第二词槽集合;/n基于所述第一词槽集合及所述第二词槽集合,输出所述输入语句所包含的词槽。/n
【技术特征摘要】
1.一种词槽抽取方法,其特征在于,所述词槽抽取方法应用于自然语言处理系统,所述词槽抽取方法包括:
当接收到输入语句时,确定所述输入语句所属的目标领域;
基于所述目标领域所包含的一个以上实体词典,构建领域词典树;
通过所述领域词典树对所述输入语句进行词槽抽取,得到第一词槽集合;
通过所述自然语言处理系统中预加载的通用词典树对所述输入语句进行词槽抽取,得到第二词槽集合;
基于所述第一词槽集合及所述第二词槽集合,输出所述输入语句所包含的词槽。
2.如权利要求1所述的词槽抽取方法,其特征在于,所述当接收到输入语句时,确定所述输入语句所属的目标领域,包括:
若接收到包含有所述输入语句的交互请求,则基于所述交互请求所携带的应用程序ID确定所述输入语句所属的应用程序,作为目标应用程序;
将与所述目标应用程序相关联的领域确定为所述输入语句所属的目标领域。
3.如权利要求1所述的词槽抽取方法,其特征在于,所述基于所述目标领域所包含的一个以上实体词典,构建领域词典树,包括:
根据预设的多模匹配算法以及预设的双数组字典树算法,为所述目标领域所包含的一个以上实体词典构建领域词典树。
4.如权利要求1所述的词槽抽取方法,其特征在于,所述通过所述自然语言处理系统中预加载的通用词典树对所述输入语句进行词槽抽取,得到第二词槽集合,包括:
在所述输入语句中,屏蔽所述第一词槽集合中的词槽所对应的词语;
通过所述自然语言处理系统中预加载的通用词典树对屏蔽词语后的所述输入语句进行词槽抽取,得到第二词槽集合。
5.如权利要求1至4任一项所述的词槽抽取方法,其特征在于,所述词槽抽取方法还包括:
在预设的实体词典库中,通过大数据分析确定一个以上目标实体词典,其中,所述目标实体词典为满足预设的使用频率条件的实体词典;
在所述自然语言处理系统初始化时,为所述一个以上目标实体词典构建通用词典树,并预加载所述通用词典树。
...
【专利技术属性】
技术研发人员:何凯,熊友军,
申请(专利权)人:深圳市优必选科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。