【技术实现步骤摘要】
本专利技术实施例涉及语言处理
,尤其涉及一种特定领域的对话挖掘方法及装置。
技术介绍
对话交互是智能硬件的一个基本功能,而目前的对话系统多数面向通用,不能直接应用于特定领域,特定领域的对话环境要求特殊,如儿童领域需要去除脏话、成人、政治和暴力等敏感信息,并且有特殊的对话内容和对话习惯。然而,目前尚且缺乏针对特定领域对话环境做特殊优化,无法真正满足特定领域对话需求。
技术实现思路
本专利技术实施例提供一种特定领域的对话挖掘方法及装置,以通过对特定领域对话环境做特殊优化来满足特定领域对话需求。本专利技术实施例提供了一种特定领域的对话挖掘方法,包括:收集特定领域的多媒体对话资源;依据所述多媒体对话资源构建所述特定领域的对话语料;对所述对话语料进行分词、词性标注和实体识别处理;依据处理结果确定所述特定领域的对话特征。另一方面,本专利技术实施例还提供了一种特定领域的对话挖掘装置,包括:资源收集模块,用于收集特定领域的多媒体对话资源;语料构建模块,用于依据所述多媒体对话资源构建所述特定领域的对话语料;语料处理模块,用于对所述对话语料进行分词、词性标注和实体识别处理;对话特 ...
【技术保护点】
一种特定领域的对话挖掘方法,其特征在于,包括:收集特定领域的多媒体对话资源;依据所述多媒体对话资源构建所述特定领域的对话语料;对所述对话语料进行分词、词性标注和实体识别处理;依据处理结果确定所述特定领域的对话特征。
【技术特征摘要】
1.一种特定领域的对话挖掘方法,其特征在于,包括:收集特定领域的多媒体对话资源;依据所述多媒体对话资源构建所述特定领域的对话语料;对所述对话语料进行分词、词性标注和实体识别处理;依据处理结果确定所述特定领域的对话特征。2.根据权利要求1所述的方法,其特征在于,依据处理结果确定所述特定领域的对话特征,包括:依据所述对话语料的问答顺序,以及对所述对话语料进行分词、词性标注和实体识别的处理结果,得到所述特定领域的对话问答模式。3.根据权利要求1所述的方法,其特征在于,依据处理结果确定所述特定领域的对话特征,包括:依据对所述对话语料进行分词、词性标注和实体识别的处理结果,提取所述对话语料的语气词和语法模式;对所述对话语料的语气词和语法模式进行筛选,得到符合特定领域对话习惯的语气词和语法模式。4.根据权利要求1所述的方法,其特征在于,收集特定领域的多媒体对话资源之后,包括:对收集的多媒体对话资源进行实体、属性及关系识别;依据所述多媒体对话资源中包含的实体、属性及关系,构建所述特定领域的知识图谱。5.根据权利要求1-4任一项所述的方法,其特征在于,依据所述多媒体对话资源构建所述特定领域的对话语料,包括:将音频对话资源和/或视频对话资源转化为文本对话资源;解析所述文本对话资源中包含的称谓信息;依据所述称谓信息,将所述特定领域的所述文本对话资源处理成对话文本,以得到所述特定领域的对话语料。6.一种特定领...
【专利技术属性】
技术研发人员:郭瑞,郭祥,雷宇,
申请(专利权)人:北京智能管家科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。