The invention discloses a spoken query artificial intelligence analytical method, device and storage medium based on the method comprises the following steps: for any application, get the corresponding to the application domain knowledge base; knowledge base is determined according to the training corpus as training query; according to the training corpus training depth query analytical model obtained by using depth; query analytical model for users of query analysis, the analytical results obtained. The accuracy of the analytical result can be improved by using the scheme of the invention.
【技术实现步骤摘要】
基于人工智能的口语查询解析方法、装置及存储介质
本专利技术涉及计算机应用技术,特别涉及基于人工智能的口语查询解析方法、装置及存储介质。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。计算机和人的自然交互是人工智能的一个核心问题,要让机器和人类能够无障碍的交流,首先需要解决的就是让机器能够理解人类说的语言。目前,人机对话产品的应用越来越广泛,与搜索的查询形式不同,人机对话产品中的查询(query),通常是以口语的形式出现,这种形式更加符合人类的自然表达,但它的表述多样性以及复杂性却增大了机器对这类query的理解难度。目前的主要人机对话产品中,都会把主要功能拆解为不同的应用领域(Domain),比如,定火车票是一个应用领域,天气查询也是一个应用领域。机器 ...
【技术保护点】
一种基于人工智能的口语查询解析方法,其特征在于,包括:针对任一应用领域,获取所述应用领域对应的知识库;根据所述知识库确定出作为训练语料的训练查询query;根据所述训练语料训练得到深度query解析模型;利用所述深度query解析模型对用户的query进行解析,得到解析结果。
【技术特征摘要】
1.一种基于人工智能的口语查询解析方法,其特征在于,包括:针对任一应用领域,获取所述应用领域对应的知识库;根据所述知识库确定出作为训练语料的训练查询query;根据所述训练语料训练得到深度query解析模型;利用所述深度query解析模型对用户的query进行解析,得到解析结果。2.根据权利要求1所述的方法,其特征在于,所述获取所述应用领域对应的知识库包括:获取所述应用领域的领域概要Schema、领域词典以及领域模板;获取各应用领域通用的通用词典;将获取到的信息作为所述应用领域对应的知识库。3.根据权利要求1所述的方法,其特征在于,所述根据所述知识库确定出作为训练语料的训练query包括:对候选query库进行筛选,从中筛选出与所述知识库相匹配的query以及与所述知识库不相匹配的query;将筛选出的query作为训练query。4.根据权利要求1所述的方法,其特征在于,所述利用所述深度query解析模型对用户的query进行解析,得到解析结果包括:对所述query进行分词处理;针对得到的每个词,分别获取所述词对应的embedding表示;将各词对应的embedding表示输入给所述深度query解析模型,得到所述query的解析结果;其中,所述解析结果中包括:是否属于所述应用领域,若属于所述应用领域,则进一步包括意图以及所述意图下的参数信息。5.根据权利要求4所述的方法,其特征在于,所述获取所述词对应的embedding表示包括:分别获取所述词的词性标签以及领域知识标签;利用预先训练得到的word2vec模型,分别得到所述词、所述词的词性标签以及所述词的领域知识标签的embedding表示;将三个embedding表示进行拼接,将拼接结果作为所述词对应的embedding表示。6.根据权利要求4所述的方法,其特征在于,所述深度query解析模型中利用条件随机场CRF模型进行全局的槽位标注,确定出所述query中的参数信息。7.根据权利要求3所述的方法,其特征在于,该方法进一步包括:将所述query存入所述候选query库;若获取到更新后的知识库,则根据更新后的知识库重新筛选训练语料,并根据筛选出的训练语料训练得到更新后的深度query解析模型。8.一种基于人工智能的口语查询解析装置,其特征在于,包括:预处理单元以及解析单元;所述预处理单元,用于针对任一应用领域,获取所述...
【专利技术属性】
技术研发人员:王硕寰,孙宇,于佃海,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。