任务型对话的语义识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26689787 阅读:26 留言:0更新日期:2020-12-12 02:39
本发明专利技术涉及人工智能领域,公开了一种任务型对话的语义识别方法、装置、电子设备及存储介质,用于提高多领域任务会话的语义识别准确度。本发明专利技术的主要技术方案为:获取用户的待识别对话和历史对话;将待识别对话和历史对话分别进行分字或分词;将待识别对话的分字或分词结果和历史对话的分字或分词结果输入到语义理解模型,得到与待识别对话对应的语义识别结果;语义理解模型是根据对话样本以及与对话样本对应的样本标签训练得到的,对话样本包括待识别对话样本和历史对话样本,样本标签包括对话样本的领域、意图、槽位及槽值;语义识别结果包括与待识别对话对应的领域、意图、槽位及槽值。本发明专利技术还涉及区块链技术,语义理解模型存储于区块链中。

【技术实现步骤摘要】
任务型对话的语义识别方法、装置、电子设备及存储介质
本专利技术涉及人工智能的语义识别
,尤其涉及一种任务型对话的语义识别方法、装置、电子设备及存储介质。
技术介绍
任务型对话系统的目的是帮助用户完成某些具体的任务。例如:订火车票,询问天气,打车,订外卖等。一个更加智能的任务型对话系统可以很大程度上节省人力和提升效率。由于其具大的应用前景和商业价值,各大公司和学术机构都在这方面加大了投入。在任务型对话系统中,语义理解模型是系统的入口,它的效果直接决定后续模型的效果上限。因此研发理解力更强的语义理解模型就成为构建更智能的任务型对话系统的关键。传统的语义理解模型研发多集中在单个领域,也就是说只能处理订会议室或打车等单个领域下的用户诉求。但是,现实中用户的诉求往往是多领域的,比如人们在寻求旅游服务的时候,往往需要同时进行订票,订餐馆,询问景点等多项行为。在这种情况下,传统的语义理解模型往往会遇到领域歧义的问题,例如:当用户说“我想订明天早上的票”,那么很难确定发生的领域是在订火车,订飞票,还是订景点门票等。同时,传统的语义理解模型,针对不本文档来自技高网...

【技术保护点】
1.一种任务型对话的语义识别方法,其特征在于,所述方法包括:/n获取用户的待识别对话和历史对话;/n将所述待识别对话和所述历史对话分别进行分字或分词;/n将所述待识别对话的分字或分词结果和所述历史对话的分字或分词结果输入到语义理解模型,得到与所述待识别对话对应的语义识别结果;所述语义理解模型是根据对话样本以及与所述对话样本对应的样本标签训练得到的,所述对话样本包括待识别对话样本和历史对话样本,所述样本标签包括所述对话样本的领域、意图、槽位及槽值;所述语义识别结果包括与所述待识别对话对应的领域、意图、槽位及槽值。/n

【技术特征摘要】
1.一种任务型对话的语义识别方法,其特征在于,所述方法包括:
获取用户的待识别对话和历史对话;
将所述待识别对话和所述历史对话分别进行分字或分词;
将所述待识别对话的分字或分词结果和所述历史对话的分字或分词结果输入到语义理解模型,得到与所述待识别对话对应的语义识别结果;所述语义理解模型是根据对话样本以及与所述对话样本对应的样本标签训练得到的,所述对话样本包括待识别对话样本和历史对话样本,所述样本标签包括所述对话样本的领域、意图、槽位及槽值;所述语义识别结果包括与所述待识别对话对应的领域、意图、槽位及槽值。


2.根据权利要求1所述的任务型对话的语义识别方法,其特征在于,所述语义理解模型通过下述方式训练得到:
获取所述对话样本中的每一个句子中包含的字或词的语义表达,及所述字或词与其所在句子内的其他字或词的相关关系;所述对话样本中时间序列在最后的句子为所述待识别对话样本,所述对话样本中时间序列在所述待识别对话样本之前的句子为所述历史对话样本;
根据所述句子中包含的字或词的语义表达,及所述字或词与所在句子内其他字或词的相关关系,确定每一个所述句子的语义表达及该句子与所述句子内字或词的相关关系;
通过所述对话样本的各所述句子中包含的字或词的语义表达、所述字或词与所在句子内其他字或词的相关关系、各所述句子的语义表达、各所述句子与所述句子内字或词的相关关系,及与所述对话样本对应的样本标签进行训练得到所述语义理解模型。


3.根据权利要求2所述的任务型对话的语义识别方法,其特征在于,通过所述对话样本的各所述句子中包含的字或词的语义表达、所述字或词与所在句子内其他字或词的相关关系、各所述句子的语义表达、各所述句子与所述句子内字或词的相关关系,及所述与所述对话样本对应的样本标签进行训练得到所述语义理解模型,包括:
根据各所述句子的语义表达、各所述句子与所述句子内字或词的相关关系、所述对话样本的各所述句子中字或词的语义表达,及所述字或词与所在句子内其他字或词的相关关系,确定所述对话样本的槽位特征及槽值特征;
根据所述对话样本中各句子的语义表达确定所述对话样本的领域特征、意图特征;
通过所述领域特征、意图特征、槽位特征及槽值特征,及对应的领域、意图、槽位及槽值进行训练得到所述语义理解模型。


4.根据权利要求2所述的任务型对话的语义识别方法,其特征在于,获取所述对话样本中的每一个句子中包含的字或词的语义表达,及所述字或词与其所在句子内的其他字或词的相关关系,包括:
对所述对话样本进行分字或分词,并确定每个字或词对应的向量;
根据所述字或词的向量对所述字或词进行注意力编码,所述注意力编码结果中包含所述字或词与所在句子中其他字或词的相关关系;
根据所述字或词的注意力编码结果确定所述对话样本的句子中包含的字或词的语义表达及所述字或词与所在句子内其他字或词的相关关系。


5.根据权利要求4所述的任务型对话的语义识别方法,其特征在于,所述根据所述字或词的注意力编码结果确定所述对话样本的句子中包含的字或词的语义表达及所述字或词与所在句子内其他字或词的相关关系之前...

【专利技术属性】
技术研发人员:杨静远陆凯赵知纬高维国
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1