面向期货问答的用户意图识别方法和系统技术方案

技术编号:32799282 阅读:16 留言:0更新日期:2022-03-23 20:03
本申请涉及一种面向期货问答的用户意图识别方法和系统,其中,该方法包括:通过获取用户问句,采用预设实体识别模型对用户问句进行分词和实体识别,根据实体识别的结果,通过粗分类语言模型对用户问句进行预测,确定用户问句的用户意图类别,对于不同的用户意图类别,分别采取对应的细分类语言模型进行预测,进而得出用户问句的用户意图。通过本申请,解决了用户问句理解精度较低和维度少的问题,实现了通过有层次地细分问句的意图类型,采用适合的语言预测模型进行分别预测,提高了期货领域中问句意图识别的维度和精确度。问句意图识别的维度和精确度。问句意图识别的维度和精确度。

【技术实现步骤摘要】
面向期货问答的用户意图识别方法和系统


[0001]本申请涉及自动问答
,特别是涉及一种面向期货问答的用户意图识别方法和系统。

技术介绍

[0002]在面向期货领域的问答系统中,用户问题一般会都会涉及到开户、软件使用、保证金、品种交易规则等各类客服类问题,也会涉及到期货行情交易、现货库存、仓单等行情交易类结构化数据查询,还会涉及到期货品种新闻资讯、产业政策、投资研报等舆情资讯类查询搜索,或者APP页面打开、页面跳转等指令类问题,或者寻求一些产品走势分析、买卖操作建议、风险提醒等投资建议类问题。在面对这些复杂而多样的用户问句时,如何对用户问句进行全面、精准、有效地识别,真正理解用户意图,是期货领域中实现高效精确的自动问答的关键点之一。
[0003]现有的面向期货领域的问答系统,一方面存在对用户问句理解分类维度不够全面的问题,大多系统方法只能够识别处理客服类问句;另一方面还存在语义理解的解精度不够高、通用性较差的问题。
[0004]目前针对相关技术中用户问句理解精度较低和维度少的问题,尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种面向期货问答的用户意图识别方法和系统,以至少解决相关技术中用户问句理解精度较低和维度少的问题。
[0006]第一方面,本申请实施例提供了一种面向期货问答的用户意图识别方法,所述方法包括:获取用户问句,通过预设实体识别模型对所述用户问句进行分词和实体识别;根据所述实体识别的结果,通过粗分类语言模型对所述用户问句进行预测,确定所述用户问句的用户意图类别;对于不同的用户意图类别,分别采取对应的细分类语言模型进行预测,进而得出所述用户问句的用户意图。
[0007]在其中一些实施例中,对于不同的用户意图类别,分别采取对应的细分类语言模型进行预测包括:若所述用户意图类别为客服类意图类别,则根据标准客服问句,通过最近邻相似计算逐级细分识别;若所述用户意图类别为行情类意图类别,则依次识别所述用户问句的数据查询范围、查询库表和查询字段;若所述用户意图类别为资讯类意图类别,则抽取识别所述用户问句的意图主体标签,以及分类识别所述用户问句的情感极性标签;
若所述用户意图类别为指令类意图类别,则依次识别所述用户问句的意图类型和意图槽位;若所述用户意图类别为投顾类意图类别,则采用预训练语言模型对所述用户问句进行进一步微调细分识别。
[0008]在其中一些实施例中,通过预设实体识别模型对所述用户问句进行分词和实体识别包括:构建期货用户意图类别体系,根据各用户意图类别归类确定期货行业的语义词典;通过词嵌入模型计算所述用户问句中每个字的词向量,将所述词向量分别输入预训练深度模型与CFR序列标注模型中,基于BI序列标签体系标注出所述用户问句中的实体;再构建所述语义词典的Trie树对所述实体进行最大前缀匹配识别,采用正则表达式对时间数字进行识别;最后采用开源分词工具对所述用户问句进行分词识别,完成对所述用户问句的分词和实体识别。
[0009]在其中一些实施例中,通过粗分类语言模型对所述用户问句进行预测,确定所述用户问句的用户意图类别包括:通过基于Tansformer注意力机制的Bert预训练语言模型,结合所述用户问句的N条上下文问句,确定所述用户问句的用户意图类别。
[0010]在其中一些实施例中,则根据标准客服问句,通过最近邻相似计算逐级细分识别包括:向量化标准客服问句,按照所述标准客服问句的层级,建立每个层级的层级细分意图的向量化表示,通过Consine相似度算法计算所述用户问句与若干一级细分意图的相似度,识别出所述用户问句的最佳一级细分意图,再在所述最佳一级细分意图的层级细分意图中逐级细分识别。
[0011]在其中一些实施例中,则依次识别所述用户问句的数据查询范围、查询库表和查询字段包括:通过TextCNN分类模型识别出所述用户问句的数据查询范围;再通过Biaffine双仿射模型将所述用户问句中的实体与所述数据查询范围内的数据库表字段进行语义对齐,利用tanh函数得到关联匹配度并识别出具体的查询库表;在所述查询库表中,通过TextCNN分类模型识别出所述用户问句的查询字段。
[0012]在其中一些实施例中,则抽取识别所述用户问句的意图主体标签,以及分类识别所述用户问句的情感极性标签包括:通过CRF序列标注模型与语义词典,抽取识别出所述用户问句的意图主体,再采用正则表达式识别出所述用户问句的资讯时间;再通过Bert预训练语言模型识别出所述用户问句的情感极性标签和意图事件标签。
[0013]在其中一些实施例中,则依次识别所述用户问句的意图类型和意图槽位包括:通过CharCNN模型识别出所述用户问句的意图类型,根据所述意图类型,从所述用
户问句的分词和实体识别的结果中确定潜在实体;通过预设匹配规则从所述潜在实体中匹配出意图槽位;对于未能匹配出意图槽位的,通过基于注意力机制的RNN模型识别出意图槽位。
[0014]在其中一些实施例中,则采用预训练语言模型对所述用户问句进行进一步微调细分识别包括:通过Bert Fine

Tuning模型和Softmax分类器对所述用户问句进行进一步微调细分识别。
[0015]第二方面,本申请实施例提供了一种面向期货问答的用户意图识别系统,所述系统包括命名实体识别模块、第一意图识别模块和第二意图识别模块;所述命名实体识别模块获取用户问句,通过预设实体识别模型对所述用户问句进行分词和实体识别;所述第一意图识别模块根据所述实体识别的结果,通过粗分类语言模型对所述用户问句进行预测,确定所述用户问句的用户意图类别;所述第二意图识别模块对于不同的用户意图类别,分别采取对应的细分类语言模型进行预测,进而得出所述用户问句的用户意图。
[0016]相比于相关技术,本申请实施例提供的一种面向期货问答的用户意图识别方法和系统,通过获取用户问句,采用预设实体识别模型对用户问句进行分词和实体识别;根据实体识别的结果,通过粗分类语言模型对用户问句进行预测,确定用户问句的用户意图类别;对于不同的用户意图类别,分别采取对应的细分类语言模型进行预测,进而得出用户问句的用户意图。解决了用户问句理解精度较低和维度少的问题,实现了通过有层次地细分问句的意图类型,采用适合的语言预测模型进行分别预测,提高了期货领域中问句意图识别的维度和精确度。
附图说明
[0017]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的面向期货问答的用户意图识别方法的步骤流程图;图2是对用户问句进行分词和实体识别的步骤流程图;图3是用户问句中分词与实体识别的示意图;图4是词语句序和位置的分层次编码方式的示意图;图5是CharCNN文本分类模型的结构示意图;图6是基于Attention的RNN模型的结构示意图;图7是根据本申请实施例的面向期货问答的用户意图识别系统的结构框图;图8本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向期货问答的用户意图识别方法,其特征在于,所述方法包括:获取用户问句,通过预设实体识别模型对所述用户问句进行分词和实体识别;根据所述实体识别的结果,通过粗分类语言模型对所述用户问句进行预测,确定所述用户问句的用户意图类别;对于不同的用户意图类别,分别采取对应的细分类语言模型进行预测,进而得出所述用户问句的用户意图。2.根据权利要求1所述的方法,其特征在于,对于不同的用户意图类别,分别采取对应的细分类语言模型进行预测包括:若所述用户意图类别为客服类意图类别,则根据标准客服问句,通过最近邻相似计算逐级细分识别;若所述用户意图类别为行情类意图类别,则依次识别所述用户问句的数据查询范围、查询库表和查询字段;若所述用户意图类别为资讯类意图类别,则抽取识别所述用户问句的意图主体标签,以及分类识别所述用户问句的情感极性标签;若所述用户意图类别为指令类意图类别,则依次识别所述用户问句的意图类型和意图槽位;若所述用户意图类别为投顾类意图类别,则采用预训练语言模型对所述用户问句进行进一步微调细分识别。3.根据权利要求1所述的方法,其特征在于,通过预设实体识别模型对所述用户问句进行分词和实体识别包括:构建期货用户意图类别体系,根据各用户意图类别归类确定期货行业的语义词典;通过词嵌入模型计算所述用户问句中每个字的词向量,将所述词向量分别输入预训练深度模型与CFR序列标注模型中,基于BI序列标签体系标注出所述用户问句中的实体;再构建所述语义词典的Trie树对所述实体进行最大前缀匹配识别,采用正则表达式对时间数字进行识别;最后采用开源分词工具对所述用户问句进行分词识别,完成对所述用户问句的分词和实体识别。4.根据权利要求1所述的方法,其特征在于,通过粗分类语言模型对所述用户问句进行预测,确定所述用户问句的用户意图类别包括:通过基于Tansformer注意力机制的Bert预训练语言模型,结合所述用户问句的N条上下文问句,确定所述用户问句的用户意图类别。5.根据权利要求2所述的方法,其特征在于,则根据标准客服问句,通过最近邻相似计算逐级细分识别包括:向量化标准客服问句,按照所述标准客服问句的层级,建立每个层级的层级细分意图的向量化表示,通过Consine相似度算法...

【专利技术属性】
技术研发人员:杨胜利吴福文康维鹏唐逐时
申请(专利权)人:浙商期货有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1