一种业务数据匹配查询的方法、系统及装置制造方法及图纸

技术编号:39326629 阅读:11 留言:0更新日期:2023-11-12 16:04
本发明专利技术公开了一种业务数据匹配查询的方法、系统及装置,方法包括:获取待查询业务的相关文本,对所述相关文本进行分词处理,得到查询业务分词集,基于所述查询业务分词集,基于匹配分数模型与菜单目录中的菜单项对应的业务功能号进行匹配,若匹配不成功,对未匹配成功查询业务分词进行二次分词处理,得到查询业务重分词集,基于匹配分数模型进行二次匹配,得到匹配的业务功能号并形成集合,预设词频权重模型,得到集合中对应业务功能号出现的词频权重值;基于词频权重值对集合中的业务功能号进行过滤,筛选出最佳匹配结果。本发明专利技术能够提高业务人员的工作效率,提高用户的体验。提高用户的体验。提高用户的体验。

【技术实现步骤摘要】
一种业务数据匹配查询的方法、系统及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种业务数据匹配查询的方法、系统及装置。

技术介绍

[0002]对证券业务进行查询,是银行及交易机构提供给客户的一项重要服务,然而,现有的查询操作,主要是在工作人员的指引下逐项点击菜单,或用户自己输入简单的语句查询业务流程和内容,其存在以下技术缺陷,一方面,浪费大量人力资源,同时增加了用户的时间成本,另一方面,无法识别用户输入的长文本和复杂文本,一旦用户输入的语句不标准,不规范,或者存在歧义,重复等问题时,就无法在菜单中准确调取相应的业务功能号和业务功能号,导致无法在用户界面显示业务流程和内容。

技术实现思路

[0003]本专利技术针对现有技术中的缺点,提供了一种业务数据匹配查询的方法、系统及装置。
[0004]为了解决上述技术问题,本专利技术通过下述技术方案得以解决:
[0005]一种业务数据匹配查询的方法,包括以下步骤:
[0006]获取待查询业务的相关文本,对所述相关文本进行分词处理,得到查询业务分词集,其中,每个查询业务分词包含对应的查询业务分词文本特征;
[0007]基于所述查询业务分词集,基于匹配分数模型与菜单目录中的菜单项对应的业务功能号进行匹配,若匹配不成功,对未匹配成功查询业务分词进行二次分词处理,得到查询业务重分词集,基于匹配分数模型进行二次匹配,得到匹配的业务功能号并形成集合,其中,业务功能号包括业务标题、业务介绍及业务关键词,基于业务标题、业务介绍及业务关键词构建预设匹配分数模型;
[0008]预设词频权重模型,得到集合中对应业务功能号出现的词频权重值;
[0009]基于词频权重值对集合中的业务功能号进行过滤,筛选出最佳匹配结果。
[0010]作为一种可实施方式,所述基于业务标题、业务介绍及业务关键词构建匹配分数模型,包括以下步骤:
[0011]对查询业务分词文本特征和业务介绍进行处理得到单词;
[0012]分别获取查询业务分词与业务标题、业务介绍及业务关键词重合的单词比例,得到查询业务分词和业务标题单词重合比分、查询业务分词和业务关键词单词重合比分及查询业务分词和业务关键词单词重合比分;
[0013]将查询业务分词和业务标题单词重合比分、查询业务分词和业务关键词单词重合比分及查询业务分词和业务关键词单词重合比分进行加权平均处理,得到第一匹配分数,所述第一匹配分数=查询业务分词和业务介绍的单词重合比分*业务介绍权重+查询业务分词和业务关键词单词重合比分*业务关键词权重+查询业务分词和业务标题单词重合比
分*业务标题权重,其中,业务介绍权重+业务关键词权重+业务标题权重=1;
[0014]基于业务介绍的统计结果得到查询业务分词的文本向量,将文本向量与业务介绍文本向量的相似度分数作为相似度匹配分数;
[0015]将第一匹配分数和相似度匹配分数进行加权平均处理,得到第二匹配分数,所述第二匹配分数=第一单词匹配分数*单词权重+相似度匹配分数*相似度权重,其中,单词权重+相似度权重=1;
[0016]获取查询业务分词的词向量和业务介绍的词向量并得到相似度分数;
[0017]将第二匹配分数和相似度分数进行加权平均处理,得到匹配分数模型,进而得到最终匹配分数,所述最终匹配分数=第二匹配分数*第二权重+相似度分数*第三权重,其中,第二权重+第三权重=1。
[0018]作为一种可实施方式,所述对所述待查询业务的相关文本进行分词处理,得到分词集,包括以下步骤:
[0019]以标点符号为单位对所述待查询业务的相关文本进行处理,得到分句;
[0020]对所述分句进行分词处理,得到分词单元,基于所述分词单元得到分词集。
[0021]作为一种可实施方式,所述对未匹配成功查询业务分词进行二次分词处理,包括以下步骤:
[0022]获取未匹配成功查询业务分词的信息熵;
[0023]基于信息熵确定未匹配成功查询业务分词的近义词及相似词并形成词语集合;
[0024]将词语集合中词语作为的候选词类并计算候选词类概率;
[0025]选取最高概率的候选词作为二次分词的词类,进而完成二次分词处理。
[0026]作为一种可实施方式,所述词频权重模型,表示如下:
[0027]基于分词确定词频、逆向文档词频及字段长度比率;
[0028]基于词频、逆向文档词频及字段长度比率得到词频权重值,其中,所述词频权重值表示为:词频、逆向文档词频及字段长度比率的乘积。
[0029]作为一种可实施方式,所述词频表示如下:
[0030][0031]其中,X表示词频,Nx表示分词在文档总词数中出现的次数,Wx表示总词数;
[0032]所述逆向文档词频表示如下:
[0033][0034]其中,Y表示逆向文档词频,Ny表示分词在文档总词数中出现的次数,Wy表示总词数;
[0035]所述字段长度比率表示如下:
[0036][0037]其中,Z表示字段长度比率,Nz表示分词的长度,Wz表示文档的总长度。
[0038]一种业务数据匹配查询的系统,包括数据获取模块、数据匹配模块和数据筛选模块:
[0039]所述数据获取模块,获取待查询业务的相关文本,对所述相关文本进行分词处理,
得到查询业务分词集,其中,每个查询业务分词包含对应的查询业务分词文本特征;
[0040]所述数据匹配模块,基于所述查询业务分词集,基于匹配分数模型与菜单目录中的菜单项对应的业务功能号进行匹配,若匹配不成功,对未匹配成功查询业务分词进行二次分词处理,得到查询业务重分词集,基于匹配分数模型进行二次匹配,得到匹配的业务功能号并形成集合,其中,业务功能号包括业务标题、业务介绍及业务关键词,基于业务标题、业务介绍及业务关键词构建预设匹配分数模型;
[0041]所述数据筛选模块,用于预设词频权重模型,得到集合中对应业务功能号出现的词频权重值;基于词频权重值对集合中的业务功能号进行过滤,筛选出最佳匹配结果。
[0042]作为一种可实施方式,所述数据匹配模块,被设置为:
[0043]对查询业务分词文本特征和业务介绍进行处理得到单词;
[0044]分别获取查询业务分词与业务标题、业务介绍及业务关键词重合的单词比例,得到查询业务分词和业务标题单词重合比分、查询业务分词和业务关键词单词重合比分及查询业务分词和业务关键词单词重合比分;
[0045]将查询业务分词和业务标题单词重合比分、查询业务分词和业务关键词单词重合比分及查询业务分词和业务关键词单词重合比分进行加权平均处理,得到第一匹配分数,所述第一匹配分数=查询业务分词和业务介绍的单词重合比分*业务介绍权重+查询业务分词和业务关键词单词重合比分*业务关键词权重+查询业务分词和业务标题单词重合比分*业务标题权重,其中,业务介绍权重+业务关键词权重+业务标题权重=1;
[0046]基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种业务数据匹配查询的方法,其特征在于,包括以下步骤:获取待查询业务的相关文本,对所述相关文本进行分词处理,得到查询业务分词集,其中,每个查询业务分词包含对应的查询业务分词文本特征;基于所述查询业务分词集,基于匹配分数模型与菜单目录中的菜单项对应的业务功能号进行匹配,若匹配不成功,对未匹配成功查询业务分词进行二次分词处理,得到查询业务重分词集,基于匹配分数模型进行二次匹配,得到匹配的业务功能号并形成集合,其中,业务功能号包括业务标题、业务介绍及业务关键词,基于业务标题、业务介绍及业务关键词构建预设匹配分数模型;预设词频权重模型,得到集合中对应业务功能号出现的词频权重值;基于词频权重值对集合中的业务功能号进行过滤,筛选出最佳匹配结果。2.根据权利要求1所述的一种业务数据匹配查询的方法,其特征在于,所述基于业务标题、业务介绍及业务关键词构建匹配分数模型,包括以下步骤:对查询业务分词文本特征和业务介绍进行处理得到单词;分别获取查询业务分词与业务标题、业务介绍及业务关键词重合的单词比例,得到查询业务分词和业务标题单词重合比分、查询业务分词和业务关键词单词重合比分及查询业务分词和业务关键词单词重合比分;将查询业务分词和业务标题单词重合比分、查询业务分词和业务关键词单词重合比分及查询业务分词和业务关键词单词重合比分进行加权平均处理,得到第一匹配分数,所述第一匹配分数=查询业务分词和业务介绍的单词重合比分*业务介绍权重+查询业务分词和业务关键词单词重合比分*业务关键词权重+查询业务分词和业务标题单词重合比分*业务标题权重,其中,业务介绍权重+业务关键词权重+业务标题权重=1;基于业务介绍的统计结果得到查询业务分词的文本向量,将文本向量与业务介绍文本向量的相似度分数作为相似度匹配分数;将第一匹配分数和相似度匹配分数进行加权平均处理,得到第二匹配分数,所述第二匹配分数=第一单词匹配分数*单词权重+相似度匹配分数*相似度权重,其中,单词权重+相似度权重=1;获取查询业务分词的词向量和业务介绍的词向量并得到相似度分数;将第二匹配分数和相似度分数进行加权平均处理,得到匹配分数模型,进而得到最终匹配分数,所述最终匹配分数=第二匹配分数*第二权重+相似度分数*第三权重,其中,第二权重+第三权重=1。3.根据权利要求1所述的一种业务数据匹配查询的方法,其特征在于,所述对所述待查询业务的相关文本进行分词处理,得到分词集,包括以下步骤:以标点符号为单位对所述待查询业务的相关文本进行处理,得到分句;对所述分句进行分词处理,得到分词单元,基于所述分词单元得到分词集。4.根据权利要求1所述的一种业务数据匹配查询的方法,其特征在于,所述对未匹配成功查询业务分词进行二次分词处理,包括以下步骤:获取未匹配成功查询业务分词的信息熵;基于信息熵确定未匹配成功查询业务分词的近义词及相似词并形成词语集合;将词语集合中词语作为的候选词类并计算候选词类概率;
选取最高概率的候选词作为二次分词的词类,进而完成二次分词处理。5.根据权利要求1所述的一种业务数据匹配查询的方法,其特征在于,所述词频权重模型,表示如下:基于分词确定词频、逆向文档词频及字段长度比率;基于词频、逆向文档词频及字段长度比率得到词频权重值,其中,所述词频权重值表示为:词...

【专利技术属性】
技术研发人员:吴一帅
申请(专利权)人:浙商证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1