一种业务数据匹配查询的方法、系统及装置制造方法及图纸

技术编号：39326629 阅读：11 留言：0更新日期：2023-11-12 16:04

本发明专利技术公开了一种业务数据匹配查询的方法、系统及装置，方法包括：获取待查询业务的相关文本，对所述相关文本进行分词处理，得到查询业务分词集，基于所述查询业务分词集，基于匹配分数模型与菜单目录中的菜单项对应的业务功能号进行匹配，若匹配不成功，对未匹配成功查询业务分词进行二次分词处理，得到查询业务重分词集，基于匹配分数模型进行二次匹配，得到匹配的业务功能号并形成集合，预设词频权重模型，得到集合中对应业务功能号出现的词频权重值；基于词频权重值对集合中的业务功能号进行过滤，筛选出最佳匹配结果。本发明专利技术能够提高业务人员的工作效率，提高用户的体验。提高用户的体验。提高用户的体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种业务数据匹配查询的方法、系统及装置

[0001]本专利技术涉及数据处理
，尤其涉及一种业务数据匹配查询的方法、系统及装置。

技术介绍

[0002]对证券业务进行查询，是银行及交易机构提供给客户的一项重要服务，然而，现有的查询操作，主要是在工作人员的指引下逐项点击菜单，或用户自己输入简单的语句查询业务流程和内容，其存在以下技术缺陷，一方面，浪费大量人力资源，同时增加了用户的时间成本，另一方面，无法识别用户输入的长文本和复杂文本，一旦用户输入的语句不标准，不规范，或者存在歧义，重复等问题时，就无法在菜单中准确调取相应的业务功能号和业务功能号，导致无法在用户界面显示业务流程和内容。

技术实现思路

[0003]本专利技术针对现有技术中的缺点，提供了一种业务数据匹配查询的方法、系统及装置。
[0004]为了解决上述技术问题，本专利技术通过下述技术方案得以解决：
[0005]一种业务数据匹配查询的方法，包括以下步骤：
[0006]获取待查询业务的相关文本，对所述相关文本进行分词处理，得到查询业务分词集，其中，每个查询业务分词包含对应的查询业务分词文本特征；
[0007]基于所述查询业务分词集，基于匹配分数模型与菜单目录中的菜单项对应的业务功能号进行匹配，若匹配不成功，对未匹配成功查询业务分词进行二次分词处理，得到查询业务重分词集，基于匹配分数模型进行二次匹配，得到匹配的业务功能号并形成集合，其中，业务功能号包括业务标题、业务介绍及业务关键词，基于业务标题、业务介绍及业务关...

【技术保护点】

【技术特征摘要】
1.一种业务数据匹配查询的方法，其特征在于，包括以下步骤：获取待查询业务的相关文本，对所述相关文本进行分词处理，得到查询业务分词集，其中，每个查询业务分词包含对应的查询业务分词文本特征；基于所述查询业务分词集，基于匹配分数模型与菜单目录中的菜单项对应的业务功能号进行匹配，若匹配不成功，对未匹配成功查询业务分词进行二次分词处理，得到查询业务重分词集，基于匹配分数模型进行二次匹配，得到匹配的业务功能号并形成集合，其中，业务功能号包括业务标题、业务介绍及业务关键词，基于业务标题、业务介绍及业务关键词构建预设匹配分数模型；预设词频权重模型，得到集合中对应业务功能号出现的词频权重值；基于词频权重值对集合中的业务功能号进行过滤，筛选出最佳匹配结果。2.根据权利要求1所述的一种业务数据匹配查询的方法，其特征在于，所述基于业务标题、业务介绍及业务关键词构建匹配分数模型，包括以下步骤：对查询业务分词文本特征和业务介绍进行处理得到单词；分别获取查询业务分词与业务标题、业务介绍及业务关键词重合的单词比例，得到查询业务分词和业务标题单词重合比分、查询业务分词和业务关键词单词重合比分及查询业务分词和业务关键词单词重合比分；将查询业务分词和业务标题单词重合比分、查询业务分词和业务关键词单词重合比分及查询业务分词和业务关键词单词重合比分进行加权平均处理，得到第一匹配分数，所述第一匹配分数＝查询业务分词和业务介绍的单词重合比分*业务介绍权重+查询业务分词和业务关键词单词重合比分*业务关键词权重+查询业务分词和业务标题单词重合比分*业务标题权重，其中，业务介绍权重+业务关键词权重+业务标题权重＝1；基于业务介绍的统计结果得到查询业务分词的文本向量，将文本向量与业务介绍文本向量的相似度分数作为相似度匹配分数；将第一匹配分数和相似度匹配分数进行加权平均处理，得到第二匹配分数，所述第二匹配分数＝第一单词匹配分数*单词权重+相似度匹配分数*相似度权重，其中，单词权重+相似度权重＝1；获取查询业务分词的词向量和业务介绍的词向量并得到相似度分数；将第二匹配分数和相似度分数进行加权平均处理，得到匹配分数模型，进而得到最终匹配分数，所述最终匹配分数＝第二匹配分数*第二权重+相似度分数*第三权重，其中，第二权重+第三权重＝1。3.根据权利要求1所述的一种业务数据匹配查询的方法，其特征在于，所述对所述待查询业务的相关文本进行分词处理，得到分词集，包括以下步骤：以标点符号为单位对所述待查询业务的相关文本进行处理，得到分句；对所述分句进行分词处理，得到分词单元，基于所述分词单元得到分词集。4.根据权利要求1所述的一种业务数据匹配查询的方法，其特征在于，所述对未匹配成功查询业务分词进行二次分词处理，包括以下步骤：获取未匹配成功查询业务分词的信息熵；基于信息熵确定未匹配成功查询业务分词的近义词及相似词并形成词语集合；将词语集合中词语作为的候选词类并计算候选词类概率；
选取最高概率的候选词作为二次分词的词类，进而完成二次分词处理。5.根据权利要求1所述的一种业务数据匹配查询的方法，其特征在于，所述词频权重模型，表示如下：基于分词确定词频、逆向文档词频及字段长度比率；基于词频、逆向文档词频及字段长度比率得到词频权重值，其中，所述词频权重值表示为：词...

【专利技术属性】
技术研发人员：吴一帅，
申请(专利权)人：浙商证券股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人