一种高效智能语义匹配方法组成比例

技术编号:27619865 阅读:15 留言:0更新日期:2021-03-10 10:58
本发明专利技术公开了一种高效智能语义匹配方法:基于模糊算法的自然语言处理词汇库智能mapping方法,包括语音数据采集软硬件系统和网络储存数据库,还包括智能mapping词汇库系统和用户专用自然语言数据库;所述语音数据采集软硬件系统包括语音采集软件和/或语音采集软硬件系统,所述语音采集软件安装在主机中;所述智能mapping词汇库系统包括关键字词设置捕捉程序、字词语义对比程序、字词语义映射程序和用户专用词汇库生成系统。本发明专利技术研究自然语言处理智能mapping词汇库,建立多层次词汇库,适合各种复杂场景应用,能够持续深度学习不断自动升级,自动匹配方言、俗语和语音表达习惯,方便用户应用,提高准确性和处理效率。提高准确性和处理效率。提高准确性和处理效率。

【技术实现步骤摘要】
一种高效智能语义匹配方法


[0001]本专利技术涉及自然语言处理领域,尤其涉及一种高效智能语义匹配方法。

技术介绍

[0002]自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理(NLP)是计算机科学,人工智能(AI),语言学关注计算机和人类(自然)语言之间的相互作用的领域。
[0003]以现代逻辑作为分析自然语言的工具, 自然语言的缺陷有:(1)表达式的层次结构不够清晰;(2)个体化认知模式体现不够明确;(3)量词管辖的范围不太确切;(4)句子成分的语序不固定;(5)语形和语义不对应。从自然语言的视角衡量逻辑语言, 逻辑语言的不足有:(1)初始词项的种类不够多样;(2)量词的种类比较贫乏;(3)存在量词的辖域在公式系列中不能动态的延伸;(4)由于语境的缺失而使语言传达信息的效率不高。
[0004]现有技术公开号为CN110780878A的专利技术专利,公开了一种采用深度学习技术进行JavaScript类型推断的方法,涉及人工智能领域的一种对源代码的深度学习,内容包括:数据的收集与处理、模型的构建、模型的训练、模型的评估、类型推断,首先确定神经网络种类,然后确定神经网络层数,最后确定每层神经元个数,数据的收集与处理包括:首先在Github上下载一定量的源代码,接着筛选类型丰富的源代码作为最终的数据集,然后将数据转换为单词(token)和类型(type)对齐匹配的格式,同时生成token和type词汇库,最后利用token

type映射将源代码表示为一种适合学习的数据格式,跟踪损失函数值和分类误差,更新模型参数,直至得到准确度较高的模型,以文件的形式输出,能够进行一定的底层程序处理,在编写程序层面有一定的借鉴参考意义,但只能处理统一规整的数据,还不能够应用于自然语言处理,更不能用于符合场景应用生成的高级词汇库。
[0005]专利号为CN201711204633.4的专利技术专利,公开了一种基于问句和知识图结构分析的自然语言问答方法及系统,属于图计算和自然语言问答领域,针对现有的各种问答系统所存在的问题,提出了基于问句和知识图的结构构建、分析及匹配的自然语言问答方法,从而拓展可回答自然语言问题的种类,同时提升答案的准确率,法通过以实体节点为中心的遍历,以及设计抽取规则来采用图的结构来表示查询问句;基于查询图在知识图中映射查找覆盖所有答案的子图,通过构建路径和短语的语义向量,在实现对答案子图过滤筛选的同时,计算匹配的相似度,从而得出候选答案,对基于图形生成自然语言处理效果明显,但现实中可产生图形的领域较窄,能够获取符合要求的图形场所更少,所以很难大规模实际应用,还处于继续研究阶段,不能适应环境复杂的场所,也无法针对语音环境进行应用,在底层逻辑上可以提供一些基础的技术支持,但不能提供创造性技术启示。
[0006]公开号为CN111444700A的专利技术专利,公开了一种基于语义文档表达的文本相似度量方法,通过获取待比较的两个文本,对每个文本的句子分别进行分词预处理;将两个文本预处理后的词汇进行映射,生成词向量;通过卷积神经网络模型CNN和双向长短时记忆循环网络模型BiLSTM对每个文本均进行处理,提取出每个文本的CNN句子语义特征和BiLSTM句子语义特征;对每个文本的每个句子语义特征均通过注意机制模型捕获关注特征,生成权重向量,计算权重和,生成CNN语义表示向量和BiLSTM语义表示向量,将每个文本各自的两个语义表示向量分别进行拼接,生成词汇语义关联特征向量;根据两个文本的词汇语义关联特征向量构建相似度计算函数,计算出两个文本句子的相似度,本专利技术也采用了类似算法的软件程序,属于本专利技术的基础技术支持层次,仅仅是计算工具,不能为本专利技术提供创造性启示。
[0007]公开号为CN109684482A专利技术专利,公开了一种基于深度神经网络模型的民族文化资源聚类分析方法, 属于民族文化资源挖掘
,先利用分布式网络爬虫技术获取民族文化资源文本数据,然后利用自然语言处理技术对民族文化资源文本数据进行文本解析和文本预处理,并基于doc2vec实现民族文化资源文本的特征词提取和向量化,再基于K

means聚类算法对向量化后的民族文化资源文本进行聚类,并利用肘部法则方法确定最优聚类簇数,最终获得民族文化资源文本关联关系,采用无监督训练方法,能揭示民族文化资源文本蕴含的语义信息,便于识别民族文化资源文本间的类别关系,为海量民族文化资源的采集、存储和智能化服务提供技术支持。
[0008]公开号为CNCN110413627A专利技术专利,公开了一种信息优化方法、装置、服务器及存储介质,其中方法包括:获取客户端发送的请求信息,并从预设的信息数据库中确定所述请求信息对应的响应信息;将所述响应信息发送给所述客户端,并从所述客户端获取基于所述响应信息输入的反馈信息;根据所述反馈信息确定对所述响应信息的满意度,并在所述满意度小于预设的满意度阈值时,对所述响应信息进行优化,得到优化后的响应信息,其中,根据所述优化后的响应信息确定的满意度大于或等于所述满意度阈值,可提升对服务器中信息数据的更新效率。
[0009]专利号为CN201510260549.9的专利技术专利公开了一种基于模糊算法的Smith预估器参数估计方法,该方法可用于实时估计Smith预估器参数,协助Smith预估器准确、快速地提高时滞系统的PID控制性能。该方法利用时滞系统的输出与输入实时地估计Smith预估器的比例系数Kp(t)以及滞后环节系数τ(t),利用模糊算法实时估计惯性环节系数T(t)。能够有效地实时估计出Smith预估器参数Kp(t)和τ(t),大大提高了实时估计的准确性;惯性环节系数T(t)模糊算法模型的建立,不仅提高了T(t)实时估计的准确性与适应性,而且消除了外部干扰信号对惯性环节系数T(t)实时估计的干扰。该方法提高了基于PID控制的时滞系统的控制质量和准确性,并且保证了PID控制的实时性与稳定性,但具体的应用面相对比较狭窄,要想运用该专利技术,还需要很多具体的运用场景与内在逻辑的创新研究和规律性的发现。
[0010]鉴于以上所述,目前现有的技术相对来说还不够完善,因此,我们有必要研究一种基于模糊算法的自然语言处理词汇库智能mapping方法,建立多层次,适合各种复杂场景应用,方便用户应用,提高准确性和处理效率。

技术实现思路

[0011]本专利技术的目的在于克服现有技术存在的以上问题,提供一种基于模糊算法的自然语言处理词汇库智能mapping方法,本专利技术适用性强,适用范围广,无需常规耗时耗力成本巨大的专门调研手段,前人栽树后人可乘凉本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高效智能语义匹配方法,包括网络储存数据库,其特征在于:还包括智能mapping词汇库系统、上下游系统对接智能识别自动映射系统、深度学习自动优化升级系统和用户专用自然语言数据库;所述智能mapping词汇库系统包括关键字词设置捕捉程序、字词语义对比程序、字词语义映射程序和用户专用词汇库生成系统;所述深度学习自动优化升级系统具体操作步骤程序如下:用户在目标工作区域安装好语音采集软件、语音采集软硬件系统,进行软硬件连接和匹配调试;用户启用系统,登录管理账户,设置用户需求和用户专用和常用的关键词;通过语音采集软件、语音采集软硬件系统收集用户目标区域的影音数据;后台启动关键字词设置捕捉程序,捕捉并筛选出含有关键字词影音数据片段;将影音数据片段转化为文字语句,通过字词语义对比程序分析影音数据片段的语义,筛选出符合用户需求的影音数据片段,排除明显不属于用户按需求设定应用环境的影音数据片段;启用字词语义映射程序,为自然语言、词典语义、筛选出的影音数据片段、用户方言和用户口语关联关键词建立初步映射对应关系;用户专用词汇库生成系统高频调用初步映射对应关系,生成符合用户设定环境的日常用语,在存在互动时,自动添加到互动环节中,并根据与用户和/或用户的顾客反馈情况,自动或由用户手动排除互动后明显不符合实际的初步映射对应关系,生成自然语言处理映射对应关系,并将自然语言处理映射对应关系储存入用户专用词汇库生成系统,完成专用词汇库的构建。2.根据权利要求1所述的一种高效智能语义匹配方法,其特征在于:所述主机为联网或不联网的电脑主机,或基于互联网的虚拟主机,与显示屏装置和操作输入装置连接。3.根据权...

【专利技术属性】
技术研发人员:陈丽园
申请(专利权)人:上海嗨酷强供应链信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1