一种基于多层语义特征提取结构的问答文本匹配方法组成比例

技术编号：43417418 阅读：17 留言：0更新日期：2024-11-22 17:52

本发明专利技术涉及文本识别匹配技术领域，且公开了一种基于多层语义特征提取结构的问答文本匹配方法，该基于多层语义特征提取结构的问答文本匹配方法，包括步骤一、控制指令确认；步骤二、采集语音信息；步骤三、过滤噪音；步骤四、指令文本语音匹配；步骤五、指令文本语音收录。该基于多层语义特征提取结构的问答文本匹配方法，通过预先建立语音信号模型，并且通过语音信号模型以及数据库内提前录入的语音文本指令信息对采集识别的指令文本进行识别和匹配，同时根据匹配程度以及使用频率的高低进行由高至低排序，方便使用者根据实际的需求进行选择，不仅可以保证指令发出的正确性，同时也能够提升其智能化交互使用效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文本识别匹配，具体为一种基于多层语义特征提取结构的问答文本匹配方法。

技术介绍

1、随着设备智能化的普及，语音智能终端也逐渐的进入到人们的生活与工作当中，通过对于语音信息采集，并配合语音智能终端对语音文本进行翻译，从而获取指令信息，而一般智能语音终端都具有自主学习功能，依据文本的语义将大量的文本自动分门别类，从而更好地帮助人们把握文本信息，文本自动分类系统是信息处理的重要研究方向，它是指在给定的分类体系下，根据文本的内容自动判别文本类别的过程，目前，机器学习、数据挖掘等领域的方法对其进行处理，通过对文本信息进行基于内容的分类，自动生成便于用户使用的文本分类系统，从而可以大大降低组织整理文档耗费的人力资源，帮助用户快速找到所需信息。

2、但是现有的智能信息处理终端在对语音信息进行采集时，由于中文具有众多的同音字词，这些同音字词在不同的语境下所对应的词语和含义均不同，从而在一定程度上会影响到智能信息处理终端在处理这类文本信息和查询以及执行某些指令时效率受到影响，导致在群发短信和文本信息时出现错误，影响到沟通的效率和...

【技术保护点】

1.一种基于多层语义特征提取结构的问答文本匹配方法，其特征在于：其执行以下步骤：

2.根据权利要求1所述的一种基于多层语义特征提取结构的问答文本匹配方法，其特征在于：所述步骤一中进行语音识别时利用贝叶斯公式计算控制指令和语音信号与智能信息处理终端数据库内的身份信息的匹配程度，最终确认已录入的身份信息，

3.根据权利要求1所述的一种基于多层语义特征提取结构的问答文本匹配方法，其特征在于：所述步骤二中的指令信息采用智能AI学习模型，并且所述智能信息处理终端与物联网连接，对同音字和同音词收录时包含对应的语境含义，同音字的和同音词与对应语境含义信息具体形式为A（X），且X...

【技术特征摘要】

1.一种基于多层语义特征提取结构的问答文本匹配方法，其特征在于：其执行以下步骤：

3.根据权利要求1所述的一种基于多层语义特征提取结构的问答文本匹配方法，其特征在于：所述步骤二中的指令信息采用智能ai学习模型，并且所述智能信息处理终端与物联网连接，对同音字和同音词收录时包含对应的语境含义，同音字的和同音词与对应语境含义信息具体形式为a（x），且x为常数，同音字和同音词的对应语境含义对应的语句信息对应为q+a（x）+w，其中，q为出现在该同音字和同音词前的词语文本信息，所述w为出现在该同音字和同音词后的词语文本信息，在判断指令文本匹配度时作为参考。

4.根据权利要求2所述的一种基于多层语义特征提取结构的问答文本匹配方法，其特征在于：所述步骤二中的指令信息包含该智能信息处理终端日常使用以及控制命令的日常指令，并且所述日常指令在智能信息处理终端系统建立时录入数据库内。

5.根据权利要求2所述的一种基于多层语义特征提取结构的问答文本匹配方法，其特征在于：所述步骤三中过滤噪音时以智能信息处理终端开机时确认的语音信号模型为对比依据，并且在滤波时对属于当前语音信号模型的语音文...

【专利技术属性】
技术研发人员：陈东，黄剑，任飞，陆煜烨，叶敏，徐雯，高宝海，王煜中，刘敦，唐新明，陈旭，
申请(专利权)人：上海助通信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人