基于自然语言处理的语音交互式数据分析系统技术方案

技术编号:41499664 阅读:25 留言:0更新日期:2024-05-30 14:42
本发明专利技术涉及语音识别技术领域,公开了基于自然语言处理的语音交互式数据分析系统,包括通用语言识别层、附加语料层、转换识别层、查询反馈层、异常处理层和隐私保护层,通过附加语料层和转换识别层结合传统的通用自然语言处理模型,可以对特定领域的术语在语音交互时实现高准确率的识别,增大了语音交互的应用场景和提升了用户体验,在保证高准确率的前提下,降低了语音交互在特定领域的应用成本。

【技术实现步骤摘要】

本专利技术涉及语音识别,具体为基于自然语言处理的语音交互式数据分析系统


技术介绍

1、数据分析是指通过收集、清洗、处理和解释数据,以识别、分析和提取数据中的模式、趋势、关联性和洞见的过程。它涉及使用统计学、机器学习、数据挖掘和可视化等技术和方法,从大量的数据中提取有用的信息,为决策制定、问题解决和业务优化提供支持和指导。

2、通过语音交互的数据分析方式,可以获取更丰富的数据信息。除了用户的语音命令之外,语音交互还可以捕获到语音的情感、语调、语速等信息,这些信息对于用户行为分析和情感识别等方面的数据分析具有重要意义。

3、语音识别(speech recognition)是语音交互的关键技术,在语音识别的应用中,专业领域通常有许多行业术语和专业名词,这些词汇可能在通用语言模型中缺乏训练数据,导致识别准确率降低。对于这些特定领域的术语,如果准备大量的行业数据进行专门的训练或定制,会导致应用成本急剧上升,而且还会面临由于训练数据的完整性问题,导致语音识别结果不符合预期,对于特定领域需要一种准确率高且成本低的语音识别机制来满足语音式交互的数本文档来自技高网...

【技术保护点】

1.基于自然语言处理的语音交互式数据分析系统,其特征在于:

2.根据权利要求1所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:

3.根据权利要求2所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:所述转换文本判断模型包括特征提取模块、数据标记模块和模型训练模块,所述特征提取模块将通用模型输出的文本作为关键词提取特征,所述数据标记模块将提取的特征转化成便于分类的数值向量,所述模型训练模块使用逻辑回归算法构建分类模型,所述分类模型以数据标记模块转化的数值向量作为输入,以分类的结果作为输出。

4.根据权利要求3所述的基于自然语言处理的语...

【技术特征摘要】

1.基于自然语言处理的语音交互式数据分析系统,其特征在于:

2.根据权利要求1所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:

3.根据权利要求2所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:所述转换文本判断模型包括特征提取模块、数据标记模块和模型训练模块,所述特征提取模块将通用模型输出的文本作为关键词提取特征,所述数据标记模块将提取的特征转化成便于分类的数值向量,所述模型训练模块使用逻辑回归算法构建分类模型,所述分类模型以数据标记模块转化的数值向量作为输入,以分类的结果作为输出。

4.根据权利要求3所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:采用逻辑回归的二分类算法构建分类模型,将分类的标记抽象为0和1,使用对数几何函数实现映射关系:

5.根据权利要求4所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:所述特征提取模块提取的关键词特征包括词频、词长、前后词的词性和词形变化。

6.根据权利要求5所述的基于自然语言处理的语音交互式数据分析系统,其...

【专利技术属性】
技术研发人员:皇甫汉聪王永才关兆雄庞伟林林浩李沐栩王俊丰郑晓娟吴丽贤杜家兵宋才华刘胜强庞维欣
申请(专利权)人:广东电网有限责任公司佛山供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1