【技术实现步骤摘要】
本专利技术涉及语音识别,具体为基于自然语言处理的语音交互式数据分析系统。
技术介绍
1、数据分析是指通过收集、清洗、处理和解释数据,以识别、分析和提取数据中的模式、趋势、关联性和洞见的过程。它涉及使用统计学、机器学习、数据挖掘和可视化等技术和方法,从大量的数据中提取有用的信息,为决策制定、问题解决和业务优化提供支持和指导。
2、通过语音交互的数据分析方式,可以获取更丰富的数据信息。除了用户的语音命令之外,语音交互还可以捕获到语音的情感、语调、语速等信息,这些信息对于用户行为分析和情感识别等方面的数据分析具有重要意义。
3、语音识别(speech recognition)是语音交互的关键技术,在语音识别的应用中,专业领域通常有许多行业术语和专业名词,这些词汇可能在通用语言模型中缺乏训练数据,导致识别准确率降低。对于这些特定领域的术语,如果准备大量的行业数据进行专门的训练或定制,会导致应用成本急剧上升,而且还会面临由于训练数据的完整性问题,导致语音识别结果不符合预期,对于特定领域需要一种准确率高且成本低的语音识别机制
...【技术保护点】
1.基于自然语言处理的语音交互式数据分析系统,其特征在于:
2.根据权利要求1所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:
3.根据权利要求2所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:所述转换文本判断模型包括特征提取模块、数据标记模块和模型训练模块,所述特征提取模块将通用模型输出的文本作为关键词提取特征,所述数据标记模块将提取的特征转化成便于分类的数值向量,所述模型训练模块使用逻辑回归算法构建分类模型,所述分类模型以数据标记模块转化的数值向量作为输入,以分类的结果作为输出。
4.根据权利要求3所述的
...【技术特征摘要】
1.基于自然语言处理的语音交互式数据分析系统,其特征在于:
2.根据权利要求1所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:
3.根据权利要求2所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:所述转换文本判断模型包括特征提取模块、数据标记模块和模型训练模块,所述特征提取模块将通用模型输出的文本作为关键词提取特征,所述数据标记模块将提取的特征转化成便于分类的数值向量,所述模型训练模块使用逻辑回归算法构建分类模型,所述分类模型以数据标记模块转化的数值向量作为输入,以分类的结果作为输出。
4.根据权利要求3所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:采用逻辑回归的二分类算法构建分类模型,将分类的标记抽象为0和1,使用对数几何函数实现映射关系:
5.根据权利要求4所述的基于自然语言处理的语音交互式数据分析系统,其特征在于:所述特征提取模块提取的关键词特征包括词频、词长、前后词的词性和词形变化。
6.根据权利要求5所述的基于自然语言处理的语音交互式数据分析系统,其...
【专利技术属性】
技术研发人员:皇甫汉聪,王永才,关兆雄,庞伟林,林浩,李沐栩,王俊丰,郑晓娟,吴丽贤,杜家兵,宋才华,刘胜强,庞维欣,
申请(专利权)人:广东电网有限责任公司佛山供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。