【技术实现步骤摘要】
一种基于文本的情感分类方法、系统和电子设备
[0001]本专利技术涉及文本情感预测领域,尤其涉及一种基于文本的情感分类方法、系统和电子设备。
技术介绍
[0002]文本情感分析采用计算语言学的方法,可以对带有情感色彩的主观性文本进行分析,处理,归纳和推理。目前的情感分析方法主要有两种:类别型情感分析方法和维度型情感分析方法,区别于现有的类别型情感分析方法,维度型情感分析方法可以提供更为细致的情感信息。
[0003]然而,目前的面向中文的维度型情感分析方法,由于文本区域拆分单一,长短句分配不均衡,使得其情感分析准确度低。
[0004]因此,兹提出一种基于文本的情感分类方法、系统和电子设备。
技术实现思路
[0005]本说明书提供一种基于文本的情感分类方法、系统和电子设备,通过获取原始文本信息;对所述原始文本信息进行数据清洗,得到待测文本信息;为了提高情感预测的准确率,先对待测文本信息进行拆分,再对所述待测文本信息进行情感预测,得到与所述原始文本信息对应的目标情感标签,根据所述目标情感标签对所述原 ...
【技术保护点】
【技术特征摘要】
1.一种基于文本的情感分类方法,其特征在于,包括:获取原始文本信息;对所述原始文本信息进行数据清洗,得到待测文本信息;通过文本预测模型对所述待测文本信息进行拆分,得到有序的待测文本区域,对所述有序的待测文本区域进行情感预测,得到与所述原始文本信息对应的目标情感标签,根据所述目标情感标签对所述原始文本信息进行情感分类。2.如权利要求1所述的一种基于文本情感预测的方法,其特征在于,所述对所述原始文本信息进行数据清洗,包括:去除所述原始文本信息的英文;和/或,去除所述原始文本信息的数字;和/或,去除所述原始文本信息的空格;和/或,对所述原始文本信息进行标点符号转换。3.如权利要求1所述的一种基于文本情感预测的方法,其特征在于,所述通过文本预测模型对所述待测文本信息进行拆分,得到有序的待测文本区域,对所述有序的待测文本区域进行情感预测,得到与所述原始文本信息对应的目标情感标签,根据所述目标情感标签对所述原始文本信息进行情感分类,包括:按照文本拆分策略对所述待测文本信息进行拆分,得到有序的若干个待测文本区域;对所述待测文本区域进行特征提取,得到区域情感特征,所述区域情感特征与所述待测文本区域一一对应;按照所述待测文本区域的顺序,依次遍历与之对应的区域情感特征,得到目标情感标签。4.如权利要求3所述的一种基于文本情感预测的方法,其特征在于,所述按照文本拆分策略对所述待测文本信息进行拆分,得到有序的若干个待测文本区域,包括:确定与所述待测文本信息对应的所有的待测语言结构;根据第n+1级待测语言结构的拆分子策略对第n级拆分得到的待测文本区域依次进行拆分,得到与第n+1级待测语言结构对应的待测文本内容组,所述与第n+1级待测语言结构对应的待测文本内容组包括有序的若干个待测文本区域;按照所有的所述待测语言结构的排序逻辑...
【专利技术属性】
技术研发人员:何熲,谭润东,高军晖,
申请(专利权)人:上海暖禾脑科学技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。