【技术实现步骤摘要】
一种标准化文本数据处理系统
[0001]本申请涉及计算机
,尤其是涉及一种标准化文本数据处理系统。
技术介绍
[0002]目前,数据分析指用适当的统计、分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据也称为观测值,是实验、测量、观察、调查等的结果。数据分析中所处理的数据分为定性数据和定量数据。只能归入某一类而不能用数值进行测度的数据称为定性数据。定性数据中表现为类别,但不区分顺序的,是定类数据,如性别、品牌等;定性数据中表现为类别,但区分顺序的,是定序数据,如学历、商品的质量等级等。
[0003]相关技术中,由于被收集到的文本数据无论是在格式方式,还是在内容等方面,往往存在较多的不确定因素,因此,通常需要对被收集到的文本数据进行一定的处理,才能提供给后续流程使用。相对于文本的信息传达方式而言,多媒体有利于使人们能够更轻松快捷的获取信息。例如,短短的几秒钟或者几十秒钟的多媒体就 ...
【技术保护点】
【技术特征摘要】
1.一种标准化文本数据处理系统,其特征在于:包括采集模块(1)、主题筛选模块(2)、需求筛选模块(3)、质检模块(5)、预警模块(6)、输出模块(8);采集模块(1),用于采集互联网中至少一个信息源上发布的至少一个文本信息;主题筛选模块(2),用于将包含有需求主题的相关词语的文本信息作为目标文本;需求筛选模块(3),用于通过每个目标文本中的情感词语,确定该目标文本对于需求主题的需求方向;质检模块(5),用于对筛选的目标文本进行质检,确定目标文本中包含的不合法词汇;预警模块(6),用于对所述质检模块(5)质检出的不合法文本进行预警,提示用户对应文本存在风险;输出模块(8),用于将筛选出来的文本输出反馈给用户。2.根据权利要求1所述的一种标准化文本数据处理系统,其特征在于:所述质检模块(5)内连接有记忆模块(51),使用前,设计人员可在记忆模块(51)内录入一些不合法的词汇作为所述质检模块(5)的质检基础。3.根据权利要求2所述的一种标准化文本数据处理系统,其特征在于:所述输出模块(8)上连接有反馈模块(81),且所述反馈模块(81)与所述记忆模块(51)连接,所述反馈模块(81)可...
【专利技术属性】
技术研发人员:彭明齐,耿峰,周振泉,
申请(专利权)人:上海松欣智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。