The invention relates to a heterogeneous data integration platform and fusion method. The fusion platform includes a data acquisition unit, data storage unit, data standardization unit, construction unit, user portrait knowledge mapping unit and visualization unit; data acquisition unit is used for collecting multi-source heterogeneous data; data storage unit for caching of multi-source heterogeneous data; data the standard unit of lexical, syntactic and / or semantic analysis of multi-source data, get the standard text data; the user portrait construction unit out of the students by using the quantitative structure label user portrait built student; knowledge map map construction of knowledge map, knowledge of the construction of teacher student unit map and curriculum, and knowledge map knowledge map, knowledge of the students and teachers of the association, to get students to The curriculum links, social relationships, and teacher-student relationships of the heart; the visual unit displays the student - centered curriculum, social and teacher-student relationships.
【技术实现步骤摘要】
一种多源异构数据融合平台及融合方法
本专利技术属于计算机
,具体涉及一种多源异构数据融合平台及融合方法。
技术介绍
随着信息技术的飞速发展,当今社会进入了信息爆炸时代,学生信息资源的数量越来越多。然而,大量的学生相关数据存储在多个信息孤岛中,难以被整合和关联,使得人们无法充分挖掘大数据所带来的价值。而现如今市场上大多的有关学生信息的知识库仍属于信息管理系统,其具有信息查询、个人资料管理、成绩统计等功能,并不能提供智能的检索和分析服务来帮助学生更好的对学习行为进行改进以及为个人的职业发展提供决策支持。
技术实现思路
为了解决现有技术存在的上述问题,本专利技术提供了一种学生多源异构数据融合平台及融合方法。本专利技术所采用的技术方案为:一种多源异构数据融合平台包括数据采集单元、数据存储单元、数据标准化单元、用户画像构建单元、知识图谱构建单元和可视化单元;所述数据采集单元用于采集多源异构数据;所述数据存储单元将采集到的多源异构数据进行缓存;所述数据标准化单元从所述数据存储单元中读取多源异构数据,并对多源异构数据进行词法、语法和/或语义分析,得到标准化文本数据;所述用户画像构建单元从标准化文本数据中提取出学生的动态信息数据和静态信息数据,并根据提取的数据量化出学生标签,利用量化出的学生标签构建学生的用户画像;所述知识图谱构建单元根据课程内容构建课程的知识图谱,根据学生的用户画像构建学生的知识图谱,根据老师的教学数据构建老师的知识图谱;并将课程的知识图谱、学生的知识图谱和老师的知识图谱进行关联,得到以学生为中心的课程联系、社交关系和师生关系;所述可视化单元对得到的以 ...
【技术保护点】
一种多源异构数据融合平台,其特征在于,它包括数据采集单元、数据存储单元、数据标准化单元、用户画像构建单元、知识图谱构建单元和可视化单元;所述数据采集单元用于采集多源异构数据;所述数据存储单元将采集到的多源异构数据进行缓存;所述数据标准化单元从所述数据存储单元中读取多源异构数据,并对多源异构数据进行词法、语法和/或语义分析,得到标准化文本数据;所述用户画像构建单元从标准化文本数据中提取出学生的动态信息数据和静态信息数据,并根据提取的数据量化出学生标签,利用量化出的学生标签构建学生的用户画像;所述知识图谱构建单元根据课程内容构建课程的知识图谱,根据学生的用户画像构建学生的知识图谱,根据老师的教学数据构建老师的知识图谱;并将课程的知识图谱、学生的知识图谱和老师的知识图谱进行关联,得到以学生为中心的课程联系、社交关系和师生关系;所述可视化单元对得到的以学生为中心的课程联系、社交关系和师生关系进行显示。
【技术特征摘要】
1.一种多源异构数据融合平台,其特征在于,它包括数据采集单元、数据存储单元、数据标准化单元、用户画像构建单元、知识图谱构建单元和可视化单元;所述数据采集单元用于采集多源异构数据;所述数据存储单元将采集到的多源异构数据进行缓存;所述数据标准化单元从所述数据存储单元中读取多源异构数据,并对多源异构数据进行词法、语法和/或语义分析,得到标准化文本数据;所述用户画像构建单元从标准化文本数据中提取出学生的动态信息数据和静态信息数据,并根据提取的数据量化出学生标签,利用量化出的学生标签构建学生的用户画像;所述知识图谱构建单元根据课程内容构建课程的知识图谱,根据学生的用户画像构建学生的知识图谱,根据老师的教学数据构建老师的知识图谱;并将课程的知识图谱、学生的知识图谱和老师的知识图谱进行关联,得到以学生为中心的课程联系、社交关系和师生关系;所述可视化单元对得到的以学生为中心的课程联系、社交关系和师生关系进行显示。2.如权利要求1所述的一种多源异构数据融合平台,其特征在于,所述多源异构数据包括学生数据、企业数据、高校数据、留学机构数据和政府机构数据;所述学生数据包括课堂表现、成绩、技能、性格、社交和求职意向;所述企业数据包括职位需求、企业状况和薪资;所述高校数据包括专业需求、分数要求、毕业去向和毕业薪资;所述留学机构数据包括留学需求、学费和留学生分布;所述政府机构数据包括职位需求和薪资。3.如权利要求1所述的一种多源异构数据融合平台,其特征在于,所述对多源异构数据进行词法、语法和/或语义分析包括对多源异构数据的原始文本数据基于词法、语法和/或语义分析进行结构化处理和分词处理。4.如权利要求1或2或3所述的一种多源异构数据融合平台,其特征在于,所述知识图谱构建单元包括信息抽取单元、信息表示单元和构建单元;所述信息抽取单元用于从标准化文本数据中抽取事实信息,事实信息包括实体、属性、实体之间的关系以及实体与属性之间的关系;所述信息表示单元采用预设表现形式对事实信息进行结构化表示,得到事实信息的结构化数据对...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。