高效率的学生记录匹配制造技术

技术编号:17202333 阅读:33 留言:0更新日期:2018-02-07 16:54
公开了一种用于有效地且智能地匹配学生注册记录的系统和方法。该方法例如可以用于追踪学生从中学机构到高等教育机构的进展情况且生成关于总的大学入学率的统计资料以通知政策决定。在示例性实施方式中,匹配算法分析学生姓名的常用变型以及中学机构与学生的当前已知地址之间的地理距离,以生成较高可信度的匹配。

High efficient student record matching

A system and method for effectively and intelligently matching a student registration record effectively and intelligently is disclosed. This method, for example, can be used to track the progress of students from secondary institutions to higher education institutions, and generate statistical data about the total university enrollment rate, so as to inform policy decisions. In the exemplary way of implementation, the matching algorithm analyzes the commonly used variants of student names and the geographical distance between secondary institutions and the current known addresses of students, so as to generate higher confidence matches.

【技术实现步骤摘要】
【国外来华专利技术】高效率的学生记录匹配
技术介绍
确保从高中毕业的所有学生都为大学作好准备是国家的必要的事。存在大的有待拉近的成绩差距,并且我们的国家需要提高对于所有学生的教育标准以保持竞争力。虽然要达到这些目标存在一系列挑战,但是从联邦政府,许多州、地区和教育改革者以及慈善家的努力中显现出对于改变的强劲势头。一些群体的目标是确保从高中毕业的高中学生中的80%为大学作好准备,在达到该目标的过程中,着重于支持低收入和少数民族的年轻人。该策略的关键因素是确保丰富和可靠的数据的可得,利用这些数据在从校舍到州议会大厦的所有层面上制定出合理的政策和实践决策,这对学生的成绩和成果有很大影响。该数据既提供了K-12教育系统的性能的成果数据,而且还为项目的评估提供了强大的数据集。进一步地,用于测量大学准备策略的成功的最有可能的方式将是评估学生的高等教育的成绩和成果。一些需要答复的独特问题如下:我们高中毕业生在毕业后直接上大学或者在毕业后的两年内上大学的百分比是多少?我们学生团体年年保持登记入读的百分比是多少以及获得学位的百分比是多少?如何使对这些问题的答复针对各个地区、高中学校和关键的学生群体而不同?如何使对这些问题的答复针对各种类型的高等教育制度(例如,公共/私人,2年制/4年制,选择性的/非选择性的)而不同?K-12项目(例如,所完成的高中课程、国家成绩测试分数)和高等教育成果之间的关系是什么?什么高等教育成果与我们的特定K-12项目(尤其是为了提高大学准备率和就读率而设计的项目)相关联?寻找这些问题的答案呈现出许多独特的且具有挑战性的难题。必须记录和维护的数据量本身就是挑战,即使是在这个数字化时代。然而,如果适当地组织数据且向数据提供适当的用于索引的标识符,则当前的数据库技术允许大量数据的管理。适当的索引允许有效地且高可靠性地进行检索。利用所积累的数据和适当的索引,可以答复部分上述问题,并且为我们的一些教育难题找到了解决方案。目前,国内大多数大学生的记录由全国学生资料库存储和保管。该机构通过维护来自学院和大学的反映其当前招生情况的更新信息的数据库,来提供许多政府职能所需的服务(例如,大学贷款服务)。该数据库目前持有许多记录,这些记录反映了从1993年以来的大学招生数据。全国的高中学校地区具有关于其学生的信息,包括学生在标准化考试中的成绩如何,学生的种族和影响教育的其它因素。因为在中学记录和高等教育记录之间出现的差异,导致将来自高中学校的记录匹配到大学注册记录的能力是难以满足的。这些问题可以包括简单的笔误、学生改变其姓名、学生的姓名通过什么形式记录。例如,在中学记录上,学生的姓名可以是JimmyJohnson,但是在高等教育记录中,他的姓名被记录为JamesJohnson或者JimJohnson。在这种情况下,即使一名学生在两个数据库中都有记录,匹配中学记录和高等教育记录也可能是困难的或者无法实现的。这会导致Jimmy没有去上大学的错误结论。为了有助于防止出现不匹配,用户将经常想要使用学生的社会安全号码(SocialSecurityNumber,SSN)作为标识符来获取匹配。然而,在当前的隐私法(例如家庭教育权利和隐私法(FERPA))下,不允许研究员出于研究目的而使用SSN来匹配记录。因此,代理处和研究员可被迫使用姓名和出生日期来进行搜索,导致准确度低的结果。因此,需要这样的系统,该系统在符合保护学生信息的法律的同时,允许在匹配高等教育数据库以提供与中学学生信息的匹配上增大可靠性和效率。
技术实现思路
公开了一种用于有效地且智能地匹配学生注册记录的计算机系统和基于计算机的方法。该方法例如可以用于利用计算机追踪学生从中学机构到高等教育机构的进展情况且生成关于总的大学注册率的统计资料以报告政策决定。在示例性实施方式中,可将来自中学机构(例如高中学校)的记录与来自高等教育机构(例如大学和学院)的记录进行匹配。可以使用基于计算机的在计算机处理器中实现的匹配算法来匹配来自各个机构的记录,该匹配算法基于姓名、姓名的变型、出生日期、地理位置、注册日期和中学机构代码来匹配记录。在示例性实施方式中,该匹配算法可以基于学生姓名的拼写的常用变型来匹配姓名和出生日期。姓名的常用变型可以通过检查预先匹配的学生注册记录并识别学生姓名的拼写的常用变型来确定。该匹配算法也可以调换记录的名字和中间名,以将该记录与其它记录进行匹配。附加地,该匹配算法可以计算中学机构和学生的当前已知地址之间的地理距离,以生成较高可信度的匹配。此外,该匹配算法可以将与高等教育机构记录相关联的注册日期与学生从其中学机构毕业的日期进行比较。附图说明图1示出中学记录数据库和高等教育记录数据库以及其中的个人记录;图2示出用于在中学数据库和高等教育数据库之间匹配记录的匹配算法;以及图3示出用于匹配的硬件系统。具体实施方式在下面的详细描述中,参照附图,这些附图形成本专利技术的一部分并且以说明性的方式示出本专利技术的具体实施方式。足够详细地描述这些实施方式以使本领域的技术人员能够实现这些实施方式,并且应当理解,可以利用其它实施方式且可进行符合逻辑的处理变化。图1示出中学(高中学校)记录数据库100,高等教育记录数据库120。中学记录数据库100包括记录110、记录112、记录114、记录116,其中,记录110、记录112、记录114、记录116每个都包含单个学生的信息。记录110、记录112、记录114、记录116可以包括名字和姓氏、中间名或者首字母、SSN、出生日期(DOB)、中学学校的毕业日期、以及中学学校代码。或者,记录110、记录112、记录114、记录116可以包括学生的SSN、名字和姓氏、种族和高中学校代码。一些记录110、记录112、记录114、记录116可以包括SSN,其它记录可以不包括SSN。进一步地,个人记录110、个人记录112、个人记录114、个人记录116每个都可以包括除名字和姓氏以及出生日期以外的不同信息。本质上,记录110、记录112、记录114、记录116可以包括学生的许多标识符和属性,且不应当被限制于所给出的示例。高等教育数据库120包括学生记录130、学生记录132、学生记录134、学生记录136、学生记录138。这些记录130、记录132、记录134、记录136、记录138中的每个都可以包括与中学记录数据库100中的记录110、记录112、记录114、记录116相同的信息,例如,学生的名字和姓氏、中间名或者首字母、SSN、DOB和其它标识信息。应该理解,记录130、记录132、记录134、记录136、记录138可以包括其它信息且这些信息可以不限于所给出的示例。高等教育记录130、记录132、记录134、记录136、记录138由高等教育机构提供且反映这些机构的各自的招生记录。进一步地,当在高等教育数据库120中创建高等教育记录130、记录132、记录134、记录136、记录138时,这些记录中的每个记录都被提供独特的或特定的高等教育标识符。中学记录数据库100和高等教育记录数据库120可以配置在任何允许有效地存储和检索数据库的数据库结构中。中学数据库100可以包括为具有特定属性而已经被预先选择的记录。例如,中学数据库100中的所有记录可以是进入某高中学校或者进入某本文档来自技高网
...
高效率的学生记录匹配

【技术保护点】
一种用于匹配学生教育注册记录的计算机化的方法,所述方法包括:使用处理器从第一数据库检索包括学生姓名的第一教育注册记录;借助所述处理器来确定所述学生姓名的拼写的常用变型;借助所述处理器来将所述第一教育注册记录的学生姓名的拼写的常用变型与其它教育注册记录进行比较,其中,该比较步骤包括:使用历史姓名变型数据库将所述学生姓名中的名字与包括该名字的一组历史姓名变型进行匹配;以及使用所述处理器来基于所述变型在第二数据库中识别与所述学生姓名相关联的至少一个其它教育注册记录,其中,该识别步骤包括:使用所述处理器调换所述学生姓名中的名字和中间名;使用所述处理器来基于调换后的名字和中间名识别与所述学生姓名相关联的在所述第二数据库中的至少一个其它教育注册记录;和将与所述第一教育注册记录有关的学校所关联的至少一个邮政编码和与所述学生姓名相关联的邮政编码进行匹配。

【技术特征摘要】
【国外来华专利技术】2011.08.16 US 13/211,0311.一种用于匹配学生教育注册记录的计算机化的方法,所述方法包括:使用处理器从第一数据库检索包括学生姓名的第一教育注册记录;借助所述处理器来确定所述学生姓名的拼写的常用变型;借助所述处理器来将所述第一教育注册记录的学生姓名的拼写的常用变型与其它教育注册记录进行比较,其中,该比较步骤包括:使用历史姓名变型数据库将所述学生姓名中的名字与包括该名字的一组历史姓名变型进行匹配;以及使用所述处理器来基于所述变型在第二数据库中识别与所述学生姓名相关联的至少一个其它教育注册记录,其中,该识别步骤包括:使用所述处理器调换所述学生姓名中的名字和中间名;使用所述处理器来基于调换后的名字和中间名识别与所述学生姓名相关联的在所述第二数据库中的至少一个其它教育注册记录;和将与所述第一教育注册记录有关的学校所关联的至少一个邮政编码和与所述学生姓名相关联的邮政编码进行匹配。2.如权利要求1所述的方法,其中,该确定步骤还包括:检查针对其他学生姓名预先匹配的学生教育注册记录,并且识别所述学生姓名的拼写的常用变型。3.如权利要求1所述的方法,其中,该识别步骤包括:将与所述第一教育注册记录相关联的注册日期和所述学生的来自所述至少一个其它教育注册记录的毕业日期进行比较。4.如权利要求1所述的方法,其中,所述第一教育注册记录包括中学教育注册记录。5.一种用于追踪学生注册的计算机系统,所述系统包括:第一数据库,所述第一数据库包含第一中学或高等教育的教育注册记录;第二数据库,所述第二数据库包含...

【专利技术属性】
技术研发人员:道格拉斯·T·夏皮罗黛安娜·吉勒姆
申请(专利权)人:全国学生资料库
类型:发明
国别省市:美国,US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1