·科技事件·
大数据与教育同行,优势与问题同在

赖在床上不去上课,以为只有你的死党知道?你的出门时间、教学楼打水次数……都被校园卡“记录在案”。而无数这样的数据集中在一起,就构成了可供分析的“大数据”。近日,电子科技大学教育大数据研究所教授周涛领衔研发出一套大数据系统,研究人员发现,成绩较好的学生作息时间比成绩差的学生更规律。然而,在教育专家看来,教育大数据应用带来的问题,依然不容小觑。

发现学霸与独行侠 大数据算出教育者关心问题

该系统的基础数据源于电子科大两万余名本科生的学籍信息、毕业去向、“校园一卡通”刷卡记录等。通过挖掘、分析学生的消费行为、活动轨迹、考试成绩等信息,“算” 出每名学生的学习、生活状态。

关于数据处理流程和方法,周涛在接受《科技导报》采访时谈到,首先进行的是异常数据处理,主要是剔除一些不规范的数据。然后用关联分析、回归分析、Nullmodel(零模型)等手段进行统计分析,找出变量之间的关系。比如用零模型分析一个人的朋友成绩对其成绩是否有影响时,做法是在数据中把同学之间的社交网络打乱,将打乱关系之后朋友成绩对此人成绩的影响,与真实社交关系中朋友成绩对此人成绩的影响比较,会发现后者远远大于前者,说明真实社交关系中,朋友成绩对一个人的成绩是有影响的。此外,还会应用数据挖掘的方法,找到所有可能有关联的变量,通过机器学习,确定哪些特征量的价值更大,有更强的预测能力。

通过计算,该团队从定量的角度证实了人们的主观感受,行为规律性较强的学生更容易取得好成绩。此外,还可以预测将考科目的 “挂科率”,并算出每名学生的 “在校朋友圈”,量化学生孤独的程度等。

对于该项研究,华东师范大学教育科学学院教育信息网络中心主任肖玉敏告诉《科技导报》:“研究中所呈现的分析视角,如挂科预警、生活规律、学生的孤独程度等,确实是教育者非常关心的。”

但是,采集学生被动存储的数据,并以此来判断和了解其行为习惯的做法,让人感到恐惧。她认为,大数据的应用限度迫切需要得到关注。

刻板判断与隐私问题 大数据用于学生管理尚存隐忧

“世界似乎在一夜之间演变成了一个人类和技术共存的联合体,它既拥有无与伦比的力量,也具有前所未有的弱点”。MIT 人类动力实验室主任阿莱克斯·彭特兰的这句话,恰能表达肖玉敏对大数据用于学生管理的担忧。

大数据有可能限制学生的行动自由。学生们有可能担心数据为自己带来不良的印象,而把良好的数字记录作为追求的目标,这样的策略消解了大学生活本应有的内在丰富性,学生的情感、愿望、追求等也许就会消失在这些冷冰冰的数据之中。

因而,她认为,该系统作为管理和了解学生基本情况的参考,有它的价值,但是还是需要更好的设计,以便可以更完善地构建对学生日常行为的复杂的定量预测。

《大数据时代:生活、工作与学习的未来》一书的作者舍恩伯格库克耶曾担心贴上标签的行为,会使 “我们的社会倒退为一种近似种姓制度的新形式——精英和高科技封建主义的古怪联姻。”

对此,周涛不否认会有贴标签的可能,但他解释说:“我们评估学生的时候,有一个遗忘机制,建模的时候用大数据,评估的时候只用近两年数据。”

对于大数据应用带来的隐私问题的争论,周涛承认的确存在数据泄露的风险。但同时也会采取一些保障措施,比如所有技术人员看到的都是匿名信息,只有当发生异常时,才会有信息推送给辅导员。

促进资源共享 未来大数据让教育更公平

在谈到未来的计划时,周涛说:“希望在大学推广该系统,让更多大学加入进研究计划中来,人的数目做到百万,希望变成真正的large scale (大规模) 的项目。”

然而,肖玉敏提醒,该系统采集的是学生无意识存储的日常生活和学习数据,学生对此没有控制权,如果学校搜集、分析和应用这些数据是在学生并不完全知情的情况下开展,会对学生的隐私有所侵犯,有一定的法律和道德风险,学校需要对此更加谨慎。

此外,该团队还计划基于大数据,为K12(基础教育阶段)的学生设计个性化的家庭作业,根据评分判断,当学生知识点掌握比较好的时候,继续出少量比较难的题目;反之,就会出相对简单的题目,但是题量较大。

肖玉敏对大数据在促进学习方面的作用表示乐观。大数据能够帮助教师确定最有效的教学方式,也可以帮助学生诊断自己学习的质量,及时调整学习策略。规模性的学生学习数据还能够帮助学校更好地设计课程。

在肖玉敏看来,教育大数据有着光明的应用前景。尤其是在促进教育公平方面,技术在一定程度上促进了资源共享,创造了让边远落后地区孩子拥有更好教育的机会,而这些机会就实实在在地体现于大数据所反映的现实中: 基于大数据分析,可以更准确地判断和预测不同地区师生的学习需求和学习特点,从而提供更具针对性的课程。

大数据应用于教育领域,尽管还不尽如人意,但或许正如舍恩伯格和库克耶所说“大数据正悄悄影响到教育体系的每个层面,对于全世界的学习与教育活动,都会产生极为深远的影响。大数据能告诉我们什么是最有效率的,并且揭示那些过去无从发现的谜题。”

文/王微
(责任编辑  李娜)