大数据在成人教育中的应用前景探讨


  摘要:随着信息技术的快速发展,大数据成为继云计算后兴起的热门产业,大数据在教育领域的主要应用是教育数据挖掘和学习分析。本文对国内外大数据在成人教育中的应用现状进行了分析和综述,并且探讨了大数据在成人教育中的应用前景。
  关键字:大数据 成人教育 数据挖掘 学习分析
  当今世界,手机、平板电脑、PC、移动互联网、物联网、云计算以及遍布世界各个角落的各种各样的传感器诸如监控摄像器、天文望远镜、气象传感器等,每天产生大量数据,同时随着YouTube、Twitter、FaceBook、微博、微信等社交网络工具的出现产生了海量的视频、图片、文本、短消息,数据量不断扩大,从几十个TB(1TB = 1,024 GB)扩展到多个PB(1PB = 1,024 TB);相对而言,CPU、存储、带宽的成本愈发低廉,从20世纪60年代1万美元1M降到现今1美分1G的水平,网络带宽从同轴电缆过渡到光纤时代,网络接入方式从有线连接向高速无线连接的方式转变。在这样大规模的新数据来源以及遍布政府、商业、学术领域的新兴信息技术的支持下,“大数据”时代正以一种前所未有的速度向我们袭来,本文将通过对国内外大数据在教育领域的应用现状进行分析,探讨大数据在成人教育中的应用前景。
  一、大数据的由来
  早在20世纪70年代,《未来的冲击》的作者、美国著名未来学家阿尔文·托夫勒在其书中预测,未来社会中大量的“人工编码信息”将代替自然信息,充斥着人们的生活。时至今日,托夫勒所描述的这个时代已悄然到来。2012年,著名信息管理专家涂子沛先生出版了《大数据》,同年,被誉为“大数据商业应用第一人”的维克托·迈尔·舍恩伯格先生的《大数据时代》也在中国出版上市,引发了人们对大数据战略、数据治国的讨论,也让很多人彻底接受了一次思想洗礼[1]。政府、企业、学校,贯穿商业、科技、医疗、人文以及社会的各个领域,“大数据”正在悄然改变着世界的各方各面,改变着我们传统的行为方式和思维方式。
  “大数据”(Big Data, Mega Data),或称巨量资料、海量数据、大资料,指的是所涉及的数据量巨大到无法通过人工在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息资产。“大数据”具有的特点是4个“V”:Volume(大量)、Variety(多样)、Value(价值)以及Velocity(高速)——第一,数据量大,根据计算,目前人类生产的所有印刷材料的数据量约为200PB,同时,随着科技发展,一般个人计算机硬盘的容量已经升级至TB量级,而部分大企业的数据量更是接近EB量级;第二,数据类型多,从以往以文字为主的结构化数据迅速发展到现今的网络日志、音频、视频、图片、地理位置信息等各类非结构化数据;第三,数据价值低,数据价值的高低往往与数据总量的大小成反比,以视频为例,1小时的视频在连续不间断的监控中,往往有用数据可能仅有一两秒;第四,数据处理速度快,与传统数据不同,“大数据”采集的样本量更为庞大,采集方式更为灵活,采集手段更为多样,采集速度更为迅速,采集人员更为大众[2]。
  二、大数据在成人教育中的应用现状
  (一)美国高校应用大数据的情况
  2012年3月,美国奥巴马政府宣布“大数据的研究和发展计划”(Big Data Research and Development Initiative)——“承诺通过提高我们从巨量复杂的数字数据集中提取知识和观点的能力,帮助加快其在科学与工程中的研发步伐,加强国家安全,并改变教学研究模式”。这个计划里,美国国家自然基金会(NSF)、卫生健康总署(NIH)、能源部(DOE)、国防部(DOD)等六大部门和机构联合,提供新的2亿美元的投资启动大数据技术研发,提升从巨量数字数据中访问、组织、收集、发现信息的手段和技术水平。“我们还计划政府部门联合工业企业、大学研究所、非营利性机构为尽可能多地使用大数据创造机会。一些相关企业已经赞助大数据相关的比赛,并给大学提供这方面的研究资助。大学里也开始开设一些全新的研究型课程,以培养下一代的‘数据科学家’。一些无国界组织帮助非营利性机构对公益性的服务数据进行采集、分析和可视化处理。”[3]
  目前,耶鲁大学、哈佛大学、斯坦福大学等世界知名高校在教育大数据相关研究上已经启动了诸多项目计划;另外,美国学校管理者协会(AASA)协同学校网络联合会(COSN)以及在信息技术研究和咨询方面具有全球权威的Gartner公司共同实施了一个名为“Closing the Gap: Turning Data into Action”的项目,其目标就是为了促进学校在学生信息系统和学习管理系统中对大数据的使用。美国在大数据应用上的实例很多——普渡大学于2009年推出“课程信号”(Course Signals)项目,它是一个基于Hadoop的系统,可以跟踪学生学业进展,并实时提醒学生相关课程的学习进度及进行预警,该系统支持教师在课程开设后的第二周就能预测某个学生是否能够顺利地完成该课程,以便教师能更早地实施干预措施,降低学生的课业失败率。北亚利桑那大學研发GPS(Grade Performance Status)系统,它是一个课堂学习绩效评估系统,该系统能实时地为教师提供全校在校学生的出勤情况以及学生的课堂学习反馈意见,同时向学生提供教师的最新评价信息及对学校重大事项进行提醒。田纳西州的奥斯汀佩伊州立大学(APSU)在梅琳达·盖茨基金会的资助下开发了“学位罗盘”(Degree Compass)系统,它是一个课程推荐系统,该系统能从学生信息系统和学习管理系统中提取学生以往的课程学习成绩(包括大学、高中、SAT成绩)信息,通过不同课程成绩间的相关性、主修专业及学位的要求和预测成绩的基础上推荐适合学生学习的课程。马里兰大学学院综合大学,号称全球最大的在线大学,侧重于成人教育,其加入了“Civitas Learning”学习社区项目,Civitas学习社区链接多种机构的大数据,包括四年制大学、社区学院和在线大学,是一个新型的网络社区,用以对学生的学习周期进行预测。哈佛大学和麻省理工学院在2012年4月联合发布了著名的网络课程MOODs项目平台edX,2013年6月两所知名学府宣布,通过Github释放源代码,提供给世界范围的机构使用;随即,斯坦佛大学也宣布支持edX,将其旗下的开源MOODs平台Class2Go的功能整合到edX,其目的在于收集整合更大范围的数据源,为未来的大数据分析服务。