时间:2024-05-04
刘乐,穆佳男
(贵州师范大学教育学院,贵阳 550025)
国务院于2015年8月发布了《促进大数据发展行动纲要》,在纲要中明确表明“数据是国家基础性战略资源”。随后在启动的十大工程之一“公共服务大数据工程”中,创造性地提出要建设教育大数据。现在各国正在争相进行教育大数据的相关战略部署,在我国教育大数据已经成为我国教育研究中不可或缺的一部分[2]。
目前,教育领域在人工智能等科技的冲击下面临着全新的布局,正因看到了大数据技术与其他行业的结合,教育领域的学者也在积极探索如何深入挖掘大数据,将其与教育深入融合,以此来助力我国教育事业的改革。本文将对我国教育大数据目前发展的理论研究、技术研究以及应用场景进行探讨,希望对其他相关学者有帮助。
本文通过对教育大数据相关文章先进行检索和梳理,借助CiteSpace软件进行可视化分析,比较教育大数据理论、技术、应用的热点和趋势,以期较为客观地反应这一领域地基本情况,因此本文围绕着“教育大数据研究热点”为问题,总结目前发展趋势,为国内学者进一步研究提供参考。
为了更直观呈现教育大数据的研究样态,本文借助陈超美博士研发的CiteSpace软件,这是一款基于Java的可视化分析软件。通过此软件可以得到本领域的“科学知识图谱”,知识图谱能够反映出本领域研究的热点和趋势,以此来形成本领域的研究演化进程。
本文的样本直接来源是中国知网,从2010年到2021年6月,在中国知网上,以“篇关摘=(教育大数据)”检索出来451篇文献,来源期刊限定为北大核心、CSSCI。通过手工筛选,剔除报道、会议通知、文件、征稿启事、卷首语等无价值的条目,共得到402篇有效文献。
本文基于文献计量学及科学知识图谱方法,结合CiteSpace软件对上述检索样本进行发文趋势、期刊来源分布、关键词词频和中心度进行分析,归纳国内研究的热点和趋势。
通过对近20年教育大数据研究的发文量统计,可以整体把握教育大数据研究的发文量变化趋势,具体文献走势如图1所示。
图1 发文量年度趋势
总体来看,教育大数据的研究呈增长趋势。教育大数据的相关研究从2013年开始兴起,到2015年期间都是缓慢增长,从2015年开始快速增长,这主要源自于国家在2015年推出的《国务院关于积极推进“互联网+”行动的指导意见》,智慧教室、专递课堂等“互联网+教育”的产出,开始走进校园。同时利用学习分析等技术,来挖掘教育大数据中隐藏的教育规律,从而对翻转课堂、个性化教学进行支持也是当前研究的重点、难点。在2017年到2020年,每年发文量保持在75篇左右。从2013年到2021年6月,发文量增加了近10倍。
对文章刊登的期刊进行分析,能够使我们了解,目前这一研究领域在哪门学科的研究人员在关注。期刊来源分布如表1所示。可以看出,教育大数据主要是教育技术学领域在研究,其次是图书情报。总体而言,教育大数据发文期刊的类别主要分布以教育类期刊为主,其次是计算机类期刊。教育领域的刊物是属于社会科学一类,计算机领域的刊物属于自然科学一类。而社会科学领域重理论研究,自然科学领域更重视实践研究。“教育+大数据”的组合是使用科学技术来解决教育领域的难题,从文章分布期刊来看,目前这一领域理论研究明显多于实践研究。
表1 发文期刊数量
中心度和词频高的关键词代表着这一领域的研究者们共同关注的热点。中心度越高,说明该词在网络中所占比重越大、越重要。词频越高,说明该词在该领域是研究的重点。如表2所示。
表2 关键词
文献中出现词频数排名前十的关键词有“教育大数据”“大数据”“学习分析”“人工智能”“个性化学习”“数据挖掘”“数据治理”“教育信息化”“智慧教育”。其中学习分析、数据挖掘、数据治理等人工智能技术是对教育大数据进行分析,找出数据中隐藏的教育规律,来解决个性化学习、教育信息化、智慧教育等方面遇到的问题。
“大数据”一词诞生于计算机行业,作为一个专业术语被专业人士定义为“数据数量规模巨大,以至于无法采用人工的方式在合理且有限的时间内进行清洗、管理、分析、整理成人类能够理解的信息”。教育大数据特指教育领域的大数据。杨现民把教育大数据定义为能够采集到的、在教育活动中产生的、用于教育发展的数据集合[3]。孙洪涛认为教育大数据必须要满足两个服务对象:教育主题、教育过程。并且具有强周期性和教育价值的数据集合,这个数据集合具有高复杂性[4]。吴中南则将教育大数据定义为在教育体系中产生的所有数据,不仅包含了线下学校、社会、家庭等教育场景中的数据还包括线上各个教育应用中产生的数据[5]。娄晓敏与吴中南的看法相似,但她并没有局限教育大数据的来源,她认为凡是能在教育领域创造价值并且助力教育发展的数据都可称之为教育大数据[6]。
以上几位学者都有自己的看法,同时又对教育大数据有共同的观点。首先,教育大数据是服务于教育行业。其次,教育大数据在教育过程的各个阶段都能起到重要作用,例如学习者的个性化学习、教育资源共享与传递、教育管理与决策等方面。
大数据技术在教育领域的应用主要包括数据采集技术、数据存储技术、数据挖掘技术。
3.2.1 数据采集技术
在大数据技术中,数据采集是最基础最重要的环节,在采集过程中,数据质量、数据范围、可靠性等因素,最终影响着教育大数据价值潜能的实现程度[7]。
(1)物联感知。利用传感器、GPS、摄像头等物理技术对互连(物理或虚拟)的事物进行识别物体、信息采集,来实现特定对象的评测、感知。其主要技术包括物联感知技术、可穿戴设备技术和校园一卡通技术。
(2)视频录制。视频录制分为线上线下两种方式。线上视频录制是指在计算机视窗环境内的内容进行录制,一般利用计算机自带的屏幕录制工具。线下视频录制是指利用摄像机、手机等带有录像功能的设备对计算机硬件终端等进行视频录制[8]。
(3)图像识别。图像识别技术是指计算机对图像进行处理、加工、分析等工作,识别不同类型、不同方式、不同模型的目标和对象的技术。目前图像识别技术是深度学习算法的落地实践应用。
(4)平台采集。借助网络爬虫等数据采集技术,按照一定的规则,对平台上用户的点击次数、来浏览时长等信息进行获取[9]。该类技术主要有各行业各公司根据自我需求来进行相关平台开发,并通过自身指定的规则选择对平台的部分数据进行公开。
3.2.2 数据存储与挖掘技术
数据存储技术一般使用Hadoop、云存储等技术对关系型数据、非关系型数据进行存储。有学者使用内容中心网络(CCN)与软件定义网络(SDN),提出了未来互联网模型,目的是提高大数据架构(Hadoop)的可扩展性。此外,数据仓库也是教育大数据存储的备选方案之一[10]。
教育数据挖掘是指开发、研究和应用计算机方法来对传统教育环境中的大量数据进行分析和监测,从而更好地理解学生及其学习系统。教育数据挖掘利用课堂实录、学生作业、考勤打卡、学习资源使用等数据,进行学习者学习风格、学习模式建模,来预测学习者学习情况,并对其进行干预或者促进等操作,为教学者、教育管理者、学习者等对象提供现状分析以及决策建议。
3.2.3 数据可视化技术
在大数据分析过程中,可视化是重要一环[11],可视化数据能够解决教师做出决策时面临的问题。随着大数据技术的不断升级创新,现在已经可以构建关于智人的认知模型,并运用可视化技术将其展示出来,但大数据背后蕴藏的知识与智慧我们只触及了其中一部分。在智慧课堂中产生的动态生成性数据,来源不同、数据类型不同、数据维度也不尽相同,面对这种情况要开展数据分析工作,交互式可视化分析技术必不可少,并且单纯的依赖计算机技术是不可靠的,数据分析工作更多的是要依靠人的认知、推理等能力[12]。
教育大数据提出至今,不少学者、教育机构和企业纷纷加入实践队伍中,实践者分布于各个国家,涵盖地区广泛。目前教育大数据的应用范围不算非常广泛,主要集中在课堂教学、在线学习等,还有研究人员通过分析社交媒体的数据来研究某种教学内容的受关注程度。
3.3.1 在线教育中的应用
目前大数据支持下在在线教育中的应用比较有特点的两个案例分别是“函数课程分析”和“无屏幕编程教育”。
2014年,日本Benesse公司和DK(digital knowledge)开展了函数课程“通信教育讲座”,参加该课程的小学生将得到一块平板电脑,学生在使用平板电脑过程中产生的数据,由该公司收集处理后,开展相关的应用研究。其中收集的数据种类包括课上和课下两部分。课上数据包括课堂内容、学习目标、授课方式、教学设计等,课下数据包括复习测试、自主学习时间、资源推送学习、家校参与情况等。将收集到的数据利用相关技术进行分析,定位学习者学习风格、探索学习者学习方式,并与教师家长进行紧密沟通,改善现有上课模式[13]。该方法主要针对个性化教学,让大数据助力因材施教,对学生提供精准的学习帮助。
在2018年1月1日到2020年6月30日,研究人员对全球范围内涉及无屏幕编程教育的推特推文进行了数据处理,利用社交媒体研究法(SMR),采用定量与定性相结合的方式进行分析。发现现阶段在全世界范围内,多数人秉持着持续观察、大力支持的态度。而最近发展区和支架理论是无屏幕编程教育的理论基础,无屏幕编程教育从四个方面来分析学习者的认知能力、学习质量、计算思维,在最后会评估是否对学习者形成了良好的促进作用[14]。
3.3.2 学校中的应用
在学校中应用大数据相关技术,在高等教育中较为常见,其一是“课堂视频分析”,其二是“批改网”。
课堂实录分析一直是教育技术领域研究的重点,这是学者们观察教育过程、得出教育规律的重要手段之一。在华中师范大学教育技术团队的不懈努力,针对数字化课堂实录开发出了视频分析工具。团队运用S-T分析功能对优质课进行了分析,发现教学过程中每个不同教学模式有着明显的不同特征,不同科目之间、新旧教师之间,在师生互动、主题探讨等方面的特点也不尽相同[15]。
批改网一直是英语类教师们使用频率最高的大数据教育应用。在2015年举办的北京市初中生英语写作比赛中,批改网发挥了巨大作用。通过对学生作文和语料库之间的对比,采用一定的计分算法,对雷同、抄袭、病句等情况进行判断。以班级为集体,将学生作文得分的具体情况形成诊断报告发送给各个班级的英语教师。对学生个人而言,能够针对学习者个人情况,在单词搭配、语法时态、词组搭配等,给出了详细的意见。并且通过此次活动,批改网也形成了更加精准的语料库。教师们反映,批改网基于教育大数据形成的学情诊断报告在一定程度上能够帮助教师改进课堂教学效果。
教育大数据的研究虽然逐步深入,但是面临不少挑战。包括技术方面的挑战、安全与隐私的挑战、价值的挑战。
4.1.1 教育大数据的技术挑战
教育大数据在应用场景的各个环节中存在各种挑战,例如在数据采集前期,由于我国现阶段还没有数据统一的法定条文,又面临着不同系统、不同来源之间兼容性的问题。遵从顶层设计原则,应由相应的协会组织或者教育部牵头,对数据格式、数据传输协议、数据存储等关于大数据的问题制定符合行业规范、符合社会需求的统一范式。再根据地域不同、机构类型不同、学校不同按照自身需求,再统一范式下设计适合自身的系统,打破数据孤岛,让教育大数据发挥更大的价值。
4.1.2 教育大数据的安全与隐私挑战
在人工智能伦理领域中,教育大数据也面临着侵犯个人隐私和数据安全的挑战。无论是从智慧课堂还是学习系统中得到的数据,都有关用户的隐私。现在数据的安全性等级和隐私性关系还没有相关的评估规则和评估工具。又因现在科技的飞速发展,黑客若利用系统漏洞获取学习者相关信息,这不仅会对学习者个人造成骚扰还会对当地的教育政策的制定形成一定的影响。并且关于数据的所有权问题,也是目前各位学者关注的一个焦点。教育数据源自用户,但又通过学习系统形成。目前通过强制性协议,数据所有权大部分是相关企业拥有,但是数据所有权到底归谁?这其中牵扯到的利益如何?都是需要我们深思熟虑的问题。
4.1.3 教育大数据的价值挑战
数字经济时代,教育大数据在政企协同、行业协同以及区域协同等方面对教育数字化升级、产业数字化转型具有重要意义。矿产、物资等有形资产如果被恶意使用,则会被严格的法律制裁,而具有无限潜力的数据被外泄、被攻击时,因是无形资产所以无法被法律裁定。而将数据完全保护起来就无法发挥应有的社会价值。因此如何开放数据、开放什么数据、开放到什么程度,这是目前面临的挑战之一,对数据进行评估以此来保证重要的、有价值的数据被严密保护,也是挑战之一。这些都是目前为止各个国家、联盟所面临的重大挑战[16]。
教育大数据最有价值的地方应当表现为“因材施教”“重构评价体系”“创新教学模式”等目前在教育领域遭遇瓶颈的业务上面,并且积极推动教育融入信息时代也是其体现价值的方式之一。
4.2.1 实现个性教学
“因材施教”是孔子提出来的观点。信息时代下,利用眼动仪、课堂实录、作业笔记、视频学习等学习记录来发现影响学习者学业发展水平的因素,构建学习者画像,并对学习者开展全方面、客观的评价,在此基础上对学习者进行因材施教,帮助学习者认识自己、重构自己,形成自己的学习风格,找到自己的优势所在,确定自己的发展方向。
4.2.2 重构评价体系
现存的学生、教师、学校的评价体系,无一不是更加注重结果而非过程。在教育大数据的支持下,智慧校园的构建能为学校里的人员提供科学、准确的数据支撑。尤其是教师方面,响应教育部新发布的《深化新时代教育评价改革总体方案》,“破五唯”、实施四个评价等措施,不仅从科研成果、申报项目等方面来评价教师,更让课堂设计、备课教学等方面融入到教师评价体系中。从而推动整个教育系统的变革。
4.2.3 创新教学模式
在教育大数据的信息化背景下,利用课件、视频、课堂实录等学习记录对学生进行全方位的了解,教师基于教育大数据落实教学反思,对现存的教学模式进行创新。应用教育大数据让教育信息化有了新的发展[17]。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!