时间:2024-05-18
陈 洁 孙笑笑 黄彬彬
(杭州电子科技大学计算机学院 浙江·杭州 310018)
大数据是指超过传统数据库系统处理能力的海量数据。大数据技术与云计算、物联网等技术相互融合,数据规模越来越大,增长越来越快,大数据摩尔定律显示数据量大约每两年就能增长一倍。[1,2]大数据具有四大特征:数据规模巨大(volume)、数据类型多样(variety)、处理速度快(velocity)、价值密度低(value)。大数据的处理是对多种不同类型的数据进行分析和研究,并从中提取出有价值的信息。随着大数据技术的不断发展,人们思维方式也悄然变化。大数据在各行各业都得到了广泛的应用,帮助人们做出科学的决策。[3,4]相关数据统计显示,未来市场对大数据相关岗位的需求缺口达到百万级别。随着大数据技术的发展和相应理论的逐渐成熟,高校大数据专业及课程的开设越来越广泛。然而,实际教学过程中却存在难以兼顾理论知识讲解和具体的案例实践的问题。大数据技术的应用和不断发展也促进教师在其教学方式、教学内容等方面进行不断的改革和探索。[5]
在现代教学过程中,案例教学法是一种常见的教学方法。[6]在传统课堂教学模式的基础上,案例教学法主张“案例分析—学生主体”的教学理念,它将现实生活中曾经发生的或正在发生的事件作为教学案例引入课堂。[7]它将学生带入案例背景中,激发学生的求知兴趣从而主动探求所需知识,发现实际案例中存在的问题并运用所学知识形成解决方案。与传统教学方法相比,案例教学法在培养学生分析案例和解决实际案例能力方面具有一定的优势。[8]而大数据课程的教学目的正是在培养学生的综合分析实践能力,使学生能够分析和解决大数据环境下的实际案例。[9]这不仅要求学生要掌握必要的理论知识,还要求他们必须具备处理工程问题的能力,具有一定的实践性和高度的综合性。[10]
由于大数据课程具有很强的应用背景和实践意义,因此,适合采用案例教学法。文章改变传统的以教师为主体的讲授法教学方法,研究基于案例驱动的大数据课程的教学内容及实施过程。基于案例驱动的大数据课程教学采用以案例作为驱动、以教师作为主导、以学生做为课堂主体的教学模式。在讲授大数据相关的理论知识和技术的基础上,重点培养学生的综合案例实践能力。根据教学目的和教学内容要求,运用典型案例将学生带入大数据知识空间,然后通过学生独立思考或集体协作,引导其进一步将所学知识扩展应用到实际案例中,通过解决实际问题,激发学生学习的兴趣和热情,提高学生实践和解决实际案例的能力。
在课堂中采用案例驱动的方式,使学生掌握关系大数据分析与处理的具体步骤和方法,熟悉与各类大数据分析技术和工具的结合使用,对大数据技术及应用有一个较全面的认识和理解。基于案例驱动教学的课程内容设计如图1 所示,具体可归纳为三部分:基础理论、技术知识、综合实验。课程设置以综合实验的方式开展,基础理论与技术知识讲解两个方面同步进行。
首先,通过大数据基础理论和大数据生态系统的介绍帮助学生理解案例分析及相关技术。其中大数据理论知识包括大数据的基本概念、大数据的特征、主要应用领域等,通过对大数据基础理论的讲解让学生了解和熟悉大数据的基本概念,帮助学生构建大数据知识体系。同时,介绍大数据技术生态圈的各个组件和工具包括Hadoop、Spark、HBase、Hive等,让学生能够直观地感受到大数据技术和发展。在此基础上,引导学生根据自己的兴趣选择实际案例。案例的选择应当与理论知识紧密相关的实际项目案例为基础,同时要求将课程内容所包含的各项能力要求以及每个能力点所包含的知识点在案例中有所体现。
然后,按照大数据理论知识体系和大数据案例分析的各个步骤,将大数据处理过程拆解并贯穿于整个教学过程中。具体采用分阶段的教学方式,按照大数据处理的流程拆分教学阶段,共包括三个阶段:数据获取与清洗、数据存储与管理、数据处理与分析。在各个阶段,从案例的实际需求出发,通过描述案例分析的主要目的和关键问题为学生讲解相关的基础理论知识,然后通过介绍案例采用的技术和方法让学生了解对应的技术工具。各部分的内容包括:
(1)数据收集与清洗:介绍在数据来源广泛、数据类型丰富的背景下的数据采集技术和预处理技术,包括数据采集、抽取、清洗、转换、约束、加载、检查数据一致性,处理无效值和缺失值等。结合案例来源介绍相关技术,包括Scrapy爬虫框架、Python爬虫基础、日志采集工具Flume、流式数据采集工具Kafka、迁移工具Sqoop 等。
(2)数据存储与管理:介绍大数据面临的存储管理问题、数据的存储模式等。结合案例数据的特征,介绍存储管理系统,包括分布式存储HDFS、分布式列存储数据库HBase、大数据仓库Hive、分布式键值数据库MongoDB 等。
(3)数据处理与分析:介绍在数据体量巨大、价值密度低、实时性强的背景下的数据处理与分析技术,包括静态数据的批处理技术、在线数据的实时流处理技术、数据可视化技术等。并结合案例的分析目标介绍处理模型及工具,包括分布式计算框架 MapReduce 基础、SparkStreaming、SparkRDD 等。
图1 基于案例驱动的大数据课程教学内容
在课堂设计中,实施”以教师为主导,学生为主体”的自主合作探究式学习模式,将学生组成学习小组,开展合作式学习。在课堂授课环节,以教师为主导设计问题,并构建出一定的应用情境,学生通过自主学习,对案例进行分析和研究。案例驱动的课堂实践按照如图2 所示的过程实施,主要分为示范案例和实验案例两部分展开。具体来说分为如下步骤展开:
首先,在案例教学中通过示范案例,引导学生学习大数据相关的基本知识和技术,帮助学生形成对大数据知识体系及其应用的轮廓性认识。
(1)经典案例介绍:选择经典案例作为示范案例,例如,法律咨询数据分析与服务推荐、电商产品评论数据情感分析、航空公司客户价值分析、互联网电影智能推荐等,能很好地向学员展示如何获取数据、如何进行预处理、如何建立分析模型、如何求解并展现结果。
(2)重点难点讲解:通过对示范案例的详细分析,解析大数据知识体系中的重点和难点,从而帮助学生明确学习的目标,理解抽象的概念。
(3)学习资源介绍:大数据这个领域本身正处于蓬勃发展的阶段,知识更新迭代非常迅速。课堂上无法面面俱到地涉及到所有内容。因此,在基础理论讲解的基础上,教师鼓励学生积极查阅资料,引导学生根据自己的能力和兴趣点自主学习更多相关的先进技术。
然后,引导学生在示范案例的基础上进行扩展。让学生在参与完成感兴趣的实际的大数据案例分析任务,并在这个过程中主动学习相关知识,深化对大数据理论知识的理解,培养实践能力。
(1)引导案例扩展:学生在示范案例的基础上,从实际生活中寻找自己感兴趣的案例,如微博数据、头条新闻数据、淘宝用户行为数据、外卖评论数据、游戏评论数据等,以此来激发学生的学习兴趣和主动探索的学习热情。同时,案例的选择要求能够覆盖课程的知识点。
(2)指导方案设计:指导学生模仿经典案例分析的过程,针对新的案例提出若干分析问题,引导学生自主探究合适的解决问题的方案,在层层递进的问题解决中,强化学生对所学理论知识的理解完成知识点的学习和应用。在探索这些问题的过程中引发、维持学生的学习兴趣,给更多学生提供思考空间。在学生碰到新的问题时,鼓励其自主学习所需知识,使学生成为了学习的主体和发展者,提高他们运用所学知识分析和解决实际案例的能力设计实验方案。
(3)组织案例实践:以小组为单位,组织学生进行案例实践,帮助确定采用何种技术、模型分析数据,指导学生进行任务拆解和分工合作,引导学生逐步完成案例分析任务。最后,以组为单位完成分析报告,阐述案例分析任务的执行流程、选用的技术工具和人员分工情况,给出各自的分析结果,讨论方法是否合理及未来改进建议。
图2 案例驱动的实施过程
该过程以案例分析任务为课程核心,要求学生在教师的指导和小组协作下,通过对各个知识点和技术的学习和应用,进行自主探索、深入思考。在这一过程中,充分发挥学生的自主能动性,激发他们的求知欲望。
针对大数据课程在课程考核方式上只是单纯以考试成绩与平时成绩为评价指标,造成学生对该课程的学习出现突击性的应试学习这一问题。因而,文章研究以案例分析实践能力为目标的课程考核方案。围绕案例分析开展教学,在整个过程中通过提炼出的若干问题,引导学生在完成每一个具体任务中,习得知识、掌握技能,能更加有效地帮助学生。不仅有效改善了传统评价方式中,仅依据学生实验报告和考试卷打分有失偏颇的状况,而且能帮助每一个学生在实践中认识自己的优势与不足、明确探索过程中继续学习与行为改进的方向。
为了使得学生能够投入更多的课外时间进行学习,保证课堂上的学习和讨论质量,避免学生以突击考试为目标进行应试学习。本课程将课程教学与案例分享相结合。随着实验分阶段有层次地进行,在每一阶段学生需要在课堂上进行部分成果展示,分享案例分析进展、技术选择方案、技术实施情况、分析结果等内容。通过实时反馈,教师可以根据学生对知识点的掌握程度、对案例的理解程度等及时调整实验进度和方案,以达到预期的实验效果。同时,在课堂中让学生一同分享不同案例可以激发学生的学习兴趣和热情,使得学生在相互比较和在实践中逐步提升创新能力,使学生在自主学习活动与案例任务中重新梳理知识结构。将反馈、激励与改进功能统一于案例解决的过程之中,同时将多种技术知识有机融合与统整起来,最终从整体上改善整个课程的教学效果。
大数据是对基础理论和技术实践要求都比较强的课程。而在教师引导下,学生为主体的案例教学在提高学生解决实际问题的实践能力、自主创新学习意识的形成等方面有积极租用。文章针对作者所承担的计算机专业的大数据课程,围绕案例分析的实践能力的培养展开,深入研究了基于案例驱动的教学内容的设置、课堂实践的实施模式和课程考核方法。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!