时间:2024-08-31
郭传好
(浙江理工大学 经济管理学院,浙江 杭州 310018)
随着移动互联网、物联网、云计算、人工智能等新兴信息技术的出现和普及,人们周围的数据呈现爆炸式增长,整个社会已经进入了大数据时代[1]。海量数据中隐藏着人们的消费喜好、消费方式及生活工作和行为的点点滴滴,存储着与企业的发展和管理、生产与销售、客户关系管理等息息相关的各种各样的数据,挖掘和分析这些信息和数据背后所存在的模式、规律和趋势,并结合各行各业的特点进行创新应用,已成为当前这个时代的主要研究课题。因此,在大数据背景下,为适应经济社会发展需求和行业的发展需求,国内众多高校陆续设立了数据科学与工程等大数据相关专业,并在一些学院开设了数据挖掘、深度学习、统计学、人工智能、云计算等相关专业课程,使用统一兼分散的方式为社会培养数据挖掘与分析专业人才。由此亦可见,数据挖掘学科是大数据时代的产物,是学校培养大数据挖掘人才的核心基础课程[2-3]。
值得注意的是,数据挖掘是一门综合交叉学科,涉及统计学、数据库、机器学习、数学建模、模式识别、高性能计算等多门学科的相关内容,如图1 所示,是一门以方法论为核心,以数学理论知识为基础,注重实践创新能力培养和训练的综合学科[4]。目前国内众多高校开设了数据挖掘相关课程,但在对课程的理论性、应用性、实践性的认识上同社会和学生的需求还存在一定差距,重理论教学轻实践教学的现象比较普遍,尤其是面向商科、经管专业或数学思维、计算能力比较薄弱的学生[5-6]。如何让学生快速有效地掌握数据挖掘的基本理论知识内容,并能够较熟练地使用一些常用数据挖掘工具或软件进行相关数据挖掘与分析工作,还缺乏系统性的教学设计方案。因此,如何改进数据挖掘课程的现有教学方法、教学内容和教学实践,建立一个以需求为导向的完整教学方案体系,具有重要的理论和实践意义。
图1 数据挖掘——多学科交叉的学科
本文将从社会需求、学生需求和学科专业发展需求等角度出发,同时结合笔者近几年对数据挖掘及其相关课程的授课经历和感受,对数据挖掘课程的教学内容和过程进行了新的思考和探讨。
在大数据、物联网、人工智能等新技术逐渐发力,走进社会各个领域的背景下,数据挖掘相关技术广泛应用于零售、加工制造、财务金融保险、交通通讯、生物化工、物流以及社会医疗服务等众多领域。而在这些风口领域内,想要突围的公司无数,也带动了对数据挖掘优秀人才的全面争夺。据相关数据统计,应届毕业生培训后平均就业薪资为8-10K 左右,有一定实践能力的可达15K 以上甚至更高,大数据工程师工作1 年后通常会成为月薪10K 以上的资深工程师或项目经理。可以说,未来的大数据相关工作意味着高薪、稳定、广泛的职业使用度和优越感。但是近几年间大数据人才缺口非常大,企业高薪都难以找到足够的大数据开发人才,大数据从业者的增长量,远远满足不了市场需求的扩张,大数据人才需求将可能出现“井喷”现象。
随着越来越多的新智能产品科技公司、信息技术企业涌现,许多学生也开始逐渐意识到这是一个新兴的且非常有发展潜力的领域,而与之相关联紧密且易于就业的工作岗位就是数据挖掘与分析。我们现行开设的数据挖掘课程,只是作为信息管理与信息系统专业学生的一门专业课程,而非数据挖掘与分析专业的专业核心课程。同时,还有诸如课时时间限制、基础知识课程的选课等诸多因素影响,导致了现有课程教学内容和体系只能给学生介绍一些基础的数据挖掘知识和方法,不能有效地满足部分学生对相关知识的进一步深入渴求。例如,在近几届毕业生中,就有部分学生为了想去应聘数据挖掘相关工作岗位,在毕业之前,去报名社会上举办的一些数据挖掘培训公司进行相关技能培训。此外,还有部分学生,在选修这门课程的时候,其目的和目标是比较明确的,就是想今后从事数据挖掘与分析相关的工作,或有在这领域进一步深造学习的计划,因此现有的教学内容和计划也不能够满足这些学生的需求。
在上述两个需求因素的合力驱动下,国内众多高校的相关专业设置和学生培养定位也在随之发生相应变化。相关数据显示,截至2018 年,全国已有35 所高校申报并开设了大数据相关专业,同时几乎70%以上的高校都开设有数据挖掘相关课程,其广泛分散于理学院或数学学院、经管学院、计算机或信息学院、通信或控制等学院的相关专业教学培养计划中。值得注意的是,数据挖掘课程是大数据相关专业的专业核心基础课程,这些被分散的数据挖掘课程,由于面向的学生专业不一样,课程的教学内容和要求定位也随之大不相同,没有统一的课程教学大纲和教学内容要求,对后续相关学院申请大数据或数据挖掘相关专业具有一定的影响。作者所在信息管理与信息系统专业设置于经管学院,尽管已开设数据挖掘这一课程多年,但该课程的开设主要面对的是经管学院的学生,只是作为信管专业学生的一门专业基础课程和金融、经济统计等专业学生的选修课,同时还存在学生的数学和计算能力基础普遍较薄弱、相关课程内容设置之间衔接不够等一些问题。此外,学院今年开始也在积极准备申报大数据相关专业。这一系列需求也是进一步促使笔者对数据挖掘课程教学内容和体系进行深入探索和思考的重要因素。
众所周知,数据挖掘应用了很多学科的新概念,是多学科交融的学科,包括统计学、数学建模、机器学习、信息系统与数据库等众多学科。内容广泛、理论知识深、学习难度大是数据挖掘课程的突出特点,尤其是面对数学基础薄弱、计算能力偏弱的经管学院的学生,学习起来更是困难。针对这些教学难点,可以从以下几方面进行改进:第一,强化前期相关基础课程的教学要求。对前期的管理统计、数据库、管理运筹学、程序设计等相关课程,加强课程的考核和学习要求,让更大比例的同学不仅能够比较扎实地掌握相关理论知识内容,而且同时具有一定的知识运用能力,为后续数据挖掘课程的学习打好坚实基础。第二,简化理论知识的学习。结合我们学校以培养应用型本科人才为主的教育目标,强化数据挖掘相关方法实践能力的培养和训练,在数据挖掘课程的实际教学过程中,以启发学生思维和理解数据挖掘方法的思路为主,辅以会建立合理的数学模型和解读数据挖掘结果,授课的主要内容和安排如表1 所示。第三,强化学生数据挖掘实践能力的锻炼。由于数据挖掘是一门实践性很强的课程,加之企业对毕业生动手实践能力的需求,教学过程中不仅会安排相应的实验课程(约12 学时),同时还鼓励学生积极参加全国各类数据挖掘、统计调查和数学建模等相关比赛,来锻炼综合实践能力。
由于数据挖掘的课程内容偏重于算法理论和数学模型,相关理论内容的传统授课方式对经管学院学生而言晦涩难懂,内容枯燥,无法激发学生的学习兴趣,导致课堂教学难、教学效果不好。鉴于此类情况,可从以下几方面加以改进:第一,案例引导,吸引学生兴趣。每节课前,给学生介绍一个与本节课内容相关的数据挖掘案例,尤其是经济、电子商务、金融等领域的实际案例,让学生了解到数据挖掘能够非常有效地解决实际领域的很多问题,且能够带来很大效益,以激发学生学习相关知识的兴趣和动力。第二,参加数据挖掘相关竞赛,激发学习兴趣。数据挖掘理论与方法学习成果的最好检验方法就是去系统地解决一个实际问题,而现行的各类数据挖掘竞赛,包括大学生数学建模比赛、MathorCup 高校数学建模挑战赛、泰迪杯数据挖掘挑战赛等赛事恰好提供了这样一个平台。学生通过比赛不仅能够获得荣誉,还能够锻炼其团队合作能力、创新能力等综合素质。第三,多元化的授课方法。当前在校的大学生热衷于新技术以及新奇、灵活、多变的授课方式。教师要结合当前流行的各种新技术手段,如翻转课堂、雨课堂等技术,在授课过程中灵活运用,以激发和吸引学生的学习兴趣。如在介绍SVM 算法时,老师可以先介绍其相关概念和执行流程,并以小组形式让学生去研讨该方法的具体细节、特点,然后解决一个小问题,总结汇报学习和作业心得,最后老师加以系统总结和点评。总之,一切以激发和吸引学生学习兴趣为出发点,目的是让其牢固习得相关知识和方法技能,为后续的工作和学习打好基础。
表1 数据挖掘课程内容和安排
传统的课程效果考核方式通常以期末试卷分数作为评分主要依据,但笔试往往偏重于理论知识的考核,忽略了对实践知识和技能的考核。鉴于数据挖掘是一门理论与实践结合,侧重于实践能力培训的课程,建议采用多种考核方法。如采用试卷成绩、实践成绩、大作业成绩、竞赛成绩等多种成绩的综合评分结果,作为学生的最终考核结果。针对不同水平和兴趣的学生,考核方式灵活多变,如理论知识学习较好的学生,鼓励其深入钻研相关模型和算法的改进与创新,指导其撰写相关学术论文;实践动手能力较好的学生,鼓励其参加各类数据挖掘竞赛。分别以论文水平、竞赛成绩等作为考核重要指标。
此外,老师教学质量的评价应与学生成绩的考核方式相对应,也应做相应的调整。如将课程的理论教学结果和学生的竞赛成绩、发表论文成绩等因素结合起来,按一定比例统一作为老师的总体评价。不论是学生,还是老师,采用多元化的考评方式不仅有利于学生实践能力的培养,对老师的教学水平也是一种促进,有利于整个课程教学质量的不断提高。
随着商务、经济、医疗等社会各领域的信息数据爆炸式增长,掌握数据挖掘技能和方法将是大数据时代大学生必备的社会技能之一。在此背景下,对数据挖掘课程的教学内容和教学方法等进行研究,具有重要的理论和现实价值。本文从社会需求、学生需求和学科专业发展需求等角度出发,同时结合笔者近几年数据挖掘课程授课的结果反馈和感受,对数据挖掘课程的教学内容和方法等进行了总结和分析,得到了一些有意义的结果,其对进一步提高数据挖掘课程教学质量和相关课程教学改革具有一定的指导价值和借鉴意义。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!