王牌课程请AI做助教,看完哈佛这波操作,才发现AI是福是祸,只在一念之间
看点 近日,哈佛大学宣布,从秋季学期开始,将使用自主研发的语言模型CS50 Bot,作为计算机科学入门这一高人气课程的助教,新一届学生因此将成为“第一批吃螃蟹”的人。此举引起网络热议,有人担忧:AI会将破坏学生的动力学习;哈佛教授则表示,AI助教可以缓解现实教学困境,改善学习体验。
【资料图】
支持外滩君,请进入公众号主页面“星标”我们,从此“不失联”。
文丨Luna 编丨Jennifer
自去年以来,AI话题的热度就一直不减。但是,看到哈佛将在王牌选修课上“聘用”AI,还是让人不由得吃惊: “AI的应用,进化得这么快的吗?”
这个消息源自《哈佛深红报》, CS50(计算机科学入门)的主讲教授David Malan确认,这门课从秋季学期开始,AI将和50位课程助理(Course Assistant)、教学助理(Teaching Fellow)一起,为学生服务 (TF是比CA更高级的助教) 。
《哈佛深红报》报道标题&Malan在推特的回应
这次使用的AI不 是大家熟悉的GPT-3.5或者GPT-4,而是哈佛自己在此基础上研发的一个语言模型 CS50 Bot。它将负责回答一些课程的常见问题,给学生的作业提出修改意见,并在其他助教的工作时间之外,随时回答学生的各种疑问。
此次AI担任助教的CS50课程,可是哈佛的高人气课程,近十年来,每年选课人数少则500,多则800。甚至有其他专业的学生上完课以后,转到了计算机科学专业或者转而从事这个专业的相关工作。
CS50每年选课人数统计
这样一门热门课,在哈佛还没有针对AI推出完备的教育应用方案时,就直接引入AI助教,让人不禁感叹“哈佛真敢啊!”
网络上的热议也是各有想法:
有人觉得AI的功能太过强大,担心这是AI取代人类的开始?
也有人质疑AI的能力,反问哈佛每年学费高达5万美元,是不是拿AI糊弄学生?
也有人担心,AI会不会将让学生不再有动力学习,甚至彻底颠覆人类的认知发展。
那么,作为美国顶尖学府的代表之一,哈佛应用AI助教,到底是怎么想的?面对种种AI危机的疑虑,哈佛又有怎样的思考?
哈佛最热门的CS50也有差评
AI助教是来“救火”的
AI是不是会取代人类老师?这是很多人在看到哈佛新闻后的第一反应。
不过,翻阅一下《哈佛深红报》的报道,就会发现,这次的助教CS50 Bot 与其说是来取代人类助教,代替教授上课,倒不如说更像是来“救火”的。
一方面,主讲教授Malan一直把CS50 Bot定位为学生的学习工具,从来没有提到要由Bot来主讲,就连助教身份,Bot也“低人一等”,它给出的建议只有经过其他助教的确认,才能被认为是“准确的”;
另一方面,Malan迫切地希望AI能改善学生的学习体验,让这门近千名学生的大课,也能提供24小时一对一的辅导。放在以前,这是不可能完成的任务。
Malan 教授在计算机科学导论的讲座上
摄影Alana M Steinberg
Malan既是在策划一场大型AI测验,又考虑到了现实教学的困境。
在很多人的印象中,哈佛的王牌课程都自带光环——在CS50的YouTube录播中,David Malan站在桑德斯剧院宽敞的舞台上,像表演戏剧般讲解那些复杂的计算机概念。
如果你很幸运在哈佛就读,那么还会知道,这门课还有个庞大的助教团,为学生们提供参考资料和作业辅导。
但是今年3月,《哈佛深红报》的另一篇报道《Undervalued, but Highly Utilized》却揭开了这些大型入门课光鲜背后的辛酸。
《哈佛深红报》关于助教的报道
“Malan教授在台上奉献了精彩的讲座,但除此以外的学习都靠助教。”曾任CS50教学助理的学生Fernandes说出了自己的看法, “本质上说,是教学助理撑起了这门课。”
管理教授的office hours、领导小型辅导、参加每周的员工会议,还算是助教的合理工作。如今,他们还要在课后长时间答疑,准备大部分课程材料。
这些负担已经远超学校协议的规定——教学助理每周最多可以得到10小时工作量的酬劳,课程助理最多只能计算4小时的工作量。按照这个标准,Fernandes每周留给作业点评的时间只有3小时。纵然助教团有几十个人,每人3小时也忙不过来。
CS50现任的教学助理Leggett还补充了一个“槽点”:“助教还要支持CS50的作品展,可是往往后一天就是我们自己高级计算机科学的期末考试,协议从来没提到这种时间冲突,后果只能我们自己承担。”
这样的情况,CS50不是例外。概率导论、生命科学综合导论都是如此。
除了学生助教有不满,选修课的学生也吃了不少“哑巴亏”。
哈佛的招生网站上写道,“作为世界级的教育工作者,教授们与学生们并肩工作,鼓励他们用新的眼光看待问题。”但很多哈佛学生却觉得,自己只是听教授讲座的观众,真要说和学生并肩工作的,还是助教。
“虽然学生确实有可能直接接触到全球最伟大的一些学者,但这种机会比看起来小得很多。”《哈佛深红报》如此评价。
更何况, 助教毕竟也是学生。他们再怎么热爱自己的学科,和教授之间知识、思维、教学的差距是真实存在的。
有选修了生物入门课的学生抱怨,助教虽然懂得很多,但是辅导水平堪忧,并不能将复杂的概念转述成她能理解的表达,最后还是让她靠背诵和记忆。
还有的助教,囿于知识储备和理解,给出的见解和教授的观点矛盾,这对本来就有疑惑的学生来说简直雪上加霜。
正在攻读博士学位的Kyle Waldman说,除非是小班课或者学生自己很外向,否则教授“很难与学生进行持续的互动”。与规模较小的学校相比,哈佛学生很“吃亏”。
学生想要更多的辅导,助教呼吁减少工作,教授难以在研究和教学之间找到平衡。学生需求和人力、时间成本的矛盾越来越突出。
既然无法禁止学生使用AI,
那不如“化敌为友”,利用AI的优势
Malan让AI助教来“救火”,这样利用AI的方式,在哈佛的一众教授里也显得比较“激进”。但实际上,这已经算动作慢的了。
学生的手脚比教授们的对策更快。去年年末ChatGPT刚出圈,就有哈佛学生开着ChatGPT,参加线上开卷考试,而且还不是个例。
直到1月下旬,本科教育办公室的邮件才姗姗来迟,请老师们重视ChatGPT的影响,但并没有给出具体的规定,决策权交到了老师手中。
哈佛大部分教授对AI技术的影响持负面态度,因此很多课都明令禁止使用ChatGPT,比如宗教、西班牙语、物理课。
更多的老师意识到,想要全面禁止已经不太可能,所以想方设法减少学生使用ChatGPT的机会,推着学生亲自学习。
此前,法语课的主要评估就都放在课堂上完成,限制学生利用谷歌翻译这种工具。ChatGPT风靡之后,讲师Amanda Gann又把期末评估改成了“论文+对话”的方式,随时提问,防止学生用ChatGPT提前写好稿。
Gann坦言, 如果不是ChatGPT,口头评估不会有如今这样的重要地位。这也激励着她去反思自己的作业:“这是只有人类才能做的吗?”“怎样让学生一开始就不想用AI来完成?”
英雄所见略同。计算机科学教授Boaz Barak也提高了作业和考试的难度。
以前,编写一个简单的神经网络代码就足以完成一份作业;但现在,学生要在尖端研究的启发下,再现一个更加复杂的代码。“既然学生能接触到更先进的工具,那我自然要提出更多要求。”
“英语:大数据的黑暗面”的Maria Dikcis教授则更进一步, 鼓励学生批判性地使用ChatGPT。她在作业中,尝试让学生与机器智能较量:由学生自己先写一篇简短的分析文章,再用ChatGPT就同一主题生成一篇论文,然后比较两篇文章。她希望学生能看到AI辉煌表象背后的缺点,还能思考这些缺点的意义和价值。
相比之下,CS50的AI助教,更有一种“化敌为友”的感觉。老师们担心学生使用AI是因为ChatGPT实在太容易使用了,那不如反过来利用这一点,让AI成为24小时在线的助教。
这个想法,也和Malan一直在探索的个性化学习体验契合。为了让水平参差不齐的学生,能一直保持对CS50的兴趣,Malan和助教设计了不同难度的作业。
CS50课程学生学习感受统计&分层作业设计
比如为图片设计滤镜,能力比较弱的学生,可以写一个黑白滤镜,而能力比较强的学生,可以挑战胶卷底片+反色的滤镜。
不同水平的学生可以自由选择作业难度
但解决了学生的问题,助教的时间矛盾还在。他们花费很多时间来点评作业,可读评语花不了学生14秒,修改之后,又是漫长的等待才能获得回复。“这对助教和学生来说,都不是高效利用时间的方式。” Malan说。
而AI的便利性就像是缺少的那块拼图碎片。因此,Malan让AI助教承担了很多程序性、重复性的工作。虽然目前AI助教的修改意见读起来仍然有股“机器人味”,但是一针见血找到问题,还给出详尽的解释,倒也获得了“weirdly informative”的评价。
测试中的CS50 Bot
AI助教是大型技术测验,也是给学生示范了如何合理使用AI。在此之后,Malan还希望能够在其他STEM课,甚至人文课上,融入AI技术,为教学带来一些变革。
做学习的主人,还是技术的傀儡?
AI是一柄达摩克里斯之剑
不过,教学方法的改变似乎仍然无法解决一个疑问—— AI来势汹汹,人类能坚守阵地,不被取代吗?
哈佛大学的心理学教授Steven Pinker的经历就是一个很直观的回答:
作为心理学入门课的主讲人,他也一度担心ChatGPT已经强大到能替代他上课,直到他发现AI和人类在认知上的不同。
“我问ChatGPT,‘如果Mabel在上午9点和下午5点时都活着,那她中午还活着吗?’ 我们都知道,人一旦死亡就无法复生,可是ChatGPT回答:‘没有信息明确指出Mabel中午是否还活着。’可见,AI并没有掌握世界运行的基本事实,缺乏人类赖以生存的常识与逻辑。”
“人类的记忆力和计算能力有限,必须承认AI在检索大量信息方面更强。”Pinker说,但AI的“认知”源于海量信息的集合,并没有发展出逻辑能力,和人类完全不同。
Steven Pinker在Harvard Gazette的采访中如是说
可以说, 思维能力是人类独有的优势,逻辑能力还只是其中之一。学生能否在学习中锻炼各种思维能力,决定着和AI“对垒”的结果。在这个问题上,哈佛的教授们也强调了AI思维能力的各种弱势。
缺乏批判性思维,就是目前AI的另一个明显弱点。
《麻省理工科技评论》早早就发文提醒,因为互联网上存在大量偏见和仇恨的语言,以此为训练集的AI会进一步放大这些偏见。
另外,生成虚假内容也一直是AI的明显问题。今年3月,监管机构NewsGuard的专家又发现,GPT-4竟然100%地对虚假新闻做出了回应,GPT-3.5至少还能对20%的虚假消息回复“这些说法毫无根据”。
NewsGuard关于GPT-4的报道
再加上GPT-4比以前更不“擅长”编程,在CS50上引入的AI助教,也引起了一些质疑。Malan自己也预测,AI助教在一开始可能会“偶尔表现不佳甚至出错”。
但他认为,这恰恰是学生锻炼思维能力的机会,他告诉学生 “在接收信息时,无论来源是AI还是人类,始终要进行批判性思考。鉴别信息真伪,评估可信程度,再决定是否接受对方的信息。”
推理和思考能力,也是AI的弱势,尽管这一点非常有迷惑性。
有学生用ChatGPT概括阅读材料的大意,它逐字逐句的输出方式,让人感觉它真的在思考。但真是这样吗?
哈佛肯尼政治学院公共政策的Soroush Saghafian副教授,把这称为AI的瑕疵。“人们认为AI会思考、会推理,甚至认为它无所不能,都是商业炒作的结果。”
人工智能初创公司MosaicML的首席科学家Frankle也验证了这个说法:“初创公司开发AI的目的一直都是构建一个很棒的语言模型产品,而不是发布和分享知识,这只是附带的效应。”
Saghafian认为,学生要主动与ChatGPT互动,更要了解AI本身的弊端。“2000年那会儿,老师教导学生认识谷歌这样的搜索引擎在思考上的弊端,如今对待ChatGPT也需要如此。 学生要了解推理思考和单纯输出内容之间的差别。”
人类的思维能力从哪里来?必然是学习过程中来。但在特别需要高分和高绩点的时候,学生也难免会用ChatGPT来偷懒。即便是哈佛的教授们,能使用的手段也有限,学习的决策最终还是在学生手里。
尽管如此,哈佛大学和教授们还是尽可能地启发着学生:
哈佛把学习的意义称为智力转型的价值。
“改变自己必然很困难。学习量子力学原理或是了解工业革命前的社会,都需要解构自己的世界观并重新构建。因此,哈佛大学不是单纯强调学术道德,也是期望学生能够经历这一艰难的过程。”
哈佛德语和比较文学教授John Hamilton的一段话更为深刻:
技术打破了种种限制,让我们的生活变得更加轻松、方便。我们可以飞跃世界,可以扫描识字识图,或者在谷歌搜索关键词来了解任何事。 但是,能够赋予我们生活意义的还是限制。
如果黄金充足,我们就不会关心黄金;如果我们能永生,也不会太关心生活。我们的关心来自于有限的能力。没有限制的生活最终会没有价值。
参考文献:
(上下滑动浏览)
1.CS50 Will Integrate Artificial Intelligence Into Course Instruction
2.‘Undervalued, but Highly Utilized’: CAs, TFs, and the Quality of a Harvard Education
3.ChatGPT, Cheating, and the Future of Education
4.SIGCSE 2023 - Differentiating for Comfort with Computer Science
5.Harvard Taps AI to Help Teach Computer Science Course
6.How to make a chatbot that isn’t racist or sexist
7.Despite OpenAI’s Promises, the Company’s New AI Tool Produces
8.Misinformation More Frequently, and More Persuasively,than its Predecessor
9.Will ChatGPT supplant us as writers, thinkers?
关注外滩教育
发现优质教育