1. 研究背景与核心问题为什么我们需要关注ML/AI学生的“去留”如果你在机器学习或者人工智能领域待过几年无论是做研究还是工业界落地一个感受会越来越明显这个圈子里的人背景和想法越来越像了。这并不是说大家水平接近而是指在技术讨论、职业选择甚至价值判断上逐渐形成了一种“主流叙事”。这种同质化带来的问题远不止是开会时观点重复那么简单。当一群背景相似、思维模式相近的人用相似的算法框架去处理关乎千万人生活的决策——比如谁可以获得贷款、哪些简历能进入面试、甚至司法系统中的风险评估——那些隐藏在数据背后的社会偏见和不平等就很容易被忽视甚至被算法放大和固化。这就是为什么多伦多大学和麻省理工学院的研究团队要深入探究一个看似简单却至关重要的问题为什么有些选择了ML/AI专业的学生最终会离开这个领域这项研究戳中了一个行业痛点我们一边在高喊“AI赋能一切”、“未来已来”另一边却在面临严峻的人才多样性危机。根据斯坦福大学2021年AI指数报告北美AI博士毕业生中女性仅占18%而黑人博士的比例更是低至约4%。这种失衡并非天生而是在教育漏斗的每一个环节——从兴趣萌芽、专业选择到职业坚持——层层筛选和流失的结果。传统上对STEM科学、技术、工程、数学领域学生留存率的研究已经不少但ML/AI有其特殊性。它不像传统工程学科那样有相对稳定和公认的社会价值形象比如土木工程师造桥修路造福社会其社会影响充满争议公众舆论分裂。它也不像纯计算机科学早期那样“极客”文化浓厚如今的ML/AI领域与资本、商业、社会应用紧密绑定充满了高薪、竞争和快速迭代的喧嚣。更重要的是这个领域对技能的要求正在悄然变化除了扎实的数学和编程功底沟通、协作、伦理思辨等“非技术技能”的比重日益增加。这些独特之处使得沿用旧的STEM留存模型来解释ML/AI学生的职业意向很可能失之毫厘谬以千里。因此这项研究的目的非常明确构建并验证一个针对ML/AI领域学生“意向持续性”的进阶模型。它不仅仅关心学生“能不能”留下来由成绩、能力决定更关心他们“想不想”留下来由动机、认同感和价值观驱动。研究者们试图找出在控制了专业、年级等常规因素后有哪些独特的心理和社会因素在推动或拉扯着学生特别是女性和其他少数群体学生在这个充满机遇与争议的领域里是选择深耕还是转身离开。2. 研究设计与核心变量拆解他们到底测量了什么要理解这项研究的发现我们得先弄明白研究者们是如何设计调查和定义关键概念的。这不是一份泛泛而谈的问卷每一个变量背后都有扎实的理论基础和精细的操作化定义。2.1 因变量两种“意向持续性”研究没有跟踪学生毕业后的实际去向行为持续性而是聚焦于他们的“意向”。这在实际研究中更为可行且意向被证明是预测未来行为的重要前兆。他们区分了两种时间维度的意向短期意向持续性学生是否打算在大学期间选修更多的ML/AI课程。这衡量的是学生在学术路径上继续探索该领域的意愿。长期意向持续性学生是否预期自己在五年后从事与ML/AI相关的工作。这直接指向了职业承诺。两者都被处理为二分变量高意向 vs. 低意向以便进行逻辑回归分析。这种区分很有意义因为影响一个学生多选一门课的因素比如课程难度、时间安排和影响他选择一份职业的因素比如行业前景、个人价值观可能完全不同。2.2 核心自变量三个待验证的假设研究提出了三组核心假设围绕三个关键的心理建构1. 社会效益兴趣它是什么指个人希望自己的工作能为社会带来积极影响的价值观强度。简单说就是“做这份工作我能让世界变得更好吗”的内心驱动力。研究假设H1A女性学生普遍拥有更高的社会效益兴趣基于过往STEM研究中女性更看重工作 altruistic 价值的结论。H1B社会效益兴趣越高长期留在ML/AI领域的意向反而越低基于ML/AI社会影响存在争议、且常被与负面案例关联的现状。2. 非技术技能自我评估它是什么个人对自己在沟通、团队合作和领导力这三项核心人际技能上的自信程度。注意这里测量的是“自信程度”而非客观能力。研究假设H2A女性学生在非技术技能上的自我评估更高源于社会性别刻板印象。H2B H2C非技术技能自信越高短期和长期留在ML/AI领域的意向越低基于一种推测学生可能尚未意识到这些技能在ML/AI职业中的重要性或认为拥有这些技能的人更适合去管理、咨询等“非纯技术”岗位。3. 社会归属自信它是什么个人对自己能否融入ML/AI领域的专业社群、并与同行建立有意义关系的信心。它关乎“我在这里是否被接纳我属于这里吗”的感受。研究假设H3A男性学生拥有更高的社会归属自信源于STEM领域长期由男性主导的环境文化。H3B社会归属自信越高长期留在ML/AI领域的意向越高这是从一般STEM研究推导出的经典正面预测关系。2.3 控制变量与背景变量排除干扰看清真相为了确保上述核心变量的效应是“纯净”的研究模型中加入了一系列已知或可能影响持续性的变量作为控制专业角色自信沿用成熟量表包含“专业能力自信”觉得自己有本事干这行和“职业适配自信”觉得这行的日常工作和价值观适合自己。这是预测工程领域留存的最强因子之一。环境毒性感知测量学生在ML/AI课程中是否经历过或感知到来自教师或同学的歧视、区别对待或负面刻板印象强化。早期接触学生多早了解到ML/AI作为一个职业选项。领域吸引力因素对高薪的重视程度。参与竞争性活动体育、竞赛等的频率。选择当前ML/AI课程是否受到该领域“热门”程度的影响。人口统计学特征性别、可见少数族裔身份研究中聚焦华裔、南亚裔、国际学生身份、第一代大学生身份、贷款状态等。这些是分析多样性问题的关键维度。2.4 数据收集一份来自前沿课堂的截面快照研究团队在2021年秋季学期于北美一所顶尖大学结合上下文很可能是多伦多大学的10门ML/AI入门或通识课程中发放了问卷。这些课程横跨计算机科学和工程院系旨在捕捉广泛的学生样本。最终在剔除无效问卷后获得了159份有效回复。样本构成显示了一些有趣的特点女性占33%与国际生比例44%和可见少数族裔比例79%其中华裔42%南亚裔18%一起勾勒出一个高度国际化、多元文化背景的学生群体画像。这恰恰是研究ML/AI领域多样性问题的理想样本——它反映了当前顶尖院校中该领域生源的现实图景。3. 核心发现与深度解读数据揭示了哪些反直觉的真相通过对调查数据的逻辑回归分析一些假设被证实一些被推翻还有一些发现了更复杂的关联。这些发现远比简单的“鼓励女生学编程”要深刻得多。3.1 社会效益兴趣一个“劝退”信号这是本研究最引人注目也最值得深思的发现。假设H1A被证实数据分析显示女性学生确实报告了显著更高的社会效益兴趣。这与大量前人研究一致表明女性在职业选择中普遍更看重工作的社会贡献和意义感。假设H1B被证实更高的社会效益兴趣显著地预测了更低的长期ML/AI职业意向。这是一个强有力的负面预测因子。这意味着什么想象两个同样优秀的学生A更看重技术挑战和高薪B则梦想用技术解决社会问题。研究告诉我们B选择长期留在ML/AI领域的可能性更低。而这其中女性又占了更高比例。这直接为ML/AI领域的性别流失提供了一个全新的解释路径并非女性能力不足或兴趣不够而可能是一种价值观上的“不匹配”或“幻灭”。ML/AI在公众舆论和媒体报道中常常与“算法偏见”、“监控”、“就业替代”、“伦理争议”等负面词汇挂钩。尽管该领域也有医疗影像、环境保护、教育公平等正面应用但负面案例往往传播更广、冲击力更强。对于那些怀抱“用技术让世界更美好”理想的学生尤其是对此更为敏感的女性学生而言这种充满争议的行业形象可能构成了一种心理上的“推离力”。他们可能会觉得这个领域目前的工作重心或社会影响与自己的价值追求存在偏差。实操心得与教育启示 这个发现对ML/AI教育者提出了一个尖锐的挑战我们如何在课堂上谈论伦理是把它作为最后一章轻描淡写的“注意事项”还是将其贯穿于整个技术教学的核心研究团队明确指出教育者需要更有意义地meaningfully讨论ML/AI的伦理挑战。这包括平衡叙事不仅要讲授造成危害的案例如COMPAS再犯风险评估算法中的种族偏见更要花同等甚至更多精力展示和让学生实践那些产生积极社会效益的项目如用AI进行稀有物种保护、早期疾病筛查、教育资源个性化推荐。实践导向的伦理课将伦理讨论从哲学思辨下沉到工程实践。例如在数据收集、特征工程、模型评估的每一个步骤都设置关于公平性、可解释性、问责制的检查点和讨论。邀请多元声音邀请来自社会学、伦理学、法律、公共政策领域的学者以及受AI系统影响的社区代表进入课堂提供技术之外的多维度视角。让学生看到解决伦理问题本身就是一项需要深厚技能和巨大社会价值的“技术活”。3.2 非技术技能自信被低估的“软实力”这里的发现部分推翻了研究者的初始假设揭示了ML/AI职场需求的真实变化。假设H2A被证实女性学生在沟通、团队合作和领导力方面的自我评估显著高于男性。这符合社会性别角色期待。假设H2B被推翻非技术技能自信与短期课程意向是否继续选课没有显著关联。选课决策可能更受课程内容、教授口碑、时间安排等即时因素影响。假设H2C被部分支持方向相反分析发现更高的非技术技能自信与更高的长期职业意向存在正相关趋势尽管在统计上只是边缘显著p 0.1。这与假设的负面预测完全相反。这意味着什么学生们的直觉或许比我们想象的更敏锐。尽管课堂上可能仍在强调数学理论和编程技巧但学生们尤其是那些人际技能自信高的似乎已经隐约察觉到未来的ML/AI职场需要的不再是“孤独的天才程序员”。一个成功的ML项目需要与业务部门沟通以明确需求需要与数据工程师协作搭建管道需要向非技术背景的决策者解释复杂的模型结果需要领导跨职能团队推进项目落地。沟通、协作、领导力这些“软技能”正在成为ML/AI职业成功的“硬通货”。那些对自己这些技能有信心的人可能更看好自己在该领域的长期发展前景因而留存意向更高。这打破了“擅长沟通的人就该去做产品经理”的陈旧观念指出了在技术深度之外构建综合能力的重要性。实操心得与教育启示 ML/AI课程设计必须超越传统的“理论讲授编程作业”模式系统性融入非技术技能培养项目制学习设计需要团队合作完成的、模拟真实场景的ML项目如Kaggle竞赛式项目。强制要求团队进行项目规划、分工、定期汇报和最终的产品演示。技术沟通训练设置专门的环节要求学生向“小白”听众解释他们的模型原理、优势和局限性。可以模仿“三分钟论文”或电梯演讲的形式。跨学科合作与商学院、公共政策学院、医学院等合作开设课程让ML学生与其他专业学生组队解决真实的跨领域问题。这能最直接地锻炼沟通与协作能力。明确技能价值教师应在课程开始时就直接阐明这些非技术技能在业界的重要性并将其纳入评分标准如团队合作分、报告展示分给予学生正向激励和反馈。3.3 社会归属自信依然关键的基本盘这一部分的发现与STEM领域的普遍研究结论高度一致。假设H3A被证实男性学生报告了更高的社会归属自信。这反映了当前ML/AI领域乃至整个技术圈由男性主导的文化氛围可能让女性学生感到更难以融入。假设H3B被证实更高的社会归属自信显著预测更高的长期职业意向。感觉自己属于这个社群是留下来长期发展的情感基石。这意味着什么“归属感”不是锦上添花而是雪中送炭。无论一个领域多么有前景、薪资多高如果一个人在其中感到孤立、被排斥或“像个异类”他离开的可能性就会大大增加。对于女性和少数族裔学生这种“归属不确定性”往往更加强烈因为他们可能缺乏角色榜样或需要经常应对微歧视和 stereotype threat刻板印象威胁。3.4 其他重要发现专业角色自信仍是压舱石研究再次确认“专业能力自信”和“职业适配自信”是预测ML/AI长期意向最稳定、最强烈的正面因素。这提醒我们帮助学生打下扎实的技术基础并让他们理解ML/AI工作的真实日常始终是根本。短期意向的驱动因素更“务实”短期是否继续选课主要与学术因素相关如所学专业、年级等。机械与工业工程专业的学生相比电气工程/计算机科学专业的学生继续选课的意向更低这可能与课程设置和职业路径规划有关。“热门”的影响力相当一部分学生承认他们选择ML/AI课程是因为这个领域很“火”、很“流行”。这表明并非所有选修者都经过了深思熟虑的职业规划其中存在一定的从众心理。这对课程的留存率提出了挑战——如何将“凑热闹”的学生转化为“真热爱”的学习者人口统计学因素的复杂作用在控制了其他变量后性别本身对长期意向的直接预测作用并不显著。这意味着性别差距可能主要是通过中介变量如更高的社会效益兴趣、更低的社会归属自信间接起作用的。这为干预提供了更精确的靶点与其泛泛而谈“鼓励女性”不如具体解决“如何提升女性在ML/AI领域的归属感”和“如何重塑ML/AI的社会价值叙事”。4. 对教育者与行业建设者的行动指南基于以上发现我们可以超越“发现问题”的层面进入“解决问题”的实践阶段。以下是一份结合研究发现与个人观察的行动清单4.1 重塑课程叙事从“技术神话”到“负责任创新”伦理贯穿始终不要开设孤立的“AI伦理”选修课而要将伦理、公平、问责、透明FAccT作为核心模块嵌入每一门核心ML/AI课程。在讲解分类算法时必须讨论公平性指标在讲解推荐系统时必须分析信息茧房和偏见强化。案例库建设精心构建包含正反两方面、覆盖不同行业、不同社会群体的案例库。特别要挖掘和展示那些由多元团队完成的、产生显著社会正向价值的ML项目作为榜样。价值引导讨论在课程中设立“价值反思”环节引导学生讨论我学习的这项技术可能对哪些人群产生何种影响作为未来的从业者我的责任边界在哪里4.2 系统性培养“全栈”ML人才技术硬实力与人文软实力并重课程结构改革在培养方案中明确加入沟通、项目管理、团队协作、商业理解等必修或强选修模块。与人文社科学院合作开发课程。评价体系革新将团队合作成果、项目报告、口头演示、同行评审纳入课程总评并占有相当权重。让学生明白这些技能和编程能力一样重要且会被严肃评估。创建包容性学习环境推行主动教学法减少纯讲座增加小组讨论、同伴教学、工作坊让所有学生尤其是沉默者都有参与和表达的机会。建立导师与社群为女性和少数族裔学生匹配同背景的导师研究生、校友或业界人士。创建或支持相关的学生社团如Women in ML, AI for Social Good club提供归属感。教师培训对教师进行无意识偏见、包容性教学法的培训确保课堂互动和评价公平。4.3 行业与学界联动展示多元、真实的职业图景业界嘉宾多元化邀请来自不同性别、种族、背景的ML从业者分享他们的工作日常。特别要邀请那些从事AI for Social Good、AI Ethics、AI Policy等交叉领域工作的人展示ML职业路径的多样性。实习与实践项目与致力于社会公益的科技公司、非营利组织、政府机构合作提供相关的实习和研究机会。让学生亲眼看到、亲手实现技术向善的可能。招聘标准传达企业在校园招聘时除了考察算法题也应展示对沟通能力、团队协作、伦理思考的重视从需求端发出明确的信号。这项研究像一面镜子照出了ML/AI领域在高速发展期所隐藏的深层张力技术的工具理性与人文的价值理性之间的张力同质化精英文化与多元化创新需求之间的张力高薪竞争的职业表象与复杂矛盾的社会影响之间的张力。解决多样性问题远不止是完成一个“政治正确”的指标而是关乎这个领域能否健康、可持续、负责任地发展下去的根本。对于正在这个领域学习或工作的个人而言这项研究的启示在于你的去留不仅仅关乎个人能力与兴趣更与你如何看待技术的意义、如何评估自己的综合技能、以及能否在社群中找到归属感紧密相连。认识到这些因素能帮助你做出更清醒的职业选择也能让你更理解身边同行者的不同路径。对于教育者和行业领袖这项研究提供了一份基于实证的“诊断书”和“处方笺”。它告诉我们吸引和留住多元化人才需要一场从课程设计、技能培养、环境营造到行业文化塑造的系统性变革。这绝非易事但却是构建一个真正包容、健康、充满活力的ML/AI生态的必经之路。毕竟我们想要的未来不应该由一半的人类来设计。