专论:无知之幕——从思想实验到伦理中间件——在“互惠律”与“公正律”之间的罗尔斯装置
专论无知之幕——从思想实验到伦理中间件——在“互惠律”与“公正律”之间的罗尔斯装置元提示本文是《AI元人文道德金律的谱系、实践与智慧》第二章“互惠律”部分的一个理论补注。主文曾指出“罗尔斯的无知之幕可以被视为互惠律的一种扩展版本——从与具体他人互换到与所有可能处境互换”同时也承认这一解读“偏离了罗尔斯本人的框架且存在窄化之嫌”。本文旨在系统梳理无知之幕的核心构造、批评脉络与当代应用并在此基础上重新审视其与主文“伦理中间件”框架的理论关系。引言在20世纪政治哲学的版图中约翰·罗尔斯John Rawls的“无知之幕”veil of ignorance占据着一个独特的位置。它既是一篇思想实验中最引人注目的装置也是整个当代公正理论赖以为基的论证起点同时还是被误读、质疑和修补最多的理论构件之一。无知之幕的魅力在于其悖论式的结构为了公正我们必须主动选择无知。不要知道你是谁不要知道你拥有什么天赋不要知道你属于哪个阶层甚至不要知道你信奉什么善观念——在对自己一无所知的状态下你反而能够做出对所有人最公正的选择。这种“通过无知抵达公正”的逻辑与主文第二章互惠律中的“角色互换测试”共享了同一个结构性的根茎两者都依赖可逆性检验来排除自我偏私都要求行动者在做决策时剥离与自身处境相关的信息。但无知之幕不止于此。互惠律的“角色互换”停留在与某一个具体的、已知的他者互换位置而无知之幕将其推向了一个更激进的维度与所有可能的他者、所有可能的社会位置、所有可能的善观念同时互换。这种从“具体互换”到“普遍互换”的跃迁正是理解无知之幕的关键。本文的结构如下第一节以思想实验的叙事方式进入无知之幕还原其运作逻辑第二节分析无知之幕的两大核心假设及其衍生出的两个正义原则第三节梳理批判传统社群主义的“自我观批判”、女性主义的“性别盲视批判”、能力理论的“资源批判”及其辩护与回应第四节展示无知之幕在AI时代的最新应用第五节回到主文的“伦理中间件”框架讨论无知之幕如何被重新理解为一种程序性装置。一、故事原初状态的想象实验让我们做一个思想实验。想象你被邀请参加一次人类社会最根本的设计会议。你们的任务不是修修补补——不是给现有法律增加几条修正案也不是优化某个社会福利制度——而是从头开始设计一个全新的社会的“基本结构”即这个社会最基础的制度框架宪法框架、政治程序、财产制度、机会平等的规则框架。这是一张白纸。你有机会设计一个在你看来真正公正的社会。但这里有一个关键的约束。在你开始设计之前所有的参与者都被要求进入一种特殊的认知状态无知之幕。在这道幕布之后你被剥夺了关于自己的一切特殊信息。你不知道自己的性别、种族或民族。你不知道自己的家庭背景、社会阶层或继承的财富。你不知道自己拥有什么样的自然天赋——是智力超群还是体力过人是艺术天才还是工程头脑。你不知道自己信奉什么样的宗教甚至不知道自己对“什么样的生活值得过”持有何种观念。更彻底地说你甚至不知道自己是否健康或有残疾不知道自己的年龄不知道自己所处的历史时代。但你并非一无所知。罗尔斯并不要求我们退回到一种虚无状态。幕布之后的知识被筛选为两个层次。你仍然知道的东西被称为“普遍事实”。你知道人类社会的一般运行规律经济生产的常识、社会心理的基本原理、政治学的基本概念。你知道一个社会是如何运作的——什么会导致秩序什么会导致崩溃什么会产生繁荣什么会引发衰退。你还知道诸如“中等匮乏条件”moderate scarcity之类的普遍事实社会中的资源是有限的不足以满足所有人的所有欲望但也并非稀缺到无法分配的程度。你不知道的东西被称为“特殊事实”。你不知道自己在社会中的具体位置。这些被屏蔽的信息在罗尔斯看来都是“道德上任意的”morally arbitrary——它们不是个人选择的结果不是个人努力所能决定的。你生在哪个家庭、拥有什么天赋、甚至具备怎样的人格倾向在很大程度上都是运气使然。既然这些特征不是你应该“应得”的它们就不应该成为你设计社会制度时的有利条件。那么在这个无知之幕后理性的人们会做出什么样的选择罗尔斯的推演是这样的因为你不知道自己会落在社会中的哪个位置你将不得不考虑所有可能的位置。你会像保险购买者一样思考——你无法预知自己是否会“中奖”所以你真正的策略是确保即使自己落在最差的位置上这个位置也依然是可以接受的。用经济学的语言来说你处于“风险厌恶”的决策立场。这不是因为你的人格中有风险回避的倾向罗尔斯并不依赖于任何具体的人格假设而是因为无知之幕的结构本身就产出了这种决策逻辑——你不知道概率分布你无法计算期望值唯一理性的策略是最大化最坏情况下的回报。于是在这个思想实验中罗尔斯断言理性参与者将一致同意两个核心的正义原则。二、分析正义原则与无知之幕的理论结构2.1 两个正义原则第一原则基本自由原则 “每个人都应有平等的权利去享有与所有人类似的自由体系相容的最广泛的平等的基本自由总体系。”这一原则覆盖的自由包括政治自由选举和被选举权、言论和集会自由、良心自由和思想自由、人身自由和财产权、免受任意逮捕的自由。这些自由被视为“基本善”primary goods是任何合理的人生计划都不可或缺的条件。第一原则具有优先性——它不能被任何经济或社会福利的考虑所逾越。第二原则包含两个子原则“社会和经济的不平等应这样安排使它们(a) 适合于最少受惠者的最大利益差别原则(b) 在机会公平平等的条件下使所有职位和地位向所有人开放机会均等原则。”差别原则difference principle是无知之幕论证中最具特色也最受争议的部分。它要求允许经济不平等但仅限于那些能够使社会中最弱势的群体受益的不平等。一个医生比清洁工获得更高的收入不是因为医生的“应得”更大而是因为这种差别激励能够确保医疗服务的社会供给而清洁工也可能是医生的子女最终也从优质的医疗服务中间接受益。2.2 无知之幕的六重证成无知之幕并非一个随意的设计。杨伟清在一篇系统性的研究中从罗尔斯的文本中清理出六条主要的证成理由1达成实质性的共识无知之幕屏蔽了个体之间相互冲突的具体利益使原本分歧不可调和的各方有可能达成一致。当每个人都不知道自己是谁时关于“什么制度对所有人最公正”的判断就会收敛到一个可同意的范围。2限制自利追求如果人们知道自己特殊处境的具体信息他们会在制度设计中为自己谋取最大的私利。无知之幕使这种“机会主义”无法操作迫使参与者从整体公正的角度思考问题。3消除自然和社会偶然性的影响一个人的社会位置取决于“出生彩票”——家庭、阶级、种族、性别、自然禀赋——这些因素在道德上都是任意的。无知之幕将这些偶然因素排除在道德论证之外使结果只依赖于纯粹理性的考量。4公共理性的诉求任何正义原则都必须能够向所有公民以他们能理解和接受的方式加以辩护。无知之幕确保了这种辩护的普遍可及性——被屏蔽的正是那些无法普遍化的特殊诉求。5平等对待无知之幕赋予每一个参与者完全相同的决策地位没有任何人在制度设计时拥有比他人更多的信息优势。6公平的立约环境以上五条中前五条在杨伟清的分析中各有利弊但第六条——“公平的立约环境”——可能是对无知之幕的最有力证成。它整体性地说明无知之幕模拟了一个公平的程序其结果之所以是公正的不是因为程序之外的任何先验标准而是因为程序本身的公正性。这类似于纯粹程序正义只要公平的程序被遵循其结果不论具体为何都被认为是公正的。2.3 与互惠律的结构性关联现在我们回到主文互惠律章的线索。互惠律的“角色互换测试”——“如果我在他的位置上我会愿意被这样对待吗”——与无知之幕的“普遍位置互换测试”之间存在一个阶梯式的递进关系。共同结构两者都依赖“可逆性测试”来排除偏私。在交互设计中这是“不做自己不想要的事”的操作化。关键差异之一互惠律的测试对象是“一个具体的人”你与他角色互换无知之幕的测试对象是“所有可能的人”你与他者互换→你与所有人互换。关键差异之二互惠律处理的是交互中的对等关系“你对我怎样我便对你怎样”无知之幕处理的是制度设计本身的公正性“在不知道自己是制度的受益者还是承受者时你还会设计这样的制度吗”。前者是“交互正义”后者是“制度正义”。这正是主文指出的“窄化风险”所在。将无知之幕完全纳入互惠律会遮蔽它的制度设计维度——它不是在处理两个人之间的交往伦理而是在处理整个社会的基本结构。一篇更完整的专论需要同时处理这两个层面。三、批评与辩护无知之幕是一个被批评者反复检验的装置。这些批评不是对它的否定而是对它的一种填补和激发——每一次有力的批评都催生了罗尔斯理论的一次重要修正。3.1 社群主义的批判自我的抽象化社群主义者是罗尔斯最早也最持久的批评者之一。桑德尔Michael Sandel在《自由主义与正义的局限》中提出核心批评无知之幕之后的“自我”是一个被抽空了所有具体归属的抽象物。罗尔斯假设个体可以脱离自己的家庭、社群、传统和价值承诺来思考公正问题。但在社群主义者看来这种“无负荷的自我”unencumbered self本身就是一种幻觉——人的身份认同由这些归属构成剥离了它们剩下的只是一个逻辑实体而并非真实的人。另一社群主义者迈克尔·沃尔泽Michael Walzer则指出了无知之幕的实践局限它或许能够帮助推导抽象原则但无助于理解特定社群内部实际的公正分配。公正不是单一公式而是一个在不同社会领域“复合平等”中各不相同的东西。罗尔斯的回应他在《政治自由主义》中修正了自己的立场将正义原则的适用范围从“整全性学说”comprehensive doctrines收缩到“政治的正义”领域。无知之幕之后的参与者不需要剥离自己的价值判断——他们只需要在政治领域宪法基本要素和基本正义问题达成重叠共识。这种修正使罗尔斯的理论更接近多元社会现实。3.2 女性主义的批判公共的性别盲视女性主义对罗尔斯的批判集中在家庭领域。苏珊·奥金Susan Okin指出罗尔斯的原初状态忽略了家庭内部的性别分工和不平等默认地将“家庭”排除在正义原则的直接适用范围之外。但家庭的性别结构恰恰是塑造社会不平等的根源之一——如果女性在家庭中承担了不成比例的照护劳动那么“机会均等”就会成为一个空洞的承诺。然而有趣的是奥金并没有完全抛弃无知之幕。相反她主张“改良”罗尔斯——将无知之幕延伸到家庭内部要求参与者在设计家庭制度时也不知道自己将来会是父亲、母亲还是孩子。这种“彻底的性别盲视”反而能产生最激进的性别平等论证。奥金因此认为罗尔斯的“工具”具有巨大的女性主义潜力。努斯鲍姆Martha Nussbaum采取了另一条路径。她认为无知之幕的资源分配逻辑不足以捕捉人类福祉的全部维度——能力capabilities而非资源才是正义的真正尺度。但她保留了罗尔斯装置的核心直觉能力清单的辩护也需要某种超越特殊立场的普遍视角。3.3 能力理论的批判资源分配的局限性马莎·努斯鲍姆和阿马蒂亚·森Amartya Sen等人提出的“能力进路”capabilities approach指出罗尔斯的“基本善”收入和财富、机会和权力、自尊的社会基础清单太窄无法捕捉人与人之间的实质性差异。两个收入相同的人可能具有截然不同的生活能力——一个健康的人和一个重度残疾的人。真正的公正不是分配相同的资源而是使所有人都具备过上有尊严的生活的实质性能力。努斯鲍姆提出了十项核心能力清单生命、身体健康、身体完整、感受与想象、情感、实践理性、归属、其他物种、玩耍、对自身环境的控制并主张这些能力是所有政治社会都应保障的最低限度。然而有趣的是努斯鲍姆在辩护其能力清单时仍然沿用了无知之幕的程序逻辑“想象你自己不知道将会生在什么样的社会处境中你会选择什么样的能力保障作为每个人的最低门槛” 无知之幕在这里不再产生罗尔斯式的分配规则差别原则而产生一个能力清单。这表明即使对罗尔斯最有力的批评者无知之幕的基本结构仍然是一种不可或缺的道德想象力工具。3.4 辩护无知之幕的持续有效性尽管批评众多罗尔斯的装置仍然保持其生命力原因在于它指向了一个无法绕过的追问如果我们认真对待他者的存在在不知道我将会是谁的条件下我仍然愿意接受什么样的制度和规则 这种“公平阈”的设置在当代AI治理、全球正义和跨代正义等领域中焕发出新的活力。罗尔斯装置的核心合法性不在于它所推导的具体结论而在于它所开启的思考程序。四、当代应用AI时代的无知之幕如果说20世纪的正义理论家们将无知之幕视为解决人类社会中分配正义问题的工具那么21世纪的算法伦理学家们正在用同一装置来回答一个全新的问题如果我们不知道自己在算法社会中的位置我们会设计什么样的AI4.1 维丁格等人的实证研究2023年DeepMind团队Laura Weidinger、Kevin McKee、Richard Everett等在《美国国家科学院院刊》上发表了一项研究以2508名参与者为样本测试无知之幕对AI治理原则偏好的影响。实验设计如下一组参与者被置于“标准条件”下他们知道自己与AI助手的相对位置是受益者还是承受者另一组被置于“无知之幕后”——他们不知道自己的位置。研究要求参与者为AI助手选择指导原则是优先帮助处境最差者罗尔斯式还是按效用最大化功利主义式还是让每个成员保留部分资源不受AI干预。结果在无知之幕条件下参与者对“优先帮助最差者”原则的偏好显著增强。并且当随后揭晓真实位置后无知之幕组改变主意的比例显著低于控制组——他们的偏好更具稳健性即使新的信息触发了自利动机。更值得注意的是无知之幕组在解释其选择时自发使用“公平”“公正”等规范性语言的频率远高于控制组这表明无知之幕确实激活了超越自利的道德推理。4.2 算法偏见与“知情不偏”Hertwig等人2024则将无知之幕与心理学中“有意无知”deliberate ignorance进行了系统性整合。核心论证是无论是设计算法的人类工程师还是算法本身都面临一种结构性困境——掌握了太多关于受决策影响者的具体信息反而会导致系统性的偏见如推荐算法利用用户疲劳期推送高价内容。解决方法恰恰是“主动屏蔽”某些信息不允许算法“知道太多”。Hertwig等人的结论是无知之幕既是一个实践性的公平保障装置屏蔽偏见来源也是一个认知性的启发式工具触发超越自利的思考。它的价值不依赖于任何形而上学承诺只依赖于一个事实——“认知什么”比“知道什么”更重要。4.3 伦理中间件中的位置在主文的“伦理中间件”框架中无知之幕可以被操作化为两种功能功能一制度设计层的“程序公平检验” 。当一个社会政策如税收制度、教育资源分配被提出时伦理中间件可以运行一个“最小无知之幕模拟”——在屏蔽决策者自身的社会位置信息的情况下评估该政策是否仍然可被接受。这不是要求真实决策者失忆而是要求算法辅助生成一个“从所有位置考虑的评估报告”。功能二冲突调解层的“偏好净化” 。当互惠律、仁爱律、公正律之间的冲突需要协商性权衡时无知之幕可以作为阶段性工具“暂时冻结”相关方的自利信息使协商更接近公平的立约环境。五、理论反思从思想实验到伦理中间件在《正义论》中无知之幕是原初状态的核心装置在政治自由主义中它被收缩为重叠共识的辅助工具。但在跨出罗尔斯框架之后无知之幕已经独立生长为一个“活的概念”——它不再是罗尔斯体系中某一个环节而是一种广泛可用的道德想象力工具。5.1 无知之幕作为程序性装置无知之幕的有效性不在于它模拟了一个“真实存在过的社会契约”罗尔斯始终强调这一点是假设性的也不在于它能够“产生唯一正确的正义原则”罗尔斯的批评者指出这种唯一性并不成立而在于它提供了一个 “公平异议检验” 任何一个制度设计如果它在无知之幕的测试中被接受它就必须能够经受住如下质疑——“你是否仍然坚持这一制度如果你无法确定自己是制度的受益者还是承受者”这不是一个逻辑推导装置——它不输出确定的命题。这是一个异议程序所有不能通过这个检验的制度设计都是有问题的——不是因为它们违反了某种先验的“绝对律令”而是因为它们无法通过一个最基本的公平性对话。无知之幕在这里的定位与主文“伦理中间件”的逻辑形成了一个呼应它不是为了终极裁决而存在而是为了开启协商。5.2 与互惠律的理论距离我们回到主文提出的核心问题将无知之幕归入互惠律是一种“窄化”吗答案是严格来说“是”但这种窄化并非没有道理。窄化之处互惠律处理的是对称情境中的对等交换“我对你怎样你也应该对我怎样”。无知之幕超越了对等交换——差别原则允许不平等只要这种不平等对最差者有利。一个清洁工在教育子女时享受到的优质医疗服务并不是对医生高收入的“对等回报”而是罗尔斯所设计的系统补偿机制。有道理之处两者的可逆性结构——从“如果我处于他的位置”扩展到“如果我处于所有可能的位置”——确实描述了一个从具体到普遍的升华阶梯。而且在主文的“伦理中间件”框架中无知之幕更适合被理解为互惠律与公正律之间的一个理论装置一方面它分享了互惠律的“角色互换”逻辑所以我将它放在互惠律章另一方面它导向的不是个案的调解而是制度的公正性评估。一种更准确的定位或许是无知之幕是连接交互伦理互惠律与制度伦理公正律的一座理论桥梁。它在互惠律章被介绍但在公正律章被以其完整的理论重量进行阐释。这个安排主文已经做了——将公正律列表置于宽恕律之后而在互惠律结尾用了“无知之幕”的案例。5.3 局限它不能做什么在将无知之幕融入“伦理中间件”之前我们需要对其局限保持清醒。局限一无知之幕不能解决价值维度的冲突。当两个社会都通过无知之幕检验但却给出不同的正义原则时无知之幕本身无法裁定谁对谁错——这正是伯林“价值多元论”所指出的问题。局限二无知之幕不是决策执行工具。它是一个制度设计层面的“前置检验”机制而不是一个现场调解工具。在无知之幕后达成协议是一回事在实际生活中执行那是另一回事。局限三无知之幕预设了某种参与者的“理性能力”。实践中决策者并非总是理性的——认知偏见如“乐观偏差”、群体动力多数人的暴政和信息不对称都会影响无知之幕的运作效果。这是为什么罗尔斯强调“反思平衡”reflective equilibrium——无知之幕不是万能的个人判断与普遍原则之间的持续调试是不可避免的。局限四无知之幕无法处理“在交互中动态生成的规范”。罗尔斯的原初状态是一次性的设计协议而主文“沉积规则”中的规范是在重复交互中沉淀出来的。无知之幕更适合回答“第一次如何设计”而“交互痕迹论”更适合回答“如何在交互中不断修正”。5.4 空白金兰契的延伸主文第五章提出的“空白金兰契”要求留出“未知的未知”的空间。将无知之幕放入这个框架我们发现它其实已经隐含了一层对这种不确定性的承认无知之幕屏蔽的之所以是具体事实而非“所有知识”正是因为它承认我们并不知道所有可能影响公正判断的因素。如果未来技术如脑机接口、超人类主义创造出全新的社会分层形式今天的无知之幕设置将需要被重新检讨。真正的无知之幕应该是后设的——它不仅要求你不知道你是“谁”还要求你不知道“你会变成什么”。在这个意义上无知之幕并非一份封闭的契约而是一个动态调校的程序起点——正如空白金兰契所提示的我们不仅要为未知的结果留出空间更应为未知的交互形态本身留出变革的缝隙。结语无知之幕是一个悖论式的装置为了抵达正义我们必须披上无知。它不是要返回一种原始的无知状态而是要主动屏蔽那些在道德上不相关信息——我们与他人之间的运气差异、天赋的不平等、阶级的区隔。在主文的“伦理中间件”框架中无知之幕获得了一个新位置它不再是罗尔斯理论体系中的“原初状态”而是一个可插拔的公平性检验模块。当互惠律的角色互换测试不够用时当更复杂的制度设计问题浮出水面时无知之幕可以被调用——不是因为它比互惠律更“优越”而是因为两者的适用域不同。罗尔斯的《正义论》出版于1971年。半个多世纪后无知之幕不仅没有被遗忘反而在AI伦理、全球分配正义和跨代责任等新领域被重新激活。这或许是因为它回应了一个人类永恒的深层心理结构我们都渴望一个公正的社会但我们都知道如果我们在设计制度时知道自己的特殊位置我们的判断会不可避免地受到偏见蒙蔽。无知之幕的真正力量不在于它的任何具体结论而在于它的结构本身——它迫使一种特殊的反思选择一种明知对自己无知的视角然后才能看见所有人。在实践中敬畏空白参考文献[1] Rawls, J. (1971). A Theory of Justice. Harvard University Press.[2] Rawls, J. (1996). Political Liberalism. Columbia University Press.[3] Weidinger, L., McKee, K. R., Everett, R., et al. (2023). Using the Veil of Ignorance to align AI systems with principles of justice. Proceedings of the National Academy of Sciences, 120(18).[4] Okin, S. M. (1994). Gender Inequality and Cultural Differences. Political Theory, 22(1), 5–24.[5] Hertwig, R., Herzog, S. M., Kozyreva, A. (2024). Blinding to Circumvent Human Biases: Deliberate Ignorance in Humans, Institutions, and Machines. Perspectives on Psychological Science.[6] 杨伟清. (2023). 重思罗尔斯的无知之幕. 伦理学研究.[7] Sandel, M. (1982). Liberalism and the Limits of Justice. Cambridge University Press.