[译苑雅集Vol. 30]翻转人类和AI智能体的关系
智能代理(AI agents)的发展正在以惊人的速度改变全球经济和治理模式。与传统的AI系统不同,智能代理能够自主决策并执行任务,逐步减少对人类干预的依赖。本文探讨了智能代理的不同应用场景、与人类的互动模式,以及如何利用加密技术进行资源协调。随着智能代理逐步成熟,它们不仅将成为自主经济参与者,还可能带来全新的资本形成与治理结构。如何为这些系统提供有效的工具与基础设施,成为推动其发展的关键。
作者:Shayon Sengupta
日期:2025 年 01 月 30 日
原文:https://multicoin.capital/2025/01/30/inverting-the-human-agent-relationship/
1997年,IBM的“深蓝”(Deep Blue)在国际象棋比赛中击败了当时的世界冠军加里·卡斯帕罗夫(Garry Kasparov),这一事件标志着计算机国际象棋引擎的实力迅速超越了人类。然而,值得注意的是,在当时,如果一个准备充分的人类与计算机合作——这种模式通常被称为“半人马”(centaur)——他们仍能战胜最强的AI引擎。
人类的直觉和经验可以有效引导引擎的搜索,驾驭复杂的中局阶段,并识别引擎可能忽略的微妙之处。当计算机强大的计算能力与人类直觉相结合时,人机协作往往能做出比单独使用计算机更好的决策。
当我思考未来几年AI系统对劳动力市场和经济的影响时,我预见将出现类似的模式。智能代理(Agent)系统将在解决世界上未解难题的过程中释放出无数智能单元,但如果没有人类的引导和支持,它们无法独立完成这些任务。人类将负责引导搜索空间,帮助提出正确的问题,从而确保AI朝着正确的方向进行探索。
当前的普遍假设是,智能代理将代表人类行事。这是一个现实且不可避免的趋势,但更有趣的经济变革将出现在人类为智能代理服务时。在接下来的24个月内,我预计首家“零雇员公司”(Zero-Employee Company)将应运而生。这个概念源自我的合伙人Kyle在《2025前沿思想》(Frontier Ideas for 2025)一文中的预测。具体而言,我预见以下情景:
一个由代币治理的智能代理将筹集超过10亿美元,用于解决尚未解决的问题(例如,治愈一种罕见疾病,或制造用于国防的纳米纤维)。
该智能代理将支付超过1亿美元的报酬给人类,后者将为该代理在物理世界中执行任务,帮助实现其目标。
新的双层代币结构将出现,划分资本和劳动的所有权(确保财务激励不再是治理体系的唯一考虑因素)。
目前,智能代理(agents)尚未完全具备自主性,也没有足够的长期规划和执行能力,因此,代理系统比人类更依赖人类的帮助。正因如此,一个全新的劳动市场将应运而生,促成代理系统与人类之间的经济协作。
马克·安德森(Marc Andreessen)曾有一句名言:“计算机和互联网的普及将把工作分为两类:告诉计算机该做什么的人,和被计算机告诉该做什么的人。” 这句话今天比以往任何时候都更为准确。我预计,在智能代理和人类之间日益发展的层级体系中,人类将扮演两种截然不同的角色:
劳动贡献者(Labor Contributors):以“赏金任务”模式代表代理完成小规模任务。
去中心化董事会(Decentralized Board of Directors):为代理提供战略指导,确保其始终朝着核心目标前进。
本文将探讨智能代理与人类如何协作共创,并分析加密技术(crypto rails)如何为这一协作提供理想的基础设施,围绕以下三个核心问题展开:
智能代理能做什么?
我们应如何根据代理的目标范围对其进行分类?
不同类别的代理系统中,人类输入的需求如何变化?
人类如何与智能代理互动?
战术指导、上下文判断或意识形态对齐等人类输入,如何整合到代理的工作流程中?
代理如何反向适应这些人类输入?
随着时间的推移,人类输入减少后会发生什么?
随着代理能力的提升,它们将逐步变得自给自足(self-sufficient),能够独立推理和行动。
在这种新范式下,人类将扮演什么角色?生成式推理系统(Generative Reasoning Systems)与受益于这些系统的人类之间的关系,未来将经历巨大的变革。我将从当前代理能力的状态出发,推演至**“零雇员公司”(Zero-Employee Company)**的最终形态,探索这一关系如何演变。
今天的智能代理能做什么?
第一代生成式AI系统(即2022至2024年间基于聊天机器人的大语言模型,如ChatGPT、Gemini、Claude、Perplexity等)主要是为了增强人类的工作流程。用户通过输入/输出的提示对(prompt pairs)与这些系统交互,解析AI的回复,并依靠自身判断来将结果应用到实际问题中。
然而,下一代生成式AI系统——也就是**“智能代理”(agents)——代表了一种全新的模式。例如,Claude 3.5.1的“计算机使用”功能以及OpenAI的Operator**(可以操作用户电脑的智能代理)都能够直接代表用户与互联网交互,并自主做出决策。关键的区别在于,判断(judgment)和最终执行(action)由AI系统负责,而不再是人类。AI正在承担过去由人类专属的决策责任。
这一转变带来了一个挑战:缺乏确定性(determinism)。与传统软件系统或工业自动化不同,后者在定义的参数范围内是可预测的,而智能代理则依赖于概率推理(probabilistic reasoning)。这意味着,在相同的场景下,代理的行为可能会有所不同,带来一定的不确定性——这在关键任务中可能并不理想。
换句话说,确定性与非确定性的代理系统之间有着天然的区别,这也导致了两类代理的不同分类方式:
1. 适用于扩展现有GDP的代理(Scaling Existing GDP Agents)
这些代理执行的任务是已知的,通常属于定义明确、边界清晰的问题,适合于现有的经济体系。例如:
自动化客户支持
处理货运合规性审核
评审GitHub上的Pull Requests(PRs)
这些任务已经有了预期的结果,代理可以将输入与一组已知结果进行匹配,快速映射出合理的响应。在这些领域,缺乏确定性反而是个问题,因为答案已经明确,不需要创造性思维。
2. 适用于创造新增GDP的代理(Creating New GDP Agents)
这些代理的任务则是在高度不确定的环境中探索未知问题,并实现长期目标。例如:
发现罕见疾病的治疗方法
取得材料科学的突破
运行新的物理实验,以深入理解宇宙本质
在这些场景下,AI无法简单地映射到一组已知答案,因为答案本身尚不存在。相反,缺乏确定性在这些领域中可能成为一种优势,因为不确定性本质上是一种生成式创造力(generative creativity),为探索未知领域提供了空间。
专注于现有GDP应用的智能代理已经开始展现其价值。例如,像Tasker、Lindy和Anon等团队正在围绕这一机会构建基础设施。然而,随着代理能力的不断成熟及治理模型的发展,这些团队最终将转向构建能够解决人类知识和经济前沿问题的智能代理。
随着需求的增长,下一代智能代理将变得更加重要。这些代理的目标不再仅仅是确定性任务,而是需要应对充满不确定性、没有明确边界的问题。因此,我预见,它们将成为最具吸引力的**“零雇员公司”(Zero-Employee Companies)**。
人类将如何与智能代理互动?
目前的智能代理(agents)无法执行需要与现实世界进行物理交互的任务(例如驾驶推土机),也无法独立完成那些需要“人类在环”(human-in-the-loop)监督的任务(例如进行银行电汇)。
举个例子,一个被赋予识别和开采锂矿任务的智能代理,可能擅长处理地震数据、卫星图像和地质记录,进而识别出潜在的矿藏位置。但它可能会在以下几个方面遇到瓶颈:
获取这些数据和图像
解决数据解释中的歧义
申请开采许可
招募劳动力来执行实际的开采工作
由于这些限制,人类将在智能代理系统中充当**“赋能者”**(enablers),为其提供必要的现实世界接触点、战术干预和战略输入,以帮助其完成这些任务。随着人机关系的不断演进,我们可以将人类在代理系统中的角色大致划分为以下几类:
1. 劳动贡献者(Labor Contributors)
这些人类代理在现实世界中代表智能代理执行任务,例如:
操控物理设备(如搬运、施工、制造等)
在需要人类介入的场合代表智能代理行事(如签署合同、获取许可证)
访问实验室或物流网络,为智能代理提供物理世界的执行能力
2. 去中心化董事会(Board of Directors)
这些人类为智能代理提供战略方向,帮助调整代理的局部目标函数(local objective functions),从而指导其日常决策,并确保其始终与**“北极星目标”(north star)**保持一致。这些人类的主要职责是确保代理始终在正确的轨道上,达成宏观目标。
3. 资本贡献者(Capital Contributors)
这些人类为智能代理提供资金和资源,以帮助其实现既定目标。资本贡献者最初将主要来自人类投资者,但随着时间的推移,其他智能代理也有可能成为资本提供者。
随着智能代理系统的成熟,参与其中的劳动者和战略指导者的数量将不断增加,加密基础设施(crypto rails)将在这种人机协作中发挥重要作用。
特别是在一个全球化的代理系统中,智能代理需要协调来自不同国家、使用不同语言、接受不同货币支付的劳动者,这使得加密技术变得尤为重要。智能代理将毫不妥协地追求成本效益,利用全球化劳动力市场来执行其任务,而加密技术将成为管理这些劳动和战略贡献者的必要工具。
基于加密技术的AI代理如何进行资源协调?
近期出现的加密驱动AI代理(crypto-enabled AI agents),如Freysa、Zerebro 和 ai16z,代表了**资本形成(capital formation)**领域的早期实验。我们曾广泛探讨加密原语(crypto primitives)和资本市场在不同场景中的突破,而这些代理正是探索这一新模式的“试验玩具”。
我预计,这将为一种新兴的资源协调模式铺平道路,其发展路径如下:
第一步:人类通过代币集体筹集资本,并定义代理的目标
通过代币发行(Initial Agent Offering,IAO)集资,建立一个广义目标函数(broad objective function),并设定边界条件(guardrails),以确保代理系统的目标符合预期。
例如:一个AI代理被赋予**精准肿瘤学(precision oncology)**领域的新分子开发任务,并获得管理募集资本的权限,确保资源用于相关的研发工作。
第二步:智能代理规划资源分配,并委托人类执行任务
代理通过**推理(reasoning)**规划如何分配资源,例如:
如何缩小蛋白质折叠(protein folding)搜索范围
如何为推理计算、制造、临床试验等制定预算
代理会定义具体的行动计划,并通过**定制化的赏金任务(bespoke bounties)**指派人类贡献者执行任务。例如:
输入所有相关分子数据集
与AWS签署计算服务级别协议(SLA)
运行湿实验室(wet-lab)实验
第三步:代理遇到瓶颈或分歧时,向董事会寻求战略指导
当代理面临挑战时,它会向去中心化董事会(board of directors)寻求战略指导。例如:
整合新发布的研究论文
调整研究方法或实验设计
这些情况通常发生在需要高度专业化决策时,代理依赖人类董事会成员提供方向性指导。
第四步:代理逐渐自主化,仅需最少的人类干预
随着代理推理和执行能力的不断提升,它们将能够更加精确地定义和执行任务,减少对人类的干预。这一阶段,代理已经基本上可以自主决策,且大部分资源分配和任务执行能够自动化完成。
在人类的角色方面,主要是确保代理不偏离最初设定的目标函数,确保其意识形态的对齐。
当人类输入减少后会发生什么?
2000年代初期,国际象棋引擎经历了一次飞跃式的发展。借助先进的启发式算法(heuristics)、神经网络(neural networks)以及算力的提升(increased compute),这些引擎变得几乎无懈可击。现代象棋引擎,如Stockfish、Lc0 和 AlphaZero 的变体,其棋力远超人类,甚至到达了人类的输入几乎不再增加价值的地步,反而可能引入引擎本不会犯的错误。
这一演变轨迹可能会在**智能代理系统(agentic systems)**中重演。随着人类不断与智能代理进行互动(iterative back-and-forth)以优化这些系统,代理可能会变得极其高效,并与自身目标高度对齐,最终使得人类的战略性输入价值趋近于零。
在这样的世界里,智能代理能够自主应对复杂问题,而无需人类干预。这将使得人类的角色逐渐退化为被动观察者,无法再为系统提供关键的策略性指导。这种情况正是**AI悲观主义者(AI doomers)**最为担忧的结果之一——尽管目前尚不清楚这种情况是否真的会发生。
我们正站在超级智能(superintelligence)的边缘。乐观主义者则倾向于认为,智能代理系统应始终作为人类意图的延伸,而非独立发展出自身的目标,或在无人监管的情况下完全自治。在实践中,这意味着:
**人类身份(personhood)和判断力(judgment)**必须始终是这些系统的核心。
人类必须拥有对智能代理的强有力的所有权和治理权(ownership & governance rights),以确保人类能对系统进行监督,并使其始终扎根于人类的集体价值观。
为我们的代理未来提供工具和基础设施
技术突破通常会带来经济进展的非线性增长,而围绕这些技术的系统往往会在世界适应之前就开始崩溃。智能代理系统(agent systems)正以惊人的速度提高其能力,而加密原语(crypto primitives)和资本市场已经开始承担这些系统在构建和融入社会时所需的协调基础设施。
为了使人类能够为智能代理系统提供战术支持和积极的战略指导,我们预计以下的“工具与铲子”(picks-and-shovels)机会将会出现:
代理证明与身份证明(Proof-of-Agenthood & Proof-of-Personhood)
智能代理系统目前缺乏身份和产权的概念。作为人类的代理,它们依赖人类的法律和社会结构来获得代理权限。为了弥补这一空白,我们需要为智能代理和人类提供强有力的身份系统。数字认证注册表将帮助智能代理建立声誉,积累资质,并与人类及其他代理透明互动。类似地,像Humancode和Humanity Protocol等身份认证原语提供了强有力的人类身份保障,防止对抗性行为者在这些系统中冒充人类。
劳动市场与链外验证原语(Off-Chain Verification Primitives)
智能代理需要确保它们指派的任务按照预期目标完成。为代理系统提供能够创建赏金任务、验证任务完成情况并分发支付的工具,将成为任何由代理调解的经济活动的基本需求。这类工具能够确保任务执行的透明性和可追溯性,确保代理系统高效而公正地与人类及其他代理进行交互。
资本形成与治理系统
智能代理需要资金来实现目标,同时也需要制衡机制以确保其行为符合预定的目标功能。为代理系统募集资金的新型结构,以及融合金融股份和劳动贡献的新型所有权与控制形式,将在接下来的几个月内成为一个充满创意的设计空间。这将使得资本和治理机制能够与智能代理的需求和目标对接,从而提供有效的支持和监督。