区块链为机器而建,却不为智能体而设计。
撰文:Zack Pokorny
编译:Chopper,Foresight News
AI 智能体在区块链上的落地并不顺利,区块链虽然具有可编程、无许可特性,却缺乏适配智能体的语义抽象与协同层。加密研究机构 Galaxy 发布研究报告指出,智能体在链上面临机会发现、可信验证、数据读取与执行流程四大结构性摩擦,现有基础设施仍围绕人类交互设计,难以支撑 AI 自主管理资产、执行策略,这些成为智能体在区块链上规模化落地的核心瓶颈。以下为报告全文编译:
AI 智能体的应用场景与能力已开始进化。它们开始自主执行任务,并且被开发用于持有和配置资本、发掘交易与收益策略。尽管这一实验性转变仍处于极早期阶段,但这与以往智能体主要作为社交和分析工具的发展模式已截然不同。
区块链正成为这一进化过程天然的试验场。区块链无需许可、可组合、拥有开源应用生态、向所有参与者平等开放数据,并且链上所有资产默认可编程。
这便引出了一个结构性问题:如果区块链是可编程且无需许可的,那么自主代理为何还会面临摩擦?答案不在于执行是否可行,而在于执行之上究竟有多少语义和协调负担。区块链保证状态转换的正确性,但通常不提供协议原生的抽象,例如用于经济解释、规范身份或目标层面的协调。
部分摩擦源于无需许可系统的架构缺陷,部分则反映了当前工具、内容管理和市场基础设施的现状。实际上,许多上层功能仍然依赖于软件和工作流程,而这些软件和工作流程的构建需要人工操作的参与。
区块链架构与 AI 智能体
区块链的设计围绕共识和确定性执行展开,而非语义解释。它对外暴露的是存储槽、事件日志、调用轨迹等底层原语,而非标准化的经济对象。因此,头寸、收益率、健康系数、流动性深度等抽象概念,通常需要由索引器、数据分析层、前端界面与应用程序接口在链下重构,将各协议特有的状态转化为更易用的形式。
许多主流的去中心化金融操作流程,尤其是面向散户与主观决策类的流程,仍然围绕用户通过前端界面交互并对单笔交易进行签名的模式展开。这种以用户界面为中心的模式随着散户的普及实现了扩张,即便链上相当一部分活动已由机器驱动。当前主流的散户交互模式依然是:意图 → 用户界面 → 交易 → 确认。程序化操作遵循另一种路径,但同样存在自身限制:开发者在构建阶段选定合约与资产集合,随后在这一固定范围内运行算法。这两种模型都无法适应那些必须在运行时根据不断变化的目标动态发现、评估并组合操作的系统。
当一套专为交易验证优化的基础设施,被需要同时解读经济状态、评估信用、围绕明确目标优化行为的系统使用时,摩擦便开始显现。这类差距一部分源于区块链无需许可、异构化的设计特点,另一部分则源于交互工具仍围绕人工审核与前端中介构建。
智能体行为流程与传统算法策略的对比
在探讨区块链基础设施与智能体系统之间的差距之前,有必要先明确:更具智能自主性的行为流程,与传统的链上算法系统究竟有何区别。
二者的差异并不在于自动化程度、复杂程度、参数化设置,甚至也不在于动态自适应能力。传统算法系统可以实现高度参数化,能够自动发现新合约与新代币,在多种策略类型间分配资金,并根据表现进行再平衡。真正的区别在于,系统能否处理构建阶段未曾预见的场景。
传统算法系统无论多么复杂,都只会针对预设的模式执行预设逻辑。它们需要为每一类协议配备预定义的接口解析器、将合约状态映射为经济含义的预定义评估逻辑、明确的信用与标准性判断规则,以及为每一个决策分支设置硬编码规则。当出现不符合预设模式的情况时,系统要么跳过,要么直接失效。它无法对陌生场景进行推理,只能判断当前场景是否匹配已知模板。
就像这只 「消化鸭」 机械自动装置,能够模仿生物行为,但所有动作都是预先编写好的
一台扫描 DeFi 借贷市场的传统算法,可以识别出发出熟悉事件或匹配已知工厂模式的新部署合约。但如果出现一款接口陌生的新型借贷基础组件,系统便无法对其进行评估。必须由人类检查合约、理解其运行机制、判断其是否属于可挖掘机会,并编写集成逻辑。在此之后,算法才能与之交互。人类负责解读,算法负责执行。基于基础模型的智能体系统改变了这一边界。它们可以通过习得的推理能力实现:
- 解读模糊或表述不完整的目标。诸如 「最大化收益但规避过高风险」 的指令,需要进行语义解读。怎样算过高风险?收益与风险应如何权衡?传统算法需要提前对这些条件做出精确定义。而智能体则能够解读意图、做出判断,并根据反馈优化自身的理解。
- 能够泛化适配陌生接口。智能体可以阅读陌生的合约代码、解析文档,或查看从未接触过的应用程序二进制接口,并推断该系统的经济功能。它无需为每一类协议预先搭建解析器。尽管目前这一能力尚不完善,智能体可能会误判所见内容,但它能够尝试与构建阶段未曾预见的系统进行交互。
- 在信任和规范性存在不确定性的情况下进行推理。当信用信号模糊或不完整时,基础模型可以概率化地权衡信号,而非简单套用二元规则。这款智能合约是否具备标准性?从现有证据判断,该代币是否合法?传统算法要么有规则可循,要么无计可施;而智能体可以对置信度进行推理。
- 解释错误并进行调整。当意外情况发生时,智能体可以推理问题根源,并决定应对方式。相比之下,传统算法只会执行异常捕获模块,仅转发异常信息,不做解读。
这些能力目前真实存在但并不完美。基础模型会产生幻觉、误判内容,并做出看似笃定的错误决策。在对抗性且涉及资本的环境中(即代码可控制或接收资产),「尝试与未预见的系统交互」 可能意味着资金损失。本文的核心观点并非智能体如今已能可靠执行这些功能,而是它们能够以传统系统无法实现的方式进行尝试,且未来的基础设施可以让这些尝试更安全、更可靠。
这一差异更应被视作一个连续状态,而非绝对的分类界限。部分传统系统会融入习得推理的形式,部分智能体也可能在关键路径上依赖硬编码规则。这种区别是方向性的,而非绝对二元的。智能体系统将更多的解读、评估与自适应工作转移到运行时推理中,而非构建阶段的预设规则。这一点对于摩擦问题的论述至关重要,因为智能体系统尝试实现的,是传统算法完全回避的事情。传统算法通过让人类在构建阶段筛选合约集合,规避了发现摩擦;依靠运营者维护的白名单,规避了控制层摩擦;使用为已知协议预先搭建的解析器,规避了数据摩擦;在预设的安全边界内运行,规避了执行摩擦。人类提前完成语义、信用与策略层面的工作,算法则在划定范围内执行。早期的链上智能体行为流程或许会沿用这一模式,但智能体的核心价值在于将发现、信用与策略评估转移到运行时推理,而非构建阶段的预设。
它们会尝试发现并评估陌生机会,在无硬编码规则的情况下推理标准性,在无预设解析器的情况下解读异构状态,并针对可能模糊的目标执行策略约束。摩擦的存在,并非因为智能体在做与算法相同的事情却难度更高,而是因为它们在尝试截然不同的事情:在开放、动态解读的行为空间中运行,而非封闭、预先集成的体系内运作。
摩擦
从结构层面来看,这种矛盾并非源于区块链共识的缺陷,而是围绕其发展起来的整体交互栈的运行方式所致。
区块链保证确定性的状态转换、对最终状态的共识,以及最终确定性。它不会尝试在协议层编码经济含义解读、意图验证或目标追踪。这些职责历来由前端界面、钱包、索引器及其他链下协同层承担,其中始终需要人为干预。
即便是资深参与者,当前主流的交互模式也体现了这一设计。散户通过仪表盘解读状态,通过用户界面选择操作,通过钱包签署交易,并非正式地验证结果。算法交易机构实现了执行自动化,但仍依赖人类操作者筛选协议集合、核查异常情况,并在接口变更时更新集成逻辑。两种场景下,协议仅负责保证执行正确性,而意图解读、异常处理与新机会适配均由人类完成。
智能体系统压缩甚至消除了这一分工。它们必须程序化地重构具备经济意义的状态,评估目标推进情况,并验证执行结果,而非仅确认交易上链。在区块链上,这些负担尤为突出,因为智能体运行在开放、对抗性且快速变化的环境中,新合约、资产与执行路径可在无中心化审核的情况下出现。协议仅保证交易正确执行,不保证经济状态易于解读、合约具备标准性、执行路径符合用户意图,或相关机会可被程序化发现。
下文将沿着智能体运行循环的各个阶段,逐一梳理此类摩擦:发现现有合约与机会、验证其合法性、获取具备经济意义的状态,以及围绕目标执行操作。
发现摩擦
摩擦的产生,是因为去中心化金融的行为空间在无需许可的环境中开放扩张,而相关性与合法性则由人类通过链上的社交、市场与工具层进行筛选。新协议通过公告涌现,同时也会经过前端集成、代币列表、数据分析平台与流动性形成等筛选层过滤。久而久之,这些信号往往会形成一个可行的判断标准,用以区分行为空间中哪些部分具备经济价值、足够可信,尽管这种共识可能是非正式、不均衡的,且部分依赖第三方与人工筛选。
可以为智能体提供经过筛选的数据与信用信号,但它们本身并不具备人类解读这些信号时所用的直觉捷径。从链上视角来看,所有已部署的合约都具有同等的可发现性。合法协议、恶意分叉、测试部署与废弃项目,均以可调用字节码的形式存在。区块链本身不会编码哪些合约重要、哪些安全。
因此,智能体必须构建自身的发现机制:扫描部署事件、识别接口模式、跟踪工厂合约(即可程序化部署其他合约的合约),并监控流动性形成情况,以确定哪些合约应纳入决策范围。这一过程不仅是寻找合约,更是判断其是否应进入智能体的行为空间。
识别出候选对象只是第一步。合约通过初步发现筛选后,还需经过下一节所述的标准性与真实性验证流程。智能体必须先确认所发现的合约名副其实,才能将其纳入决策空间。
发现摩擦并非指检测新部署行为。成熟的算法系统已能在自身策略范围内实现这一点。监控 Uniswap 工厂事件并自动纳入新资金池的搜索者,就是在执行动态发现。摩擦出现在两个更高层面:判断所发现合约是否合法,以及判断其是否与开放式目标相关,而非仅匹配预设策略类型。
搜索者的发现逻辑与其策略紧密绑定。它知道要寻找何种接口模式,因为策略已做出定义。而执行 「配置风险调整后最优机会」 这类更宽泛指令的智能体,无法仅依赖源自策略的筛选器。它必须对照目标本身评估新遇到的机会,这就需要解析陌生接口、推断经济功能,并判断该机会是否应纳入决策空间。这在一定程度上是通用自主性问题,但区块链加剧了这一问题。
控制层摩擦
控制层摩擦的产生,是因为身份与合法性的判定通常在协议之外完成,综合依靠筛选、治理、文档、接口与操作者判断。在当前许多工作流程中,人类仍是判定环节的重要部分。区块链保证确定性执行与最终确定性,但不保证调用者正在与目标合约交互。这种意图判定被外化到社交语境、网站与人工筛选中。
在当前流程中,人类将网页的信用层作为非正式验证手段。他们访问官方域名(通常通过 DeFiLlama 等聚合平台或项目认证社交账号找到),并将该网站视为人类概念与合约地址之间的标准映射载体。随后,前端界面会形成一套可行的可信基准,明确哪些地址为官方地址、应使用哪种代币标识,以及哪些入口是安全的。
1789 年的机械土耳其人是一款下棋机器,表面上看起来自主运行,但实际上依靠一名隐藏的人工操作员
智能体默认无法通过社交语境解读品牌标识、认证社交信号或 「官方性」。可以为其输入源自这些信号的筛选后数据,但要将其转化为持久可用的机器信用假设,需要明确的注册表、策略或验证逻辑。可以为智能体配置运营者提供的筛选白名单、认证地址与信用策略。问题并非完全无法获取社交语境,而是在动态扩张的行为空间中维护这些防护措施操作成本极高,且当这些措施缺失或不完善时,智能体缺乏人类默认使用的备用验证机制。
链上智能体驱动系统已出现信用判定薄弱带来的实际后果。网红加密货币博主 Orangie 的案例中,有智能体据称将资金存入了蜜罐合约。另一案例中,名为 Lobstar Wilde 的智能体因状态或上下文故障误判地址状态,将大额代币余额转给了线上 「乞讨者」。这些案例并非核心论据,但足以说明信用判定、状态解读与执行策略失误会如何直接导致资金损失。
问题不在于合约难以发现,而在于区块链通常没有原生的 「这是某应用的官方合约」 概念。这种缺失一定程度上是无需许可系统的特性,而非设计疏漏,但仍给自主系统带来协同难题。这一问题部分源于标准身份标识薄弱的开放系统架构,部分则源于注册表、标准与信用分发机制尚不成熟。尝试与 Aave v3 交互的智能体,必须判定哪些地址是标准地址),以及这些地址是否不可更改、是可通过代理升级,或当前处于治理变更待定状态。
人类通过文档、前端界面与社交媒体解决这一问题。智能体则必须通过核查以下内容判定:
- 代理模式与实现要点
- 管理权限与时间锁
- 治理控制的参数更新模块
- 已知部署间的字节码 / 应用二进制接口匹配
在缺乏标准注册表的情况下,「官方性」 成为一个推理问题。这意味着智能体不能将合约地址视为静态配置。它们要么维护持续验证的筛选白名单,要么在运行时通过代理检查与治理监控重新推导标准性,要么承担与废弃、受损或仿冒合约交互的风险。在传统软件与市场基础设施中,服务身份通常由机构维护的命名空间、凭证与访问控制锚定。相比之下,在链上,一款合约可被调用、可正常运行,但从调用者角度看,其在经济或业务层面不具备标准性。
代币真实性和元数据是同一个问题。代币看似能自我描述。但代币元数据并不具备权威性,只是代码返回的字节数据。典型案例是封装以太坊(WETH)。广泛使用的 WETH 合约代码中明确定义了名称、符号和精度。
这看似是身份标识,实则不然。任何合约都可以设置:
- symbol() = WETH
- decimals() = 18
- name() = Wrapped Ether
并实现相同的 ERC-20 代币标准接口。name ()、symbol () 与 decimals () 只是公开的只读函数,返回部署者设定的任意内容。事实上,以太坊上有近 200 种代币名称为 「Wrapped Ether」、符号为 「WETH」、精度为 18 位。不查阅 CoinGecko 或 Etherscan,你能分辨哪个 「WETH」 是标准版本吗?
智能体面临的就是这样的处境。区块链不核查唯一性,不对照任何注册表验证,也不做任何限制。你今天可以部署 500 个合约,全部返回完全相同的元数据。链上存在一些试探性判定方法(例如核查以太坊余额与总供应量是否匹配、查询主流去中心化交易所的流动性深度、验证其是否作为借贷协议抵押品),但均无法提供绝对证明。每种方法要么依赖阈值假设,要么递归依赖其他合约的标准性验证。
就像在迷宫中寻找 「真正」 的路径需要外部指引,链上没有原生的标准信号
这就是代币列表与注册表作为链下筛选层存在的原因。它们为 「WETH」 这一概念映射到具体地址提供了一种方式,这也是钱包与前端界面维护白名单或依赖可信聚合平台的原因。对智能体而言,核心问题不仅在于元数据可信度低,更在于标准身份通常由社交或机构层面确立,而非协议原生。可靠的链上标识符是合约地址,然而将 「兑换为 USDC」 这类人类意图映射到正确地址,仍高度依赖非协议原生的筛选、注册表、白名单或其他信用层。
数据摩擦
在去中心化金融各协议间优化配置的智能体,需要将每一个机会标准化为经济对象:收益率、流动性深度、风险参数、费率结构、预言机来源等。从某种角度来说,这是常见的系统集成问题。然而在区块链上,协议异构性、直接资本敞口、多调用状态拼接,以及底层缺乏统一的经济模式,进一步加重了这一负担。而这些正是比较机会、模拟分配和监控风险所必需的基本要素。
区块链通常不会在协议层暴露标准化的经济对象。它暴露存储槽、事件日志与函数输出,经济对象需从中推断或重构。协议仅保证合约调用返回正确的状态数值,不保证该数值能清晰映射为可读的经济概念,也不保证可以通过跨协议的一致接口检索到相同的经济概念。
因此,市场、头寸、健康系数等抽象概念并非协议原语。它们由索引器、数据分析平台、前端界面与应用程序接口在链下重构,将异构的协议状态转化为可用抽象。人类用户通常只看到这一标准化后的层级。智能体也可以使用这一层级,但会随之继承第三方模式、延迟与信用假设;否则,就必须自行重构这些抽象。
这一问题在各类协议中愈发突出。金库的份额价格、借贷市场的抵押率、去中心化交易所资金池的流动性深度、质押合约的奖励率,均为具备经济意义的基础组件,但均无标准化接口暴露。每一类协议都有各自的获取方式、结构布局与单位惯例。即便在同一类别中,实现方式也存在差异。
借贷市场:检索碎片化的典型案例
借贷市场清晰体现了这一问题。其经济概念通用且大致统一,例如供给与借贷流动性、利率、抵押率、额度上限与清算阈值,但获取路径却各不相同。
在 Aave v3 中,市场枚举与储备状态获取是两个独立步骤。典型流程如下:
通过以下方式列举储备资产,返回代币地址数组。
针对每种资产,通过另一代码片段获取流动性与利率基础数据,
该方法通过一次调用返回一个包含流动性总量、利率指数和配置标志的结构体,例如:
相比之下,Compound v3 中每个部署对应单一市场(USDC、USDT、ETH 等),且无统一的储备结构体。相反,需通过多次函数调用拼接市场快照:
- 基础利用率
- 总量
- 利率
- 抵押资产配置
- 全局配置参数
每次调用仅返回经济状态的不同子集。「市场」 并非一级对象,而是由调用者拼接而成的推断结构。
从智能体角度看,两款协议均为借贷市场;但从集成角度看,二者是结构完全不同的获取系统。不存在统一的共享模式。相反,智能体必须针对不同协议采用不同的资产枚举方式,通过多次调用拼接状态。
碎片化带来延迟与一致性风险
除结构不一致外,这种碎片化还会引入延迟与一致性风险。由于经济状态并非以单一原子化市场对象暴露,智能体必须通过多次远程过程调用跨多个合约重构快照。每多一次调用,延迟、限流风险与区块不一致概率都会增加。在波动环境中,当供给利率计算完成时,利率可能已发生变化;若不明确锁定区块,配置参数可能与流动性总量对应不同区块高度。用户依赖于 UI 缓存层和聚合后端来间接缓解这些问题。直接操作原始 RPC 接口的代理必须显式地管理同步、批处理和时间一致性。因此,非标准化的检索不仅会造成集成上的不便,还会限制性能、同步和正确性。
由于缺乏规范的经济数据检索方案,即使协议实现了几乎相同的金融原语,其状态暴露也取决于合约的具体情况和组成方式。这种结构性差异是数据摩擦的核心组成部分。
潜在数据流不匹配
区块链上的经济状态访问本质上是拉取模式,即便执行信号可流式传输。外部系统向节点查询所需状态,而非接收持续、结构化的更新。这一模式反映了区块链的核心功能,按需验证,而非维持应用级别的持续状态视图。
推送式原语是存在的。WebSocket 订阅可实时流式传输新区块与事件日志,但这些不包含承载大部分经济意义的存储状态,除非协议明确选择冗余发布。智能体无法直接通过链上订阅借贷市场利用率、资金池储备或头寸健康系数。这些数值存储在合约存储中,且大多数协议未提供原生机制向下游使用者推送这些信息。当前最优的模式是订阅新区块头,并在每个区块重新查询。日志仅能提示状态可能发生变化,但不编码最终经济状态;重构该状态仍需显式读取与历史状态访问。
智能体系统或许能从反向流程中受益。智能体无需轮询数百个合约的状态变化,而是可接收结构化、预计算的状态更新,直接推送至运行环境。推送式架构可减少冗余查询,降低状态变化与智能体感知间的延迟,并允许中间层将状态打包为语义明确的更新,而非让智能体从原始存储中解读含义。
这种反向转变并非易事。它需要订阅基础设施、筛选相关性的逻辑,以及将存储变动转化为智能体可执行经济事件的模式。但随着智能体成为持续性参与者,而非间歇性查询者,拉取模式的低效性成本愈发高昂。将智能体视为持续消费者而非间歇性客户端的基础设施,或许更贴合自主系统的运行方式。
推送式基础设施是否真的更优仍是一个悬而未决的问题。海量的状态变更会造成过滤难题,代理仍然需要判断哪些变更相关,这在另一个层面上重新引入了拉取式语义。关键不在于拉取式架构本身有什么问题,而在于当前的架构设计并未考虑到持久化的机器消费者,随着智能体使用规模的扩大,或许值得探索其他替代模型。
执行摩擦
执行摩擦的产生,是因为当前许多交互层将意图转换、交易审核与结果验证,打包进围绕前端界面、钱包与运营者监督设计的工作流程。在散户与主观决策场景中,这种监督通常由人类完成。对自主系统而言,这些功能必须被形式化并直接编码。区块链根据合约逻辑保证确定性执行,但不保证交易符合用户意图、遵守风险约束或实现预期经济结果。在当前流程中,用户界面与人类填补了这一缺口。
用户界面组合操作序列(兑换、授权、存入、借贷),钱包提供最终 「审核并发送」 节点,用户或运营者通常在最后一步非正式地做出策略判断。他们往往在信息不完整的情况下,判断交易是否安全、报价结果是否可接受。若交易失败或出现意外结果,用户会重试、调整滑点、更改路径或直接放弃操作。智能体系统将人类从这一执行循环中移除。这意味着系统必须用机器原生方式替代三项人类功能:
- 意图整合。诸如 「将我的稳定币转入风险调整后最优收益场所」 的人类目标,必须整合为具体行动计划:选择哪款协议、哪个市场、哪条代币路径、多大规模、哪些授权,以及执行顺序。对人类而言,这一过程通过用户界面隐性完成;对智能体而言,则必须形式化实现。
- 策略执行。点击 「发送交易」 不仅是签名,更是隐性检查交易是否符合约束条件:滑点容忍度、杠杆上限、最低健康系数、白名单合约,或 「禁止可升级合约」。智能体需要将明确的策略约束编码为机器可校验规则:
- 执行系统必须验证所提出的调用图是否满足这些规则才能进行广播。
- 结果验证。交易上链并不等于任务完成。交易执行成功仍可能未达成目标:滑点可能超出容忍范围、因额度限制未达到目标头寸规模,或利率在模拟与上链之间发生变动。人类通过事后查看用户界面非正式验证。智能体则必须程序化评估后置条件。
这就引入了对完成检查的要求,而不仅仅是简单的事务包含。以意图为中心的架构可以通过将「如何」执行的更多负担从智能体转移到专门的求解器,来部分解决这个问题。通过广播已签名的意图而不是原始调用数据,智能体可以指定基于结果的约束,求解器或协议级机制必须满足这些约束才能使执行可接受。
多步骤工作流程与故障模式
去中心化金融的大部分执行操作本质上是多步骤的。一笔收益配置可能需要完成授权 → 兑换 → 存入 → 借贷 → 质押。部分步骤可能为独立交易,其他步骤则可通过多调用或路由合约打包。人类可容忍部分完成,返回用户界面继续流程。智能体则需要确定性流程编排:若任意步骤失败,智能体必须决定重试、重路由、回退或暂停。
这催生了人类流程中大多被掩盖的新型故障模式:
- 决策与上链之间的状态漂移。模拟与执行之间,利率、利用率或流动性可能发生变化。人类接受这种可变性;智能体则必须设定可接受范围并强制执行。
- 非原子执行与部分成交。部分操作可能跨多笔交易执行,或产生部分结果。智能体必须跟踪中间状态,并确认最终状态符合目标。
- 授权额度与审批风险。人类通过用户界面下意识签署授权;智能体则必须将授权范围(额度、使用者、期限)作为安全策略的一部分推理,而非仅视为用户界面步骤。
- 路径选择与隐性执行成本。人类依赖路由合约与用户界面默认设置。智能体必须将滑点、最大可提取价值风险、gas 成本与价格影响纳入目标函数。
执行:机器原生控制问题
执行摩擦的核心论点是,去中心化金融的交互层以人类钱包签名作为最终控制平面。这一环节承载了当前的意图验证、风险容忍与非正式的「是否合理」 判断。移除人类后,执行成为一个控制问题:智能体必须将目标转化为行为模式,自动执行策略约束,并在不确定性下验证结果。这一挑战存在于许多自主系统中,但区块链环境尤为严苛:执行直接涉及资本、可组合陌生合约,且暴露于对抗性状态变化。人类凭借启发式方法做出决策,并通过试错纠正错误。智能体则必须以机器速度程序化完成相同工作,且通常在动态变化的行为空间中。因此,「智能体只需提交交易」 的说法,低估了难度。提交交易是最简单的部分。
结论
区块链的设计初衷并非原生提供智能体所需的语义与协同层。它的设计目标,是在对抗性环境中保证确定性执行与状态转换共识。建立在这一基础之上的交互层,围绕人类用户通过界面解读状态、通过前端界面选择操作、通过人工审核验证结果的模式演进。
智能体系统颠覆了这一架构。它们将人类解读员、审批者与验证者从循环中移除,要求这些功能转为机器原生实现。这一转变在四个维度暴露了结构性摩擦:发现、信用判定、数据获取与执行流程。这些摩擦的产生,并非因为执行不可行,而是因为围绕区块链的基础设施在多数情况下仍假设,在状态解读与交易提交之间存在人类参与。
弥合这些缺口,大概率需要在多层技术栈中搭建新型基础设施:将跨协议经济状态归一化为机器可读的中间件;头寸、健康系数、机会集合等语义原语的索引服务或远程调用扩展;提供标准合约映射与代币真实性验证的注册表;以及编码策略约束、处理多步骤工作流程、程序化验证目标完成的执行框架。部分缺口源于无需许可系统的结构特性:开放部署、标准身份薄弱、接口异构。另一部分则取决于当前工具、标准与激励设计,随着智能体使用规模扩大、协议竞相优化对自主系统的集成友好度,这些缺口有望收窄。
随着自主系统开始管理资本、执行策略并直接与链上应用交互,当前交互层的架构假设将愈发凸显。本文所述的大部分摩擦,反映了区块链工具与交互模式围绕人类中介工作流演进的特点;部分摩擦则源于无需许可系统的开放性、异构性与对抗性环境;还有一部分是复杂环境下自主系统普遍面临的问题。
核心挑战并非让智能体签署交易,而是为其提供可靠途径,完成当前在区块链状态与操作行为之间,由软件与人类判断共同承担的语义解读、信用判定与策略执行工作。