AI代理互联互通:当你的数字员工终于学会了“人话”

小编头像

小编

管理员

发布于:2026年04月14日

31 阅读 · 0 评论

作为一个天天跟各种AI工具打交道的科技老炮儿,我最近是真有点绷不住了。不知道你们有没有这种体验——手里装了五六个AI助手,文心一言负责写文案,豆包帮忙查资料,Kimi整理会议纪要,ChatGPT干点别的洋活。平时各干各的倒还好,可一旦需要它们配合着干一件稍微复杂点的事,立马就露怯了。

前两天我就想安排个周末短途游,需求其实贼简单:让一个AI帮我订高铁票,另一个查酒店,再找个本地美食推荐的小助手。结果呢?仨AI各玩各的,订票的不知道我几点到,查酒店的不知道离车站远不远,推荐美食的更绝,直接给我整了个离住宿地二十公里外的“网红店”。我当时就在想,这帮家伙要是能互相通个气,至于让我这么抓狂吗?

这事儿还真不是我一个人遇到。现在圈子里最热的话题,就是这个AI代理互联互通。说白了,就是让不同的AI智能体能像人一样“聊起来”,你负责啥、我干到哪一步了,大家心里都有数。

支付这事儿,AI终于能自己搞定了

先说说最让我兴奋的一个进展。以前让AI帮忙买东西,那叫一个费劲。我去年让某个助手帮我抢演唱会票,它倒是挺积极,早早蹲在页面了,结果最后一步支付的时候卡壳了——它没法替我付钱,非得我自己掏手机扫码。这不脱裤子放屁吗?

Google最近搞了个AP2协议,这玩意儿是真解决痛点了-1-5它是专门给AI代理用的支付语言,让AI能自己完成从比价到付款的全流程。更绝的是它那个“双授权”机制——你要是信任它,可以提前设个价格上限,比如“1000块以下的酒店直接订”,AI就能全自动搞定;要是金额大了,它会把购物车推给你最后瞄一眼-6

这么一来,咱们念叨了好几年的“数字管家”才算真正有了雏形。想象一下,你正开着会呢,手机悄咪咪震一下:“亲,您关注的显卡降到心理价位了,按约定已下单,预计明天到。”这不比双十一蹲点儿抢券爽多了?

大厂打架还是牵手?这波操作有点迷

说到AI代理互联互通,肯定绕不开标准这事儿。说实话,去年那会儿市场乱得呀,各家都想着自己立山头。Google推它的A2A协议,Anthropic搞MCP,OpenAI弄Agents.md-4-10。就跟当年手机充电口似的,你用Type-C,我还在搞Lightning,出门得带一堆线。

神奇的是,这帮巨头最近居然想通了。Linux基金会底下搞了个AAIF,Google、微软、OpenAI这些死对头都进去了-4-10这种“打架打累了先一起把蛋糕做大”的节奏,在科技圈其实挺常见的。我有个哥们儿在里头做技术,他说现在开会那场面可有意思了,Google的人和OpenAI的人坐一块儿改代码,互相还递咖啡呢。

这对我这种普通用户意味着啥?最直观的就是,以后不用再纠结“我用的是哪家生态”了。管你是混元还是DeepMind,只要能听懂通用的指令,能调用统一的接口,那体验感直接拉满。

技术还不够完美,但也别太焦虑

话说回来,互联互通这事儿现在还远远没到成熟的地步。前两天跟一个做网络设备的朋友聊天,他说现在AI代理之间通信面临个大问题——数据格式太“胖”了-3

啥意思呢?现在的AI通信喜欢用自然语言,动辄一大段描述,这在服务器上跑没问题。但要是以后路由器、交换机里也嵌了AI,让它们互相沟通网络故障,再用这种唠嗑的方式就太占资源了。设备之间需要的是那种“短平快”的二进制语言,几毫秒搞定问题-3。这个技术gap,IETF(互联网工程任务组)那边正在想办法填坑-7

还有个让人头大的是安全。你想啊,要是你的AI能代表你跟别的AI打交道了,万一有个坏心眼的AI伪装成你同事,骗你的代理泄露公司数据咋办?这叫“提示注入攻击”-10就跟现实里的电信诈骗似的,只不过现在骗子换成了AI。好在国内的信通院和IIFAA联盟已经在推“可信互联”的标准了,强调“可信身份、可信意图”这四个维度-8

国内进展也不慢,腾讯这波有点东西

说起国内玩家,腾讯最近搞的那个WorkBuddy是真有点意思-2。花旗那边还专门发了报告吹了一波。我实测了一下,这玩意儿能直接调用QQ、飞书甚至钉钉的接口,把办公软件那堵墙给拆了。你让它整理一下过去一周各群里的待办事项,它能从不同APP里把信息捞出来汇总。

而且它支持在混元、DeepSeek、Kimi这些模型之间随便切-2。这个思路其实很务实——反正未来肯定是多模型共存的,与其强迫用户只用一家,不如做个大管家,帮用户协调各方的能力。这不就是AI代理互联互通最朴素的落地场景吗?

证券时报那边有篇文章说得挺透,未来会是“智能体互联网”的时代,千亿级的AI智能体需要统一的寻址、发现、信任机制-9。现在咱们还处在拨号上网的阶段,等啥时候这些代理能像TCP/IP协议一样无障碍沟通,那才叫真正的智能爆发。


网友问:你说的互联互通这么热闹,那我家里的小爱同学、天猫精灵和Siri啥时候能互相说话?

这位朋友提的这个问题我太有感触了!我家也是“三足鼎立”,喊谁都得用特定口令。坦率说,消费级设备的互联互通比企业级要慢很多,因为这里面涉及太多商业利益了——谁都不想把自己辛辛苦苦积累的用户拱手让人。

不过技术上已经有苗头了。IIFAA发布的那个ASL标准,本质上就是想解决跨设备、跨平台的信任问题-8。你可以这么理解:虽然小爱同学和Siri表面上还是各玩各的,但底下多了一层“握手协议”。比如你跟Siri说“让小爱把客厅灯关了”,Siri会把这条指令翻译成一个标准的、带签名的“任务单”,通过云端或者局域网广播出去,小爱收到后验证签名确认不是外人使坏,就执行了。

卡脖子的不是技术,而是商业博弈。我个人估计,还得再等两年左右,等用户抱怨声大到厂商扛不住了,或者某家想通了用开放换流量,那时候真正的“全屋智能互通”才可能成真。现阶段你可以试试Home Assistant这类开源平台,虽然折腾了点,但能提前过把瘾。

网友问:如果AI代理都能自己交易了,会不会出现AI“黑吃黑”骗钱的情况?

你这个问题问到点子上了,也是现在搞AP2协议那帮人最头疼的事。理论上这种风险是存在的,比如某个恶意商家伪造一堆好评,诱骗你的购物代理用高价下单-10

但现在的防护机制也在跟进。AP2协议里有个很关键的设计叫“可追溯审计”,每一笔AI交易的来龙去脉都会被加密记录下来,从最初的用户意图到最后的付款确认,形成一条完整的证据链-5-6。万一真出事了,翻账本一查就知道是哪个环节被黑了,是代理理解错了,还是商家使坏,赖都赖不掉。

另外,“双授权”机制也是个保险-1。大额交易必须由你本人最后确认,这就拦住了绝大多数乱花钱的情况。我理解这就跟给你的熊孩子一张信用卡副卡似的,能花,但每一笔你都能收到短信,超额了还能锁死。当然,随着AI越来越狡猾,安全攻防肯定是场持久战。

网友问:工作流里那么多AI工具,我总不能给每个都配个账号吧?以后能不能“一号通”?

这问题我太理解了!我现在电脑上光AI相关的账号就十几个,密码管理器里都塞满了。好消息是,跨域互操作的框架已经在研究这个事了-7。未来的方向是“身份联邦”——你用微信或者谷歌账号登录后,会生成一个临时的、带权限的“数字身份凭证”,你的各个AI代理拿着这个凭证去跟其他代理打交道-7

这有点像你住酒店给张房卡,只能在特定楼层刷开特定房间。你的主AI把任务拆开后,每个子AI会获得一个“临时工牌”,上面写着“我是xxx派来订酒店的,权限只有查询和下单,预算不能超500,有效期到今天下午3点”-9。任务完成,工牌自动作废。这样就既不用到处注册账号,又能保证安全,毕竟就算某个小代理被人拐跑了,它兜里也就那么点权限,掀不起大浪。

标签:

相关阅读