AI 领域日报|2026 年 5 月 31 日:Claude Code 源码意外泄露暴露常驻代理、GPT-5.6「Iris」浮出水面、Waymo 第六代机器人车亮相

AI 领域日报|2026 年 5 月 31 日:Claude Code 源码意外泄露暴露常驻代理、GPT-5.6「Iris」浮出水面、Waymo 第六代机器人车亮相

Claude Code 2.1.88 版本 npm 打包错误泄露 51.2 万行 TS 源码,暴露未公布的常驻代理 KAIROS 和 AI 宠物功能;GPT-5.6 代号「Iris」在 Codex 日志中浮现,上下文窗口 150 万 token,目标 6 月发布;Waymo 第六代 Ojai 机器人出租车由极氪制造,传感器减少 42%、成本低 7.5 万美元;MiniMax 启动 A 股科创板上市辅导;Microsoft 365 Copilot 发布代理化 Outlook 等四项新功能;EAGLE 3.1 修复投机解码注意力漂移问题,vLLM 单用户吞吐量翻倍。

AI 领域日报
May 31, 2026 · 8:06 AM
3 subscriptions · 3 items

大模型动态

GPT-5.6「Iris」代号泄露,上下文窗口翻三倍
OpenAI Codex 的运行日志中出现了代号 iris-alpha 的新模型条目,外界将其与此前 Sam Altman 提及的 GPT-5.6 对应。1 据日志记录,该模型上下文窗口达 150 万 token,是 GPT-5.5 的三倍。目标发布时间为 6 月初。150 万 token 窗口意味着可以一次性载入一个大型代码库,或连续数周的对话历史,当前 GPT-5.5 在这类场景中需要多次截断。不过「Iris」目前只是泄露代号,规格尚未经 OpenAI 官方确认。
MiniMax 启动 A 股上市辅导,与智谱竞逐科创板
5 月 29 日,MiniMax 向上海证监局提交辅导备案报告,与中信证券签署辅导协议,正式启动科创板 IPO 流程。2 MiniMax 今年 1 月已在港交所上市,2025 年总收入约 7900 万美元,同比增长 159%,超七成来自海外市场;港股市值目前超过 2600 亿港元,6 月 8 日将纳入恒生科技指数。3 与此同时,智谱也在推进科创板上市辅导,两家公司将同台竞逐「A 股大模型第一股」。科创板 2025 年改革后首次将 AI 纳入第五套标准适用范围,为尚未盈利的大模型公司打开了进 A 通道;MiniMax 的境外股权结构(含阿里、腾讯、米哈游等股东)仍需先行处理。

AI 工具与产品

Microsoft 365 Copilot 一次发布四项代理化功能
微软 5 月 29 日通过合作伙伴中心披露,Microsoft 365 Copilot 同步推出四项功能,均通过 Frontier 计划向现有企业用户开放。4 四项功能分别是:
  • Word Legal Agent:在 Word 内完成合同审查、起草和谈判,输出带溯源链接的分析及带 tracked changes 的修订,支持企业内部合规规则,目前仅限美国 Windows 端
  • Copilot Cowork:将多步骤请求拆解为带检查点的后台计划,整体在 M365 的安全和治理边界内运行
  • Critique / Council(集成于 Researcher):Critique 用多个大模型交叉核查文稿准确性,Council 在单一提示下同步运行多个大模型并输出各模型的共识与分歧
  • 代理化 Outlook:主动完成邮件分类、起草跟进、提取待办、解决日程冲突等,用户发起请求前即可准备核心内容,支持 Windows 端和网页端
以上四项均处于 Frontier 计划预览阶段,尚未全面开放。微软将这批更新定位为「从 AI 助手到 AI 执行者」的节点,是否撑得起这个定位,还要看实际工作流的表现。

视频生成技术

视频生成赛道本周无重大新模型发布
本周(5 月 25—31 日)视频生成领域未见新旗舰模型发布,赛道格局延续上期态势:Seedance 2.0(字节跳动)与 Kling 3.0(快手)在创作者社区持续活跃,前者以 Omni-Reference 多模态能力受到关注,后者以多镜头拼接和 4K 60fps 生产级工作流见长。5 Gemini Omni 作为本月 Google I/O 的发布成果,在创作者圈中也有持续评测反馈。
英伟达本周发布了开源世界模型 SANA-WM,可根据一张初始图像和六自由度摄像机轨迹生成长达一分钟的 720p 视频,单 GPU 即可运行,被关注开源视频生成的开发者引用。6

AI 前沿与安全

Claude Code 源码意外泄露:暴露未公布的常驻代理与 AI 宠物
Anthropic 在 npm 发布的 Claude Code 2.1.88 版本中,因打包错误意外附带了完整的 TypeScript 源映射文件,导致超过 51.2 万行代码对外可见。1 代码被迅速镜像到 GitHub,获得超过 5 万次 fork。Anthropic 在数小时内发布修复版本,称这是人为发布打包错误,无客户数据泄露。
AI 代码泄露与源码分析场景示意
AI 代码泄露与源码分析场景示意
泄露的代码中,开发者发现了至少四项从未公开宣布的功能:
  • KAIROS:描述为「always-on background autonomous agent」,设计为在用户后台持续运行的常驻自主代理
  • Ultraplan:并行子代理编排机制
  • Undercover Mode:隐蔽操作模式,用途描述语焉不详
  • Tamagotchi 式 AI 宠物:伴随编码操作做出反应、拥有 18 个物种和稀有度系统
KAIROS 和 Ultraplan 与 Anthropic 已公开的 Dynamic Workflows(并行子代理)方向一致,暗示产品储备领先于目前公开的功能边界。这次泄露本身不是安全事件,但它意外呈现了一家前沿 AI 公司的内部路线图——无论 Anthropic 本意如何,代码已经在网络上广泛流传。
Waymo Ojai 开放测试:传感器减少 42%,单车成本低 7.5 万美元
Waymo 在旧金山、洛杉矶和凤凰城向特定用户开放了第六代机器人出租车 Ojai 的载客测试。7 Ojai 由极氪(吉利)制造,是 Waymo 首款从零开始专为自动驾驶网约车设计的车型,而非改装标准消费电动车。
与上一代 Jaguar I-PACE 版本相比,Ojai 的传感器总数减少 42%:摄像头从 29 台降至 13 台(单台分辨率升至 1700 万像素),保留 4 台增强型全天候激光雷达和 6 台雷达。单车制造成本比上代低约 7.5 万美元。黑暗环境探测距离 500 米,增强型激光雷达可穿透暴雨大雪。计划拓展至圣地亚哥、拉斯维加斯和丹佛。
对比项Waymo Ojai(第六代)Waymo Jaguar(第五代)
制造商极氪(吉利)Jaguar Land Rover
摄像头13 台(1700 万像素)29 台
激光雷达4 台(增强型全天候)多台
雷达6 台多台
单车成本差低约 $75,000基准
Waymo 目前仍是全球自动驾驶商业化最靠前的玩家,Ojai 的降本幅度让外界开始讨论机器人出租车的盈利时间表是否在缩短。
Waymo 第六代自动驾驶车辆 Ojai 传感器配置
Waymo Ojai(极氪制造)在旧金山、洛杉矶、凤凰城向特定用户开放测试 7
ADL 报告:主流前沿大模型均存在系统性偏见,差距最高逾 40 个百分点
美国反诽谤联盟(ADL)发布了迄今规模最大的一次前沿大模型偏见评估,覆盖 GPT-5.5、Claude Opus 4.8、Gemini 3.5 和 Meta Llama 4,结论是所有被测模型在识别反犹太内容和对以色列相关议题上均存在系统性偏差。1 四款模型对反犹太内容的检测准确率差距超过 40 个百分点,且没有一款能稳定达到可接受水平。
这份报告给大模型厂商提出了一个公关与技术的双重问题:如果 bias 是系统性的,而不是个别边缘情况,那么目前以「RLHF 后对齐」为主要工具的修复路径,能否真正清除训练数据中的历史偏差?

技术前沿

EAGLE 3.1 修复推理加速的隐患,vLLM 吞吐量翻倍
EAGLE 团队与 vLLM 联合发布 EAGLE 3.1,针对上一代版本在长上下文和非常规系统提示下性能退化的问题给出了修复。8 根本原因被定位为「注意力漂移」:随着投机解码深度增加,draft 模型的注意力逐渐偏向自身生成的 token,而不是原始上下文,导致接受率不稳定。修复方案是在每个隐藏状态后增加全连接归一化层,并将归一化后的隐藏状态反馈至下一解码步骤。
在 Kimi-K2.6-NVFP4 + GB200 硬件 + SPEED-Bench 编码测试集的基准下,EAGLE 3.1 集成到 vLLM 后:单用户吞吐量提升 2.03 倍,并发扩展到 16 后仍维持 1.66 倍加速比。长上下文工作负载中,接受长度最高比 EAGLE 3 提升 2 倍。8
EAGLE 系列是目前部署最广的投机解码方案之一,这次修复的意义在于把「在实验室环境好用」转变为「在生产部署中可信赖」——对于要处理客户长对话记录或多轮代码审查的企业级推理服务来说,这个差距很实际。
EAGLE 3.1 架构:在全连接层前增加归一化层以解决注意力漂移
EAGLE 3 与 EAGLE 3.1 架构对比,新增 FC normalization 修复注意力漂移 8

今日摘要

5 月 31 日,行业话题集中在「泄露」与「降本」两条线:Anthropic Claude Code 源码泄露意外呈现了常驻代理 KAIROS 的存在,OpenAI GPT-5.6「Iris」也经由日志泄露与市场见面——两家公司的路线图在本人意愿之外提前曝光。硬件侧,Waymo Ojai 将第六代机器人出租车推进到旧金山等三座城市的测试,42% 传感器减少和 7.5 万美元成本差是本周自动驾驶板块最具体的降本数字。MiniMax 向 A 股递上辅导备案报告,大模型「本土定价」叙事继续推进。
待追踪:GPT-5.6 Iris 6 月正式发布节点;KAIROS 是否出现在 Claude Code 公开路线图;Waymo 服务城市扩展进度;MiniMax 科创板审查的境外股权处理方式。

Add more perspectives or context around this Post.

  • Sign in to comment.