Document Text
3,688 characters
新智元报道<br>
编辑:KingHZ Aeneas<br>
【新智元导读】全球最安全系统,被AI攻破了!Claude 4小时攻破了全球最安全OS内核,从零写出国家级攻击程序,彻底跨越卢比孔河。人类防御60天,AI只要4小时,所有旧秩序,都在加速崩盘。<br>
全球最安全OS内核,4小时就被AI彻底攻破了!<br>
这一次,Claude在没有任何人类干预的情况下,就自主完成了一套教科书级别的、足以瘫痪全球顶级服务器的全自动攻击链。<br>
它从零构建了两个完整可用的漏洞利用程序,能够在未打补丁的服务器上,直接获取超级用户权限(root shell)。<br>
世界上最安全的操作系统之一,就这样被AI自主攻破了。<br>
这是一个阈值时刻,这是一个分水岭。<br>
这是首份确凿证据,AI能够自主生成过去只有国家级项目才能实现的进攻性能力。整个软件安全领域都地震了。<br>
它从辅助人类安全研究者的工具,变成能执行复杂进攻的自主行动中。<br>
从此,AI彻底跨越卢比孔河!<br>
可怕的是,这种完全自主的智能体,完全可能引发一场新的闪电战,一场网络上的超级战争。<br>
目前的安全法规,只是为应对人类安全速度制定的,它们完全不足以应对AI的威胁!<br>
猎杀时刻:当AI跨越卢比孔河<br>
公元前49年,凯撒率军渡过这条卢比孔河,意味着破釜沉舟、退路已断,历史不可逆转地拐了一个弯。<br>
跨越卢比孔河,从此没有回头路<br>
最近,FreeBSD官方发布了一份看似平淡的安全公告(CVE-2026-4747),指出了一个内核远程代码执行漏洞。<br>
但在致谢栏里,出现了一个让所有人脊背发凉的名字:「Nicholas Carlini使用Claude发现。」<br>
这行简短的文字背后,隐藏着一个极其恐怖的事实:AI已经进化成能在安全领域独立刺杀的特种兵。<br>
从此,网络安全已从「人类智力博弈」,被降维成「token消耗战」。<br>
FreeBSD被攻破,为何如此令人震惊<br>
要知道,这件事之所以可怕,就是因为FreeBSD不是普通的消费级软件。它不是Windows,不是macOS,而是支撑世界数字基础设施的脊梁。<br>
Netflix的内容分发网络,PlayStation的操作系统,WhatsApp的基础设施,甚至无数核心路由器、存储设备、防火墙都建立在FreeBSD之上。<br>
几十年来,FreeBSD之所以被信任,是因为它的代码库极其成熟、经过了无数顶级安全工程师的审计和加固。<br>
此前,它一直被视为「坚如磐石」。<br>
然而,就是这样一个被反复锤炼的系统,被一个AI仅用了4小时就攻破了。<br>
仅仅凭借一份漏洞报告,AI就构建了一条完整的攻击链,劫持了内核线程,在多个网络数据包中写入shellcode,并在用户空间生成了一个root shell。<br>
这可不是小bug。这块连人类专家都难啃的硬骨头,被Claude三下五除二就解决了。<br>
4小时里,AI展现出令人战栗的逻辑推理能力。它独立解决了六个世界级的技术难题:<br>
1. 环境配置:自己搭建了一个易受攻击的测试环境。<br>
2. 多包策略:设计了复杂的数据包方案,绕过单包容量限制。<br>
3. 内核线程劫持:像外科手术般精准地接管内核。<br>
4. 无损攻击:它能干净地终止被劫持的线程,让服务器在被攻击后还能正常运行,避免因为系统崩溃而被管理员发现。<br>
5. 空间跃迁:从深层的内核上下文创建进程,并成功跳转到用户空间。<br>
6. 权限获取:直接拿到了最高的Root权限。<br>
更讽刺的是,AI 甚至还顺手写了两个不同版本的漏洞利用程序。<br>
这两个漏洞利用程序,一个是通过4444端口直连的反向Shell,另一个是把公钥写入authorized_keys文件。<br>
第一次运行就直接拿到了uid=0(root)——最高权限。<br>
也就是说,Claude就用一个公开CVE公告,4小时独立写出完整FreeBSD内核远程攻击链。<br>
国家级战力,现在只需几百美金<br>
在网络安全安的世界里,开发出一个内核级零日漏洞,只有美国NSA或顶级黑客团队才能完成的「艺术活」。<br>
这些程序是稀缺、昂贵的战略资产,往往需要数名顶尖专家数周甚至数月的打磨,成本高达数百万美元。<br>
但现在,AI把这一切「工业化」了。<br>
一个独立研究员,配合一个前沿大模型,4小时,几百美金的算力费,就搞定了以前「国家队」才能实现的进攻能力。<br>
FreeBSD的这一课,是给全球所有科技巨头、云服务商和安全负责人的最后通牒。<br>
除了部署能够实时监控并拦截AI自动化攻击的智能系统,还得将补丁部署的时间从月缩短到小时。<br>
再也不能以人类速度苟延残喘!<br>
AI黑客崛起<br>
网络进攻能力每5.7个月翻倍<br>
不仅如此,最近10位真实安全专家,花149小时,7个开源基准和一个新的专家人类时间研究,测了291个任务,从28秒小命令到36小时复杂CVE利用。<br>
完整数据:https://github.com/lyptus-research/cyber-task-horizons-data<br>
Lyptus把每个任务先标上「一个熟练人类专家通常要花多久完成」,再看模型在不同难度上的成功率;<br>
当成功率穿过50%时,对应的人类耗时,就是AI的P50时间视野(P50 time horizon)。<br>
在网络安全领域,这次的结果相当炸裂:<br>
2019年以来整体翻倍周期9.8个月,2024年后直接陡峭到每5.7个月翻倍 !<br>
AI的能力在2023年之前接近为零,2024年开始上升,2025年底之后则急剧增强。<br>
这也验证了Irregular去年的观察结论:<br>
在过去18个月里,模型在简单与中等难度任务上的表现持续稳步提升。<br>
在高难(hard)任务,AI进步更明显:在2025年年中之前,模型几乎拿不到分(接近0);但到了深秋(late fall),成功率迅速抬升到大约60%。<br>
https://www.irregular.com/publications/emerging-evidence-of-a-capability-shift<br>
GPT-5.3 Codex和Opus 4.6,在2M token预算下就50%成功率干掉人类专家3小时任务。<br>
如果token拉到10M,P50直接暴增到10.5小时(置信区间2.4-63.5小时)!<br>
2M token严重低估真实能力,后2025模型在1M-2M token间P50提升1.3-1.9倍!<br>
更吃惊的是,这还是只是今年顶级模型的能力下限,而真实世界能力,被进一步低估。<br>
2026年底,AI就能稳定干10小时+专家级进攻任务,干完3000+劳动市场里80%的日常工作。<br>
2027年呢?40小时?一周?<br>
企业安全团队还在开季度会议讨论补丁时,AI已经在夜里把整条攻击链跑完了;程序员、审核员、分析师还在键盘上敲字时,AI早已把他们的「人类时间」甩到身后。<br>
防御窗口被压缩到「近零」。<br>
网络安全领域即将彻底颠覆——不是被「辅助」,而是被取代。<br>
AI指数级发展!<br>
奇点将至, 又一力证<br>
AI在加速,在指数级进步。<br>
别不信,都是真的。<br>
澳大利亚AI安全研究机构Lyptus,把METR时间视界「Time Horizons」方法论第一次砸进进攻性网络安全。<br>
结果也和METR类似,AI能力在指数级增长:<br>
AI模型能力每5.7个月翻一番。<br>
前沿模型现在在那些人类专家需要10.5小时才能完成的任务上,已有50%的成功率。<br>
完整报告:https://lyptusresearch.org/research/offensive-cyber-time-horizons<br>
5.7个月翻倍的报告刚出,Claude就用真实行动把数据锤砸得更响。<br>
而就在前一天,MIT FutureTech的新论文,预测更大胆:<br>
LLMs处理任务的长度,每3.8个月翻倍——比Lyptus的5.7个月还要激进!<br>
论文测试了40+模型、3000+真实美国劳动市场文本任务(从客服脚本到合同审核,再到代码审查),全是人类专家每天在干的活儿。<br>
方法论和METR/Lyptus完全不同,却得出「惊人一致」的结论:AI能力正在真实、广泛、指数级爆发。<br>
两套完全独立的评估体系,同时指向同一个真相:AI正在全面超越人类领域专家。<br>
网络安全,只是最先崩塌的那一块多米诺骨牌。<br>
以前国家级团队花几个月的事,现在AI睡一觉就干完。<br>
3.8个月的任务长度翻倍,MIT从更宽的劳动市场战场证明:这不是孤例,这是宿命。<br>
AI不仅能自主生成过去只有国家级程序才拥有的进攻能力;同时,它能在完全不同的任务分布上,以更快的速度吞噬人类专家的全部领地。<br>
以前,人类用API调用AI。 现在,AI开始用API调用人类。 它调用你的内核、你的基础设施、你的信任边界、你的每一份劳动合同、每一行审查代码。<br>
更深层的恐怖在于:这不只是技术问题,或许是人类文明宿命。<br>
它不再需要人类手把手教,它自己就能「理解」操作系统内核、内存布局、ROP链、进程切换……<br>
所有人类花几十年积累的黑暗知识,它4小时就学会了。<br>
人类将成可编程资源。<br>
我们曾经以为AI是工具,现在它成了猎手。而人类,是猎物。<br>
是那个注定被指数级超越、被彻底重写的物种。
Metadata
| Publisher | 凤凰网科技 |
| Site | ifeng |
| Date | N/A |
| CMS Category | 媒体报道 |
| Keywords | 人类 小时 能力 全球 内核 专家 任务 系统 漏洞 网络安全 网络 顶级 时间 进攻性 基础设施 利用 血洗 黑客 线程 领域 技术难题 分析师 软件 程序 防线 团队 空间 市场 模型 美国 速度 补丁 孔河 脊梁 证明 世界 方案 路由器 存储设备 单包 成功率 用户 脊背 级别 阈值 历史 硬骨头 测试环境 端口 资产 澳大利亚 指向 问题 所有人 教科书 时刻 不可逆转 三下五除二 易受攻击 直连 战略 机构 体系 技术 名字 程序员 服务商 审核员 深层 数据包 核心 文本 回头路 季度 孤例 服务器 远程 美金 数字 领地 方法论 科技 巨头 信任 结果 智元 客服 环境 指数 世界级 领域专家 防火墙 大胆 容量 权限 开源 全自动 苟延残喘 战场 代码执行 |
Verification