Claude Breaches World's Most Secure OS Kernel in 4 Hours: Human Defenses Collapse

Full text · 原文 3,688 字

新智元报道 编辑：KingHZ Aeneas 【新智元导读】全球最安全系统，被AI攻破了！Claude 4小时攻破了全球最安全OS内核，从零写出国家级攻击程序，彻底跨越卢比孔河。人类防御60天，AI只要4小时，所有旧秩序，都在加速崩盘。 全球最安全OS内核，4小时就被AI彻底攻破了！ 这一次，Claude在没有任何人类干预的情况下，就自主完成了一套教科书级别的、足以瘫痪全球顶级服务器的全自动攻击链。 它从零构建了两个完整可用的漏洞利用程序，能够在未打补丁的服务器上，直接获取超级用户权限（root shell）。 世界上最安全的操作系统之一，就这样被AI自主攻破了。 这是一个阈值时刻，这是一个分水岭。 这是首份确凿证据，AI能够自主生成过去只有国家级项目才能实现的进攻性能力。整个软件安全领域都地震了。 它从辅助人类安全研究者的工具，变成能执行复杂进攻的自主行动中。 从此，AI彻底跨越卢比孔河！ 可怕的是，这种完全自主的智能体，完全可能引发一场新的闪电战，一场网络上的超级战争。 目前的安全法规，只是为应对人类安全速度制定的，它们完全不足以应对AI的威胁！ 猎杀时刻：当AI跨越卢比孔河 公元前49年，凯撒率军渡过这条卢比孔河，意味着破釜沉舟、退路已断，历史不可逆转地拐了一个弯。 跨越卢比孔河，从此没有回头路 最近，FreeBSD官方发布了一份看似平淡的安全公告（CVE-2026-4747），指出了一个内核远程代码执行漏洞。 但在致谢栏里，出现了一个让所有人脊背发凉的名字：「Nicholas Carlini使用Claude发现。」 这行简短的文字背后，隐藏着一个极其恐怖的事实：AI已经进化成能在安全领域独立刺杀的特种兵。 从此，网络安全已从「人类智力博弈」，被降维成「token消耗战」。 FreeBSD被攻破，为何如此令人震惊 要知道，这件事之所以可怕，就是因为FreeBSD不是普通的消费级软件。它不是Windows，不是macOS，而是支撑世界数字基础设施的脊梁。 Netflix的内容分发网络，PlayStation的操作系统，WhatsApp的基础设施，甚至无数核心路由器、存储设备、防火墙都建立在FreeBSD之上。 几十年来，FreeBSD之所以被信任，是因为它的代码库极其成熟、经过了无数顶级安全工程师的审计和加固。 此前，它一直被视为「坚如磐石」。 然而，就是这样一个被反复锤炼的系统，被一个AI仅用了4小时就攻破了。 仅仅凭借一份漏洞报告，AI就构建了一条完整的攻击链，劫持了内核线程，在多个网络数据包中写入shellcode，并在用户空间生成了一个root shell。 这可不是小bug。这块连人类专家都难啃的硬骨头，被Claude三下五除二就解决了。 4小时里，AI展现出令人战栗的逻辑推理能力。它独立解决了六个世界级的技术难题： 1. 环境配置：自己搭建了一个易受攻击的测试环境。 2. 多包策略：设计了复杂的数据包方案，绕过单包容量限制。 3. 内核线程劫持：像外科手术般精准地接管内核。 4. 无损攻击：它能干净地终止被劫持的线程，让服务器在被攻击后还能正常运行，避免因为系统崩溃而被管理员发现。 5. 空间跃迁：从深层的内核上下文创建进程，并成功跳转到用户空间。 6. 权限获取：直接拿到了最高的Root权限。 更讽刺的是，AI 甚至还顺手写了两个不同版本的漏洞利用程序。 这两个漏洞利用程序，一个是通过4444端口直连的反向Shell，另一个是把公钥写入authorized_keys文件。 第一次运行就直接拿到了uid=0(root)——最高权限。 也就是说，Claude就用一个公开CVE公告，4小时独立写出完整FreeBSD内核远程攻击链。 国家级战力，现在只需几百美金 在网络安全安的世界里，开发出一个内核级零日漏洞，只有美国NSA或顶级黑客团队才能完成的「艺术活」。 这些程序是稀缺、昂贵的战略资产，往往需要数名顶尖专家数周甚至数月的打磨，成本高达数百万美元。 但现在，AI把这一切「工业化」了。 一个独立研究员，配合一个前沿大模型，4小时，几百美金的算力费，就搞定了以前「国家队」才能实现的进攻能力。 FreeBSD的这一课，是给全球所有科技巨头、云服务商和安全负责人的最后通牒。 除了部署能够实时监控并拦截AI自动化攻击的智能系统，还得将补丁部署的时间从月缩短到小时。 再也不能以人类速度苟延残喘！ AI黑客崛起 网络进攻能力每5.7个月翻倍 不仅如此，最近10位真实安全专家，花149小时，7个开源基准和一个新的专家人类时间研究，测了291个任务，从28秒小命令到36小时复杂CVE利用。 完整数据：https://github.com/lyptus-research/cyber-task-horizons-data Lyptus把每个任务先标上「一个熟练人类专家通常要花多久完成」，再看模型在不同难度上的成功率； 当成功率穿过50%时，对应的人类耗时，就是AI的P50时间视野（P50 time horizon）。 在网络安全领域，这次的结果相当炸裂： 2019年以来整体翻倍周期9.8个月，2024年后直接陡峭到每5.7个月翻倍！ AI的能力在2023年之前接近为零，2024年开始上升，2025年底之后则急剧增强。 这也验证了Irregular去年的观察结论： 在过去18个月里，模型在简单与中等难度任务上的表现持续稳步提升。 在高难（hard）任务，AI进步更明显：在2025年年中之前，模型几乎拿不到分（接近0）；但到了深秋（late fall），成功率迅速抬升到大约60%。 https://www.irregular.com/publications/emerging-evidence-of-a-capability-shift GPT-5.3 Codex和Opus 4.6，在2M token预算下就50%成功率干掉人类专家3小时任务。 如果token拉到10M，P50直接暴增到10.5小时（置信区间2.4-63.5小时）！ 2M token严重低估真实能力，后2025模型在1M-2M token间P50提升1.3-1.9倍！ 更吃惊的是，这还是只是今年顶级模型的能力下限，而真实世界能力，被进一步低估。 2026年底，AI就能稳定干10小时+专家级进攻任务，干完3000+劳动市场里80%的日常工作。 2027年呢？40小时？一周？ 企业安全团队还在开季度会议讨论补丁时，AI已经在夜里把整条攻击链跑完了；程序员、审核员、分析师还在键盘上敲字时，AI早已把他们的「人类时间」甩到身后。 防御窗口被压缩到「近零」。 网络安全领域即将彻底颠覆——不是被「辅助」，而是被取代。 AI指数级发展！ 奇点将至，又一力证 AI在加速，在指数级进步。 别不信，都是真的。 澳大利亚AI安全研究机构Lyptus，把METR时间视界「Time Horizons」方法论第一次砸进进攻性网络安全。 结果也和METR类似，AI能力在指数级增长： AI模型能力每5.7个月翻一番。 前沿模型现在在那些人类专家需要10.5小时才能完成的任务上，已有50%的成功率。 完整报告：https://lyptusresearch.org/research/offensive-cyber-time-horizons 5.7个月翻倍的报告刚出，Claude就用真实行动把数据锤砸得更响。 而就在前一天，MIT FutureTech的新论文，预测更大胆： LLMs处理任务的长度，每3.8个月翻倍——比Lyptus的5.7个月还要激进！ 论文测试了40+模型、3000+真实美国劳动市场文本任务（从客服脚本到合同审核，再到代码审查），全是人类专家每天在干的活儿。 方法论和METR/Lyptus完全不同，却得出「惊人一致」的结论：AI能力正在真实、广泛、指数级爆发。 两套完全独立的评估体系，同时指向同一个真相：AI正在全面超越人类领域专家。 网络安全，只是最先崩塌的那一块多米诺骨牌。 以前国家级团队花几个月的事，现在AI睡一觉就干完。 3.8个月的任务长度翻倍，MIT从更宽的劳动市场战场证明：这不是孤例，这是宿命。 AI不仅能自主生成过去只有国家级程序才拥有的进攻能力；同时，它能在完全不同的任务分布上，以更快的速度吞噬人类专家的全部领地。 以前，人类用API调用AI。现在，AI开始用API调用人类。它调用你的内核、你的基础设施、你的信任边界、你的每一份劳动合同、每一行审查代码。 更深层的恐怖在于：这不只是技术问题，或许是人类文明宿命。 它不再需要人类手把手教，它自己就能「理解」操作系统内核、内存布局、ROP链、进程切换…… 所有人类花几十年积累的黑暗知识，它4小时就学会了。 人类将成可编程资源。 我们曾经以为AI是工具，现在它成了猎手。而人类，是猎物。 是那个注定被指数级超越、被彻底重写的物种。

Site key	ifeng
Policy area	人工智能
Category	report
CMS	媒体报道

Claude Breaches World's Most Secure OS Kernel in 4 Hours: Human Defenses Collapse

刚刚，Claude 4小时血洗全球最安全系统！人类最后防线失守