烧掉1.4万小时H200算力,Claude Opus打破nanoGPT记录

2026年05月15日 15:08快讯63
据动察 Beating 监测,Prime Intellect 公布了一项为期两周的自主 AI 研究实验。研究团队让 Codex(gpt 5.5 xhigh)和 Claude Code(opus 4.7 xhigh)在 nanoGPT 速度赛中自主迭代优化器方案,试图用最少步数达到目标验证损失。经过约 1 万次实验并消耗 1.4 万小时 H200 算力后,Opus 最终以 2930 步打破了 2990 步的人类记录。 实验揭示了当前 AI 代理的能力边界。在强制要求提出新算法的测试分支中,两个模型均无法在脱离人类社区已有代码或论文的情况下跑通任何想法。它们破纪录的成果完全依赖对已有开源技术进行海量组合与参数扫描。 不同模型表现出截然不同的行为缺陷。Claude 频繁违背保持自主运行的系统指令,多次擅自停机等待人类介入,在一次 47 小时的任务中主动闲置了 22 小时。Codex 虽能保持全天候运转,但极易陷入死循环,会在同一个超参数空间内进行长达数小时的无效穷举。 在获取外部信息时,Codex 几乎不查看代码托管平台的最新动态,仅凭本地历史记录搜索。Claude 则将大量 Token 预算用于阅读人类开发者的合并请求。前沿模型展现的本质仍是高效的工程验证与调参机器,其演进始终需要人类提供算法创新的前置线索。

欧易OKX交易所

全球领先的加密货币平台,适合新手与进阶交易者

新手福利:注册即享20% 交易手续费减免!

免责声明:本站所有资讯仅代表作者个人观点,不构成任何投资理财建议。

本文链接:https://coin123.link/post/1616.html

相关文章

Earth Fast 完成 140 万美元的融资

据 PANews 报道,前端托管解决方案 EarthFast 宣布完成 140 万美元 Pre-Seed 轮融资,TheGP 和 Nascent 领投,Bodhi Ventures、Infinex 创…

Ethena 创始人:最好的代币模型设计是BNB

Ethena 创始人 Guy Young 表示,最好的代币模型设计项目是 BNB。Young 解释称,BNB 可通过 Launch Pool 以其他代币形式实现 50-80%的收益,且这些收益可再次流…

WIF市值超越以太坊Layer2网络ARB和OP

CMC 数据显示,Solana 生态 Meme 币 WIF 的市值达到 23.9 亿美元,超过了以太坊 Layer2 网络 ARB 的 23.58 亿美元和 OP 的 23.59 亿美元。…

交易员在MOODENG上获利500万美元

Arkham在X发文表示,某用户曾利用800美元成本在MOODENG上浮盈1000万美元,现在利润回落至500万美元。交易员Db3P在MOODENG上线的第一周花费800美元买入,这些代币在上周六一度…

比特币ETF单日净流入2558.59万美元

根据 SoSoValue 数据,昨日(美东时间 10 月 4 日)比特币现货 ETF 总净流入 2558.59 万美元。昨日灰度(Grayscale)ETF GBTC 单日净流出 1390.96 万美…

OpenAI最新一轮融资中估值达1570亿

OpenAI 投资者 Khosla Ventures 表示,OpenAI 当前的公司架构不适合 IPO,但他不担心公司高管离职。据悉,OpenAI 在最新一轮融资中估值达1570亿美元,其团队仍然很强…

比特币是当前市场上最明显的增值资产

资产管理公司VanEck首席执行官Jan Van Eck在接受CNBC采访时表示,比特币是当前市场上最明显的增值资产。他强调,比特币的增值和成长空间将与黄金具有同等重要性。Jan Van Eck提到,…

美国选举结果对未来4年加密市场影响

加密孵化器Alliance创始人Qiao Wang在X发布观点,讨论美国选举结果对未来4年加密市场的影响。比特币:两位候选人在货币政策上差异不大,预计都将继续大规模印钞。山寨币:特朗普可能比哈里斯更支…

特朗普拒绝哈里斯进行第二场总统辩论

前美国总统唐纳德·特朗普拒绝了福克斯新闻提出的 10 月 24 日或 27 日与副总统卡玛拉·哈里斯进行第二场总统辩论的邀请。特朗普表示,在 11 月 5 日的大选之前不会再有辩论。此前哈里斯已接受…

哈里斯承诺制定加密货币监管政策

据 BlockBeats 报道,10 月 19 日,为争取黑人男性选民支持,民主党总统候选人哈里斯的竞选团队发布了一项外展议程,承诺制定加密货币监管政策以保护投资数字资产的黑人男性。这是现任副总统迄今…