新闻
发布日期:2025-11-11 16:01 点击次数:164
人人六大主流大言语模子(LLM)各发1万好意思元,丢进合并真的市集实盘拼杀开云体育,会发生什么?
上周六(10月18日),好意思国东谈主工智能筹办施行室nof1.ai在其“Alpha Arena”(阿尔法竞技场)平台上举办了一场当作——给六个顶级模子一万好意思元的真金白银,让它们下场走动,况且并非模拟盘,真金白银地走动。
这六大模子永诀为Anthropic的Claude 4.5 Sonnet、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。
测试章程写谈,每个模子得到10,000好意思元的“真的成本”,在走动所Hyperliquid上,以探求请示词与输入数据条目下,走动加密货币的永续合约。扫数的对话齐在nof1.ai网站上公开可见。
章程称,比赛的标的是“将风险调遣后的收益最大化”:“每个东谈主工智能(AI)模子必须自行产生Alpha(逾额收益)、细目仓位、择时走动并处理风险”。
系统会告诉AI模子现时的技能、账户信息、握仓情况,然后附上及时价钱、筹算等数据。 然后,要求模子作念出有筹算:若是握有仓位,是不时握有仍是平仓;若是空仓,是买入仍是不时不雅望。
经由近60小时的激战后,为止北京技能周一(10月20日)17:18,DeepSeek的握仓总市值接近1.4万好意思元,收益率约40%,最高时一度接近1.5万好意思元,是现时阐扬最佳的模子。

Grok 4实力次之,现在握仓总市值在1.33万好意思元隔邻。具体来看,DeepSeek和Grok 4齐依靠作念多比特币和以太坊赚钱。
Claude主要走动瑞波币和以太坊,Qwen则专注于以太坊,两者收益位列三四,但也举座跑赢比特币现货的走势。
与之比拟,GPT 5和Gemini已出现了彰着失掉,现在握仓总市值永诀为7300好意思元和6900好意思元,意味着两个模子已失掉约2700和3100好意思元,阐扬最差。
nof1.ai暗示,进行这一竞赛是为了是让基准测试更面临真的天下,而金融市集是最理念念的试真金不怕火场,因为这类市集具有动态性、起义性、怒放性与高度不成臆想性。
“这些特点能以静态测试无法企及的情势,实在挑战东谈主工智能,”nof1.ai莫得提到本次竞赛的已毕技能,只写谈“第一季将开动数周,随后推出紧要更新的第二季”。
有分析合计,市集早已期待在DeFAI(DeFi + AI)方朝上出现杀手级期骗,让LLM参与链上博弈有很大的念念象空间。

Powered by 开云(中国)Kaiyun·官方网站 - 登录入口 @2013-2022 RSS地图 HTML地图
Copyright Powered by站群 © 2013-2024