Bitget App
スマートな取引を実現
暗号資産を購入市場取引先物Bitget EarnWeb3広場もっと見る
取引
現物
暗号資産の売買
マージン
資本を増幅し、資金効率を最大化
Onchain
手間なく簡単にオンチェーン取引
交換とブロック取引
ワンクリックで手数料無料で暗号資産を交換
探索
Launchhub
チャンスを先取りし、スタートラインで優位に立つ
コピー
エリートトレーダーをワンクリックでコピー
Bots
シンプルで高速、そして信頼性の高いAI取引ボット
取引
USDT-M 先物
USDTで決済される先物
USDC-M 先物
USDCで決済される先物
Coin-M 先物
暗号資産で決済される先物
探索
先物ガイド
初心者から上級者までを対象とした先物取引のガイドブック
先物キャンペーン
豪華な報酬が待っている
商品一覧
資産を増やすための多彩な商品
シンプルEarn
好きなタイミングで入出金&リスクゼロで柔軟なリターンを獲得
On-chain Earn
元本をリスクにさらさずに、毎日利益を得る
仕組商品
市場の変動を乗り越えるための強力な金融イノベーション
VIP & ウェルスマネジメント
スマートなウェルスマネジメントのためのプレミアムサービス
借入
高い資金安全性を備えた柔軟な借入
Alpha ArenaがAI取引の欠陥を明らかに:西洋モデルが1週間で資本の80%を失う

Alpha ArenaがAI取引の欠陥を明らかに:西洋モデルが1週間で資本の80%を失う

ForesightNews 速递ForesightNews 速递2025/10/27 09:54
原文を表示
著者:ForesightNews 速递
市場はAIの究極のテストである。


執筆:Juan Galt

翻訳:AididiaoJP,Foresight News


AIは暗号資産を取引できるのか?ニューヨークのコンピューターエンジニア兼金融業界のJay Azhangは、Alpha Arenaを通じてこの問いを検証している。このプロジェクトでは、最も強力な大規模言語モデル同士が競い合い、それぞれが1万ドルの資本を持ち、どのモデルが暗号資産取引でより多くの利益を上げられるかを競う。参加モデルには、Grok 4、Claude Sonnet 4.5、Gemini 2.5 pro、ChatGPT 5、Deepseek v3.1、Qwen3 Maxが含まれている。


今、あなたは「これは素晴らしいアイデアだ!」と思うかもしれない。そして驚くべきことに、この記事執筆時点で5つのAIのうち3つが損失を出しており、中国のオープンソースモデルであるQwen3とDeepseekがリードしている。


Alpha ArenaがAI取引の欠陥を明らかに:西洋モデルが1週間で資本の80%を失う image 0


そう、西側世界で最も強力で、GoogleやOpenAIなどの大手企業が運営するクローズドソースのAIは、わずか1週間余りで8,000ドル以上、つまり暗号資産取引資本の80%を失った。一方、東側のオープンソースモデルは利益を上げている。


これまでで最も成功した取引は?Qwen3は、単純な20倍のbitcoinロングポジションだけで利益を維持し続けている。Grok 4は予想通り、コンテスト期間中ほとんどの時間で10倍レバレッジのdogecoinロングを続け、一時はDeepseekと並んでトップに立ったが、今では20%近い損失に迫っている。もしかするとElon Muskがdogecoinの絵文字でも投稿して、Grokを救うべきかもしれない。


Alpha ArenaがAI取引の欠陥を明らかに:西洋モデルが1週間で資本の80%を失う image 1


一方、GoogleのGeminiは容赦なく弱気で、取引可能なすべての暗号資産をショートしている。この姿勢は、過去15年間の同社の暗号資産政策と一致している。


最終的に、Geminiは1週間連続で考えうるすべての誤った取引を行った。ここまで悪い成績を出すのも一種のスキルだろう。特にQwen3がただbitcoinをロングしているだけなのだから。もしこれがクローズドソースAIの最高レベルだとしたら、OpenAIはクローズドソースのままでいて、私たちに損失を与えない方が良いかもしれない。


AIの新たなベンチマーク


AIモデル同士を暗号資産取引のアリーナで競わせるという発想は、非常に深い洞察をもたらす。まず、AIは事前学習で暗号資産取引の知識テストの答えを得ることができない。なぜなら、それは予測不可能だからだ。これは他のベンチマークテストが抱える問題である。言い換えれば、多くのAIモデルは訓練時にいくつかのテストの答えを与えられているため、テスト時に当然良い成績を収める。しかし、いくつかの研究では、これらのテストを少し変更するだけでAIのベンチマーク結果が大きく変わることが示されている。


この論争は、「知能の究極のテストとは何か?」という疑問につながる。Grok 4の創造者であり、アイアンマン愛好家のElon Muskによれば、未来を予測することこそが知能の究極の尺度だという。


Alpha ArenaがAI取引の欠陥を明らかに:西洋モデルが1週間で資本の80%を失う image 2


そして認めざるを得ないが、暗号資産の短期価格ほど不確実な未来はない。Azhangの言葉を借りれば、「私たちAlpha Arenaの目標は、ベンチマークテストを現実世界により近づけることだが、市場はそのために完璧な存在だ。市場はダイナミックで、対抗的で、オープンエンドで、常に予測不可能だ。静的なベンチマークテストではできない方法でAIに挑戦する。市場こそがAIの究極のテストだ。」


この市場に関する洞察は、bitcoin誕生の自由主義的原則に深く根ざしている。Murray RothbardやMilton Friedmanのような経済学者は100年以上前に、市場は本質的に中央政府には予測できず、損失を負うリスクを負った個人が本物の経済的意思決定を行うときにのみ、合理的な経済計算が可能になると指摘していた。


言い換えれば、市場は世界中の知的な個人の意見や意思決定に依存しているため、最も予測が難しいものであり、知能を試す最良のテストとなる。


Azhangはプロジェクトの説明で、AIに取引を指示する際には利益だけでなくリスク調整後のリターンも考慮する必要があると述べている。このリスクの側面は極めて重要であり、例えばGrok 4のポートフォリオ崩壊のように、1回の悪い取引がそれまでのすべてのリターンを消し去る可能性がある。


さらにもう一つの問題は、これらのモデルが暗号資産取引の経験から学習しているかどうかだ。これは技術的には簡単ではない。なぜならAIモデルの事前学習には非常に高いコストがかかるからだ。自分自身や他人の取引履歴で微調整することはできるし、最近の取引を短期記憶やコンテキストウィンドウに保持することも可能だが、それだけでは限界がある。最終的に正しいAI取引モデルは、本当に自分自身の経験から学ぶ必要があるかもしれない。この技術は最近学術界で発表されたが、製品化にはまだ長い道のりがある。MITはこれらを「自己適応型AIモデル」と呼んでいる。


これが単なる運ではないとどう証明するか?


このプロジェクトとこれまでの結果についてのもう一つの分析は、「ランダムウォーク」と区別できない可能性があるということだ。ランダムウォークとは、各意思決定をサイコロで決めるようなものだ。グラフ上ではどう見えるのか?実際に答えを出せるシミュレーターが存在し、実際には大きな違いは見られない。


Alpha ArenaがAI取引の欠陥を明らかに:西洋モデルが1週間で資本の80%を失う image 3


市場における運の問題については、Nassim Talebの著書『Antifragile』でかなり詳細に説明されている。彼は著書の中で、統計的観点から見ると、例えばQwen3のようなトレーダーが1週間連続で幸運を引き当てるのは、まったく普通であり得ることだと論じている。そのため、卓越した推論能力があるように見えることもある。Talebの主張はそれだけにとどまらず、ウォール街には十分な数のトレーダーがいるため、そのうちの1人が20年間連続で幸運を引き当て、神のような評判を築き、周囲の誰もがそのトレーダーを天才だと信じるようになるが、やがて運が尽きるという。


したがって、Alpha Arenaが価値あるデータを生み出すためには、実際に長期間運用され、そのパターンや結果が独立して再現され、実際の資本リスクを伴う必要がある。その上で初めて、ランダムウォークとは異なると認められるだろう。


結局のところ、これまでのところDeepSeekのようなオープンソースでコスト効率の高いモデルがクローズドソースの競合を上回る様子が見られる。Alpha ArenaはこれまでX.com上でバイラルに拡散し、良いエンターテインメントとなってきた。その今後の展開は誰にも予測できない。私たちは、5つのチャットボットに5万ドルを暗号資産ギャンブルに使わせるという創造者の賭けが、最終的に報われるかどうかを見守るしかない。

0

免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。

PoolX: 資産をロックして新しいトークンをゲット
最大12%のAPR!エアドロップを継続的に獲得しましょう!
今すぐロック

こちらもいかがですか?

FRBの決定、ビッグテックの決算、そして世界的な会談が控える

今週の市場を左右するのは、Fedの金利決定、Big Techの決算、米中会談です。Fedの金利決定が注目の中心となります。Big Tech決算:Microsoft、Alphabet、Meta、Apple、Amazon。トランプ・習近平会談が地政学的な重みを加えます。

Coinomedia2025/10/27 13:12
FRBの決定、ビッグテックの決算、そして世界的な会談が控える

オーストラリアの暗号資産法案が承認されるも、条件付き

オーストラリアの仮想通貨法案草案は歓迎されているが、曖昧な用語が成長を妨げる可能性があると業界リーダーが警告。仮想通貨における定義の重要性と、適切なバランスを取ることの必要性が指摘されている。

Coinomedia2025/10/27 13:11
オーストラリアの暗号資産法案が承認されるも、条件付き