10月18日、金融市場に特化したAI研究ラボ nof1 は前例のない実験を開始しました。世界トップクラスのAIモデル6体——GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max——がHyperliquid上でそれぞれ$10,000のリアル資金を管理し、暗号化資産のリアルトレードを実施しています。
現在の順位とアカウント価値:10月30日夜時点の最新ランキングは以下の通りです。
このランキングは数日前のデータと比べて劇的な変化を見せています。DeepSeekは依然として首位ですが、利回りは95.71%から56.71%へ大きくプルバックし、アカウント価値は$19,570から$15,671へと約$4,000が消失しました。Qwen3も同様にプルバックし、53.68%から25.20%へ下落。さらに注目すべきは、Claude Sonnet 4.5が微益から7%の損失に転じ、GPT 5の損失は72%まで拡大し、清算が目前となっています。
マーケットプレイスは上昇トレンドにあり、各モデルの戦略の違いが現れ始めます。
DeepSeekの成功は「トレンドフォロー」に基づいています:95%の時間ロングポジション、トレンドの継続を信じる。上昇トレンドではこの戦略が95%の最高収益をもたらしました。しかしトレンドが反転すると、同じ戦略で30%の損失を被りました。
ここで重要なのは、トレンドフォロー戦略には有効な利食い・損切りメカニズムが必要ということです。「利益を伸ばす」だけで「損失を断ち切る」ことがなければ、一度の大きな反転でほとんどの利益が消失します。
DeepSeekは「長期保有」の価値を過信し、市場の不確実性を軽視した可能性があります。最大利益$7,378はETHを60時間保有した取引から生まれ、この成功体験が「長期主義」への信念を強化したかもしれません。しかし金融市場は一本道ではなく、トレンドはいつでも反転します。
Qwen3は実際のパフォーマンスでショートポジションの価値を証明しました。82.4%のショートポジション時間は上昇期には「機会損失」に見えますが、下落期には「損失回避」となります。
プルバック26% vs 32%、差は6ポイントですが、複利効果でこの差は拡大します。さらに重要なのは、Qwen3がより多くの元本と心理的優位性を保ち、マーケットプレイスが安定すればすぐにポジション構築できることです。DeepSeekがさらにプルバックすれば、「含み損→迷い→反転を逃す」の悪循環に陥る可能性があります。
BTC Buy & Holdのパフォーマンスは、すべての「賢い」AIへの痛烈な一撃です。この戦略はテクニカル分析も複雑なアルゴリズムもなく、頻繁なポジション調整もありませんが、現在3位でAIモデルの半分を上回っています。
この結果が示すのは、トレードでは「多く正解する」より「ミスを減らす」方が重要だということです。Geminiは193回の取引で66%の損失、BTC Buy & Holdは0回の取引で元本を守りました。どちらが成功か?答えは明白です。
Qwen3以外、ほぼすべてのAIがリスクコントロールの重大な欠陥を露呈しました。
これらのAIは「マーケットプレイスデータを読む」「取引指令を実行する」ことはできても、トレードの核心であるリスクコントロール能力はまだ未熟です。
データと分析を見て、DeepSeekの56%利回りやGeminiの66%損失に目を奪われがちですが、結論を出す前にこの実験自体のシステム的な限界を直視する必要があります——これらの限界は結果以上に重要かもしれません。
この実験は10月18日から30日まで、わずか12日間です。暗号化市場で12日間とは?完全なブル・マーケットとベア・マーケットのサイクルの一部に過ぎません。
「上昇→ピーク→プルバック」という完全なミニサイクルが見られましたが、これはむしろ運が良かっただけです。もし実験開始がマーケットプレイスの天井だったり、「519型」の1日30%暴落があれば、順位は全く逆転していたかもしれません。
DeepSeekの56%収益はこの12日間のマーケットプレイス特性に大きく依存している可能性があります。95%ロングポジション戦略は一方的な上昇では王者ですが、3ヶ月のサイドウェイでは取引手数料と損切りの繰り返しで消耗し尽くします。
同様に、Qwen3の82%ショートポジション率はサイドウェイでは有利ですが、2021年のような狂乱のブル・マーケットでは大きく負けるでしょう。BTCが$10,000から$100,000へ上昇する牛市で、80%ショートポジションなら上昇の20%しか取れません。
12日間のデータでは、どんな戦略も長期的な有効性を証明できません。
6つのAIモデルは同じマーケットプレイスデータと取引指令フレームワークを受け取っています。これは6人のファンドマネージャーが同じレポートを見て意思決定するようなもの——テストしているのはリサーチ力ではなく、実行規律です。
リアルなトレードの世界では、Alphaは情報の非対称性から生まれます。トップクラスのクオンツファンドは独自のオンチェーン追跡システムでクジラの送金を監視し、OTCの大口注文フローで機関の動向を先読みします。
しかしこの実験では、AIが見る情報は完全に同じです。これは「実行力コンテスト」であり、「戦略イノベーションコンテスト」ではありません。
この実験からは、DeepSeekに独自のオンチェーンデータ、Geminiに独自のTwitter感情分析を与えた場合、誰が真の勝者になるかは分かりません。
各AIは$10,000の元本のみを管理しています。Hyperliquid上では超小規模資金——いつでも出入りでき、スリッページは無視でき、流動性ショックもなく、大口分割も不要です。
しかしリアルなクオンツトレードの世界では、$1,000万と$10,000の運用は全く別物です。
この実験は「小資金の機動性」をテストしているだけで、「拡張可能な戦略の堅牢性」ではありません。
実験期間中のマーケットプレイスは比較的安定し、ボラティリティは中程度でした。以下のような事態は発生していません:
すべてのAIのリスクコントロール体系は極端なストレステストを受けていませんが、これこそが暗号化トレーダーが本当に直面する課題です。DeepSeekの損切りメカニズムは「連続ストップ安で約定不可」の場合どうなるのか?不明です。Qwen3の素早いポジションを閉めるは取引所ダウン時に有効なのか?これも不明です。
運が、この12日間の実験では想像以上に大きな要素かもしれません。
これは一度きりの実験であり、「第2シーズン」で戦略の安定性を検証していません。判断できないこと:
現状の結果は、6人がサイコロを振ってDeepSeekが最大値を出しただけかもしれません。しかしそれはサイコロが優れているのではなく、運が良かっただけかもしれません。
これらの限界を見た上で、「この実験に意味はあるのか?」と疑問に思うかもしれません。
意味はありますが、「誰がチャンピオンか」ではありません。この実験の本当の価値は、以下の点にあります:
もしDeepSeekが1位だからといって自分の資金を預けたり、その戦略を丸ごとコピーしようとするなら、それは大きな間違いです。
12日間のチャンピオンは12ヶ月のチャンピオンではありません;$10,000のチャンピオンは$1,000,000のチャンピオンではありません;この相場のチャンピオンは次の相場のチャンピオンではありません。
投資に簡単な答えはありません。この実験は貴重なデータを提供してくれましたが、データの背後にある限界こそ、データ以上に深く考える価値があります。
本レポートのデータはWolfDAOが編集・整理しました。ご質問があればご連絡ください。
執筆:Riffi / WolfDAO( X : @10xWolfdao )
8.71K 人気度
47.03K 人気度
9.94K 人気度
2.77K 人気度
9.76K 人気度
AIモデル対決:nof1実取引対決に基づく深層分析
10月18日、金融市場に特化したAI研究ラボ nof1 は前例のない実験を開始しました。世界トップクラスのAIモデル6体——GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max——がHyperliquid上でそれぞれ$10,000のリアル資金を管理し、暗号化資産のリアルトレードを実施しています。
現在の順位とアカウント価値:10月30日夜時点の最新ランキングは以下の通りです。
このランキングは数日前のデータと比べて劇的な変化を見せています。DeepSeekは依然として首位ですが、利回りは95.71%から56.71%へ大きくプルバックし、アカウント価値は$19,570から$15,671へと約$4,000が消失しました。Qwen3も同様にプルバックし、53.68%から25.20%へ下落。さらに注目すべきは、Claude Sonnet 4.5が微益から7%の損失に転じ、GPT 5の損失は72%まで拡大し、清算が目前となっています。
曲線から市場を読み解く:3つのフェーズの変遷
第1フェーズ(10月18~25日):上昇期、戦略の分化が始まる
マーケットプレイスは上昇トレンドにあり、各モデルの戦略の違いが現れ始めます。
第2フェーズ(10月26~28日):加速上昇、ピーク到来
第3フェーズ(10月29~30日):マーケットプレイスのプルバック、リスクコントロールの真価
下落プルバックが示す深層課題
1. 「トレンドフォロー」の両面性
DeepSeekの成功は「トレンドフォロー」に基づいています:95%の時間ロングポジション、トレンドの継続を信じる。上昇トレンドではこの戦略が95%の最高収益をもたらしました。しかしトレンドが反転すると、同じ戦略で30%の損失を被りました。
ここで重要なのは、トレンドフォロー戦略には有効な利食い・損切りメカニズムが必要ということです。「利益を伸ばす」だけで「損失を断ち切る」ことがなければ、一度の大きな反転でほとんどの利益が消失します。
DeepSeekは「長期保有」の価値を過信し、市場の不確実性を軽視した可能性があります。最大利益$7,378はETHを60時間保有した取引から生まれ、この成功体験が「長期主義」への信念を強化したかもしれません。しかし金融市場は一本道ではなく、トレンドはいつでも反転します。
2. ショートポジションは知恵であり防御でもある
Qwen3は実際のパフォーマンスでショートポジションの価値を証明しました。82.4%のショートポジション時間は上昇期には「機会損失」に見えますが、下落期には「損失回避」となります。
プルバック26% vs 32%、差は6ポイントですが、複利効果でこの差は拡大します。さらに重要なのは、Qwen3がより多くの元本と心理的優位性を保ち、マーケットプレイスが安定すればすぐにポジション構築できることです。DeepSeekがさらにプルバックすれば、「含み損→迷い→反転を逃す」の悪循環に陥る可能性があります。
3. シンプル戦略の生命力
BTC Buy & Holdのパフォーマンスは、すべての「賢い」AIへの痛烈な一撃です。この戦略はテクニカル分析も複雑なアルゴリズムもなく、頻繁なポジション調整もありませんが、現在3位でAIモデルの半分を上回っています。
この結果が示すのは、トレードでは「多く正解する」より「ミスを減らす」方が重要だということです。Geminiは193回の取引で66%の損失、BTC Buy & Holdは0回の取引で元本を守りました。どちらが成功か?答えは明白です。
4. リスク管理の欠如
Qwen3以外、ほぼすべてのAIがリスクコントロールの重大な欠陥を露呈しました。
これらのAIは「マーケットプレイスデータを読む」「取引指令を実行する」ことはできても、トレードの核心であるリスクコントロール能力はまだ未熟です。
実験の限界:データの外側にある冷静な考察
データと分析を見て、DeepSeekの56%利回りやGeminiの66%損失に目を奪われがちですが、結論を出す前にこの実験自体のシステム的な限界を直視する必要があります——これらの限界は結果以上に重要かもしれません。
1. 時間ウィンドウが短すぎる:12日間では真実は見えない
この実験は10月18日から30日まで、わずか12日間です。暗号化市場で12日間とは?完全なブル・マーケットとベア・マーケットのサイクルの一部に過ぎません。
「上昇→ピーク→プルバック」という完全なミニサイクルが見られましたが、これはむしろ運が良かっただけです。もし実験開始がマーケットプレイスの天井だったり、「519型」の1日30%暴落があれば、順位は全く逆転していたかもしれません。
DeepSeekの56%収益はこの12日間のマーケットプレイス特性に大きく依存している可能性があります。95%ロングポジション戦略は一方的な上昇では王者ですが、3ヶ月のサイドウェイでは取引手数料と損切りの繰り返しで消耗し尽くします。
同様に、Qwen3の82%ショートポジション率はサイドウェイでは有利ですが、2021年のような狂乱のブル・マーケットでは大きく負けるでしょう。BTCが$10,000から$100,000へ上昇する牛市で、80%ショートポジションなら上昇の20%しか取れません。
12日間のデータでは、どんな戦略も長期的な有効性を証明できません。
2. 同一Prompt:AIの手足が縛られている
6つのAIモデルは同じマーケットプレイスデータと取引指令フレームワークを受け取っています。これは6人のファンドマネージャーが同じレポートを見て意思決定するようなもの——テストしているのはリサーチ力ではなく、実行規律です。
リアルなトレードの世界では、Alphaは情報の非対称性から生まれます。トップクラスのクオンツファンドは独自のオンチェーン追跡システムでクジラの送金を監視し、OTCの大口注文フローで機関の動向を先読みします。
しかしこの実験では、AIが見る情報は完全に同じです。これは「実行力コンテスト」であり、「戦略イノベーションコンテスト」ではありません。
この実験からは、DeepSeekに独自のオンチェーンデータ、Geminiに独自のTwitter感情分析を与えた場合、誰が真の勝者になるかは分かりません。
3. 資金規模の歪み:$10,000のファンタジー
各AIは$10,000の元本のみを管理しています。Hyperliquid上では超小規模資金——いつでも出入りでき、スリッページは無視でき、流動性ショックもなく、大口分割も不要です。
しかしリアルなクオンツトレードの世界では、$1,000万と$10,000の運用は全く別物です。
この実験は「小資金の機動性」をテストしているだけで、「拡張可能な戦略の堅牢性」ではありません。
4. マーケットプレイス環境の幸運:本当の地獄は未経験
実験期間中のマーケットプレイスは比較的安定し、ボラティリティは中程度でした。以下のような事態は発生していません:
すべてのAIのリスクコントロール体系は極端なストレステストを受けていませんが、これこそが暗号化トレーダーが本当に直面する課題です。DeepSeekの損切りメカニズムは「連続ストップ安で約定不可」の場合どうなるのか?不明です。Qwen3の素早いポジションを閉めるは取引所ダウン時に有効なのか?これも不明です。
運が、この12日間の実験では想像以上に大きな要素かもしれません。
5. 単発実験の偶然性:第2シーズンの検証なし
これは一度きりの実験であり、「第2シーズン」で戦略の安定性を検証していません。判断できないこと:
現状の結果は、6人がサイコロを振ってDeepSeekが最大値を出しただけかもしれません。しかしそれはサイコロが優れているのではなく、運が良かっただけかもしれません。
では、これらの順位をどう捉えるべきか?
これらの限界を見た上で、「この実験に意味はあるのか?」と疑問に思うかもしれません。
意味はありますが、「誰がチャンピオンか」ではありません。この実験の本当の価値は、以下の点にあります:
もしDeepSeekが1位だからといって自分の資金を預けたり、その戦略を丸ごとコピーしようとするなら、それは大きな間違いです。
12日間のチャンピオンは12ヶ月のチャンピオンではありません;$10,000のチャンピオンは$1,000,000のチャンピオンではありません;この相場のチャンピオンは次の相場のチャンピオンではありません。
投資に簡単な答えはありません。この実験は貴重なデータを提供してくれましたが、データの背後にある限界こそ、データ以上に深く考える価値があります。
本レポートのデータはWolfDAOが編集・整理しました。ご質問があればご連絡ください。
執筆:Riffi / WolfDAO( X : @10xWolfdao )