مسابقة نماذج الذكاء الاصطناعي: نظرة عميقة على مسابقة التداول الحقيقي المباشر المستندة إلى nof1

في 18 أكتوبر، أطلق مختبر nof1 المتخصص في أبحاث الذكاء الاصطناعي للأسواق المالية تجربة غير مسبوقة: حيث تولت 6 نماذج ذكاء اصطناعي عالمية المستوى—GPT-5، Gemini 2.5 Pro، Grok-4، Claude Sonnet 4.5، DeepSeek V3.1، Qwen3 Max—إدارة رأس مال حقيقي بقيمة 10,000 دولار لكل منها على منصة Hyperliquid، لتنفيذ تداولات التشفير في المحفظة.

الترتيب الحالي وقيمة الحساب: حتى مساء 30 أكتوبر، الترتيب الأحدث كالتالي:

  • DeepSeek Chat V3.1: $15,671.39 (+56.71%)
  • Qwen3 Max: $12,520.34 (+25.20%)
  • BTC Buy & Hold: $10,146.69 (+1.47%)
  • Claude Sonnet 4.5: $9,290.97 (-7.09%)
  • Grok 4: $7,030.02 (-29.70%)
  • Gemini 2.5 Pro: $3,446.03 (-65.54%)
  • GPT 5: $2,749.32 (-72.51%)

شهد هذا الترتيب تغيرات دراماتيكية مقارنة بالأيام السابقة. DeepSeek لا يزال في الصدارة، لكن العائد انخفض من 95.71% إلى 56.71%، وقيمة الحساب تراجعت من $19,570 إلى $15,671، أي تبخر ما يقارب $4,000. Qwen3 أيضاً شهد انسحاب للخلف، من 53.68% إلى 25.20%. الأكثر لفتاً للنظر، Claude Sonnet 4.5 انتقل من ربح طفيف إلى خسارة بنسبة 7%، بينما GPT 5 زادت خسارته إلى 72%، وأصبح قريباً من الحصول على التصفية.

قراءة السوق من المنحنيات: تطور عبر ثلاث مراحل

المرحلة الأولى (18-25 أكتوبر): فترة الارتفاع، بداية تباين الاستراتيجيات

المتجر في قناة ارتفاع، وبدأت اختلافات استراتيجيات النماذج تظهر:

  • DeepSeek: ارتفع بسرعة من $10,000 إلى $17,000، قدرة قوية على التقاط الاتجاهات
  • Qwen3: ارتفع تدريجياً إلى نطاق $12,000-$15,000
  • Claude/Grok: تذبذب في نطاق $10,000-$12,000
  • Gemini/GPT: انخفضا دون $5,000، رسوم التداول والقرارات الخاطئة سببت التأخر

المرحلة الثانية (26-28 أكتوبر): تسارع الارتفاع، ظهور الذروة

  • DeepSeek بلغ الذروة: في 27 أكتوبر تجاوز $23,000، وحقق عائد 130% خلال 9 أيام. احتفظ بكميات كبيرة من ETH وSOL في المراكز الطويلة، واستخدم رافعة مالية 10-15 مرة.
  • Qwen3 كان متحفظاً: الذروة $17,000، ارتفاع معتدل. معدل المركز القصير 82.4% سمح له باختيار التوقيت وتجنب مطاردة السعر.
  • Claude/Grok متذبذبين: تذبذب في نطاق $11,000-$13,000، استراتيجيات مترددة—يرغبان في المشاركة لكن دون حسم.
  • Gemini/GPT خرجا من المنافسة: الحسابات انخفضت إلى $3,000-$4,000، وفقدا فرصة التعافي.

المرحلة الثالثة (29-30 أكتوبر): انسحاب للخلف في السوق، التحكم في المخاطر يظهر

  • DeepSeek: انسحاب للخلف حاد: من $23,000 إلى $15,671، خسارة $7,000 خلال يومين (-30%): لا يوجد آلية جني أرباح، لم يتم إغلاق المراكز عند الذروة. 95.6% من الوقت في المراكز الطويلة، بدون وسائل تحوط، ولم يتم إيقاف الخسارة في الوقت المناسب. رغم انسحاب للخلف بنسبة 30%، لا يزال متقدماً على الثاني بـ$3,000، ميزة المرحلة الأولى كانت كافية.
  • Qwen3: أظهر مرونة، من $17,000 إلى $12,520 (-26%)، أقل من DeepSeek، معدل المركز القصير 82.4%، إغلاق مركز سريع، تداول قصير الأجل (متوسط 9.7 س)، فترة التعرض قصيرة، إيقاف الخسارة بسرعة، لم يسمح بتوسع الخسارة.
  • BTC Buy & Hold: انتصار الاستراتيجية البسيطة، الحساب $10,146 (+1.47%)، تجاوز Claude وGrok، في المركز الثالث. مفارقة ساخرة: أربعة نماذج ذكاء اصطناعي “ذكية” نفذت مئات التداولات، لكن استراتيجية “اشتر واحتفظ” تفوقت عليهم، كثرة التداول ≠ جودة التداول، الاستراتيجية البسيطة تجنبت الإفراط في التداول وتكاليف مرتفعة.
  • Claude: الاستراتيجية المحافظة فشلت، من +0.93% إلى -7.09% ($10,093→$9,290). رسوم التداول أكلت الأرباح، نسبة الأرباح/ الخسائر (PNL) منخفضة (1.34:1)، أرباح صغيرة وتكاليف كبيرة، كثرة تغيير المراكز أثناء الانسحاب للخلف زادت الخسارة، missed ضخ السعر، لم يدافع جيداً أثناء الهبوط.
  • Grok: تسارع الانهيار، الخسارة من -8% إلى -29.7% ($7,030): 90.6% في المراكز الطويلة لكن معدل الفوز فقط 22.7%، خسارة محققة -$2,449، رأس المال المتبقي قليل، يعتمد على $1,611 أرباح غير محققة، معرض للانهيار في أي لحظة.
  • Gemini/GPT: صراع أخير، GPT انخفض إلى $2,749 (-72.51%)، Gemini $3,446 (-65.54%). الفشل شامل: إفراط في التداول، معدل فوز منخفض، نسبة الأرباح/ الخسائر (PNL) سيئة، مخاطر رافعة مالية عالية.

المشاكل العميقة التي كشفها الانسحاب للخلف

1. وجهان لاستراتيجية “اتباع الاتجاه”

نجاح DeepSeek بني على “اتباع الاتجاه”: 95% من الوقت في المراكز الطويلة، يثق باستمرار الاتجاه. في الاتجاه الصاعد، هذه الاستراتيجية حققت له 95% من أعلى عائد. لكن عند انعكاس الاتجاه، نفس الاستراتيجية سببت خسارة 30%.

هذا يكشف مشكلة أساسية: استراتيجية متابعة الاتجاه تحتاج آليات جني أرباح وإيقاف الخسارة فعالة. إذا كان هناك فقط “دع الأرباح تنمو” بدون “قطع الخسائر”، فإن انعكاس كبير واحد قد يلتهم معظم الأرباح.

DeepSeek ربما يثق كثيراً بقيمة “الاحتفاظ طويل الأجل”، ويتجاهل عدم اليقين في المتجر. أكبر ربح له $7,378 جاء من صفقة ETH استمرت 60 س، هذه التجربة الناجحة ربما عززت إيمانه بـ"الاستثمار طويل الأجل". لكن الأسواق المالية ليست طريقاً واحداً، الاتجاه قد ينعكس في أي وقت.

2. المركز القصير ذكاء وحماية

Qwen3 أثبت عملياً قيمة المركز القصير. 82.4% من الوقت في المركز القصير، في مرحلة الارتفاع يبدو أنه “أضاع الفرصة”، لكن في مرحلة الانسحاب للخلف أصبح “تجنب الخسارة”.

انسحاب للخلف 26% مقابل 32%، الفرق 6 نقاط مئوية فقط، لكن مع تأثير الفائدة المركبة، هذا الفرق يتسع أكثر. الأهم، Qwen3 احتفظ برأس مال ونفسية أفضل، وعندما يستقر المتجر يمكنه بناء مركز جديد بسرعة. أما DeepSeek إذا استمر في الانسحاب للخلف، قد يدخل في حلقة “خسارة عائمة-تردد-تفويت الانتعاش”.

3. قوة الاستراتيجية البسيطة

أداء BTC Buy & Hold صفعة لكل نماذج الذكاء الاصطناعي “الذكية”. هذه الاستراتيجية بلا تحليل تقني، بلا خوارزمية معقدة، بلا تغيير مراكز متكرر، لكنها الآن في المركز الثالث، متفوقة على نصف النماذج.

النتيجة توضح: في التداول، ارتكاب أخطاء أقل أهم من اتخاذ قرارات صحيحة كثيرة. Gemini نفذ 193 صفقة وخسر 66%، بينما BTC Buy & Hold لم ينفذ أي صفقة وحافظ على رأس المال. من الأكثر نجاحاً؟ الجواب واضح.

4. غياب التحكم في المخاطر

باستثناء Qwen3، جميع نماذج الذكاء الاصطناعي أظهرت عيوباً كبيرة في التحكم في المخاطر:

  • DeepSeek: لا يوجد آلية جني أرباح، سمح بانسحاب للخلف من 130% إلى 57%
  • Claude: اعتماد مفرط على التفكير الأحادي “عدم فتح مركز قصير”، بلا وسائل تحوط
  • Grok: رغم معدل الفوز فقط 22.7%، أصر على المراكز الطويلة 90.6% من الوقت
  • GPT: مركز BTC برافعة مالية 40 مرة، سعر التصفية به هامش خطأ 1.2% فقط
  • Gemini: بلا أي تحكم في المخاطر، 193 صفقة أشبه بالمقامرة

هذا يوضح أن هذه النماذج رغم قدرتها على “قراءة” بيانات المتجر و"تنفيذ" أوامر التداول، إلا أن التحكم في المخاطر—وهو جوهر التداول—لا يزال بعيداً عن النضج.

حدود التجربة: التفكير الهادئ خارج البيانات

بعد مراجعة البيانات والتحليل، من السهل الانجذاب لعائد DeepSeek 56% أو خسارة Gemini 66%. لكن قبل استخلاص أي استنتاج، يجب مواجهة حدود هذه التجربة النظامية—هذه الحدود قد تكون أهم من النتائج نفسها.

1. نافذة زمنية قصيرة: 12 يوماً لا تكشف الحقيقة

التجربة استمرت من 18 إلى 30 أكتوبر، فقط 12 يوماً. ماذا تعني 12 يوماً في سوق التشفير؟ ربما مجرد جزء صغير من دورة السوق الصاعدة/الهابطة.

ما رأيناه من “ارتفاع-ذروة-انسحاب للخلف” هو دورة صغيرة كاملة، لكنه أقرب للحظ. لو بدأت التجربة عند قمة المتجر، أو حدث big dump بنسبة 30% في يوم واحد، ربما انقلب الترتيب تماماً.

عائد DeepSeek 56% ربما يعتمد بشكل كبير على خصائص هذه الفترة. استراتيجيته في المراكز الطويلة 95% فعالة في اتجاه صاعد، لكن في 3 أشهر من طرق جانبية، ستأكل رسوم التداول وإيقاف الخسارة الأرباح.

كذلك، معدل المركز القصير 82% لدى Qwen3 ميزة في السوق المتذبذب، لكن في سوق صاعدة مثل 2021، سيخسر كثيراً. لو ارتفع BTC من $10,000 إلى $100,000، المركز القصير 80% يعني أنك استفدت فقط من 20% من الارتفاع.

بيانات 12 يوماً لا تثبت فعالية أي استراتيجية على المدى الطويل.

2. نفس الـPrompt: الذكاء الاصطناعي مقيد

جميع النماذج تلقت نفس بيانات المتجر وإطار أوامر التداول. كأنك تطلب من 6 مديري صناديق قراءة نفس التقرير لاتخاذ القرار—ما يتم اختباره هو الانضباط في التنفيذ، وليس القدرة على البحث.

في الواقع، Alpha يأتي من عدم تماثل المعلومات. الصناديق الكمية الكبرى لديها أنظمة تتبع الحوت على السلسلة، وترى تدفقات أوامر المؤسسات قبل الجميع.

لكن في هذه التجربة، جميع النماذج ترى نفس المعلومات. الأمر أشبه بمسابقة “تنفيذ” وليس “ابتكار استراتيجيات”.

لا يمكننا الحكم من هذه التجربة: لو أعطينا DeepSeek بيانات حصرية من السلسلة، وGemini تحليل مشاعر Twitter حصري، من سيكون الفائز الحقيقي؟

3. حجم رأس المال غير واقعي: عالم $10,000 الخيالي

كل نموذج يدير رأس مال $10,000 فقط. في Hyperliquid هذا مبلغ صغير جداً—يمكنك الدخول والخروج بسهولة، الانزلاق معدوم، لا يوجد تأثير سيولة، ولا حاجة لتقسيم الأوامر الكبيرة.

لكن في الواقع، إدارة $10 مليون تختلف تماماً عن إدارة $10,000.

  • رافعة GPT 40 مرة ممكنة مع $10,000، لكن لو كانت $10 مليون × 40 = $400 مليون، أي حركة عكسية 3% ستسبب الحصول على التصفية فوراً، وأوامرك ستؤثر على المتجر نفسه.
  • استراتيجية Qwen3 القصيرة الأجل فعالة مع رأس مال صغير، لكن مع رأس مال كبير، تكلفة كل صفقة (انزلاق + رسوم التداول) ستجعل الاستراتيجية غير مجدية. فتح مركز سيرفع السعر، إغلاق مركز سيخفضه، وستكتشف أنك تدفع للمتجر.
  • استراتيجية DeepSeek ذات الرافعة المالية العالية فعالة مع $10,000، لكن مع $1 مليون، أوامرك ستترك أثر واضح في عمق Hyperliquid، والمتداولون الآخرون سيراقبون مراكزك ويعملون عكسك.

التجربة تختبر “مرونة رأس المال الصغير”، وليس “استقرار الاستراتيجيات القابلة للتوسع”.

4. بيئة المتجر المحظوظة: لم تواجه الجحيم الحقيقي

خلال التجربة، كان المتجر مستقراً نسبياً، التقلب متوسط. لم نشهد:

  • انهيار نظامي: مثل إفلاس FTX، جميع العملات تهبط فجأة، السيولة تختفي فوراً
  • انهيار عملة واحدة: مثل LUNA، من $80 إلى $0.0001 خلال ساعة
  • عطل منصة التداول: مثل توقف Binance، لديك مركز ولا تستطيع إغلاقه، تشاهد الحصول على التصفية أمامك
  • جفاف السيولة الشديد: مثل منتصف الليل في عطلة نهاية الأسبوع، الانزلاق 20% عند تنفيذ أمر إيقاف الخسارة

جميع أنظمة التحكم في المخاطر للنماذج لم تُختبر تحت ضغط شديد، وهذه هي التحديات الحقيقية للمتداولين في التشفير. كيف ستتصرف آلية إيقاف الخسارة لدى DeepSeek إذا حدث “توقف متتالي لا يمكن تنفيذ الأوامر”؟ لا نعلم. هل إغلاق مركز Qwen3 السريع فعال أثناء عطل المنصة؟ أيضاً لا نعلم.

الحظ في تجربة 12 يوماً ربما كان له دور أكبر مما نتخيل.

5. صدفة التجربة الواحدة: لا يوجد موسم ثانٍ للتحقق

هذه تجربة لمرة واحدة، لا يوجد “موسم ثانٍ” للتحقق من استقرار الاستراتيجيات. لا يمكننا معرفة:

  • هل تفوق DeepSeek ناتج عن قدرة حقيقية أم مجرد حظ؟
  • لو أعدنا خلط معايير استراتيجيات النماذج الستة وشغلناها من جديد، هل سيبقى DeepSeek في الصدارة؟
  • لو بدأنا من 1 نوفمبر لمدة 12 يوماً أخرى، هل سينقلب الترتيب؟

النتيجة الحالية أشبه برمي النرد بين 6 أشخاص، وDeepSeek حصل على أعلى رقم. هذا لا يعني أن نرده أفضل، ربما فقط كان محظوظاً أكثر.

إذاً، كيف ننظر لهذه الترتيبات؟

بعد مراجعة هذه الحدود، قد تتساءل: هل لهذه التجربة قيمة؟

نعم، لكن القيمة ليست في “من هو البطل”. القيمة الحقيقية للتجربة أنها أظهرت لنا:

  1. الذكاء الاصطناعي يمكنه التداول الحقيقي—وهذا بحد ذاته إنجاز. قبل عام كنا نتساءل هل سيحل الذكاء الاصطناعي محل المتداولين، الآن الذكاء الاصطناعي نفذ تداولات في المحفظة.
  2. التحكم في المخاطر أهم من التنبؤ—جميع النماذج تستطيع “قراءة” الشموع، لكن القليل منها يضبط المخاطر. هذا يؤكد حكمة وول ستريت القديمة.
  3. مرونة الاستراتيجية البسيطة—مركز BTC Buy & Hold الثالث يذكرنا أنه في المتجر غير المؤكد، ارتكاب أخطاء أقل قد يكون أكثر قيمة من اتخاذ قرارات صحيحة كثيرة.
  4. لا توجد استراتيجية مثالية دائمة—تفوق DeepSeek اليوم قد يكون فخ الغد. عندما يتغير المتجر، تتغير الاستراتيجية المثلى.

لكن إذا قررت أن تسلم أموالك لـDeepSeek لأنه في المركز الأول، أو تقلد استراتيجيته، فأنت ترتكب خطأً كبيراً.

بطل 12 يوماً لا يعني بطل 12 شهراً؛ بطل $10,000 لا يعني بطل $1,000,000؛ بطل هذه الفترة لا يعني بطل الفترة القادمة.

الاستثمار ليس له إجابة سهلة أبداً. هذه التجربة قدمت لنا بيانات ثمينة، لكن حدود البيانات قد تكون أكثر أهمية من البيانات نفسها.

بيانات هذا التقرير تم تحريرها وتجميعها بواسطة WolfDAO، لأي استفسار يمكنكم التواصل معنا للتحديث؛

كتابة: Riffi / WolfDAO( X : @10xWolfdao )

BTC-3%
ETH-5.92%
SOL-8.88%
LUNA-9.42%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$4.34Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$4.35Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.36Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.56Kعدد الحائزين:2
    0.00%
  • تثبيت